Πειραματική κάμερα της Microsoft δείχνει τον συνομιλητή να σας κοιτάει στα μάτια
Ένα σύστημα μηχανικής όρασης της Microsoft, για χρήση σε τηλεδιασκέψεις, δημιουργεί τρισδιάστατες συνθετικες εικόνες των συνομιλητών ώστε ο ένας να φαίνεται ότι κοιτάει απευθείας τον άλλο. Το i2i αναπαράγει τη γεωμετρία του προσώπου σε πραγματικό χρόνο
36
Ένα σύστημα μηχανικής όρασης της Microsoft, για χρήση σε τηλεδιασκέψεις, δημιουργεί τρισδιάστατες συνθετικες εικόνες των συνομιλητών ώστε ο ένας να φαίνεται ότι κοιτάει απευθείας τον άλλο.
Το σύστημα i2i περιλαμβάνει μια διπλή, στερεοσκοπική κάμερα που παρακολουθεί τις κινήσεις του χρήστη, καθώς και ειδικό λογισμικό που συνδυάζει τις δύο εικόνες για να δημιουργήσει ένα τρισδιάστατο μοντέλο του προσώπου.
Ο εξελιγμένος αλγόριθμος του i2i μπορεί έτσι να παρουσιάζει τον ομιλητή υπό ελαφρώς διαφορετική γωνία, έτσι ώστε να φαίνεται ότι κοιτάει απευθείας τον συνομιλητή του, αντί το φακό.
Το σύστημα μπορεί να αναπαράγει την τρισδιάσταση γεωμετρία και τις κινήσεις του ανθρώπινου προσώπου σε πραγματικό χρόνο, αναφέρει στο BBC ο Αντόνιο Κριμίνιζι, επικεφαλής της Ομάδας Μηχανικής Μάθησης και Αντίληψης της Microsoft, με έδρα στο Κέμπριτζ της Βρετανίας.
Το i2i, εξηγεί ο Κριμίνιζι, ουσιαστικά μιμείται τα ανθρώπινα μάτια και τον οπτικό φλοιό του εγκεφάλου. Ο αλγόριθμος ξεχωρίζει χρώματα, σχήματα και αποστάσεις και δημιουργεί τρισδιάστατους χάρτες του οπτικού πεδίου.
Στο μέλλον, το σύστημα θα μπορεί να απομονώνει το πρόσωπο του χρήστη και να αντικαθιστά το φόντο με συνθετικά περιβάλλοντα. «Αυτό είναι σημαντικό για την προσωπική ζωή, καθώς εγώ μπορεί να μην θέλω να δει κάποιος πόσο ακατάστατο είναι το υπνοδωμάτιό μου» σχολιάζει ο Κριμίνιζι.
Το i2i αναγνωρίζει αυτόματα που πρέπει να εστιάσει και παρακολουθεί τις κινήσεις του χρήστη με μια τεχνική που ονομάζεται «smart framing» (έξυπνη πλαισίωση, σε ελεύθερη απόδοση).
«Αυτού του είδους η έρευνα συνεχίζεται εδώ και χρόνια στην κοινότητα της μηχανικής όρασης, αλλά αυτού του είδους τα αποτελέσματα δεν είχαν παραχθεί στο παρελθόν με τέτοια ακρίβεια» περηφανεύεται ο Κριμίνιζι.
«Είναι σημαντικό για τις εφαρμογές τηλεδιάσκεψης, γιατί το σύστημα μπορεί αυτόματα να αναγνωρίζει τι είναι σημαντικό στη σκηνή« προσθέτει.
Το i2i έχει ήδη εξοπλιστεί με τη δυνατότητα να εισάγει στην εικόνα τρισδιάστατα, αιωρούμενα emoticons -αναπαραστάσεις των ανθρώπινων εκφράσεων, όπως το γνωστό 🙂 – ενώ στο μέλλον θα μπορεί να καλύπτει τα πρόσωπα των συνομιλητών με 3D μάσκες της επιλογής τους.
Newsroom ΑΛΤΕΡ ΕΓΚΟ
- Μύκονος Betsson: Ανακοίνωσε τον Μοχάβι Κινγκ
- Η Νύφη! – Mια ταινία Φρανκενστάιν αλά Μπόνι και Κλάιντ που ισοδυναμεί με καθαρή τρέλα
- Αίγινα: Συνελήφθη 30χρονος που έκανε σούζες και κόντρες – Αναρτούσε τα «κατορθώματά» του στα social media
- Η Τουρκία στέλνει F16 στα κατεχόμενα της Κύπρου σύμφωνα με τουρκοκυπριακά ΜΜΕ
- Ναρκωτικά, όπλα, κλοπές – 15 φορές είχε συλληφθεί ο 48χρονος που απειλούσε με χειροβομβίδες έξω από τη ΓΑΔΑ
- ΑΕΚ – Προμηθέας 102-85: Παράσταση για ένα ρόλο και 9η σερί νίκη για την Ένωση


