Πειραματική κάμερα της Microsoft δείχνει τον συνομιλητή να σας κοιτάει στα μάτια
Ένα σύστημα μηχανικής όρασης της Microsoft, για χρήση σε τηλεδιασκέψεις, δημιουργεί τρισδιάστατες συνθετικες εικόνες των συνομιλητών ώστε ο ένας να φαίνεται ότι κοιτάει απευθείας τον άλλο. Το i2i αναπαράγει τη γεωμετρία του προσώπου σε πραγματικό χρόνο
36
Ένα σύστημα μηχανικής όρασης της Microsoft, για χρήση σε τηλεδιασκέψεις, δημιουργεί τρισδιάστατες συνθετικες εικόνες των συνομιλητών ώστε ο ένας να φαίνεται ότι κοιτάει απευθείας τον άλλο.
Το σύστημα i2i περιλαμβάνει μια διπλή, στερεοσκοπική κάμερα που παρακολουθεί τις κινήσεις του χρήστη, καθώς και ειδικό λογισμικό που συνδυάζει τις δύο εικόνες για να δημιουργήσει ένα τρισδιάστατο μοντέλο του προσώπου.
Ο εξελιγμένος αλγόριθμος του i2i μπορεί έτσι να παρουσιάζει τον ομιλητή υπό ελαφρώς διαφορετική γωνία, έτσι ώστε να φαίνεται ότι κοιτάει απευθείας τον συνομιλητή του, αντί το φακό.
Το σύστημα μπορεί να αναπαράγει την τρισδιάσταση γεωμετρία και τις κινήσεις του ανθρώπινου προσώπου σε πραγματικό χρόνο, αναφέρει στο BBC ο Αντόνιο Κριμίνιζι, επικεφαλής της Ομάδας Μηχανικής Μάθησης και Αντίληψης της Microsoft, με έδρα στο Κέμπριτζ της Βρετανίας.
Το i2i, εξηγεί ο Κριμίνιζι, ουσιαστικά μιμείται τα ανθρώπινα μάτια και τον οπτικό φλοιό του εγκεφάλου. Ο αλγόριθμος ξεχωρίζει χρώματα, σχήματα και αποστάσεις και δημιουργεί τρισδιάστατους χάρτες του οπτικού πεδίου.
Στο μέλλον, το σύστημα θα μπορεί να απομονώνει το πρόσωπο του χρήστη και να αντικαθιστά το φόντο με συνθετικά περιβάλλοντα. «Αυτό είναι σημαντικό για την προσωπική ζωή, καθώς εγώ μπορεί να μην θέλω να δει κάποιος πόσο ακατάστατο είναι το υπνοδωμάτιό μου» σχολιάζει ο Κριμίνιζι.
Το i2i αναγνωρίζει αυτόματα που πρέπει να εστιάσει και παρακολουθεί τις κινήσεις του χρήστη με μια τεχνική που ονομάζεται «smart framing» (έξυπνη πλαισίωση, σε ελεύθερη απόδοση).
«Αυτού του είδους η έρευνα συνεχίζεται εδώ και χρόνια στην κοινότητα της μηχανικής όρασης, αλλά αυτού του είδους τα αποτελέσματα δεν είχαν παραχθεί στο παρελθόν με τέτοια ακρίβεια» περηφανεύεται ο Κριμίνιζι.
«Είναι σημαντικό για τις εφαρμογές τηλεδιάσκεψης, γιατί το σύστημα μπορεί αυτόματα να αναγνωρίζει τι είναι σημαντικό στη σκηνή« προσθέτει.
Το i2i έχει ήδη εξοπλιστεί με τη δυνατότητα να εισάγει στην εικόνα τρισδιάστατα, αιωρούμενα emoticons -αναπαραστάσεις των ανθρώπινων εκφράσεων, όπως το γνωστό 🙂 – ενώ στο μέλλον θα μπορεί να καλύπτει τα πρόσωπα των συνομιλητών με 3D μάσκες της επιλογής τους.
Newsroom ΑΛΤΕΡ ΕΓΚΟ
- Χανιά: Συναγερμός για κρούσμα μηνιγγίτιδας σε λύκειο – Στο νοσοκομείο 17χρονη μαθήτρια
- «Βράζουν» για τη διαιτησία του ΑΕΚ – Κραϊόβα οι Ρουμάνοι: «Αστείες αποφάσεις» (pic)
- Αυξάνονται τα ληξιπρόθεσμα χρέη στην Εφορία: Πόσα και…γιατί χρωστούν οι Έλληνες;
- Ινδονησία: Φρικτός θάνατος για 10χρονο – Τον άρπαξε κροκόδειλος ενώ κολυμπούσε με φίλους του
- Meteo: Μόλις το 1% της χώρας καλύπτεται με χιόνι – Κάτω από τον μέσο όρο της περασμένης τετραετίας
- Ο σκύλος σάς γυρνάει την πλάτη του – Τι δηλώνει αυτή η συμπεριφορά





