Το ανατριχιαστικά ρεαλιστικό ρομπότ EMO έχει σημειώσει ένα σημαντικό επίτευγμα στην ανθρωποειδή ρομποτική: μπορεί πλέον να κινεί τα χείλη του με ακρίβεια που θυμίζει ανθρώπινη ομιλία, παρακολουθώντας τον εαυτό του σε έναν καθρέφτη και μελετώντας βίντεο στο YouTube.
Η εξέλιξη αυτή υπόσχεται να φέρει τα ανθρωποειδή ρομπότ πιο κοντά στην καθημερινή ανθρώπινη αλληλεπίδραση.
EMO: Ένα ρομπότ που κοιτάζει τον καθρέφτη
Το EMO διαθέτει χείλη από σιλικόνη και 26 κινητήρες στο πρόσωπό του, καθένας από τους οποίους μπορεί να κινηθεί σε έως και 10 βαθμούς ελευθερίας.
Για πρώτη φορά, οι επιστήμονες κατάφεραν να δημιουργήσουν ένα ρομπότ που μπορεί να συντονίζει αυτές τις κινήσεις ώστε να μιμείται ρεαλιστικά την ανθρώπινη ομιλία.
Η παρατήρηση του ίδιου του του προσώπου στον καθρέφτη ήταν καθοριστική.
Μέσω αυτής της διαδικασίας, το EMO έμαθε πώς οι κινήσεις των χειλιών και των μυών του προσώπου σχετίζονται με την παραγωγή ήχου, προσεγγίζοντας το επίπεδο ρεαλισμού που αποφεύγει το γνωστό «uncanny valley» – το ενοχλητικό συναίσθημα όταν κάτι είναι πολύ κοντά στο ανθρώπινο αλλά όχι αρκετά φυσικό.
Τεχνητή νοημοσύνη και η μέθοδος «vision-to-action»
Η εκπαίδευση του EMO βασίστηκε σε ένα σύστημα τεχνητής νοημοσύνης γνωστό ως «vision-to-action» language model (VLA).
Αυτό επιτρέπει στο ρομπότ να μετατρέπει ό,τι βλέπει σε συντονισμένες κινήσεις, χωρίς να χρειάζεται προκαθορισμένες οδηγίες.
Κατά τη διάρκεια της εκπαίδευσης, το EMO έκανε χιλιάδες τυχαίες κινήσεις των χειλιών μπροστά στον καθρέφτη.
Στη συνέχεια, παρακολούθησε ώρες βίντεο στο YouTube με ανθρώπους που μιλούσαν ή τραγουδούσαν σε διάφορες γλώσσες.
Έτσι, το ρομπότ έμαθε να συνδέει τις κινήσεις των χειλιών με τους αντίστοιχους ήχους, χωρίς να κατανοεί πραγματικά τι λέγονταν.
Με αυτόν τον τρόπο, το EMO κατάφερε να συγχρονίζει τα χείλη του με ομιλίες σε 10 διαφορετικές γλώσσες, συμπεριλαμβανομένων των ήχων που είναι ιδιαίτερα δύσκολοι, όπως το «B» και το «W», τα οποία απαιτούν ειδική σύσπαση των χειλιών.
Γιατί τα ρομπότ χρειάζονται φιλικά πρόσωπα
Αν και υπάρχουν διαφορές μεταξύ των φύλων και των πολιτισμών στον τρόπο με τον οποίο οι άνθρωποι κατανέμουν το βλέμμα τους, οι άνθρωποι γενικά βασίζονται σε μεγάλο βαθμό στα χαρακτηριστικά του προσώπου όταν αλληλεπιδρούν μεταξύ τους.
Μια μελέτη παρακολούθησης των ματιών του 2021 διαπίστωσε ότι κοιτάζουμε το πρόσωπο των συνομιλητών μας το 87% του χρόνου, με περίπου 10 έως 15% αυτού του χρόνου να επικεντρώνεται συγκεκριμένα στο στόμα.
Άλλες έρευνες έχουν δείξει ότι οι κινήσεις του στόματος είναι τόσο σημαντικές που επηρεάζουν ακόμη και αυτό που ακούμε.
Το μέλλον των ανθρωποειδών
Η ικανότητα των ρομπότ να μιμούνται ανθρώπινες εκφράσεις θα επηρεάσει καθοριστικά την αποδοχή τους από τους ανθρώπους.
Όπως επισημαίνει ο Yuhang Hu, κύριος συγγραφέας της μελέτης, «Τα ρομπότ με αυτή την ικανότητα θα έχουν σαφώς πολύ καλύτερη ικανότητα να συνδέονται με τους ανθρώπους, επειδή ένα σημαντικό μέρος της επικοινωνίας μας περιλαμβάνει τη γλώσσα του σώματος του προσώπου».
Παράλληλα, άλλες ομάδες σε Κίνα και Ιαπωνία εργάζονται για πιο ρεαλιστικά ανθρωποειδή, με τεχνητό δέρμα που αυτοΐάται και τρομακτικά ρεαλιστικά κεφάλια ρομπότ.
Αυτές οι εξελίξεις δείχνουν ότι η ανθρωποειδής ρομποτική μπαίνει σε μια νέα εποχή, όπου η ρεαλιστική εκφραστικότητα και η αλληλεπίδραση θα είναι κεντρικά στοιχεία.
Ένα φρούτο με μεγάλη ιστορία, που όμως τα τελευταία χρόνια έχει προσελκύσει το ενδιαφέρον των επιστημόνων χάρη στην υψηλή του περιεκτικότητα σε αντιοξειδωτικά.