H Google και ο Γιάννης Ασσαέλ χάκαραν την αρχαιολογία – Μοντέλο ΑΙ μαντεύει λατινικές επιγραφές
Μοντέλο που συμπληρώνει και χρονολογεί φθαρμένες ρωμαϊκές επιγραφές λύνει τα χέρια ιστορικών και αρχαιολόγων. Ο έλληνας Γιάννης Ασσαέλ επικεφαλής της μελέτης.
Μοντέλο τεχνητής νοημοσύνης που ανέπτυξε η Google DeepMind συμπληρώνει τα χαμένα τμήματα αρχαίων λατινικών επιγραφών και μαντεύει τη χρονολογία και την προέλευσή τους, ένα εργαλείο που δίνει νέα ώθηση στην αρχαιολογία και την επιστήμη της επιγραφικής.
Ο Γιάννης Ασσαέλ της DeepMind, σύμβουλος της ελληνικής κυβέρνησης για την τεχνητή νοημοσύνη, ήταν επικεφαλής της ομάδας που ανέπτυξε το μοντέλο Aeneas, το οποίο παίρνει το όνομα του γιου της Αφροδίτης και ήρωα της Τροίας Αινεία.
Για την αποκατάσταση και τη χρονολόγηση αρχαίων επιγραφών, οι ιστορικοί πρέπει πρώτα να εντοπίζουν κείμενα με παρόμοια φρασεολογία, σύνταξη ή ενδείξεις προέλευσης, Χάρη στην ικανότητά του να συγκρίνει τις φθαρμένες επιγραφές με χιλιάδες άλλα παραδείγματα, το Aeneas επιταχύνει αυτή την περίπλοκη και χρονοβόρο διαδικασία, ανέφερε η Google σε ανάρτησή της.
Το σύστημα, εξηγεί η ερευνητική ομάδα σε μελέτη που δημοσιεύεται στο Nature, εκπαιδεύτηκε στα λατινικά αναλύοντας σχεδόν 180.000 επιγραφές του ρωμαϊκού κόσμου. Στο 5% των περιπτώσεων τα κείμενα συνοδεύονταν από φωτογραφίες των επιγραφών.
Τρία υποσυστήματα
Το πρώτο από τα τρία νευρωνικά δίκτυα του συστήματος μαντεύει τα αποσπάσματα που λείπουν, περίπου όπως το ChatGPT και άλλα γλωσσικά μοντέλα εκτιμούν ποια λέξη είναι στατιστικά πιθανότερο να ακολουθεί μια άλλη.
Ένα δεύτερο νευρωνικό δίκτυο προβλέπει την προέλευση του κειμένου και ένα τρίτο εκτιμά την ηλικία του. Μαζί με τα αποτελέσματα, το Aeneas παραθέτει παρόμοιες επιγραφές από τη βιβλιοθήκη του.
«Το Aeneas μπορεί να ανακτήσει αντίστοιχα κείμενα από ολόκληρο το σετ δεδομένων μέσα σε μια στιγμή» σχολίασε στον δικτυακό τόπο του Nature o Ασσαέλ. Από ελληνικής πλευράς στην ερευνητική ομάδα συμμετείχε και ο Γιάννης Παυλόπουτλος του Οικονομικού Πανεπιστημίου Αθηνών.
Ο Γιάννης Ασσαέλ της Google DeepMind σε φωτογραφία από το προσωπικό του αρχείο
Προκειμένου να εκτιμηθεί η αξιοπιστία του, το μοντέλο αναμετρήθηκε με 23 επιγραφολόγους στην αποκατάσταση, την χρονολόγηση και εκτίμηση της προέλευσης επιγραφών από τις οποίες είχαν απαλειφθεί τμήματα.
Το μοντέλο εκτίμησε την ηλικία με περιθώριο 13 ετών από τις πραγματικές χρονολογίες, ενώ οι εκτιμήσεις των επιγραφολόγων είχαν εύρος 31 ετών.
Όσον αφορά την αποκατάσταση κειμένου, οι επιδόσεις του μοντέλου ήταν ελάχιστα χαμηλότερες από των επιγραφολόγων. Η ακρίβεια όμως αυξήθηκε δραματικά όταν οι επιγραφολόγοι αξιοποίησαν τις απαντήσεις του μοντέλου.
Σε επόμενη φάση, το μοντέλο δοκιμάστηκε στο γνωστό κείμενο Res gestae divi Augusti που εξιστορεί τα επιτεύγματα του ρωμαίου αυτοκράτορα Αυγούστου. Οι προβλέψεις του για την ηλικία του έργου ήταν παρόμοιες με τις εκτιμήσεις ειδικών. Το μοντέλο αναγνώρισε επίσης ορθογραφικές παραλλαγές και άλλα χαρακτηριστικά που θα βοηθούσαν τους ιστορικούς στην εκτίμηση της ηλικίας και της προέλευσης.
Και όταν κλήθηκε να εξετάσει έναν βωμό με λατινικές επιγραφές, το Aeneas παρέθεσε παρόμοια κείμενα από έναν άλλο βωμό, παρόλο που δεν γνώριζε ότι οι δύο βωμοί βρίσκονται στην ίδια περιοχή και χρονολογούνται την ίδια περίοδο.
Η τεχνολογία του Aeneas ενσωματώνεται τώρα και σε ένα διαφορετικό μοντέλο που εκπαιδεύτηκε στα αρχαία ελληνικά (Google DeepMind)
Αποκρυπτογράφηση και στα ελληνικά
Το ίδιο μοντέλο θα μπορούσε να εκπαιδευτεί σε άλλες γλώσσες και άλλα είδη κειμένων, ακόμα και σε αρχαία νομίσματα.
Τα μοντέλα Aeneas και Ithaca είναι μόνο δύο παραδείγματα του πώς η τεχνητή νοημοσύνη γίνεται πολύτιμο εργαλείο για τους ιστορικούς και τους αρχαιολόγους.
Το 2023, ένας φοιτητής 21 ετών κέρδισε έναν διαγωνισμό με την ονομασία Vesuvius Challenge αναπτύσσοντας ένα σύστημα ΑΙ που διάβασε απόσπασμα αρχαιοελληνικού κειμένου σε τυλιγμένο πάπυρο ο οποίος είχε απανθρακωθεί στην έκρηξη του Βεζούβιου το 79 μ.Χ.