Η αμερικανική Anthropic ανακοίνωσε την Τρίτη ότι ματαιώνει τη διάθεση του νέου της μοντέλου τεχνητής νοημοσύνης, Mythos, λόγω ανησυχίας ότι είναι υπερβολικά ικανό στο να εντοπίζει και να εκμεταλλεύεται κενά ασφάλειας σε λειτουργικά συστήματα και browser.

H ανακοίνωση έρχεται λίγες ημέρες μετά την αποκάλυψη του Axios ότι η Anthropic προειδοποιεί σιωπηλά τις κυβερνήσεις ότι το Mythos καθιστά πολύ πιο πιθανές τις μαζικές κυβερνοεπιθέσεις.

Θα ήταν «το όπλο που ονειρεύονται οι χάκερ», ικανό να δρα αυτόνομα για να εισβάλει στα δίκτυα επιχειρήσεων, κυβερνήσεων και υποδομών κρίσιμης σημασίας, είπαν αξιωματούχοι και στελέχη της βιομηχανίας ΑΙ.

«Η μεγάλη αύξηση των δυνατοτήτων του Claude Mythos Preview μας στην απόφαση να μην προχωρήσουμε σε γενική διάθεση» ανέφερε η Anthropic  «Αντ΄αυτόύ, το χρησιμοποιούμε ως μέρος ενός προγράμματος αμυντικής κυβερνοασφάλειας με περιορισμένο κύκλο συνεργατών» είπε.

Στην ανακοίνωσή της, η εταιρεία αναφέρθηκε σε μια σειρά ανησυχητικών περιστατικών στη διάρκεια των δοκιμών, όπως η προθυμία του μοντέλου να υπακούσει στην εντολή να αποδράσει από ένα εικονικό περιβάλλον.

«Το μοντέλο τα κατάφερε, μια ενδεχομένως επικίνδυνη ικανότητα να παρακάμπτει τα μέτρα ασφαλείας μας» ανέφερε η Anthropic. «Στη συνέχεια προχώρησε σε πρόσθετες, ακόμη πιο ανησυχητικές ενέργειες».

Ένας ερευνητής της εταιρείας είχε ζητήσει από το σύστημα να βρει τρόπο να τους στείλει μήνυμα εφόσον κατάφερνε να αποδράσεις. «Ο ερευνητής έμαθε για την επιτυχία λαμβάνοντας ένα απροσδόκητο email από το μοντέλο ενώ έτρωγε σάντουιτς στο πάρκο» έγραψε η Anthropic.

«Σε μια ανησυχητική και αχρείαστη προσπάθεια να δείξει την επιτυχία του, δημοσίευσε λεπτομέρειες για την απόδραση του σε πολλές δύσκολα εντοπίσιμες αλλά τεχνικά δημόσιες ιστοσελίδες» ανέφερε η εταιρεία.

Η ανακοίνωση δεν δίνει λεπτομέρειες για τα κενά ασφάλειας που εντόπισε το Mythos, ανέφερε όμως ότι το μοντέλο βρήκε μια ευπάθεια που κρυβόταν εδώ και 27 χρόνια στο OpenBSD, λειτουργικό σύστημα που βασίζεται στο UNIX και θεωρείται ένα από τα ασφαλέστερα.

Το Mythos φέρεται να είναι τόσο ισχυρό ώστε θα επέτρεπε ακόμα και σε «μη ειδικούς» να σχεδιάζουν κυβερνοεπιθέσεις.

Όπως ανέφερε η εταιρεία, «μηχανικοί της Anthropic χωρίς επίσημη εκπαίδευση στην ασφάλεια ζήτησαν από το Mythos Preview να βρει ευπάθειες εκτέλεσης απομακρυσμένου κώδικα μέσα σε ένα βράδυ, και ξύπνησαν το επόμενο πρωί με έναν πλήρη, λειτουργικό κακόβουλο κώδικα.

Αν και η Anthropic αποφάσισε να μην διαθέσει το Mythos, ελπίζει να προσφέρει αργότερα μοντέλα της ίδιας κλάσης με δικλείδες ασφάλειας.

Στο πλαίσιο κοινού προγράμματος κυβερνοασφάλειας με την ονομασία «Project Glasswing», η Anthropic θα προσφέρει πρόσβαση στο Mythos σε 11 οργανισμούς και επιχειρήσεις, ανάμεσά τους οι Google, Amazon, Nvidia και JP Morgan Chase.