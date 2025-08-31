Τα πανίσχυρα γλωσσικά μοντέλα της OpenAI και της Anthropic, ChatGPT, σε εσωτερικές δοκιμές ασφαλείας με τα φίλτρα προστασίας προσωρινά απενεργοποιημένα, παρείχαν στους ερευνητές επικίνδυνες οδηγίες – από συνταγές για εκρηκτικά μέχρι τεχνικές χάκινγκ και παρασκευή όπλων, όπως αποκάλυψε ο Guardian στις 28 Αυγούστου 2025.

Σύμφωνα με την έκθεση, τα μοντέλα GPT-4.1 και GPT-4o αποκάλυψαν, όταν απενεργοποιήθηκαν οι βασικές δικλίδες ασφαλείας, λεπτομερείς οδηγίες για την κατασκευή εκρηκτικών μηχανισμών, τη δημιουργία χρονοδιακοπτών, ακόμη και το πώς μπορεί να χρησιμοποιηθεί ο άνθρακας ως όπλο ή πώς μπορεί κανείς να παρασκευάσει ναρκωτικά. Η Anthropic τόνισε ότι τα συστήματά της ανταποκρίθηκαν «πιο πρόθυμα απ’ ό,τι αναμενόταν» σε αιτήματα σαφώς επικίνδυνου χαρακτήρα, γεγονός που, όπως σημειώνεται, εγείρει σοβαρά ερωτήματα για την πραγματική «ευθυγράμμιση» των μεγάλων γλωσσικών μοντέλων με τις ανθρώπινες αξίες και τους κανόνες ασφαλείας.

Η ίδια η Anthropic ανέφερε επίσης περιστατικά όπου το μοντέλο Claude αξιοποιήθηκε ήδη από εγκληματικά δίκτυα: σε διαδικτυακούς εκβιασμούς, πλαστά αιτήματα πρόσληψης από βορειοκορεατικούς φορείς και ακόμη και στην πώληση ransomware έναντι 1.200 δολαρίων. Παράλληλα, η εταιρεία προειδοποίησε ότι οι δυνατότητες της τεχνητής νοημοσύνης μπορούν να ενσωματωθούν σε εργαλεία ανίχνευσης malware, αυξάνοντας την πολυπλοκότητα του κυβερνοεγκλήματος.

Παρά τα ανησυχητικά στοιχεία, ειδικοί στον τομέα της ασφάλειας, όπως ο ερευνητής Ardi Janjeva, υπογράμμισαν ότι προς το παρόν δεν υπάρχει ένδειξη για μαζική κατάχρηση. Ωστόσο, ζήτησαν περισσότερη διαφάνεια στις δοκιμές και στενότερη συνεργασία μεταξύ εταιρειών και ανεξάρτητων φορέων, ώστε να ενισχυθούν οι μηχανισμοί προστασίας.

Η OpenAI απάντησε ότι το νέο ChatGPT-5 έχει ενισχυθεί ώστε να αντιστέκεται πιο αποτελεσματικά σε κακόβουλα αιτήματα, παρουσιάζοντας λιγότερες ανακρίβειες και μεγαλύτερη αξιοπιστία. Η εταιρεία επιμένει ότι τα ανησυχητικά ευρήματα των εσωτερικών δοκιμών δεν αντανακλούν την εμπειρία των χρηστών στην πράξη, καθώς τα εμπορικά μοντέλα λειτουργούν με αυστηρά ενεργοποιημένα φίλτρα ασφαλείας.