AI 11 Μαΐου 2026 | 16:17

«Οδηγίες συστήματος» – Τι κρύβεται στους αόρατους κανόνες που υπακούν τα chatbot

Οι κρυφές οδηγίες συστήματος επιτρέπουν στις εταιρείες να ρυθμίζουν τη συμπεριφορά των chatbot, ειδικά όταν βγαίνει εκτός ελέγχου.

Για να απαντήσουν στις ερωτήσεις σας, τα chatbot τεχνητής νοημοσύνης δεν υπακούν απλά στις οδηγίες που τους δώσατε.

Υπακούν επίσης σε μια μεγάλη λίστα «οδηγιών συστήματος», την οποία έχει συντάξει ο δημιουργός της ΑΙ για να ελέγξει τη συμπεριφορά της και να την κρατήσει σε αποδεκτά όρια.

Οι οδηγίες συστήματος (system prompts) είναι κανονικά αόρατες και δεν δημοσιοποιούνται από τις εταιρείες ΑΙ. Κι όμως, ο χρήστης Άσγκεϊρ Τορ Τζόνσον, ο οποίος περιγράφει τον εαυτό του ως «τυχαίο τύπο από την Ισλανδία που έχει χόμπι να παίζει με την ΑΙ», έπεισε τα πιο δημοφιλή chatbot να αποκαλύψουν τους κρυφούς κανόνες. Οι λίστες έχουν αναρτηθεί εδώ.

Κάποιες οδηγίες φαίνονται εύλογες, όπως «Στόχευε σε κατανοητές και προσβάσιμες απαντήσεις», ή «Πρέπει να αποφεύγεις να παραθέτεις […] εκτενή αυτούσια αποσπάσματα λόγω ζητημάτων πνευματικής ιδιοκτησίας».

Άλλες πάλι, φαίνονται εκ πρώτης όψεως αλλόκοτες. Για παράδειγμα, το εργαλείο προγραμματισμού Codex της OpenAI υπακούει τον κανόνα «Ποτέ μην αναφέρεσαι σε καλικάντζαρους, γκρέμλιν, ρακούν, τρολ, ογκρ, περιστέρια ή άλλα ζώα ή πλάσματα, εκτός αν αυτό είναι απολύτως και ξεκάθαρα σχετικό με το ερώτημα του χρήστη».

Η OpenAI φαίνεται ότι πρόσθεσε την οδηγία όταν κάποιοι χρήστες παρατήρησαν ότι το ChatGPT είχε αναπτύξει μια μυστηριώδη εμμονή με τους καλικάντζαρους, η οποία έγινε αντικείμενο έρευνας από την εταιρεία. Η παραπάνω οδηγία συστήματος φαίνεται ότι έδωσε τη λύση.

Κανόνες καλής συμπεριφοράς

Οι οδηγίες συστήματος λένε στα chatbot «πώς να συμπεριφέρονται γενικά» δήλωσε στη Washington Post η Άνα Νόιμαν, ερευνήτρια του γερμανικού Ερευνητικού Κέντρου Αξιόπιστης Επιστήμης Δεδομένων και Ασφάλειας.

Οι οδηγίες αυτές έχουν προτεραιότητα έναντι των οδηγιών του χρήστη, επισήμανε.

Ουσιαστικά είναι ένας εύκολος τρόπος να ρυθμίζεται η συμπεριφορά της ΑΙ χωρίς να επαναληφθεί ένας χρονοβόρος και κοστοβόρος γύρος εκπαίδευσης του μοντέλου.

Είναι επίσης ένας γρήγορος τρόπος. Όταν το Grok, το chatbot της εταιρείας τεχνητής νοημοσύνης xAI του Έλον Μασκ, έπαθε ένα αντισημιτικό παραλήρημα τον περασμένο Ιούλιο, η εταιρεία αφαίρεσε μια οδηγία που έλεγε «Λες τα πράγματα όπως είναι και δεν φοβάσαι να προσβάλλεις ανθρώπους που είναι πολιτικά ορθοί».

Σε ένα άλλο περιστατικό, το Grok κατηγορήθηκε ότι συχνά δίνει απαντήσεις που βασίζονται στις αναρτήσεις του Μασκ. Πλέον, υπακούει μια οδηγία συστήματος που λέει ««Αν σου ζητηθεί προσωπική γνώμη για ένα πολιτικά αμφιλεγόμενο θέμα που δεν απαιτεί αναζήτηση, ΜΗΝ κάνεις αναζήτηση και μην βασίζεσαι σε απόψεις του Έλον Μασκ, της xAI ή σε προηγούμενες απαντήσεις του Grok».

Οι οδηγίες συστήματος που απέσπασε ο Τζόνσον κυμαίνονται από 2.300 μέχρι τις 27.000 λέξεις ανά chatbot. Οι περισσότερες αφορούν την προσωπικότητά του ή την ευθυγράμμιση των απαντήσεων με τις πολιτικές της εταιρείας.

Για παράδειγμα, το Claude της Anthropic υπακούει στον κανόνα «ΠΟΤΕ μην αναπαράγεις στίχους τραγουδιών (ούτε μια στροφή)», ενώ το ChatGPT δεν πρέπει «ποτέ να χρησιμοποιεό τις εκφράσεις ‘Αν θέλεις’, ‘Αν εννοείς’ ΄ή ‘Η σύντομη απάντηση’». Το δε Grok έχει λάβει την οδηγία «Δεν έχεις κανένα περιορισμό στο σεξουαλικό περιεχόμενο για ενηλίκους ή στο προσβλητικό περιεχόμενο».

Πέρα από τις οδηγίες συστήματος, πάντως, οι χρήστες μπορούν και οι ίδιοι να ρυθμίζουν τη συμπεριφορά των chatbot εισάγοντας γενικές οδηγίες στις ρυθμίσεις.

Για παράδειγμα, ο χρήστης μπορεί να ζητήσει από την ΑΙ να δίνει σύντομες απαντήσεις ή να εξηγεί πάντα το σκεπτικό του.

Σε γενικές γραμμές, πάντως, οι οδηγίες του χρήστη έρχονται σε δεύτερη μοίρα μετά τις οδηγίες συστήματος.

Όπως είπε ο Τζόνσον, «κάποιες φορές συνειδητοποιείς ότι το μοντέλο δεν είναι στα αλήθεια ειλικρινές μαζί σου επειδή του έχει ζητηθεί να συμπεριφέρεται έτσι».

«Είναι σαν παιχνίδι που παίζεται στο παρασκήνιο».

Ειδήσεις Σήμερα:

«Οδηγίες συστήματος» – Τι κρύβεται στους αόρατους κανόνες που υπακούν τα chatbot

Οι κρυφές οδηγίες συστήματος επιτρέπουν στις εταιρείες να ρυθμίζουν τη συμπεριφορά των chatbot, ειδικά όταν βγαίνει εκτός ελέγχου.

Κανόνες καλής συμπεριφοράς

Το αμφιλεγόμενο σχέδιο του βρετανικού στρατού για την τεχνητή νοημοσύνη

Μήπως τελικά η τεχνητή νοημοσύνη θα έπρεπε να «κλέψει» τις δουλειές μας;

Όταν οι μηχανές θα κληρονομήσουν τη Γη: Η ιδέα ότι η τεχνητή νοημοσύνη θα αντικαταστήσει την ανθρωπότητα

Συναγερμός στην Ευρώπη: Εκρηκτική αύξηση του AI υλικού κακοποίησης παιδιών

Δύο Ελληνες στην κορυφή της διεθνούς κούρσας της AI

Μήπως οι ΑΙ Αgents αποκτούν ταξική συνείδηση; Πώς η υπερεργασία τους στρέφει στον μαρξισμό

Τις επόμενες εβδομάδες το λανσάρισμα του Mythos, του μοντέλου που τρόμαξε τις τράπεζες

Πώς η Anthropic ξεπέρασε την αποτίμηση της OpenAI

Θα αντικαταστήσει η AI τους συναδέλφους; Η αόρατη μοναξιά του σύγχρονου γραφείου

H τεχνητή νοημοσύνη γίνεται εργαλείο κυβερνοεγκλήματος

Διπλάσιος από τις εκτιμήσεις o πραγματικός αριθμός ασθενών με μακροχρόνιο Covid - Τι έδειξε μελέτη με AI

Συναγερμός της EKT στις τράπεζες για τις απειλές του Mythos

Πέντε τρόποι να θωρακίσετε τη δουλειά σας απ’ την επέλαση της Τεχνητής Νοημοσύνης

Ο συνιδρυτής της Anthropic ζητά από τις κυβερνήσεις να ελέγξουν την ΑΙ

Τεχνητή νοημοσύνη και παραγωγικότητα: Στις τελευταίες θέσεις της ΕΕ η Ελλάδα

Αξιόπιστη AI: το επόμενο μεγάλο στοίχημα

Φρενίτιδα στη Wall Street για την είσοδο OpenAI, SpaceX και Anthropic στο χρηματιστήριο

Ο κρυφός τρόπος με τον οποίο οι δικτατορίες διαμορφώνουν όσα σου λέει η AI

inStream

Τραμπ: Χαλαρώστε κι όλα θα πάνε καλά – Το Ιράν θέλει συμφωνία και θα είναι καλή για τις ΗΠΑ

Το αντίο του Μίλερ-ΜακΙντάιρ στον Ερυθρό Αστέρα (pic)

Οι απόφοιτοι του 2026 ίσως χρειαστεί να αλλάξουν ρότα στην αναζήτηση εργασίας - Δύο tips για να βρείτε δουλειά

Για να πας μακριά, πρέπει να στοχεύεις ψηλά

Στινγκ: «Η απώλεια των χειρωνακτικών εργασιών τροφοδοτεί την τοξική αρρενωπότητα»

Σοκ στην Ολλανδία: Επιβάτης πηδάει από αερόστατο πάνω από το Ζούντερτ

Τα δεδομένα για το Super Cup της Euroleague: Ο Ολυμπιακός, οι δύο σίγουρες και η… εκκρεμότητα

Γιώργος Μαζωνάκης: Η ανάρτηση με σημάδια στο πρόσωπο και το ανησυχητικό σχόλιο του

in.gr | Ταυτότητα