
«Οδηγίες συστήματος» – Τι κρύβεται στους αόρατους κανόνες που υπακούν τα chatbot
Οι κρυφές οδηγίες συστήματος επιτρέπουν στις εταιρείες να ρυθμίζουν τη συμπεριφορά των chatbot, ειδικά όταν βγαίνει εκτός ελέγχου.
Για να απαντήσουν στις ερωτήσεις σας, τα chatbot τεχνητής νοημοσύνης δεν υπακούν απλά στις οδηγίες που τους δώσατε.
Υπακούν επίσης σε μια μεγάλη λίστα «οδηγιών συστήματος», την οποία έχει συντάξει ο δημιουργός της ΑΙ για να ελέγξει τη συμπεριφορά της και να την κρατήσει σε αποδεκτά όρια.
Οι οδηγίες συστήματος (system prompts) είναι κανονικά αόρατες και δεν δημοσιοποιούνται από τις εταιρείες ΑΙ. Κι όμως, ο χρήστης Άσγκεϊρ Τορ Τζόνσον, ο οποίος περιγράφει τον εαυτό του ως «τυχαίο τύπο από την Ισλανδία που έχει χόμπι να παίζει με την ΑΙ», έπεισε τα πιο δημοφιλή chatbot να αποκαλύψουν τους κρυφούς κανόνες. Οι λίστες έχουν αναρτηθεί εδώ.
Κάποιες οδηγίες φαίνονται εύλογες, όπως «Στόχευε σε κατανοητές και προσβάσιμες απαντήσεις», ή «Πρέπει να αποφεύγεις να παραθέτεις […] εκτενή αυτούσια αποσπάσματα λόγω ζητημάτων πνευματικής ιδιοκτησίας».
Άλλες πάλι, φαίνονται εκ πρώτης όψεως αλλόκοτες. Για παράδειγμα, το εργαλείο προγραμματισμού Codex της OpenAI υπακούει τον κανόνα «Ποτέ μην αναφέρεσαι σε καλικάντζαρους, γκρέμλιν, ρακούν, τρολ, ογκρ, περιστέρια ή άλλα ζώα ή πλάσματα, εκτός αν αυτό είναι απολύτως και ξεκάθαρα σχετικό με το ερώτημα του χρήστη».
Η OpenAI φαίνεται ότι πρόσθεσε την οδηγία όταν κάποιοι χρήστες παρατήρησαν ότι το ChatGPT είχε αναπτύξει μια μυστηριώδη εμμονή με τους καλικάντζαρους, η οποία έγινε αντικείμενο έρευνας από την εταιρεία. Η παραπάνω οδηγία συστήματος φαίνεται ότι έδωσε τη λύση.
Κανόνες καλής συμπεριφοράς
Οι οδηγίες συστήματος λένε στα chatbot «πώς να συμπεριφέρονται γενικά» δήλωσε στη Washington Post η Άνα Νόιμαν, ερευνήτρια του γερμανικού Ερευνητικού Κέντρου Αξιόπιστης Επιστήμης Δεδομένων και Ασφάλειας.
Οι οδηγίες αυτές έχουν προτεραιότητα έναντι των οδηγιών του χρήστη, επισήμανε.
Ουσιαστικά είναι ένας εύκολος τρόπος να ρυθμίζεται η συμπεριφορά της ΑΙ χωρίς να επαναληφθεί ένας χρονοβόρος και κοστοβόρος γύρος εκπαίδευσης του μοντέλου.
Είναι επίσης ένας γρήγορος τρόπος. Όταν το Grok, το chatbot της εταιρείας τεχνητής νοημοσύνης xAI του Έλον Μασκ, έπαθε ένα αντισημιτικό παραλήρημα τον περασμένο Ιούλιο, η εταιρεία αφαίρεσε μια οδηγία που έλεγε «Λες τα πράγματα όπως είναι και δεν φοβάσαι να προσβάλλεις ανθρώπους που είναι πολιτικά ορθοί».
Σε ένα άλλο περιστατικό, το Grok κατηγορήθηκε ότι συχνά δίνει απαντήσεις που βασίζονται στις αναρτήσεις του Μασκ. Πλέον, υπακούει μια οδηγία συστήματος που λέει ««Αν σου ζητηθεί προσωπική γνώμη για ένα πολιτικά αμφιλεγόμενο θέμα που δεν απαιτεί αναζήτηση, ΜΗΝ κάνεις αναζήτηση και μην βασίζεσαι σε απόψεις του Έλον Μασκ, της xAI ή σε προηγούμενες απαντήσεις του Grok».
Οι οδηγίες συστήματος που απέσπασε ο Τζόνσον κυμαίνονται από 2.300 μέχρι τις 27.000 λέξεις ανά chatbot. Οι περισσότερες αφορούν την προσωπικότητά του ή την ευθυγράμμιση των απαντήσεων με τις πολιτικές της εταιρείας.
Για παράδειγμα, το Claude της Anthropic υπακούει στον κανόνα «ΠΟΤΕ μην αναπαράγεις στίχους τραγουδιών (ούτε μια στροφή)», ενώ το ChatGPT δεν πρέπει «ποτέ να χρησιμοποιεό τις εκφράσεις ‘Αν θέλεις’, ‘Αν εννοείς’ ΄ή ‘Η σύντομη απάντηση’». Το δε Grok έχει λάβει την οδηγία «Δεν έχεις κανένα περιορισμό στο σεξουαλικό περιεχόμενο για ενηλίκους ή στο προσβλητικό περιεχόμενο».
Πέρα από τις οδηγίες συστήματος, πάντως, οι χρήστες μπορούν και οι ίδιοι να ρυθμίζουν τη συμπεριφορά των chatbot εισάγοντας γενικές οδηγίες στις ρυθμίσεις.
Για παράδειγμα, ο χρήστης μπορεί να ζητήσει από την ΑΙ να δίνει σύντομες απαντήσεις ή να εξηγεί πάντα το σκεπτικό του.
Σε γενικές γραμμές, πάντως, οι οδηγίες του χρήστη έρχονται σε δεύτερη μοίρα μετά τις οδηγίες συστήματος.
Όπως είπε ο Τζόνσον, «κάποιες φορές συνειδητοποιείς ότι το μοντέλο δεν είναι στα αλήθεια ειλικρινές μαζί σου επειδή του έχει ζητηθεί να συμπεριφέρεται έτσι».
«Είναι σαν παιχνίδι που παίζεται στο παρασκήνιο».
- Η επόμενη (δύσκολη) αποστολή του Χάνσι Φλικ
- Οργή Γεωργιάδη για τη φωτογραφία με γυναίκα στα social – «Δεν είμαι εγώ, μάλλον είναι AI»
- Καλλιθέα: Βίντεο ντοκουμέντο με την 43χρονη τραυματισμένη μετά τους πυροβολισμούς στο μπαρ – Πώς συνέβη το επεισόδιο
- Αλλαγές στην ΚΑΕ ΠΑΟΚ: Παρελθόν οι Βεζυρτζής, Οικονομίδης, Μπουντούρης
- Οι ευρωβουλευτές του ΠΑΣΟΚ ζητούν παρέμβαση της Κομισιόν για αρχειοθέτηση Τζαβέλλα και Κράτος Δικαίου
- Η ΕΕ ενέκρινε κυρώσεις κατά των βίαιων εποίκων στη Δυτική Όχθη – Και στη Χαμάς για την 7η Οκτωβρίου






