Ένα ισχυρό μοντέλο τεχνητήες νοημοσύνης εμφανίστηκε μυστηριωδώς στο Διαδίκτυο τροφοδοτεί υποψίες ότι η κινεζική Deepseek μπορεί να δοκιμάζει σιωπηλά το νέο της σύστημα πριν από την επίσημη παρουσίασή του.

Το δωρεάν μοντέλο, με την ονομασία Hunter Alpha, εμφανίστηκε στην πλατφόρμα προγραμματιστών OpenRouter στις 11 Μαρτίου χωρίς όνομα δημιουργού. Η πλατφόρμα το περιέγραψε αργότερα ως «μοντέλο stealth».

Σε δοκιμές που πραγματοποίησε το Reuters, το chatbot περιέγραψε τον εαυτό του ως «κινεζικό μοντέλο ΑΙ που εκπαιδεύτηκε κυρίως στα κινεζικά». Είπε ακόμα ότι τα δεδομένα με τα οποία εκπαιδεύτηκαν φτάνουν μέχρι τον Μάιο του 2025, όπως συμβαίνει και με το chatbot της DeepSeek.

Όταν όμως ρωτήθηκε για τον δημιουργό του, το Hunter Alpha δεν αποκάλυψε τον δημιουργό του.

«Γνωρίζω μόνο το όνομά του, την κλίμακα των παραμέτρων μου και το μήκος του παραθύρου οδηγιών» είπε.

Η DeepSeek, η οποία έγινε διάσημη εν μία νυκτί τον Ιανουάριο του 2025, όταν παρουσίασε το ομώνυμο μοντέλο που προσφέρει υψηλές επιδόσεις με χαμηλό κόστος, δεν απάντησε στις ερωτήσεις του Reuters για το Hunter Alpha.

Ένα τρισεκατομμύριο παράμετροι

Το προφίλ του chatbot στο OpenRouter αναφέρει ότι το μοντέλο διαθέτει ένα τρισεκατομμύριο παραμέτρους, κάτι που σημαίνει ότι εκπαιδεύτηκε με ένα τρισεκατομμύριο μεταβλητές που καθορίζουν πώς το σύστημα επεξεργάζεται τη γλώσσα και δίνει απαντήσεις. Πρόκειται για έναν υψηλό αριθμό που απαιτεί σημαντικούς υπολογιστικούς πόρους για τη λειτουργία του.

Το σύστημα δέχεται οδηγίες μήκους ενός εκατομμυρίου «token», τα οποία αντιστοιχούν χονδρικά σε τμήματα λέξεων.

«Ο συνδυασμός που ξεχώρισε ήταν το ένα εκατομμύριο token σε συνδυασμό με δυνατότητες συλλογισμού και δωρεάν πρόσβαση», δήλωσε ο Ναμπίλ Χαουάμ, μηχανικός που αναπτύσσει πράκτορες AI.

«Τα περισσότερα κορυφαία μοντέλα με τέτοιο μέγεθος παραθύρου οδηγιών συνεπάγονται σημαντικό κόστος σε μεγάλη κλίμακα» επισήμανε.

Σύμφωνα με κινεζικά μέσα, οι προδιαγραφές αυτές παραπέμπουν στο νέο μοντέλο της DeepSeek, V4, το οποίο αναμένεται σύντομα, πιθανώς εντός του Απριλίου.

Η σημαντικότερη ένδειξη προέρχεται από τις συλλογιστικές ικανότητες του Hunter Alpha, εκτίμησε ο Ντάνιελ Ντιούχερστ, μηχανικός ΑΙ  που εξέτασε το μοντέλο. «Το στυλ συλλογισμού είναι δύσκολο να συγκαλυφθεί και τείνει να αντικατοπτρίζει τον τρόπο με τον οποίο εκπαιδεύτηκε ένα μοντέλο» εξήγησε.

Όπως είπε, οι εικασίες που συνδέουν το μοντέλο με τη DeepSeek είναι κατανοητές, δεδομένων των δυνατοτήτων που διαφημίζονται.

Οι ανώνυμες κυκλοφορίες μοντέλων δεν είναι ασυνήθιστες, αφού πλατφόρμες όπως το OpenRouter επιτρέπουν στους προγραμματιστές να στέλνουν ερωτήματα σε δεκάδες μοντέλα τεχνητής νοημοσύνης ταυτόχρονα, ένας δημοφιλής τρόπος δοκιμών για νέα συστήματα.

Ένα ανώνυμο μοντέλο με την ονομασία Pony Alpha εμφανίστηκε στο OpenRouter τον Φεβρουάριο. Πέντε ημέρες αργότερα, η κινεζική Zhipu AI επιβεβαίωσε ότι αποτελούσε μέρος του συστήματος GLM-5.

Το προφίλ του Hunter Alpha στην πλατφόρμα αναφέρει ότι οι οδηγίες των χρηστών και οι απαντήσεις του μοντέλου «καταγράφονται από τον πάροχο και ενδέχεται να χρησιμοποιηθούν για τη βελτίωσή του».

Αυτό παραπέμπει στη διαδεδομένη πρακτική των εταιρειών ΑΙ να λανσάρουν μοντέλα ανώνυμα για τη συλλογή αμερόληπτων σχολίων.