Νευρωνικό δίκτυο «αναγνωρίζει σκίτσα καλύτερα από ό,τι οι άνθρωποι»
Ερευνητές στη Βρετανία καμαρώνουν για τις επιδόσεις του Sketch-a-Net, ενός προγράμματος που βασίζεται στην αρχιτεκτονική του εγκεφάλου και μπορεί να αναγνωρίζει το θέμα απλών σχεδίων «καλύτερα από ό,τι οι άνθρωποι».
Ερευνητές στη Βρετανία καμαρώνουν για τις επιδόσεις του Sketch-a-Net, ενός προγράμματος που βασίζεται στην αρχιτεκτονική του εγκεφάλου και μπορεί να αναγνωρίζει το θέμα απλών σχεδίων «καλύτερα από ό,τι οι άνθρωποι».
Το λογισμικό του Πανεπιστημίου Queen Mary του Λονδίνου μπορεί για παράδειγμα να ξεχωρίζει το σχέδιο ενός γλάρου από το σκίτσο ενός περιστεριού με πιθανότητα επιτυχίας 74,9%, συγκριτικά με το 73,1% που πετυχαίνουν κατά μέσο όρο οι άνθρωποι.
Μπορεί επίσης να ξεχωρίζει παραλλαγές του ίδιου θέματος, όπως «πουλί που πετάει» ή «πουλί που στέκεται» με ακρίβεια 42,5%, συγκριτικά με την ανθρώπινη επίδοση του 24,8%.
«Τα σκίτσα είναι ενδιαφέρον αντικείμενο μελέτης επειδή χρησιμοποιούνται από τα προϊστορικά χρόνια ως μορφή επικοινωνίας» αναφέρει ο Τίμοθι Χοσπεντάλες, μέλος της ερευνητικής ομάδας. Οι άνθρωποι αντιλαμβάνονται τα σχέδια σχεδόν διαισθητικά, οι υπολογιστές όμως δυσκολεύονται να αντλήσουν νόημα από αφηρημένες ασπρόμαυρες γραμμές.
Το Sketch-a-Net ουσιαστικά μιμείται τον τρόπο με τον οποίο ο ανθρώπινος εγκέφαλος μαθαίνει. Το λογισμικό αποτελείται από έναν μεγάλο αριθμό μαθηματικών «κόμβων», οι οποίοι συνδέονται μεταξύ τους όπως οι νευρώνες του νευρικού συστήματος. Όταν του δοθεί μια λίστα σκίτσων με γνωστό θέμα, το νευρωνικό δίκτυο σταδιακά μαθαίνει τι αντιπροσωπεύει το καθένα, και μπορεί στη συνέχεια να διαβάσει νέα, άγνωστα σκίτσα.
Η μελέτη βασίστηκε σε προϋπάρχουσα βάση δεδομένων που περιέχει 250 κατηγορίες σχεδίων με 80 σκίτσα η καθεμία.
Όπως επισημαίνουν οι ερευνητές, κλειδί για την επιτυχία του λογισμικού είναι η ικανότητά του να παρακολουθεί με ποια σειρά σχεδιάζονται οι γραμμές -ένα σημαντικό στοιχείο που απουσίαζε από προηγούμενες, αντίστοιχες προσπάθειες.
Σύμφωνα με την ερευνητική ομάδα, το Sketch-a-Net θα μπορούσε να αξιοποιηθεί σε υπολογιστές με οθόνες αφής, επιτρέποντας για παράδειγμα στο χρήστη να εισάγει σκίτσα αντί για λέξεις κλειδιά.
Θα μπορούσε επίσης να χρησιμοποιηθεί από την αστυνομία σε περιπτώσεις που το σκίτσο ενός υπόπτου πρέπει να ταυτοποιηθεί σε εικόνες από κάμερες παρακολούθησης.
Η μελέτη έχει γίνει δεκτή για παρουσίαση στο Βρετανικό Συνέδριο Μηχανικής Όρασης και είναι διαθέσιμη στην υπηρεσία προδημοσίευσης arXiv.org.
Newsroom ΑΛΤΕΡ ΕΓΚΟ
- «Έξι χρόνια μετά, διαλέγω ακόμα τη ζωή»: Συγκινεί η Ιωάννα Παλιοσπύρου – Η ανάρτησή της
- Κιμ Καρντάσιαν: 90 κιλά κοκαΐνη μετέφερε φορτηγό του brand της, Skims
- Final Four: Απαγόρευση συναθροίσεων και μοτοπορειών στο κέντρο της Αθήνας
- Τελικός Europa League 2026 – Το είδαμε κι αυτό, οπαδοί της Άστον Βίλα έκλεψαν ντελιβερά! (vid)
- Στέλεχος Φενέρμπαχτσε: «Θα έχουμε πάνω από τέσσερις χιλιάδες οπαδούς στην Αθήνα»
- Σταύρος Φλώρος: Ο μεγάλος νικητής του Survivor 2026 μετά τον ακρωτηριασμό του


