Ένας αλγόριθμος ικανός να μάθει να παίζει 49 απλά βιντεοπαιχνίδια του Atari 2600, παρακολουθώντας μόνο τα πίξελ στην οθόνη να αλλάζουν χρώμα και το σκορ, αναπτύχθηκε στους κόλπους της Google από την ομάδα που εξαγόρασε το 2014 η εταιρεία, επενδύοντας στην εξυπνάδα τους 400 εκατομμύρια δολάρια. Οι DeepMind χαρακτηρίζουν το επίτευγμα ως το πρώτο βήμα σε μια μακρόχρονη προσπάθεια να μάθουν στις μηχανές να μαθαίνουν.

Τα παιχνίδια τα οποία κλήθηκε να μάθει ο υπολογιστής που έτρεχε το πρόγραμμα της DeepMind ήταν μεταξύ άλλων το Space Invaders, το Breakout, το Seaquest, το  και το Pong. Στα παιχνίδια αυτά, ο παίκτης καλείται να πατήσει ένα πλήκτρο -συνήθως το spacebar- την κατάλληλη στιγμή για να πετύχει τον στόχο του -μια μπάλα που αναπηδά ή τους εξωγήινους που εισβάλλουν στο Διάστημα. Ως δύσκολο χαρακτηρίζεται το εγχείρημα να μάθει ο ίδιος αλγόριθμος να παίξει για παράδειγμα, PacMan, όπου θα πρέπει να διαβεί έναν λαβύρινθο αποφεύγοντας τα τερατάκια. Αυτό που κατορθώνει ο αλγόριθμος της εταιρείας με έδρα στο Λονδίνο είναι να συσχετίζει την αύξηση του σκορ με τις αλλαγές στο παιχνίδι και τα αλλεπάλληλα χτυπήματα του εκάστοτε πλήκτρου. Όπως ένα μωρό ανοίγει για πρώτη φορά τα μάτια του, έτσι και ο αλγόριθμος της DeepMind επιχειρεί να μάθει από όσα παρατηρεί να προκαλούν οι κινήσεις του (αξιολογώντας παράλληλα το αποτέλεσμα, με βάση την βαθμολόγηση).

Εντούτοις, το πρόγραμμα τεχνητής νοημοσύνης που έχει ως μοναδικά δεδομένα τα pixel και το σκορ του παιχνιδιού κατάφερε να να ξεπεράσει τις επιδόσεις όλων των προηγούμενων αλγορίθμων και μάλιστα, να παίξει επιτυγχάνοντας επιδόσεις συγκρίσιμες με αυτές ενός ανθρώπου σε ένα σύνολο 49 παιχνιδιών, με τον ίδιο αλγόριθμο, την ίδια αρχιτεκτονική και παραμέτρους. Το γεγονός ήταν αρκετό για να αποτελέσει η μελέτη της DeepMind αντικείμενο δημοσίευσης στο επιστημονικό περιοδικό Nature.

Διαβάστε επίσης στο tech.in.gr:

    In.gr Τεχνολογία