Ερευνητές της Google DeepMind δημιούργησαν το πρώτο ρομπότ που παίζει πινγκ πονγκ (επιτραπέζια αντισφαίριση) και μπορεί να νικήσει έναν ερασιτέχνη παίκτη. Το ρομπότ νίκησε όλους τους αρχαρίους παίκτες και το 55% των ερασιτεχνών, ωστόσο έχασε όλα τα παιχνίδια που έπαιξε με προχωρημένους παίκτες. Συνολικά, το ρομπότ κέρδισε το 45% των παιχνιδιών που έπαιξε. Το ρομπότ διαθέτει έναν βιομηχανικό βραχίονα που ονομάζεται ABB IRB 1100 και προσαρμοσμένο λογισμικό τεχνητής νοημοσύνης που ανέπτυξαν ερευνητές της DeepMind.
«Ακόμη και λίγους μήνες πριν, προβλέπαμε πως το ρομπότ δεν θα μπορούσε να κερδίσει παίκτες με τους οποίους δεν είχε ξαναπαίξει. Το σύστημα σίγουρα ξεπέρασε τις προσδοκίες μας», δήλωσε ο Πανάγκ Σανκέτι, ανώτερος μηχανικός λογισμικού στην Google DeepMind που ηγήθηκε του έργου. «Ο τρόπος με τον οποίο το ρομπότ νίκησε ακόμη και δυνατούς αντιπάλους ήταν εντυπωσιακός» σημείωσε.
Η έρευνα αυτή αντιπροσωπεύει ένα βήμα προς τη δημιουργία ρομπότ που μπορούν να εκτελούν χρήσιμες εργασίες επιδέξια και με ασφάλεια σε πραγματικά περιβάλλοντα όπως σπίτια και αποθήκες, κάτι που είναι ένας μακροχρόνιος στόχος της κοινότητας της ρομποτικής.
Για να παίξει κάποιος πινγκ πονγκ, χρειάζεται εξαιρετικό συντονισμό χεριού-ματιού, την ικανότητα να κινείται και να λαμβάνει αποφάσεις γρήγορα — δεξιότητες που αποτελούν σημαντική πρόκληση για τα ρομπότ. Οι ερευνητές της Google DeepMind χρησιμοποίησαν μια προσέγγιση για να εκπαιδεύσουν το σύστημα ώστε να μιμείται αυτές τις δεξιότητες. Συγκεκριμένα, χρησιμοποίησαν προσομοιώσεις υπολογιστή για να εκπαιδεύσουν το σύστημα ώστε να κατακτήσει τις απιτούμενες δεξιότητες και στη συνέχεια το βελτίωσαν χρησιμοποιώντας δεδομένα πραγματικού κόσμου. Η ομάδα συνέταξε ένα σύνολο δεδομένων της μπάλας του πινγκ πονγκ, όπως η θέση και η ταχύτητα. Το σύστημα άντλησε πληροφορίες από αυτό το σύνολο δεδομένων, προκειμένου να μάθει δεξιότητες όπως το σερβίς και η επιστροφή.
Κάθε αγώνας παρήγαγε νέα δεδομένα σχετικά με τις τροχιές του μπαλακιού και τις ανθρώπινες στρατηγικές, τα οποία η ομάδα ανατροφοδοτούσε στην προσομοίωση για περαιτέρω εκπαίδευση. Αυτή η διαδικασία, που επαναλήφθηκε σε επτά κύκλους, επέτρεψε στο ρομπότ να προσαρμόζεται συνεχώς σε ολοένα και πιο ικανούς αντιπάλους και διαφορετικά στυλ παιχνιδιού. Διαπιστώθηκε, ωστόσο, πως το ρομπότ δυσκολευόταν να αντικρούσει το μπαλάκι όταν αυτό κινείτο πολύ γρήγορα, ή πέρα από το οπτικό του πεδίο, ή πολύ χαμηλά, λόγω ενός πρωτοκόλλου που το καθοδηγεί να αποφύγει συγκρούσεις οι οποίες θα μπορούσαν να καταστρέψουν τη ρακέτα του.
Η εκπαίδευση ενός ρομπότ για όλα τα ενδεχόμενα σε ένα προσομοιωμένο περιβάλλον είναι μια πραγματική πρόκληση, σύμφωνα με τον Κρις Γουάλτι, ιδρυτή της εταιρείας ρομποτικής Mytra και πρώην επικεφαλής της ομάδας ρομποτικής της Tesla, ο οποίος δεν συμμετείχε στο έργο.
«Είναι πολύ, πολύ δύσκολο να προσομοιώσεις με ακρίβεια τον πραγματικό κόσμο, επειδή υπάρχουν τόσες πολλές μεταβλητές, όπως μια ριπή ανέμου ή ακόμα και σκόνη στο τραπέζι. Η απόδοση ενός ρομπότ θα είναι περιορισμένη, εκτός αν έχετε πολύ ρεαλιστικές προσομοιώσεις» εξήγησε.
Οι ερευνητές της Google DeepMind πιστεύουν πως αυτοί οι περιορισμοί θα μπορούσαν να αντιμετωπιστούν με διάφορους τρόπους, συμπεριλαμβανομένης της ανάπτυξης προγνωστικών μοντέλων τεχνητής νοημοσύνης που έχουν σχεδιαστεί για την πρόβλεψη της τροχιάς της μπάλας και με την εισαγωγή καλύτερων αλγορίθμων ανίχνευσης σύγκρουσης.
Πάντως, οι παίκτες δήλωσαν πως απόλαυσαν τα παιχνίδια. Ακόμη και οι προχωρημένοι παίκτες που κατάφεραν να το νικήσουν, είπαν ότι βρήκαν την εμπειρία διασκεδαστική και ελκυστική και ότι θα μπορούσε να τους βοηθήσει να βελτιώσουν τις δεξιότητές τους.
Η έρευνα δημοσιεύθηκε στον ιστότοπο Arxiv.
ΠΗΓΗ: MIT Technology Review
Κάνε like στη σελίδα μας στο Facebook
Ακολούθησε μας στο Twitter
Κάνε εγγραφή στο κανάλι μας στο Youtube
Γίνε μέλος στο κανάλι μας στο Viber
– Αναφέρεται ως πηγή το ertnews.gr στο σημείο όπου γίνεται η αναφορά.
– Στο τέλος του άρθρου ως Πηγή
– Σε ένα από τα δύο σημεία να υπάρχει ενεργός σύνδεσμος