AI καταφέρνει και κερδίζει παιχνίδια που παίζαμε στις κονσόλες του 1980!

Επιστήμονες ανέπτυξαν ένα πρόγραμμα υπολογιστή που μπορεί να κερδίζει μια σειρά παιχνιδιών πλατφόρμας/ εξερεύνησης της δεκαετίας του 1980, ανοίγοντας έτσι των δρόμο για πιο αυτόνομα ρομπότ.

Όπως γράφει το BBC, οι ερευνητές δημιούργησαν μια «οικογένεια» αλγορίθμων ικανών να κερδίζουν κλασικά παιχνίδια στο Atari, όπως το Pitfall. Στο παρελθόν αυτά τα παιχνίδια ήταν δύσκολο να κερδηθούν μέσω τεχνητής νοημοσύνης (ΑΙ).

Οι αλγόριθμοι αυτοί θα μπορούσαν να βοηθήσουν ρομπότ να πλοηγούνται καλύτερα σε περιβάλλοντα πραγματικού κόσμου- κάτι που συνεχίζει να αποτελεί σημαντική πρόκληση στους τομείς της ρομποτικής και της τεχνητής νοημοσύνης. Τα επίμαχα περιβάλλοντα περιλαμβάνουν περιοχές που έχουν πληγεί από καταστροφές, όπου τα ρομπότ θα μπορούσαν να αποστέλλονται προς αναζήτηση επιζώντων, ή ακόμα και το μέσο σπίτι.

Η συγκεκριμένη έρευνα εντάσσεται στο ευρύτερο πλαίσιο της έρευνας τεχνητής νοημοσύνης που είναι γνωστή ως reinforcement learning. Κάποια από τα παιχνίδια που χρησιμοποιήθηκαν στην έρευνα θέλουν ο παίκτης να εξερευνά λαβυρίνθους που περιέχουν ανταμοιβές, εμπόδια και κινδύνους. Η οικογένεια των αλγορίθμων, που είναι γνωστή συλλογικά ως Go-Explore, έχει δώσει σημαντικές βελτιώσεις σε σχέση με προηγούμενες προσπάθειες για να κερδίζονται τέτοια παιχνίδια- όπως πχ τα Montezuma’s Revenge, Freeway και Pitfall.

Μεταξύ άλλων, οι ερευνητές ανέπτυξαν αλγορίθμους που μπορούσαν να δημιουργούν αρχεία περιοχών που είχαν ήδη επισκεφθεί. «Η μέθοδός μας είναι όντως πολύ απλή και άμεση, αν και αυτό ισχύει συχνά με τα επιστημονικά επιτεύγματα» δήλωσαν στο BBC οι ερευνητές Αντριέν Εκοφέτ, Τζουστ Χουϊζίνγκα και Τζεφ Κλουν. «Ο λόγος που η προσέγγισή μας δεν είχε εξεταστεί στο παρελθόν είναι πως διαφέρει πολύ από την κυρίαρχη προσέγγιση που παραδοσιακά χρησιμοποιείτο για την αντιμετώπιση αυτών των προβλημάτων στην κοινότητα του reinforcement learning, το αποκαλούμενο “intrinsic motivation”. Σε αυτό, αντί να διαχωρίζεται η εξερεύνηση στην επιστροφή και τη διερεύνηση όπως κάνουμε εμείς, ο δρων απλά ανταμείβεται για την ανακάλυψη νέων περιοχών».

Ένα πρόβλημα με την προσέγγιση του intrinsic motivation είναι πως, ενώ αναζητείται λύση, ο αλγόριθμος μπορεί να «ξεχνά» τις πολλά υποσχόμενες περιοχές που πρέπει ακόμα να εξερευνώνται. Αυτό είναι γνωστό ως «detachment». Οι ερευνητές βρήκαν τρόπο να το προσπερνούν αυτό: Δημιουργώντας αρχείο με τις περιοχές που έχει επισκεφθεί, ο αλγόριθμος μπορεί να επιστρέψει σε ένα υποσχόμενο ενδιάμεσο στάδιο του παιχνιδιού, ως ένα σημείο από όπου μπορεί να εξερευνά περαιτέρω.

Ωστόσο υπήρχε και ένα άλλο πρόβλημα με τις προηγούμενες προσεγγίσεις σε αυτά τα παιχνίδια: «Βασίζονται σε τυχαίες ενέργειες που μπορεί να ληφθούν σε οποιοδήποτε σημείο στον χρόνο, μεταξύ των οποίων και ενώ ο δρων πηγαίνει ακόμα προς την περιοχή που πρέπει να εξερευνηθεί» είπαν στο BBC News οι επιστήμονες. «Αν έχεις ένα περιβάλλον όπου οι ενέργειές σου πρέπει να είναι ακριβείς, όπως ένα παιχνίδι με πολλούς κινδύνους που μπορούν να σε σκοτώσουν άμεσα, τέτοιες τυχαίες ενέργειες μπορούν να σε εμποδίσουν από το να φτάσεις στην περιοχή που θες στα αλήθεια να εξερευνήσεις» (ο τεχνικός όρος για αυτό είναι derailment, εκτροχιασμός).

Η νέα μέθοδος, που περιγράφεται στο Nature, επιλύει το πρόβλημα του εκτροχιασμού διαχωρίζοντας τη διαδικασία της επιστροφής σε προηγούμενες περιοχές από τη διαδικασία της εξερεύνησης νέων- και το επιλύει με διαφορετικούς τρόπους.

 

[signoff]

 

Πηγή

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Οι επιστήμονες συμφωνούν: Πριν από 600 χρόνια, η αυτοκρατορία των Ίνκας εφηύρε τον πρώτο υπολογιστή

Ερευνητές υποστηρίζουν ότι το «quipu» των Ίνκας λειτουργούσε ως το πρώτο υπολογιστικό σύστημα στον κόσμο. Η πρόοδος της τεχνολογίας έχει οδηγήσει στο να διαθέτουμε σήμερα σύγχρονες συσκευές...

Τα laptop στην ΕΕ θα πρέπει να έχουν κοινή θύρα φόρτισης!

Η Ευρωπαϊκή Ένωση με κοινή οδηγία που τέθηκε σε ισχύ τον Δεκέμβριο του 2024, απαιτούσε από τους κατασκευαστές φορητών συσκευών να υποστηρίζουν φόρτιση με...

Samsung: Έρχεται μεγάλη αναβάθμιση ήχου στα κινητά μέσω Bowers & Wilkins

Η Samsung ετοιμάζει μια ευρεία αναβάθμιση του ηχητικού συστήματος στα μελλοντικά της smartphones, αξιοποιώντας την τεχνογνωσία premium audio brands που εντάχθηκαν πρόσφατα στο χαρτοφυλάκιό...

iPhone 18 Pro: Η μεγαλύτερη αναβάθμιση κάμερας στην ιστορία του iPhone

Ο Mark Gurman του Bloomberg ισχυρίζεται ότι τα iPhone 18 Pro και iPhone 18 Pro Max, που αναμένονται το φθινόπωρο, θα φέρουν τη μεγαλύτερη...

Έχεις Makita – DeWalt & Milwaukee? Με Φ64 και Τρελή δύναμη Είναι το Turbo Jet Fan… του μάστορα! Στα 59€ ΚΟΜΠΛΕ! (βίντεο)

Είναι Τέρας Δύναμης... είναι το Turbo Jet Fan... του μάστορα ειδικά φτιαγμένο για να συμπληρώσεις την συλλογή σου. Έχει 3 διαφορετικά μοντέλα Για Makita -...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Έχεις Makita – DeWalt & Milwaukee? Με Φ64 και Τρελή δύναμη Είναι το Turbo Jet Fan… του μάστορα! Στα 59€ ΚΟΜΠΛΕ! (βίντεο)

Είναι Τέρας Δύναμης... είναι το Turbo Jet Fan... του μάστορα ειδικά φτιαγμένο για να συμπληρώσεις την συλλογή σου. Έχει 3 διαφορετικά μοντέλα Για Makita -...

To “Hayabusa” των πατινιών!? Με 10.000W “Γράφει” 150km/h στο κοντέρ… Ανεβάζεις Αδρεναλίνη! Angwatt T1 MAX στα 1490€ ΚΟΜΠΛΕ (Βίντεο)

Ανεβάζει την Αδρεναλίνη σου στα ύψη... και σίγουρα δεν οδηγείται σαν Πατίνι! Θέλει όμως χέρια, μυαλό γνώση, ωριμότητα, τον απαραίτητο εξοπλισμό και για προσωπική άποψη...

Ανοίγω το Νέο μου Super Tablet 13″ 2,5K με Windows 11, Ai επεξεργαστή Intel Core Ultra 5 115U, 16GB DDR5, 1TB nVme & Επισκευάζω...

Με αφορμή το το Νέο μου Super Tablet 13" 2,5K με Windows 11, Ai επεξεργαστή Intel Core Ultra 5 115U και τα σχόλια πολλών έξυπνων...

Είσαι Camper ή Outdoor τύπος; ΤΕΡΑΣΤΙΑ “Τσάμπα” Σκηνή… Αυτοκινήτου! Xmund car tailgate rear tent στα 71€ ΚΟΜΠΛΕ!!! (βίντεο)

ΠΡΟΣΟΧΗ ΠΟΛΥ ΠΕΡΙΟΡΙΣΜΕΝΗ ΔΙΑΘΕΣΙΜΟΤΗΤΑ Είναι τεράστια, με βολικό factor που θα σε κάνει να εκμεταλλευτείς στο έπακρο τόσο την σκηνή σου όσο και τον χώρο που...

Από Ελλάδα με 25€!!! Το “ΚΑΛΥΤΕΡΟ” Επώνυμο Smart Watch που μπορείς να πάρεις… QCY Active GX (Βίντεο & Giveaway)

Είναι από Ελλάδα σε ΤΙΜΗ "Κίνας"... δεν έχει πραγματικά να ζηλέψει τίποτα από ακριβότερα αδέρφια του... και το χτυπάς "Θέλεις δε Θέλεις" Έχει οθονάρα Amoled...