Τεχνητή νοημοσύνη της Google Deep Mind «άσσος» στο Stratego

Ήταν ένα από τα ελάχιστα επιτραπέζια παιγνίδια που μέχρι σήμερα δεν είχε «κατακτήσει» η τεχνητή νοημοσύνη.

Άλλο ένα «ανθρώπινο» σκαλοπάτι ανέβηκε η τεχνητή νοημοσύνη, καθώς ερευνητές της βρετανικής εταιρείας Deep Mind, θυγατρικής της Google, ανακοίνωσαν ότι το νέο “έξυπνο” σύστημά τους DeepNash έμαθε να παίζει -και μάλιστα σε υψηλό επίπεδο- το δημοφιλές παγκοσμίως επιτραπέζιο παιγνίδι «Στρατέγκο»(Stratego).

Ήταν ένα από τα ελάχιστα επιτραπέζια παιγνίδια που μέχρι σήμερα δεν είχε «κατακτήσει» η τεχνητή νοημοσύνη.

Οι ερευνητές, οι οποίοι έκαναν τη σχετική δημοσίευση στο κορυφαίο επιστημονικό περιοδικό «Science», έκαναν λόγο για «ένα εντυπωσιακό επίτευγμα που η κοινότητα του Stratego δεν πίστευε πως θα ήταν εφικτό με τις υπάρχουσες τεχνικές».

Δείτε επίσης:  Ρωσία εναντίον… «μετασύμπαντος»: Προς νέα μέτρα οι ρωσικές αρχές για το metaverse

Εδώ και πολλά χρόνια, το Stratego, το οποίο δοκιμάζει την ικανότητα των παικτών στη λήψη σχετικά αργών αλλά πολύ μελετημένων λογικών αποφάσεων, αποτελούσε έναν στόχο-όριο για την έρευνα στο πεδίο της τεχνητής νοημοσύνης.

Καθώς αποτελεί ένα παιγνίδι «ατελούς» πληροφόρησης, με όψεις που μένουν κρυφές από τους αντιπάλους, το Stratego με την πολύπλοκη δομή του ενέχει σημαντικές προκλήσεις για τους ερευνητές της τεχνητής νοημοσύνης, σαφώς περισσότερες από ένα άλλο παιγνίδι ατελούς πληροφόρησης, το πόκερ Texas Hold’em, όπου η τεχνητή νοημοσύνη είχε ήδη επιτυχίες.

Παρόλα αυτά, οι μηχανικοί και ειδικοί πληροφορικής της Deep Mind εισήγαγαν μια καινοτόμο μέθοδο που επιτρέπει στο σύστημα τεχνητής νοημοσύνης τους να μάθει να παίζει Stratego και μάλιστα σε υψηλό επίπεδο. Όπως έδειξαν οι δοκιμές του στη διαδικτυακή πλατφόρμα gaming Gravon (τη μεγαλύτερη στον κόσμο online για Stratego), το bot DeepNash επιτυγχάνει αποτελέσματα ανάλογα των πολύ καλών ανθρώπων παικτών.

Δείτε επίσης:  Ο Έλληνας που παρήγαγε οξυγόνο από CO2 μιλάει για το επίτευγμα του Perseverance

Το DeepNash κέρδισε οποιοδήποτε άλλο bot που παίζει Stratego, καθώς και πολλούς ανθρώπους εξπέρ του παιγνιδιού. Στον πυρήνα του συστήματος βρίσκεται ένας νέος αλγόριθμος ενισχυτικής μάθησης, ο R-NaD, ο οποίος συνδυάζεται με αρχιτεκτονική βαθιού νευρωνικού δικτύου.

Πηγή: ΑΠΕ-ΜΠΕ

Πηγή

Μοιράσου το...