Bitte deaktivieren Sie Ihren Ad-Blocker

Für die Finanzierung unseres journalistischen Angebots sind wir auf die Anzeigen unserer Werbepartner angewiesen.

Klicken Sie oben rechts in Ihren Browser auf den Button Ihres Ad-Blockers und deaktivieren Sie die Werbeblockierung für FR.de. Danach lesen Sie FR.de gratis mit Werbung.

Lesen Sie wie gewohnt mit aktiviertem Ad-Blocker auf FR.de
  • Zum Start nur 0,99€ monatlich
  • Zugang zu allen Berichten und Artikeln
  • Ihr Beitrag für unabhängigen Journalismus
  • Jederzeit kündbar

Sie haben das Produkt bereits gekauft und sehen dieses Banner trotzdem? Bitte aktualisieren Sie die Seite oder loggen sich aus und wieder ein.

Die beiden haben Spaß. Aber der könnte rum sein, wenn einer von ihnen gegen das neue System „Go-Explore“ antreten müsste.
+
Die beiden haben Spaß. Aber der könnte rum sein, wenn einer von ihnen gegen das neue System „Go-Explore“ antreten müsste.

Schach

Eine Künstliche Intelligenz, die beim Zocken lernt

In der Schach-Welt ist der Computer längst der Meister – aber jetzt haben Forschende in den USA einen Algorithmus entwickelt, der den Menschen auch bei Erkundungsspielen abhängt

Eine künstliche Intelligenz (KI) mit einer Art Umgebungsgedächtnis schneidet in Atari-Computerspielen besser ab als menschliche Spielerinnen und Spieler. Das System namens Go-Explore baut beim Erkunden von Umgebungen ein Archiv auf und greift immer wieder darauf zurück, wenn es neue Hindernisse zu überwinden gilt.

Das System schlägt aber nicht nur menschliche Gegner:innen in allen Spielen für den Atari 2600, sondern übertrifft auch bisherige KI-Systeme. Das berichtet Adrien Ecoffet von den Uber AI Labs in San Francisco in der Fachzeitschrift „Nature“.

Auch in deutschen Fachkreisen wird diese Entwicklung der Forschenden aus den USA als ein wichtiger Schritt nach vorne bezeichnet. Zwar haben KI-System in komplexen Spielen wie Schach oder dem japanischen Brettspiel Go in den vergangenen Jahren jede Partie gegen den Menschen gewonnen. Aber es gibt eben Computerspiele, wie etwa „Pitfall“ für den Atari 2600, in denen die bisher angewendeten Algorithmen nicht zum Erfolg führen.

„Bestehende Algorithmen zum Lernen durch Verstärkung scheinen Schwierigkeiten zu haben, wenn komplexe Umgebungen wenig Feedback bieten“, heißt es in der Studie. Beim Lernen durch Verstärkung (Reinforcement Learning) lernt ein System durch Versuch und Irrtum, welche Aktionen belohnt und welche etwa durch Punktabzug bestraft werden.

Während Go-Explore die Umgebung eines Spiels erkundet, werden einzelne Spielzustände in einer stark vereinfachten Weise in einem Archiv abgelegt. Nach jeder Erkundungsrunde wählt die KI im Archiv den Zustand – oder eben jenen Weg – aus, der mit der höchsten Wahrscheinlichkeit einen Erfolg verspricht. Auf diese Weise nutzt die KI das „Erfahrungswissen“, auch wenn es noch nicht durch den angestrebten Erfolg – in diesem Fall: ein Level zu schaffen – verstärkt worden ist.

Durch diese Ergänzung der Reinforcement-Learning-Algorithmen konnte Go-Explore im Spiel „Pitfall“ Punkte sammeln – was den meisten KI-Systemen bisher nicht gelang. Dabei war Go-Explore etwas besser als der Durchschnitt menschlicher Spieler:innen. Beim Spiel „Montezuma’s Revenge“ gelang der von Ecoffet und Kollegen entwickelten KI sogar ein Weltrekord, nachdem sie von menschlichen Spieler:innen gelernt hatte. Bisherige Bilanz: In elf Spielen für den Atari 2600 schnitt Go-Explore besser ab als durchschnittliche menschliche Spieler:innen und als KI-Systeme nach dem Stand der Technik.

Den Forschenden zufolge kann ihr Ansatz auch in der Robotik hilfreich sein. Sie wendeten ihre Algorithmen bei einem Roboterarm an, der lernen sollte, einen Gegenstand nacheinander in vier Fächer zu legen, von denen zwei verschlossen waren. Im Gegensatz zu anderen KI-Systemen „vergaß“ Go-Explore nie, wenn es die Fächer bereits geöffnet hatte. So gelang es der KI, den Gegenstand schnell und zuverlässig in den vier Fächern zu platzieren. Als weitere mögliche Anwendungen von Go-Explore nennt die Studie Sprachverständnis und die Entwicklung neuer Wirkstoffe.

Jan Peters vom Max Planck Institut für Intelligente Systeme in Stuttgart bezeichnet die Studie als Durchbruch. „Menschliche Experten in so vielen Problemen zu schlagen, ist ein eindrucksvoller Erfolg.“ Das Anwendungspotenzial in der Robotik hält er jedoch für begrenzt. Durchbrüche könnte der Ansatz in der Medizin, beim autonomen Fahren und bei anderen sicherheitskritischen Anwendungen hervorbringen.

Claus Horn von der Zürcher Hochschule für Angewandte Wissenschaften erklärte im Hinblick auf das Go-Explore-System: „Es wird uns ermöglichen, komplexere Probleme zu lösen, die eine längere Reihenfolge von Entscheidungen bis zur Lösung verlangen.“ Stefan Parsch, dpa

Das könnte Sie auch interessieren

Mehr zum Thema

Kommentare