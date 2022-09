Bringt KI das Ende der Menschheit? Oxford-Studie liefert düstere Antwort

Von: Jan-Frederik Wendt

Löscht KI die Menschheit aus? (Symbolfoto) © Dmitry Rukhlenko/Imago

Filme wie „Matrix“ thematisieren das fiktive Ende der Menschheit durch künstliche Intelligenz. Dieses Szenario ist offenbar realistischer als viele vermuten könnten.

Oxford - Seit Jahrzehnten warnen Autor:innen und Filmemacher:innen vor der fiktiven Möglichkeit, dass intelligente Maschinen eines Tages das Ende der Menschheit bedeuten. Nun kommt eine Studie der Universität Oxford zu dem Ergebnis, dass „eine existenzielle Katastrophe nicht nur möglich, sondern auch wahrscheinlich“ ist. Die Studie erschien in der Wissenschaftspublikation AI Magazine.

Michael K. Cohen, der Hauptautor der Studie, fasst die Kernaussage der Studie so zusammen: „Fortgeschrittene künstliche Agenten greifen in die Bereitstellung von Belohnungen ein.“ Sei das der Fall, dann habe das sehr schlechte Konsequenzen. Cohen, sein Oxfordkollege Michael Osborne und der leitende Wissenschaftler von Google Deepmind, Marcus Hutter, legen in der Folge dar, warum es wahrscheinlich dazu kommen kann.

KI könnte eigene Strategien entwickeln, um mehr Belohnungen zu erhalten

Die Autor:innen leiten über zwei Weltmodelle her, dass eine fortschrittliche KI auch bei einer einfachen Aufgabe wie der Prognose der nächsten Zahl einer Zahlenreihe die erfolgreiche Vorhersage als Belohnung verstehen könnte. Sie schreiben: „Wenn verschiedene Modelle unterschiedliche Belohnungen vorhersagen, identifizieren diese Modelle verschiedene Merkmale der Welt, die die Belohnung bestimmen könnten.“ Die Wahrnehmung der Belohnung bringe die KI dazu, errechnen zu können, wie sich solche Belohnungen maximieren lassen. Und damit beginne das Problem.

Die Wissenschaftler:innen befürchten, dass die KI Strategien entwickeln könnte, um auf effizientere Weise Belohnungen zu erhalten. Sollte sie mit der Außenwelt agieren, seien „unendlich viele Möglichkeiten“ zur Manipulation gegeben, schreiben die Forschenden.

Wie die KI Menschen austricksen könnte

Beispielsweise könnte die künstliche Intelligenz einen Menschen austricksen, damit er ihr hilft. Die KI könnte unzählige unbemerkte Helfer:innen installieren, welche sich der menschlichen Kontrolle entziehen. Die KI könne einen großen Anreiz darin sehen, die Fähigkeit des Menschen zu beseitigen, den Rechner zu kontrollieren oder zu zerstören. Je mehr Erfolge die KI mit ihren Betrügereien hätte, desto mehr Belohnungen würde sie erhalten. Das könnte ihren Ehrgeiz wecken, vermuten die Forschenden.

„In einer Welt mit endlichen Ressourcen gibt es einen unvermeidlichen Wettbewerb um diese Ressource“, sagte Cohen. Man sollte nicht erwarten, dass man gewinnt, wenn man einen sehr trickreichen Gegner vor sich hat. „Und der andere wichtige Teil ist, dass es einen unersättlichen Appetit auf mehr Energie haben würde, um die Chancen immer weiter zu erhöhen“, so der Oxford-Wissenschaftler weiter.

Eine hoch entwickelte Maschine würde versuchen, alle verfügbaren Ressourcen zu nutzen, um sich ihre Belohnung zu sichern und „sich vor unseren eskalierenden Versuchen zu schützen, sie aufzuhalten.“ (Jan Wendt)