SIMA hat das Potenzial, die Menschheit zu retten, indem es … Videospiele spielt?

SIMA hat das Potenzial, die Menschheit zu retten, indem es … Videospiele spielt?

Quellknoten: 2517935

Der jüngste Durchbruch von Google DeepMind mit SIMA (Self-Instructing Multimodal Agent) wirft ein Schlaglicht auf die schnellen Fortschritte bei der Verwirklichung allgemeiner KI-Agenten, die speziell für virtuelle 3D-Umgebungen entwickelt wurden.

Dieser Fortschritt birgt transformatives Potenzial, nicht nur für die Gaming-Branche, sondern auch für die Art und Weise, wie wir mit virtuellen Räumen in einem breiten Anwendungsspektrum interagieren.

Mit verbesserten Fähigkeiten zum Verstehen von Anweisungen, zur Anpassung an neue Aufgaben und zum Denken innerhalb der Einschränkungen virtueller Welten bieten SIMA-ähnliche Agenten das Potenzial, mehrere Schlüsselbereiche neu zu gestalten.

Der große Erfolg von SIMA

Die neueste Innovation von DeepMind ist SIMA, was für Scalable Instructable Multiworld Agent steht. Im Gegensatz zu früherer KI, die sich auf die Beherrschung eines einzelnen Spiels konzentrierte, ist SIMA eine generalistische KI.

SIMA ist nicht auf Pixel auf dem Bildschirm beschränkt. Es kann sowohl visuelle Informationen verarbeiten (was es im Spiel sieht) und Anweisungen in natürlicher Sprache (was ein Mensch ihm sagt). Dieses multimodale Lernen ermöglicht ein differenzierteres Verständnis der Spielwelt.

Ein generalistischer KI-Agent strebt danach, ein vielseitiges Werkzeug in virtuellen Umgebungen zu sein. Im Gegensatz zur herkömmlichen KI, die sich auf eine einzelne Aufgabe konzentriert, zielt eine generalistische KI darauf ab, eine breite Palette von Aktionen zu lernen und auszuführen. Dadurch kann es sich an neue Situationen und Umgebungen anpassen, für die es nicht speziell trainiert wurde.

SIMA wird nicht nur auf ein Spiel trainiert. DeepMind arbeitete mit mehreren Spieleentwicklern zusammen und stellte SIMA einer Vielzahl von Titeln wie No Man's Sky und Teardown vor. Diese Vielfalt stärkt seine Fähigkeit, sich an neue Umgebungen anzupassen.

SIMA muss nicht nach jeder Regel gefüttert werden. Durch das Befolgen von Anweisungen kann es innerhalb eines Spiels neue Fähigkeiten erlernen, beispielsweise das Navigieren in einem neuen Gebiet, das Herstellen eines Gegenstands oder die Verwendung von Spielmenüs. Dies macht es weitaus vielseitiger als herkömmliche KI-Agenten.

Lassen Sie sich nicht von der mangelnden Konzentration auf das Erreichen von Top-Ergebnissen täuschen. Obwohl beeindruckend, Das ist nicht das Hauptziel.

Der wahre Erfolg von SIMA liegt in seiner Fähigkeit, menschliche Anweisungen in einer Spielumgebung zu verstehen und darauf zu reagieren. Diese Forschung bedeutet a Es wurde ein RIESIGER Schritt unternommen, um eine KI zu schaffen, die für uns hilfreich sein kann der realen Welt.

Einige der Spiele, bei denen Google DeepMind dieses bahnbrechende KI-Modell ausführt, sind:

  • Goat Simulator 3
  • Hydroneer
  • No Man’s Sky
  • Satisfactory
  • Teardown
  • Valheim
  • Wackeliges Leben

Abgesehen von all diesen Spielen testete das Google DeepMind-Team die Fähigkeiten von SIMA auch in realistischen Simulationen, die es erstellt hatte: „Forschungsumgebungen„. Diese Umgebungen, bestehend aus Construction Lab, Playhouse, ProcTHOR und WorldLab, simulieren viele Bereiche, in denen Es wird davon ausgegangen, dass künstliche Intelligenz in naher Zukunft integriert wird.

Die Magie hinter SIMA

Multimodale Eingabeverarbeitung

SIMA nutzt Große Sprachmodelle (LLMs), wahrscheinlich basierend auf der Transformer-Architektur, um von einem Benutzer gegebene Anweisungen in natürlicher Sprache zu verarbeiten und zu verstehen. LLMs zeichnen sich durch den Umgang mit sequentiellen Daten wie Text aus und sind daher für diese Aufgabe gut geeignet. Um seine Umgebung zu verstehen, beschäftigt SIMA Faltungs-Neuronale Netze (CNNs) um visuelle Eingaben aus der 3D-Umgebung zu verarbeiten.

CNNs sind außergewöhnlich gut darin, räumliche Merkmale und Muster aus Bildern oder Videostreams zu extrahieren. SIMA verwendet wahrscheinlich mehrere CNNs, um unterschiedliche Darstellungsebenen innerhalb der visuellen Eingabe für ein umfassendes Verständnis zu erstellen.

Selbstunterricht

Eine der wichtigsten Innovationen, die SIMA zugrunde liegen, ist die Fähigkeit, komplexe Anweisungen in eine Folge einfacherer Unteraufgaben zu zerlegen. Dies wird wahrscheinlich erreicht durch eine Kombination aus natürlicher Sprachverarbeitung (um die Anweisungen zu analysieren) und Hierarchisches Verstärkungslernen (RL).

Hierarchisches RL ermöglicht es Agenten, komplexe Verhaltensweisen zu erlernen, indem sie auf Sequenzen von Aktionen auf niedrigerer Ebene aufbauen.

Darüber hinaus kann SIMA seine eigenen Trainingsdaten und -ziele generieren, indem es seine Aktionen in der Umgebung und die daraus resultierenden Veränderungen beobachtet. Diese Selbstüberwachungstechnik ist entscheidend, um kontinuierliches Lernen und Anpassung an neue Umgebungen zu ermöglichen und ihr Flexibilität zu verleihen.

Generalistische KI von Google DeepMind SIMA
Google DeepMinds Die generalistische KI SIMA nutzt mehrere Techniken, die in komplexen Algorithmen für maschinelles Lernen und künstliche Intelligenz verwendet werden (Bildnachweis)

Zero-Shot-Verallgemeinerung

Die beeindruckende Fähigkeit von SIMA, neue Aufgaben ohne explizite Schulung auszuführen, ist wahrscheinlich auf eine umfangreiche Vorschulung anhand eines riesigen Datensatzes verschiedener 3D-Umgebungen und zugehöriger Anweisungen zurückzuführen. Durch dieses Vortraining kann das Modell eine umfassende interne Darstellung virtueller Welten und allgemeiner Anweisungen erstellen und so Wissen verallgemeinern.

Es ist wahrscheinlich, dass während der Vorschulung ein Meta-Learning-Ansatz verwendet wird, der SIMA dazu ermutigt, eine Strategie für „lernen, wie man lernt".

Dies ermöglicht es dem Agenten, sich in unbekannten Umgebungen schnell neue Fähigkeiten anzueignen.

Möglicherweise erfahren Sie mehr über die Arbeit von Google DeepMind zum allgemeinen Training von KI-Agenten mithilfe von Spielen von Google DeepMind Forschungsarbeit.

Lernen Sie aus Spielen, um in der realen Welt zu glänzen

Ob Sie es glauben oder nicht, SIMA markiert einen Wendepunkt in der Entwicklung der KI.

Videospiele bieten das ideales Übungsgelände für KI weil es sich um dynamische, in sich geschlossene Welten mit klaren Zielen, Regeln und Feedbackmechanismen handelt.

In diesen virtuellen Räumen können KI-Agenten experimentieren, Fehler machen, und lernen Sie aus ihren Erfolgen und Misserfolgen – alles ohne das Risiken oder Einschränkungen der realen Welt. Während SIMA komplexere Spielwelten erforscht und die zugrunde liegenden Modelle leistungsfähiger werden, entwickelt es die Fähigkeit, sich anzupassen, Anweisungen zu verstehen und Strategien zu entwickeln, um Ziele zu erreichen.

Diese Fähigkeiten, die in der sicheren Sandbox eines Spiels verfeinert werden, führen zu einer vielseitigen und leistungsfähigen KI, die potenziell in der Lage ist, die Komplexität unserer realen Welt zu bewältigen.

Das ist nur der Anfang was möglich ist, wenn KI spielerisch lernt.

Tatsächlich wird das Potenzial der KI zur Bewältigung realer Herausforderungen deutlich, wenn wir Untersuchen Sie die Eingabeaufforderungen, die Google DeepMind in verschiedenen Spielen verwendet.

Generalistische KI von Google DeepMind SIMA
Die prompten Beispiele von SIMA und die Aktionen, die es in Spielen ausführt, sind tatsächlich die Grundlage für eine Forschung zur Integration von KI-Technologien in das wirkliche Leben (Bildnachweis)

Um ein paar Beispiele zu nennen:

Das "Sammle Eisenerz ein” Eingabeaufforderung in Satisfactory weist auf das Potenzial von KI hin, die Sicherheit in gefährlichen Industrien wie dem Bergbau zu verbessern. Das berichtet das Bureau of Labor Statistics ein besorgniserregender Anstieg tödlicher Verletzungen im Bergbau, mit a 21.8 % Steigerung von 2020 auf 2021. Stellen Sie sich die Leben vor, die gerettet werden könnten, wenn KI-betriebene Roboter, die weniger anfällig für menschliches Versagen oder Ermüdung sind, gefährliche Bergbauaufgaben bewältigen würden.

Im Überlebensspiel Valheim, das "Finde Wasser„Prompt unterstreicht die Leistungsfähigkeit der KI bei der Bewältigung lebenswichtiger Probleme wie Wasserknappheit. Die Weltbank berichtet zur Verbesserung der Gesundheitsgerechtigkeit Etwa 226 Millionen Menschen im östlichen und südlichen Afrika hatten keinen Zugang zu grundlegenden Wasserdienstleistungen381 Millionen Menschen hatten keinen Zugang zu grundlegenden sanitären Einrichtungen.

Ein weiterer Roboter, der ohne Unterbrechung Wasserforschung an der natürlichen Wasserquelle in der Region durchführen kann, kann das Leben von Milliarden Menschen berühren.

Obwohl künstliche Intelligenz heutzutage mit der Generierung von Bildern und unaufhörlichen Chatbots gleichgesetzt zu werden scheint, glauben Sie uns: es ist viel mehr als das, und Studien wie diese bergen ein immenses Potenzial für a eine bessere Zukunft für alle.


Hervorgehobener Bildnachweis: Freepik.

Zeitstempel:

Mehr von Datenökonomie