Post Thumbnail

Neuestes Claude 3.7 Sonnet-Modell stürmt die Pokémon-Welt

Anthropic, einer der führenden Anbieter im Bereich künstlicher Intelligenz, hat einen ungewöhnlichen Ansatz zur Erprobung seines neuesten Modells Claude 3.7 Sonnet vorgestellt, indem es das kultische Game Boy-Spiel Pokémon Red verwendete.

Laut Informationen, die am 24. Februar im offiziellen Blog des Unternehmens veröffentlicht wurden, statteten die Forscher das Modell mit grundlegendem Speicher, der Fähigkeit zur Verarbeitung von Pixel-Eingaben vom Bildschirm und funktionalen Aufrufen zum Drücken von Tasten und zur Navigation aus. Dies ermöglichte es der KI, kontinuierlich Pokémon ohne zusätzliche Hilfe zu spielen.

Ein wichtiger Vorteil von Claude 3.7 Sonnet ist die Funktion „erweitertes Denken“ (extended thinking), ähnlich den Fähigkeiten von OpenAI o3-mini und DeepSeek R1. Diese Technologie ermöglicht es dem Modell, bei der Lösung komplexer Aufgaben zu „denken“, indem es zusätzliche Rechenressourcen einsetzt und mehr Zeit für die Analyse aufwendet.

Die Ergebnisse des Experiments waren beeindruckend. Während die vorherige Version des Modells, Claude 3.0 Sonnet, nicht einmal das Starthaus in Alabastia verlassen konnte, wo das Spiel beginnt, kämpfte Claude 3.7 Sonnet erfolgreich gegen drei Arenaleiter und erhielt ihre Orden.

Um diese Ergebnisse zu erzielen, führte die KI 35.000 Spielaktionen durch, um den letzten Arenaleiter Major Bob zu erreichen. Das Unternehmen hat jedoch keine genauen Daten über die Rechenleistung und die Zeit offengelegt, die für den Durchlauf des Spiels aufgewendet wurden.

Obwohl Pokémon Red eher als Unterhaltungs-Benchmark angesehen werden kann, hat die Verwendung von Spielen für KI-Tests eine lange Tradition in der Forschungsgemeinschaft. In den letzten Monaten sind eine Reihe neuer Anwendungen und Plattformen entstanden, um die Spielfähigkeiten von KI-Modellen bei verschiedenen Spielen zu testen – von Street Fighter bis Pictionary.

Dieses Experiment demonstriert die wachsende Fähigkeit von Modellen künstlicher Intelligenz, sich in komplexen interaktiven Umgebungen zurechtzufinden, Regeln zu verstehen und strategisch Aktionen zu planen, um langfristige Ziele zu erreichen – Fähigkeiten, die über die Spieleindustrie hinaus breite praktische Anwendungen haben.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

YouTube bietet kostenlose KI-generierte Musik an

YouTube startet eine revolutionäre Funktion, die es Erstellern ermöglicht, mithilfe künstlicher Intelligenz einzigartige Instrumentalmusik für ihre Videos zu erstellen. Das Unternehmen teilte dies in einem Update auf seinem Creator Insider-Kanal mit.

USA bereit, TSMC mit 1 Milliarde Dollar für Zusammenarbeit mit Huawei zu bestrafen

Dem weltweit größten Chiphersteller Taiwan Semiconductor Manufacturing Company (TSMC) droht eine Geldstrafe in Höhe von 1 Milliarde Dollar oder mehr nach Abschluss einer Untersuchung über Verstöße gegen US-Exportkontrollen. Der Grund war die Entdeckung von Chips des Unternehmens in KI-Prozessoren von Huawei, berichtet Reuters.

Google startet Gemini für Unternehmensanwender

Google hat die Einführung von Gemini in Android Studio für Unternehmen angekündigt - einen neuen Abonnementdienst, der die Entwicklung von Unternehmensanwendungen vereinfachen soll. Die Ankündigung erfolgte auf der Google Cloud Next 2025 Konferenz in Las Vegas und zielt darauf ab, die Position des Unternehmens im Unternehmenssektor zu stärken.

OpenAI startet Benchmark-Programm Pioneers Program

OpenAI hat die Einführung eines ambitionierten Pioneers Program angekündigt, das darauf abzielt, grundlegend neue Standards für die Bewertung künstlicher Intelligenz zu schaffen. Das Unternehmen beabsichtigt, ein System zur Prüfung von KI-Modellen zu entwickeln, das ihre tatsächliche Wirksamkeit in verschiedenen Berufsbereichen besser widerspiegelt.

China veranstaltet ersten Roboter-Marathon der Geschichte

Peking bereitet sich darauf vor, in die Geschichte der Weltrobotik einzugehen: Am 13. April 2025 findet in der chinesischen Hauptstadt der weltweit erste Halbmarathon mit anthropomorphen Robotern statt. Bei diesem beispiellosen Ereignis werden Dutzende menschenähnliche Maschinen zusammenkommen, die eine Strecke von 21 Kilometern zurücklegen müssen.