Post Thumbnail

Neuestes Claude 3.7 Sonnet-Modell stürmt die Pokémon-Welt

Anthropic, einer der führenden Anbieter im Bereich künstlicher Intelligenz, hat einen ungewöhnlichen Ansatz zur Erprobung seines neuesten Modells Claude 3.7 Sonnet vorgestellt, indem es das kultische Game Boy-Spiel Pokémon Red verwendete.

Laut Informationen, die am 24. Februar im offiziellen Blog des Unternehmens veröffentlicht wurden, statteten die Forscher das Modell mit grundlegendem Speicher, der Fähigkeit zur Verarbeitung von Pixel-Eingaben vom Bildschirm und funktionalen Aufrufen zum Drücken von Tasten und zur Navigation aus. Dies ermöglichte es der KI, kontinuierlich Pokémon ohne zusätzliche Hilfe zu spielen.

Ein wichtiger Vorteil von Claude 3.7 Sonnet ist die Funktion „erweitertes Denken“ (extended thinking), ähnlich den Fähigkeiten von OpenAI o3-mini und DeepSeek R1. Diese Technologie ermöglicht es dem Modell, bei der Lösung komplexer Aufgaben zu „denken“, indem es zusätzliche Rechenressourcen einsetzt und mehr Zeit für die Analyse aufwendet.

Die Ergebnisse des Experiments waren beeindruckend. Während die vorherige Version des Modells, Claude 3.0 Sonnet, nicht einmal das Starthaus in Alabastia verlassen konnte, wo das Spiel beginnt, kämpfte Claude 3.7 Sonnet erfolgreich gegen drei Arenaleiter und erhielt ihre Orden.

Um diese Ergebnisse zu erzielen, führte die KI 35.000 Spielaktionen durch, um den letzten Arenaleiter Major Bob zu erreichen. Das Unternehmen hat jedoch keine genauen Daten über die Rechenleistung und die Zeit offengelegt, die für den Durchlauf des Spiels aufgewendet wurden.

Obwohl Pokémon Red eher als Unterhaltungs-Benchmark angesehen werden kann, hat die Verwendung von Spielen für KI-Tests eine lange Tradition in der Forschungsgemeinschaft. In den letzten Monaten sind eine Reihe neuer Anwendungen und Plattformen entstanden, um die Spielfähigkeiten von KI-Modellen bei verschiedenen Spielen zu testen – von Street Fighter bis Pictionary.

Dieses Experiment demonstriert die wachsende Fähigkeit von Modellen künstlicher Intelligenz, sich in komplexen interaktiven Umgebungen zurechtzufinden, Regeln zu verstehen und strategisch Aktionen zu planen, um langfristige Ziele zu erreichen – Fähigkeiten, die über die Spieleindustrie hinaus breite praktische Anwendungen haben.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Chinesischer Kugel-Roboter RT-G mit 150 kg Gewicht erreicht 35 km/h

In China gibt es ein solches einzigartiges Ingenieurswunder — den sphärischen Roboter Rotunbot RT-G. Der die Vorstellung von Polizeitechnologien der Zukunft grundlegend verändern kann.

22% britischer Kinder von 8-12 Jahren nutzen KI, ohne zu wissen, was es ist

22% der britischen Schulkinder von 8 bis 12 Jahren nutzen bereits aktiv Werkzeuge der künstlichen Intelligenz. Obwohl die meisten von ihnen den Begriff "generative künstliche Intelligenz" nicht einmal gehört haben. Das sind Daten einer Studie des Alan Turing Instituts und der Lego Foundation.

Erste Werbung mit Google Veo 3 wurde Millionen während NBA-Finale gezeigt

Millionen von Zuschauern der NBA-Finalserie wurden Zeugen einer völlig neuen Etappe in der kreativen Evolution. Vollständig von Computeralgorithmen generierte Werbung der Wettplattform Kalshi, erstellt mit Google Veo 3.

Chinesische Plattform QiMeng erstellt Prozessoren auf Intel 486 und Arm Level

Chinesische Wissenschaftler entwickelten eine neue KI-Plattform, die selbstständig Prozessoren auf dem Niveau menschlicher Experten entwerfen kann. Forscher aus dem Staatslabor für Prozessorentwicklung und dem Forschungszentrum für intelligente Software stellten ein Open-Source-Projekt namens QiMeng vor.

Meta AI verwandelt private KI-Chats in öffentliche Posts ohne Wissen

Die Meta AI-App erwies sich als echte Katastrophe für die Privatsphäre der Benutzer. Sie verwandelt ihre privaten Gespräche mit künstlicher Intelligenz in öffentlichen Inhalt. Stellen Sie sich einen modernen Horrorfilm vor: Ihre gesamte Anfragehistorie wurde öffentlich zugänglich, und Sie ahnten nicht einmal etwas davon.