Hugging Face fordert DeepSeek heraus: Projekt Open-R1 enthüllt Geheimnisse der chinesischen KI

Das Hugging Face-Team präsentierte die ersten Ergebnisse des Open-R1-Projekts, das darauf abzielt, die Technologien der chinesischen künstlichen Intelligenz DeepSeek-R1 zu reproduzieren. Innerhalb einer Woche gelang es den Forschern, bedeutende Fortschritte beim Verständnis und der Replikation dieses fortschrittlichen Systems zu erzielen.

Ein wichtiger Erfolg war die erfolgreiche Reproduktion der Testergebnisse auf dem MATH-500-Benchmark. Die Forscher bestätigten die beeindruckenden Leistungen verschiedener Modellversionen: DeepSeek-R1-Distill-Qwen-32B erreichte eine Genauigkeit von 95,0 % im Vergleich zu den behaupteten 94,3 %, während die auf Llama-70B basierende Version 93,4 % gegenüber den offiziellen 94,5 % zeigte.

Während der Studie wurde eine einzigartige Eigenschaft von DeepSeek-R1 entdeckt – eine beispiellose Länge der generierten Antworten. Die Analyse der Verteilung im OpenThoughts-Datensatz zeigte, dass die durchschnittliche Antwortlänge etwa 6000 Token beträgt und in einigen Fällen 20.000 Token übersteigt. „Wenn man bedenkt, dass eine durchschnittliche Seite etwa 500 Wörter enthält und ein Token etwas kürzer als ein Wort ist, überschreiten viele Antworten einen Umfang von 10 Seiten“, merken die Forscher an.

Um die Transparenz der Forschung zu gewährleisten, erstellte das Hugging Face-Team eine offene Open-R1-Rangliste, wo die Community die Fortschritte bei der Reproduktion der Ergebnisse verfolgen kann. Besondere Aufmerksamkeit wird dem Problem des erheblichen GPU-Speicherbedarfs während des Trainings aufgrund der Notwendigkeit der Generierung langer Sequenzen gewidmet.

Das erst vor einer Woche gestartete Open-R1-Projekt vereinte die Bemühungen verschiedener Teams und der Entwicklergemeinschaft. Das Hauptziel bleibt die Reproduktion der Trainingspipeline und der synthetischen Daten von DeepSeek-R1, was ein besseres Verständnis der Funktionsprinzipien dieses fortschrittlichen künstlichen Intelligenz-Systems ermöglichen wird.

Diese Initiative zeigt einen wachsenden Trend zu Offenheit und Zusammenarbeit im Bereich KI, wo selbst die komplexesten technologischen Errungenschaften zum Gegenstand kollektiver Untersuchung und Reproduktion durch die globale Entwicklergemeinschaft werden.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Qualcomm begrüßt TSMC-Investition in Höhe von 100 Milliarden Dollar

Die Investition von Taiwan Semiconductor Manufacturing Co. (TSMC) in Höhe von 100 Milliarden Dollar zur Erweiterung der Produktion in den Vereinigten Staaten ist "eine großartige Nachricht", sagte Qualcomm-CEO Cristiano Amon in einem Interview mit CNBC am Dienstag, dem 4. März 2025. Seinen Angaben zufolge trägt dies zur Diversifizierung der Halbleiterproduktionsstandorte bei.

DuckDuckGo verstärkt die Integration generativer KI

Der private Suchdienst DuckDuckGo baut weiterhin seine Position im Bereich der generativen künstlichen Intelligenz aus. Laut einem am Donnerstag, dem 6. März 2025, veröffentlichten Blog-Beitrag gab das Unternehmen den Abschluss der Beta-Tests seiner Chat-Schnittstelle bekannt, die jetzt offiziell Duck.ai heißt und den umständlicheren Namen DuckDuckGo AI Chat aufgibt.

Digitaler Skandal bei der Los Angeles Times

Der Milliardär und Eigentümer der Los Angeles Times, Patrick Soon-Shiong, der ein neues KI-Tool zur Generierung gegensätzlicher Perspektiven zu Meinungsbeiträgen vorstellte, wusste nicht, dass das System weniger als 24 Stunden nach dem Start Pro-KKK-Argumente erstellt hatte — und das sogar noch Stunden nachdem die skandalösen KI-Kommentare von der Website der Publikation entfernt worden waren. Der Vorfall schuf ein enormes Hindernis für die Times, die danach strebt, alte Abonnenten zurückzugewinnen und neue durch innovative technologische Lösungen anzuziehen.

Google Shopping startet KI-Tool

Google hat die Einführung eines neuen KI-Tools für den Shopping-Tab angekündigt, das Benutzern helfen wird, Kleidung anhand ihrer verbalen Beschreibung zu finden. Die am Mittwoch, dem 5. März 2025, gemachte Ankündigung umfasst auch die Erweiterung der Funktionen von Augmented-Reality-Tools (AR) für Kosmetik und virtuelle Anprobe.

"Kann nicht mit Antworten zu Wahlen und politischen Persönlichkeiten helfen": Gemini

Der Technologieriese Google beschränkt weiterhin die Fähigkeiten seines KI-Assistenten Gemini im Bereich des politischen Diskurses, obwohl die Hauptkonkurrenten des Unternehmens, darunter OpenAI, Anthropic und Meta, ihre Chatbots in den letzten Monaten bereits für die Diskussion politisch sensibler Themen angepasst haben.