Post Thumbnail

Hugging Face fordert DeepSeek heraus: Projekt Open-R1 enthüllt Geheimnisse der chinesischen KI

Das Hugging Face-Team präsentierte die ersten Ergebnisse des Open-R1-Projekts, das darauf abzielt, die Technologien der chinesischen künstlichen Intelligenz DeepSeek-R1 zu reproduzieren. Innerhalb einer Woche gelang es den Forschern, bedeutende Fortschritte beim Verständnis und der Replikation dieses fortschrittlichen Systems zu erzielen.

Ein wichtiger Erfolg war die erfolgreiche Reproduktion der Testergebnisse auf dem MATH-500-Benchmark. Die Forscher bestätigten die beeindruckenden Leistungen verschiedener Modellversionen: DeepSeek-R1-Distill-Qwen-32B erreichte eine Genauigkeit von 95,0 % im Vergleich zu den behaupteten 94,3 %, während die auf Llama-70B basierende Version 93,4 % gegenüber den offiziellen 94,5 % zeigte.

Während der Studie wurde eine einzigartige Eigenschaft von DeepSeek-R1 entdeckt – eine beispiellose Länge der generierten Antworten. Die Analyse der Verteilung im OpenThoughts-Datensatz zeigte, dass die durchschnittliche Antwortlänge etwa 6000 Token beträgt und in einigen Fällen 20.000 Token übersteigt. „Wenn man bedenkt, dass eine durchschnittliche Seite etwa 500 Wörter enthält und ein Token etwas kürzer als ein Wort ist, überschreiten viele Antworten einen Umfang von 10 Seiten“, merken die Forscher an.

Um die Transparenz der Forschung zu gewährleisten, erstellte das Hugging Face-Team eine offene Open-R1-Rangliste, wo die Community die Fortschritte bei der Reproduktion der Ergebnisse verfolgen kann. Besondere Aufmerksamkeit wird dem Problem des erheblichen GPU-Speicherbedarfs während des Trainings aufgrund der Notwendigkeit der Generierung langer Sequenzen gewidmet.

Das erst vor einer Woche gestartete Open-R1-Projekt vereinte die Bemühungen verschiedener Teams und der Entwicklergemeinschaft. Das Hauptziel bleibt die Reproduktion der Trainingspipeline und der synthetischen Daten von DeepSeek-R1, was ein besseres Verständnis der Funktionsprinzipien dieses fortschrittlichen künstlichen Intelligenz-Systems ermöglichen wird.

Diese Initiative zeigt einen wachsenden Trend zu Offenheit und Zusammenarbeit im Bereich KI, wo selbst die komplexesten technologischen Errungenschaften zum Gegenstand kollektiver Untersuchung und Reproduktion durch die globale Entwicklergemeinschaft werden.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
UBTech wird Roboter Walker S2 für $37 Mio. an die Grenze Chinas schicken

Das chinesische Unternehmen UBTech gewann einen Vertrag über $37 Millionen. Und wird menschenähnliche Roboter Walker S2 zum Dienst an der Grenze Chinas zu Vietnam schicken. South China Morning Post berichtet, dass die Roboter mit Touristen und Personal interagieren, logistische Operationen durchführen, Fracht inspizieren und das Gelände patrouillieren werden. Und bezeichnenderweise — sie können selbstständig ihre Batterie wechseln.

Anthropic enthüllte versehentlich ein internes Dokument über die "Seele" von Claude

Anthropic enthüllte versehentlich einem Nutzer die "Seele" der künstlichen Intelligenz. Und das ist keine Metapher. Das ist ein ganz konkretes internes Dokument.

Jensen Huang befahl Nvidia-Mitarbeitern, KI überall zu nutzen

Jensen Huang verkündete innerhalb von Nvidia eine totale Mobilmachung unter dem Banner der künstlichen Intelligenz. Und das ist keine Empfehlung mehr. Das ist eine Forderung.

KI-Chatbots generieren Inhalte, die Essstörungen verschlimmern

Eine gemeinsame Studie der Stanford University und des Center for Democracy and Technology zeigte ein beunruhigendes Bild. Chatbots mit künstlicher Intelligenz stellen ein ernsthaftes Risiko für Menschen mit Essstörungen dar. Wissenschaftler warnen, dass neuronale Netze schädliche Ratschläge zu Diäten verteilen. Sie schlagen Wege vor, die Störung zu verbergen und generieren "inspirierenden Abnehm-Content", der das Problem verschlimmert.

OpenAGI veröffentlichte das Modell Lux, das Google und OpenAI überholt

Das Startup OpenAGI veröffentlichte das Modell Lux zur Computersteuerung und behauptet, dass dies ein Durchbruch ist. Nach Benchmarks überholt das Modell um eine ganze Generation Analoga von Google, OpenAI und Anthropic. Außerdem arbeitet es schneller. Etwa 1 Sekunde pro Schritt statt 3 Sekunden bei Konkurrenten. Und 10 Mal günstiger in den Kosten pro Verarbeitung von 1 Token.