Post Thumbnail

GigaChat verlor gegen Claude und Gemini in russischer Sprache im MERA-Benchmark

Das Testen von GigaChat offenbart die harte Wahrheit über Russlands Platz im globalen Rennen um künstliche Intelligenz. Jüngste Tests am MERA-Benchmark zeigten Ergebnisse, die zum ernsten Nachdenken zwingen. Das russische Modell, das speziell für die Arbeit mit russischer Sprache erstellt wurde, verlor unerwartet gegen ausländische Konkurrenten in seinem eigenen „natürlichen Element“.

Besonders bemerkenswert ist, dass die Tests vom GigaChat-Team selbst an einem spezialisierten Aufgabensatz durchgeführt wurden, der von der heimischen Allianz im Bereich künstliche Intelligenz entwickelt wurde. In vergleichenden Tests zeigten die amerikanischen Modelle Claude 3.7 Sonnet, Gemini 2.0 Flash, Gemini 1.5 Pro. Sowie die chinesischen DeepSeek-V3 und DeepSeek-V3.0324 höhere Leistungen.

Jack Clark, Mitgründer und Leiter der Politik bei Anthropic und früher Direktor für Politik bei OpenAI, gab eine eindeutige Bewertung der Situation ab. Seiner Meinung nach wird das Land, wenn GigaChat den Zustand des gesamten russischen Ökosystems von Sprachmodellen widerspiegelt, nicht nur nicht an der Spitze konkurrieren können, sondern auch auf Schwierigkeiten selbst in der Nische kleiner offener Modelle stoßen.

Die Daten dieser Tests wurden in einem wissenschaftlichen Artikel auf arxiv veröffentlicht. Diese Ergebnisse deuten darauf hin, dass der Kampf um die Führung im Bereich künstliche Intelligenz nur ein Kampf zwischen den USA und China bleibt.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Grok 4 erreichte 57% im "Letzten Examen" gegen 22% bei Gemini 2.5 Pro

Elon Musk stellte eine neue Version seines neuronalen Netzwerks vor – Grok 4. Die maximale Version – Grok 4 Heavy – kann mehrere Berechnungen gleichzeitig ausführen und erreicht 57% im schwierigsten Test "Das Letzte Examen der Menschheit". Zum Vergleich: der vorherige Spitzenreiter Gemini 2.5 Pro zeigte nur 22%.

Forscher fanden KI-Schwachstelle durch Fakten über Katzen

Von dieser Nachricht war ich gelinde gesagt überrascht. Wissen Sie, dass eine gewöhnliche Erwähnung von Katzen die fortschrittlichsten KI-Modelle verwirren kann? Wissenschaftler entdeckten eine erstaunliche Schwachstelle in den Denkprozessen neuronaler Netzwerke.

US-IT-Unternehmen entließen 94.000 Mitarbeiter in einem halben Jahr wegen KI

Im ersten Halbjahr 2025 entließen amerikanische IT-Unternehmen mehr als 94.000 technische Spezialisten. Das ist nicht nur Kosteneinsparung. Das ist ein struktureller Wandel unter dem Einfluss künstlicher Intelligenz.

OpenAI stellte den ersten Psychiater in der KI-Industrie ein, um ChatGPTs Einfluss auf die Psyche zu erforschen

Das Unternehmen OpenAI teilte mit, dass es einen professionellen klinischen Psychiater mit Erfahrung in der forensischen Psychiatrie eingestellt hat. Um den Einfluss seiner KI-Produkte auf die geistige Gesundheit der Nutzer zu erforschen.

Historischer Meilenstein: Amazons millionster Roboter nach Japan geliefert

Amazon erreichte einen historischen Meilenstein! Und nach 13 Jahren der Implementierung von Robotern in ihre Lagerhallen verkündete das Unternehmen das Erreichen der Marke von 1 Million robotisierten Geräten. Der millionste Roboter wurde kürzlich an ein Amazon-Lager in Japan geliefert.