Post Thumbnail

GigaChat verlor gegen Claude und Gemini in russischer Sprache im MERA-Benchmark

Das Testen von GigaChat offenbart die harte Wahrheit über Russlands Platz im globalen Rennen um künstliche Intelligenz. Jüngste Tests am MERA-Benchmark zeigten Ergebnisse, die zum ernsten Nachdenken zwingen. Das russische Modell, das speziell für die Arbeit mit russischer Sprache erstellt wurde, verlor unerwartet gegen ausländische Konkurrenten in seinem eigenen “natürlichen Element”.

Besonders bemerkenswert ist, dass die Tests vom GigaChat-Team selbst an einem spezialisierten Aufgabensatz durchgeführt wurden, der von der heimischen Allianz im Bereich künstliche Intelligenz entwickelt wurde. In vergleichenden Tests zeigten die amerikanischen Modelle Claude 3.7 Sonnet, Gemini 2.0 Flash, Gemini 1.5 Pro. Sowie die chinesischen DeepSeek-V3 und DeepSeek-V3.0324 höhere Leistungen.

Jack Clark, Mitgründer und Leiter der Politik bei Anthropic und früher Direktor für Politik bei OpenAI, gab eine eindeutige Bewertung der Situation ab. Seiner Meinung nach wird das Land, wenn GigaChat den Zustand des gesamten russischen Ökosystems von Sprachmodellen widerspiegelt, nicht nur nicht an der Spitze konkurrieren können, sondern auch auf Schwierigkeiten selbst in der Nische kleiner offener Modelle stoßen.

Die Daten dieser Tests wurden in einem wissenschaftlichen Artikel auf arxiv veröffentlicht. Diese Ergebnisse deuten darauf hin, dass der Kampf um die Führung im Bereich künstliche Intelligenz nur ein Kampf zwischen den USA und China bleibt.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Nvidia-Chef glaubt, dass es keine KI-Blase gibt

Nvidia-Gründer Jensen Huang zerstreute Bedenken bezüglich einer Blase auf dem KI-Markt. Und seinen Worten nach werden die neuesten Chips des Unternehmens voraussichtlich 0,5 Billionen Dollar Umsatz bringen.

Sam Altman ist müde von Geldfragen

Sam Altman ist müde von Fragen über OpenAIs Geld. Und das wurde während eines gemeinsamen Interviews mit Satya Nadella im Bg2-Podcast offensichtlich.

Anzahl der Stellen für Forward Deployment Engineers stieg um 800%

KI-Unternehmen haben einen neuen Beruf erfunden. Es geht um Forward Deployment Engineers.

OpenAI verspricht vollwertigen KI-Wissenschaftler bis 2028 zu schaffen

OpenAI versprach, bis 2028 einen vollwertigen KI-basierten Wissenschaftler zu schaffen. CEO Sam Altman erklärte auch, dass Deep-Learning-Systeme bis September nächsten Jahres die Funktionen von Forschungswissenschaftlern auf Praktikantenniveau ausführen können. Und das Niveau eines autonomen vollwertigen KI-Forschers könnte bereits 2028 erreicht werden.

Arbeitsplätze für junge IT-Spezialisten in Großbritannien brachen um 46% ein

Wissen Sie, was auf dem Arbeitsmarkt für junge IT-Spezialisten in Großbritannien passiert? Im letzten Jahr brach die Anzahl der Arbeitsplätze für junge Spezialisten um 46% ein. Und es wird ein weiterer Rückgang um 53% prognostiziert, berichtet The Register. Unter Berufung auf Statistiken des Institute of Student Employers.