Post Thumbnail

GigaChat perdió contra Claude y Gemini en idioma ruso en el benchmark MERA

Las pruebas de GigaChat revelan la dura verdad sobre el lugar de Rusia en la carrera global de inteligencia artificial. Pruebas recientes en el benchmark MERA mostraron resultados que obligan a una reflexión seria. El modelo ruso, creado específicamente para trabajar con el idioma ruso, perdió inesperadamente contra competidores extranjeros en su propio “elemento nativo”.

Particularmente notable es que las pruebas fueron realizadas por el mismo equipo de GigaChat en un conjunto especializado de tareas desarrollado por la Alianza doméstica en el campo de la inteligencia artificial. En pruebas comparativas, los modelos estadounidenses Claude 3.7 Sonnet, Gemini 2.0 Flash, Gemini 1.5 Pro. Así como los chinos DeepSeek-V3 y DeepSeek-V3.0324 demostraron mayor rendimiento.

Jack Clark, cofundador y jefe de política en Anthropic, y anteriormente director de política en OpenAI, dio una evaluación inequívoca de la situación. En su opinión, si GigaChat refleja el estado de todo el ecosistema ruso de modelos de lenguaje, entonces el país no solo no podrá competir en la vanguardia, sino que también enfrentará dificultades incluso en el nicho de modelos abiertos pequeños.

Los datos de estas pruebas fueron publicados en un artículo científico en arxiv. Estos resultados indican que la lucha por el liderazgo en inteligencia artificial sigue siendo una batalla solo entre Estados Unidos y China.

Autor: AIvengo
Latest News
Jefe de Nvidia cree que no hay burbuja de IA

Fundador de Nvidia Jensen Huang disipó preocupaciones sobre burbuja en mercado de IA. Y según él, últimos chips de compañía se espera que traigan 0.5 billones de dólares en ingresos.

Sam Altman está cansado de preguntas sobre dinero

Sam Altman está cansado de preguntas sobre dinero de OpenAI. Y esto se hizo obvio durante entrevista conjunta con Satya Nadella en podcast Bg2.

Número de vacantes de ingenieros de despliegue avanzado creció 800%

Compañías de IA inventaron nueva profesión. Hablamos de ingenieros de despliegue avanzado.

OpenAI promete crear científico de IA completo para 2028

OpenAI prometió crear científico basado en IA completo para 2028. CEO de compañía Sam Altman también declaró que sistemas de aprendizaje profundo podrán realizar funciones de científicos investigadores a nivel de pasante para septiembre de próximo año. Y nivel de investigador de IA autónomo completo podría alcanzarse para 2028.

Empleos para jóvenes especialistas IT en Gran Bretaña colapsaron 46%

¿Saben qué está pasando en mercado laboral para jóvenes especialistas IT en Gran Bretaña? Durante último año, número de empleos para jóvenes especialistas colapsó 46%. Y se pronostica caída adicional de 53%, reporta The Register. Citando estadísticas de Institute of Student Employers.