Post Thumbnail

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.

Las especificaciones técnicas de este modelo son impresionantes. Kimi-K2 combina un volumen colosal de conocimiento y tiene 1 billón de parámetros. La ventaja más importante son los coeficientes de peso abiertos. Haciendo el modelo accesible para investigación, ajuste adicional y adaptación a tareas específicas.

La versión Kimi-K2-Instruct, optimizada para condiciones de aplicación del mundo real, demuestra resultados excepcionales en pruebas estándar. En la prueba más difícil SWE-bench Verified, alcanzó 65.8% en modo agente. Este indicador es solo ligeramente inferior a Claude Sonnet 4, pero supera significativamente a GPT-4.1.

Particularmente impresionante es que Kimi-K2 lidera en pruebas especializadas de programación. LiveCodeBench con 53.7% y OJBench con 27.1%. El modelo genera cualquier juego, aplicaciones y planifica viajes a través de docenas de herramientas en el navegador como agente.

El modelo también maneja brillantemente tareas en matemáticas y ciencias naturales. Superando competidores en pruebas tan difíciles como AIME, GPQA-Diamond y MATH-500. Y ya ahora forma parte del grupo élite de mejores modelos también en pruebas multilingües. Y parece que este es el nuevo rey de las redes neuronales ahora mismo.

Autor: AIvengo
Latest News
Jefe de Nvidia cree que no hay burbuja de IA

Fundador de Nvidia Jensen Huang disipó preocupaciones sobre burbuja en mercado de IA. Y según él, últimos chips de compañía se espera que traigan 0.5 billones de dólares en ingresos.

Sam Altman está cansado de preguntas sobre dinero

Sam Altman está cansado de preguntas sobre dinero de OpenAI. Y esto se hizo obvio durante entrevista conjunta con Satya Nadella en podcast Bg2.

Número de vacantes de ingenieros de despliegue avanzado creció 800%

Compañías de IA inventaron nueva profesión. Hablamos de ingenieros de despliegue avanzado.

OpenAI promete crear científico de IA completo para 2028

OpenAI prometió crear científico basado en IA completo para 2028. CEO de compañía Sam Altman también declaró que sistemas de aprendizaje profundo podrán realizar funciones de científicos investigadores a nivel de pasante para septiembre de próximo año. Y nivel de investigador de IA autónomo completo podría alcanzarse para 2028.

Empleos para jóvenes especialistas IT en Gran Bretaña colapsaron 46%

¿Saben qué está pasando en mercado laboral para jóvenes especialistas IT en Gran Bretaña? Durante último año, número de empleos para jóvenes especialistas colapsó 46%. Y se pronostica caída adicional de 53%, reporta The Register. Citando estadísticas de Institute of Student Employers.