
Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación
¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.
Las especificaciones técnicas de este modelo son impresionantes. Kimi-K2 combina un volumen colosal de conocimiento y tiene 1 billón de parámetros. La ventaja más importante son los coeficientes de peso abiertos. Haciendo el modelo accesible para investigación, ajuste adicional y adaptación a tareas específicas.
La versión Kimi-K2-Instruct, optimizada para condiciones de aplicación del mundo real, demuestra resultados excepcionales en pruebas estándar. En la prueba más difícil SWE-bench Verified, alcanzó 65.8% en modo agente. Este indicador es solo ligeramente inferior a Claude Sonnet 4, pero supera significativamente a GPT-4.1.
Particularmente impresionante es que Kimi-K2 lidera en pruebas especializadas de programación. LiveCodeBench con 53.7% y OJBench con 27.1%. El modelo genera cualquier juego, aplicaciones y planifica viajes a través de docenas de herramientas en el navegador como agente.
El modelo también maneja brillantemente tareas en matemáticas y ciencias naturales. Superando competidores en pruebas tan difíciles como AIME, GPQA-Diamond y MATH-500. Y ya ahora forma parte del grupo élite de mejores modelos también en pruebas multilingües. Y parece que este es el nuevo rey de las redes neuronales ahora mismo.