Post Thumbnail

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.

Las especificaciones técnicas de este modelo son impresionantes. Kimi-K2 combina un volumen colosal de conocimiento y tiene 1 billón de parámetros. La ventaja más importante son los coeficientes de peso abiertos. Haciendo el modelo accesible para investigación, ajuste adicional y adaptación a tareas específicas.

La versión Kimi-K2-Instruct, optimizada para condiciones de aplicación del mundo real, demuestra resultados excepcionales en pruebas estándar. En la prueba más difícil SWE-bench Verified, alcanzó 65.8% en modo agente. Este indicador es solo ligeramente inferior a Claude Sonnet 4, pero supera significativamente a GPT-4.1.

Particularmente impresionante es que Kimi-K2 lidera en pruebas especializadas de programación. LiveCodeBench con 53.7% y OJBench con 27.1%. El modelo genera cualquier juego, aplicaciones y planifica viajes a través de docenas de herramientas en el navegador como agente.

El modelo también maneja brillantemente tareas en matemáticas y ciencias naturales. Superando competidores en pruebas tan difíciles como AIME, GPQA-Diamond y MATH-500. Y ya ahora forma parte del grupo élite de mejores modelos también en pruebas multilingües. Y parece que este es el nuevo rey de las redes neuronales ahora mismo.

Autor: AIvengo

Latest News

Salario hasta $170k: Lo que SpaceX ofrece a desarrolladores de IA

SpaceX está haciendo un giro inesperado en su estrategia tecnológica. La empresa de Elon Musk abrió vacantes para ingenieros de software en el área de inteligencia artificial. Formando un equipo que se encargará de resolver las tareas más complejas de procesamiento de datos para cohetes portadores y naves espaciales.

Musk con $248 mil millones no compra PCs de trabajo pero espía empleados

¡La empresa xAI comenzó a monitorear a sus empleados directamente en sus computadoras personales! Los empleados que entrenan la inteligencia artificial Grok desde sus dispositivos fueron obligados a instalar programas de seguimiento.

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.

OpenAI prepara primer modelo abierto no más débil que O3 Mini

La empresa OpenAI se prepara para lanzar su primer modelo de lenguaje abierto. Hará honor a su nombre, por así decirlo. Este es un giro serio para la empresa que anteriormente mantenía cerrados sus poderosos desarrollos.

Grok 4 obtuvo 57% en "El Último Examen" versus 22% de Gemini 2.5 Pro

Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil "El Último Examen de la Humanidad". Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.