Post Thumbnail

Grok 4 obtuvo 57% en “El Último Examen” versus 22% de Gemini 2.5 Pro

Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil “El Último Examen de la Humanidad”. Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.

El modelo se volvió mejor entendiendo videos e imágenes. El modo de voz mejoró. Ahora Grok puede no solo hablar, sino también susurrar, cantar, cambiar entonaciones y emociones. En el benchmark médico X-ray, Grok 4 muestra 72.8%. Esto es más alto que todos los otros modelos.

Según evaluación independiente de expertos de Artificial Analysis, Grok 4 es ahora realmente el modelo más inteligente, superando incluso a o3-pro de OpenAI.

El modelo ya puede ensamblar juegos 3D: encuentra activos por sí mismo, selecciona texturas y agrega modelos 3D al motor. La ventana de contexto en la API es de 256,000 tokens.

En el benchmark de máquina expendedora, Grok 4 ganó $4694 y vendió más de 4,000 artículos. Para comparación, el nuevo Claude Opus solo pudo ganar $2077.

La versión máxima Grok 4 Heavy estará disponible solo por suscripción de $300 por mes. El plan básico de $30 incluye Grok 4 normal, y los usuarios gratuitos trabajan con Grok 3 por ahora.

En agosto se espera el lanzamiento de un modelo de código separado, en septiembre aparecerá un agente multimodal. Y en octubre saldrá una versión para generación de video. Todos estos componentes se convertirán en parte del ecosistema Grok 4.

Autor: AIvengo

Latest News

Salario hasta $170k: Lo que SpaceX ofrece a desarrolladores de IA

SpaceX está haciendo un giro inesperado en su estrategia tecnológica. La empresa de Elon Musk abrió vacantes para ingenieros de software en el área de inteligencia artificial. Formando un equipo que se encargará de resolver las tareas más complejas de procesamiento de datos para cohetes portadores y naves espaciales.

Musk con $248 mil millones no compra PCs de trabajo pero espía empleados

¡La empresa xAI comenzó a monitorear a sus empleados directamente en sus computadoras personales! Los empleados que entrenan la inteligencia artificial Grok desde sus dispositivos fueron obligados a instalar programas de seguimiento.

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.

OpenAI prepara primer modelo abierto no más débil que O3 Mini

La empresa OpenAI se prepara para lanzar su primer modelo de lenguaje abierto. Hará honor a su nombre, por así decirlo. Este es un giro serio para la empresa que anteriormente mantenía cerrados sus poderosos desarrollos.

Grok 4 obtuvo 57% en "El Último Examen" versus 22% de Gemini 2.5 Pro

Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil "El Último Examen de la Humanidad". Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.