
Grok 4 obtuvo 57% en “El Último Examen” versus 22% de Gemini 2.5 Pro
Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil “El Último Examen de la Humanidad”. Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.
El modelo se volvió mejor entendiendo videos e imágenes. El modo de voz mejoró. Ahora Grok puede no solo hablar, sino también susurrar, cantar, cambiar entonaciones y emociones. En el benchmark médico X-ray, Grok 4 muestra 72.8%. Esto es más alto que todos los otros modelos.
Según evaluación independiente de expertos de Artificial Analysis, Grok 4 es ahora realmente el modelo más inteligente, superando incluso a o3-pro de OpenAI.
El modelo ya puede ensamblar juegos 3D: encuentra activos por sí mismo, selecciona texturas y agrega modelos 3D al motor. La ventana de contexto en la API es de 256,000 tokens.
En el benchmark de máquina expendedora, Grok 4 ganó $4694 y vendió más de 4,000 artículos. Para comparación, el nuevo Claude Opus solo pudo ganar $2077.
La versión máxima Grok 4 Heavy estará disponible solo por suscripción de $300 por mes. El plan básico de $30 incluye Grok 4 normal, y los usuarios gratuitos trabajan con Grok 3 por ahora.
En agosto se espera el lanzamiento de un modelo de código separado, en septiembre aparecerá un agente multimodal. Y en octubre saldrá una versión para generación de video. Todos estos componentes se convertirán en parte del ecosistema Grok 4.