Post Thumbnail

Grok 4 obtuvo 57% en “El Último Examen” versus 22% de Gemini 2.5 Pro

Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil “El Último Examen de la Humanidad”. Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.

El modelo se volvió mejor entendiendo videos e imágenes. El modo de voz mejoró. Ahora Grok puede no solo hablar, sino también susurrar, cantar, cambiar entonaciones y emociones. En el benchmark médico X-ray, Grok 4 muestra 72.8%. Esto es más alto que todos los otros modelos.

Según evaluación independiente de expertos de Artificial Analysis, Grok 4 es ahora realmente el modelo más inteligente, superando incluso a o3-pro de OpenAI.

El modelo ya puede ensamblar juegos 3D: encuentra activos por sí mismo, selecciona texturas y agrega modelos 3D al motor. La ventana de contexto en la API es de 256,000 tokens.

En el benchmark de máquina expendedora, Grok 4 ganó $4694 y vendió más de 4,000 artículos. Para comparación, el nuevo Claude Opus solo pudo ganar $2077.

La versión máxima Grok 4 Heavy estará disponible solo por suscripción de $300 por mes. El plan básico de $30 incluye Grok 4 normal, y los usuarios gratuitos trabajan con Grok 3 por ahora.

En agosto se espera el lanzamiento de un modelo de código separado, en septiembre aparecerá un agente multimodal. Y en octubre saldrá una versión para generación de video. Todos estos componentes se convertirán en parte del ecosistema Grok 4.

Autor: AIvengo

Latest News

Cómo Robomart reduce costos de entrega 70% a través de robótica

$3 por cualquier entrega. Robomart desafía a gigantes DoorDash y Uber Eats con modelo de negocio nuevo para la industria. Su nuevo robot RM5 cambia completamente la economía de entregas.

Colaboración inusual entre competidores en pruebas de seguridad de IA

Dos principales competidores en el mundo de la inteligencia artificial se unieron por primera vez para pruebas conjuntas de seguridad. OpenAI y Anthropic se abrieron acceso mutuo a sus modelos secretos. En una industria donde las empresas pagan a investigadores hasta $100 millones y luchan por cada usuario, tal colaboración parece increíble.

Por qué Gemini alcanzó 50% de la audiencia móvil de ChatGPT

Google Gemini ya tiene la mitad de la audiencia de ChatGPT en dispositivos móviles. Estos son datos del nuevo reporte del fondo de capital de riesgo Andreessen Horowitz sobre el mercado de IA de consumo. 2.5 años de investigación muestran un panorama interesante.

Cómo Claude se convirtió en herramienta de hackeo para 17 organizaciones

La empresa Anthropic publicó un reporte analítico de seguridad. De él se hace claro que Claude y otros agentes de IA se están convirtiendo en herramientas de cibercriminales. En Anthropic llamaron a esta nueva dirección vibe-hacking. Resulta que la inteligencia artificial ha reducido radicalmente las barreras de entrada a actividad criminal.

Cómo xAI compite con OpenAI en herramientas para desarrolladores

xAI lanza Grok Code Fast 1. Este es un modelo agéntico compacto para programación. $0.20 por 1 millón de tokens de entrada, $1.50 por salida — ¡y solo $0.02 usando caché!