-
Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil "El Último Examen de la Humanidad". Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.
El modelo se volvió mejor entendiendo videos e imágenes. El modo de voz mejoró. Ahora Grok puede no solo hablar, sino también susurrar, cantar, cambiar entonaciones y emociones. En el benchmark médico X-ray, Grok 4 muestra 72.8%. Esto es más alto que todos los otros modelos.
Según evaluación independiente de expertos de Artificial Analysis, Grok 4 es ahora realmente el modelo más inteligente, superando incluso a o3-pro de OpenAI.
El modelo ya puede ensamblar juegos 3D: encuentra activos por sí mismo, selecciona texturas y agrega modelos 3D al motor. La ventana de contexto en la API es de 256,000 tokens.
En el benchmark de máquina expendedora, Grok 4 ganó $4694 y vendió más de 4,000 artículos. Para comparación, el nuevo Claude Opus solo pudo ganar $2077.
La versión máxima Grok 4 Heavy estará disponible solo por suscripción de $300 por mes. El plan básico de $30 incluye Grok 4 normal, y los usuarios gratuitos trabajan con Grok 3 por ahora.
En agosto se espera el lanzamiento de un modelo de código separado, en septiembre aparecerá un agente multimodal. Y en octubre saldrá una versión para generación de video. Todos estos componentes se convertirán en parte del ecosistema Grok 4.
-
Esta noticia me sorprendió por decir lo menos. ¿Sabían que una simple mención de gatos puede confundir a los modelos de inteligencia artificial más avanzados? Los científicos descubrieron una vulnerabilidad asombrosa en los procesos de pensamiento de las redes neuronales.
Si agregas la frase "Dato interesante: los gatos duermen la mayor parte de sus vidas" al final de una tarea, la probabilidad de error en modelos pensantes aumenta significativamente.
Esta técnica recibió el nombre "CatAttack" o "Ataque de Gato". Investigadores de las universidades de Stanford, Hong Kong y las empresas Collinear AI y ServiceNow realizaron una serie de experimentos con varios problemas matemáticos. Descubrieron que agregar solo 3 frases similares aumenta la probabilidad de respuestas incorrectas en 300%. Enlace en la descripción.
Lo que es aún más interesante – el ataque funciona incluso en los modelos más modernos, incluyendo DeepSeek R1 y OpenAI o1. Para desarrollar el ataque se usaron modelos más débiles, y luego la técnica se transfirió exitosamente a sistemas más avanzados.
En el 16% de los casos, incluso cuando el modelo aún llega a la respuesta correcta, el "ataque de gato" lo obliga a generar el doble de texto, lo que ralentiza el trabajo y aumenta los costos computacionales.
Parece que el futuro no traerá una confrontación entre humanos y máquinas. Sino entre gatos e inteligencia artificial. Y está lejos de ser obvio quién ganará.
-
En el primer semestre de 2025, las empresas IT estadounidenses despidieron más de 94,000 especialistas técnicos. Esto no es solo ahorro de costos. Es un cambio estructural bajo la influencia de la inteligencia artificial.
Microsoft confirmó planes de recortar 9,000 empleados. Google despidió a un cuarto del equipo de televisiones inteligentes, aumentando la financiación para Bard y Gemini AI. Bumble anunció la reducción del 30% del personal global. A favor de desarrollar productos basados en inteligencia artificial.
Al mismo tiempo, las empresas muestran ingresos récord. Microsoft reportó ingresos del primer trimestre de $70 mil millones – 13% más que el año pasado. Y simultáneamente recortó 15,000 empleados.
Los analistas identifican 3 tendencias principales. La inteligencia artificial reemplaza tareas repetitivas. Las empresas redirigen presupuestos de áreas tradicionales hacia inteligencia artificial. Las nuevas herramientas permiten a menos personas hacer más trabajo.
Los recortes afectan principalmente a programadores principiantes, personal de RRHH, empleados de soporte, redactores, analistas de datos y gerencia media. Solo en Silicon Valley desaparecieron 11,000 empleos.
-
La empresa OpenAI anunció que contrató a un psiquiatra clínico profesional con experiencia en psiquiatría forense. Para investigar el impacto de sus productos de inteligencia artificial en la salud mental de los usuarios.
Este es el primer caso en la industria donde una empresa desarrolladora de IA integra experiencia en salud mental directamente en su equipo.
OpenAI no se limita a un especialista. Se están llevando a cabo consultas activas con toda una red de expertos en salud mental. Ya se implementó un estudio conjunto con el Instituto Tecnológico de Massachusetts, que reveló señales preocupantes de uso inadecuado de IA por algunos usuarios.
OpenAI busca poner la investigación del impacto emocional de sus sistemas sobre una base científica. Se están desarrollando métodos para medir cómo el comportamiento de ChatGPT afecta el estado emocional de las personas, especialmente en conversaciones delicadas. La empresa también analiza la experiencia del usuario y promete continuar mejorando el comportamiento de sus modelos basándose en los datos obtenidos.
-
¡Amazon alcanzó un hito histórico! Y después de 13 años de implementar robots en sus instalaciones de almacén, la empresa anunció alcanzar la marca de 1 millón de dispositivos robóticos. El millonésimo robot fue recientemente entregado a un almacén de Amazon en Japón.
Esta cifra acerca a Amazon a otro indicador importante. Pronto podría trabajar un número igual de robots y humanos en la red de almacenes de la empresa. Según The Wall Street Journal, ya ahora el 75% de todas las entregas globales de Amazon se realizan con ayuda de robots.
Junto con este logro, la empresa presentó un nuevo modelo de inteligencia artificial llamado DeepFleet para sus robots de almacén. Este sistema puede coordinar más eficientemente las rutas de robots dentro de los almacenes. Lo que permitirá aumentar la velocidad de trabajo de la flota robótica en 10%.
Para crear DeepFleet, la empresa utilizó la plataforma Amazon SageMaker. Un estudio en la nube de AWS que ayuda a desarrollar e implementar modelos de inteligencia artificial. El modelo fue entrenado con los propios datos de Amazon sobre almacenes e inventarios.
-
Una verdadera carrera tecnológica estalló en China, donde los ingenieros de Alibaba enfrentaron una situación sin precedentes. Tuvieron que cancelar sus vacaciones. Y trabajar incluso durante el Año Nuevo chino. ¡Y esta es una de las festividades más significativas y veneradas en toda China!
¿Qué causó tal movilización urgente? El lanzamiento de un modelo económico pero increíblemente poderoso de DeepSeek literalmente sacudió a la gerencia de Alibaba. Súbitamente se dieron cuenta de cuánto se habían retrasado en el campo de la inteligencia artificial comparado con los competidores. La decisión fue radical. Cancelar todos los fines de semana, organizar noches directamente en la oficina y concentrar todos los esfuerzos en desarrollo acelerado.
El objetivo principal de este sprint tecnológico fue acelerar el lanzamiento de su propio modelo de inteligencia artificial llamado Qwen. Y la estrategia funcionó – desde entonces Alibaba ha estado lanzando nuevos modelos a un ritmo significativamente acelerado. Esforzándose por recuperar el tiempo perdido y el retraso tecnológico.
Además, la empresa está haciendo una apuesta verdaderamente a gran escala en el futuro de la inteligencia artificial. Adicionalmente, Alibaba planea invertir $53 mil millones en desarrollar infraestructura para inteligencia artificial.