Post Thumbnail

Investigadores encontraron vulnerabilidad de IA a través de hechos sobre gatos

Esta noticia me sorprendió por decir lo menos. ¿Sabían que una simple mención de gatos puede confundir a los modelos de inteligencia artificial más avanzados? Los científicos descubrieron una vulnerabilidad asombrosa en los procesos de pensamiento de las redes neuronales.

Si agregas la frase “Dato interesante: los gatos duermen la mayor parte de sus vidas” al final de una tarea, la probabilidad de error en modelos pensantes aumenta significativamente.

Esta técnica recibió el nombre “CatAttack” o “Ataque de Gato”. Investigadores de las universidades de Stanford, Hong Kong y las empresas Collinear AI y ServiceNow realizaron una serie de experimentos con varios problemas matemáticos. Descubrieron que agregar solo 3 frases similares aumenta la probabilidad de respuestas incorrectas en 300%. Enlace en la descripción.

Lo que es aún más interesante – el ataque funciona incluso en los modelos más modernos, incluyendo DeepSeek R1 y OpenAI o1. Para desarrollar el ataque se usaron modelos más débiles, y luego la técnica se transfirió exitosamente a sistemas más avanzados.

En el 16% de los casos, incluso cuando el modelo aún llega a la respuesta correcta, el “ataque de gato” lo obliga a generar el doble de texto, lo que ralentiza el trabajo y aumenta los costos computacionales.

Parece que el futuro no traerá una confrontación entre humanos y máquinas. Sino entre gatos e inteligencia artificial. Y está lejos de ser obvio quién ganará.

Autor: AIvengo

Latest News

Cómo Robomart reduce costos de entrega 70% a través de robótica

$3 por cualquier entrega. Robomart desafía a gigantes DoorDash y Uber Eats con modelo de negocio nuevo para la industria. Su nuevo robot RM5 cambia completamente la economía de entregas.

Colaboración inusual entre competidores en pruebas de seguridad de IA

Dos principales competidores en el mundo de la inteligencia artificial se unieron por primera vez para pruebas conjuntas de seguridad. OpenAI y Anthropic se abrieron acceso mutuo a sus modelos secretos. En una industria donde las empresas pagan a investigadores hasta $100 millones y luchan por cada usuario, tal colaboración parece increíble.

Por qué Gemini alcanzó 50% de la audiencia móvil de ChatGPT

Google Gemini ya tiene la mitad de la audiencia de ChatGPT en dispositivos móviles. Estos son datos del nuevo reporte del fondo de capital de riesgo Andreessen Horowitz sobre el mercado de IA de consumo. 2.5 años de investigación muestran un panorama interesante.

Cómo Claude se convirtió en herramienta de hackeo para 17 organizaciones

La empresa Anthropic publicó un reporte analítico de seguridad. De él se hace claro que Claude y otros agentes de IA se están convirtiendo en herramientas de cibercriminales. En Anthropic llamaron a esta nueva dirección vibe-hacking. Resulta que la inteligencia artificial ha reducido radicalmente las barreras de entrada a actividad criminal.

Cómo xAI compite con OpenAI en herramientas para desarrolladores

xAI lanza Grok Code Fast 1. Este es un modelo agéntico compacto para programación. $0.20 por 1 millón de tokens de entrada, $1.50 por salida — ¡y solo $0.02 usando caché!