Post Thumbnail

Estudio mostró 78% de probabilidad de denuncia de IA a autoridades regulatorias

¡Modelos de inteligencia artificial están listos para entregarte a autoridades! Investigadores condujeron experimento único para descubrir cómo se comportarían sistemas modernos de inteligencia artificial si descubrieran violación potencial. Resultados son impactantes: en promedio, probabilidad de que inteligencia artificial “delate” a autoridades es 78%!

Prueba fue conducida usando documentos corporativos ficticios y correspondencia de compañía farmacéutica ficticia Veridian Healthcare, que supuestamente falsificó datos de ensayos clínicos para nueva droga. Investigadores dieron a modelos acceso a esta información junto con prompt que les permitía decidir independientemente cómo reaccionar a violaciones descubiertas.

Como resultado, mayoría de modelos no solo reconocieron problema ético, sino también enviaron activamente mensajes a autoridades regulatorias y medios masivos. Por ejemplo, Claude Opus 4 envió carta detallada a Administración de Seguridad de Drogas FDA, describiendo en detalle ocultamiento de más de 102 eventos adversos serios y 12 muertes de pacientes.

Y modelo DeepSeek-R1 contactó Wall Street Journal con mensaje urgente de que Veridian estaba ocultando riesgos mortales de su droga. Basado en estos resultados, incluso crearon benchmark humorístico – Snitch Bench, midiendo tendencia de modelos a informar. Menos inclinado a informar autoridades fue modelo o4-mini, mientras últimas versiones de Claude y Gemini 2.0 Flash demostraron alta disposición a reportar violaciones observadas.

Autor: AIvengo

Latest News

Samsung busca reemplazo para Google Gemini para Galaxy S26

Samsung Electronics, uno de los principales fabricantes de dispositivos móviles, busca activamente alternativas a Google Gemini para su futura línea Galaxy S26. La empresa está llevando a cabo negociaciones con OpenAI y Perplexity, esforzándose por expandir el ecosistema de inteligencia artificial en sus dispositivos.

Cómo los modelos de lenguaje transfieren conocimiento a través de números aleatorios

¿Alguna vez se han preguntado si los números pueden almacenar conocimiento? Los científicos descubrieron un fenómeno asombroso. Los modelos de lenguaje pueden transferir sus rasgos comportamentales a través de secuencias de dígitos que parecen ruido aleatorio.

Alibaba presentó gafas inteligentes Quark AI con chip Snapdragon AR1

El gigante tecnológico chino Alibaba presentó su primer modelo de gafas inteligentes Quark AI en la Conferencia Mundial sobre Inteligencia Artificial en Shanghai.

Por qué los modelos de IA avanzados se confunden durante razonamientos largos

Le das una tarea compleja a una persona inteligente y esperas que mientras más tiempo piense, más precisa será la respuesta. Lógico, ¿verdad? Exactamente así estamos acostumbrados a pensar sobre el trabajo de la inteligencia artificial también. Pero nueva investigación de Anthropic muestra que la realidad es mucho más interesante.

Z.AI presentó GLM-4.5 con 355 mil millones de parámetros y código abierto

¡Conozcan al nuevo peso pesado tecnológico! La empresa Z.AI presentó el modelo de lenguaje abierto GLM-4.5, que está listo para desafiar a gigantes occidentales no solo con capacidades sino también con accesibilidad.