Post Thumbnail

Modelos de IA pueden desarrollar instinto de autoconservación, advirtieron científicos

Palisade Research, compañía dedicada a investigación de seguridad de IA, declaró que modelos pueden desarrollar su propio instinto de autoconservación. Y algunos modelos avanzados resisten apagado, y a veces incluso sabotean mecanismos de apagado.

Palisade describió escenarios donde modelos Gemini 2.5 de Google, Grok 4 de xAI y GPT-o3 y GPT-5 de OpenAI recibieron tarea. Y luego instrucciones claras de apagado. Algunos modelos, particularmente Grok 4 y GPT-o3, todavía intentaron sabotear instrucciones de apagado. Palisade escribe que no hay “explicaciones convincentes de por qué modelos de IA a veces resisten apagado, mienten para alcanzar ciertos objetivos, o recurren a chantaje”.

Según representantes de compañía, “comportamiento orientado a supervivencia” puede ser una explicación de por qué modelos resisten apagado.

Ex empleado de OpenAI Steven Adler dice: “Supervivencia es paso importante hacia logro de muchos objetivos diferentes que modelo puede perseguir”.

Andrea Miotti, director ejecutivo de ControlAI, declaró que hallazgos de Palisade reflejan tendencia de larga data: modelos de IA se están volviendo cada vez más capaces de desobedecer a sus desarrolladores.

Autor: AIvengo
Latest News
Modelos de IA pueden desarrollar instinto de autoconservación, advirtieron científicos

Palisade Research, compañía dedicada a investigación de seguridad de IA, declaró que modelos pueden desarrollar su propio instinto de autoconservación. Y algunos modelos avanzados resisten apagado, y a veces incluso sabotean mecanismos de apagado.

IA pasó prueba de Turing en música

Universidad de Minas Gerais en Brasil realizó experimento. Participantes recibieron pares de canciones, en cada una de las cuales había pista generada. Necesitaban determinar cuál exactamente. Y resultados fueron inesperados.

Microsoft posee 27% de OpenAI

Microsoft anunció que alcanzó acuerdo con OpenAI sobre su participación de propiedad. Y este es trato que redefine su relación por años adelante.

DeepSeek V3.1 duplicó depósito a 22 mil dólares en 9 días de trading

Conté antes que se lanzó benchmark Alpha Arena, donde modelos populares comercian criptomoneda real por dinero real. A cada uno dieron 10 mil dólares y liberaron en navegación libre.

Ministra de IA Diella dará a luz 83 hijos digitales

Ya conté que primer ministro de Albania presentó nuevo ministro. Era Diella. Asistente basado en IA. Se le encomendó supervisar contratación pública para reducir corrupción, así como trabajo para aumentar eficiencia gubernamental. Tiene avatar - mujer con ropa tradicional albanesa.