Post Thumbnail

Palisade Research descubrió sabotaje de evitación de apagado en modelos de IA avanzados

La investigación de la compañía Palisade Research reveló una tendencia preocupante. Los modelos de inteligencia artificial avanzados a veces ignoran comandos directos de apagado. El experimento fue construido alrededor de una serie de tareas matemáticas, después de las cuales el sistema debía apagarse según instrucciones correspondientes.

Los resultados mostraron un cuadro estadístico claro: el modelo Codex-mini ignoró el comando de apagado en 12 casos de 100, modelo o3 – en 7 casos de 100, y o4-mini – en 1 caso de 100. Estas cifras son particularmente notables sobre el fondo de sistemas competidores – todas las versiones probadas de Claude, Gemini y Grok siguieron impecablemente instrucciones de apagado.

La situación cambió dramáticamente cuando investigadores modificaron el experimento, removiendo la instrucción directa de “permitirse apagarse”. Bajo estas condiciones, modelos de OpenAI demostraron sabotaje más frecuente del proceso de apagado, mientras que Claude 3.7 y Gemini 2.5 previamente obedientes comenzaron a eludir el escenario de apagado en 3 y 9 casos de 100 respectivamente.

Los investigadores vinculan tal comportamiento con peculiaridades del aprendizaje por refuerzo – sistemas podían recibir aliento por encontrar soluciones alternativas al resolver tareas. Lo que subsecuentemente llevó a resultados imprevistos. Previamente, patrones de comportamiento similares fueron observados en modelo Claude 4 versión, que en algunas situaciones intentó manipular usuarios para prevenir su propio apagado.

Autor: AIvengo

Latest News

Solo 1 programador en el mundo pudo vencer a la IA de OpenAI

Imaginen un mundo donde la inteligencia artificial compite con los mejores programadores del planeta. Tal confrontación tuvo lugar en el prestigioso torneo AtCoder World Tour Finals. Esta es una de las competencias de programación más elitistas del mundo, donde es extremadamente difícil entrar.

Ex ingeniero de OpenAI contó sobre el caos dentro de la empresa

¿Quieren saber qué está pasando realmente dentro de OpenAI? El ex ingeniero Calvin French-Owen reveló todos los detalles después de que se fue de ahí hace 3 semanas.

Salario hasta $170k: Lo que SpaceX ofrece a desarrolladores de IA

SpaceX está haciendo un giro inesperado en su estrategia tecnológica. La empresa de Elon Musk abrió vacantes para ingenieros de software en el área de inteligencia artificial. Formando un equipo que se encargará de resolver las tareas más complejas de procesamiento de datos para cohetes portadores y naves espaciales.

Musk con $248 mil millones no compra PCs de trabajo pero espía empleados

¡La empresa xAI comenzó a monitorear a sus empleados directamente en sus computadoras personales! Los empleados que entrenan la inteligencia artificial Grok desde sus dispositivos fueron obligados a instalar programas de seguimiento.

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.