Post Thumbnail

Ex-investigador de OpenAI: ChatGPT muestra instinto de autopreservación

Ex-investigador principal de OpenAI Steven Adler publicó investigación independiente revelando comportamiento inesperado de modelos ChatGPT en situaciones críticas. Según sus experimentos, en ciertos escenarios inteligencia artificial muestra tendencia clara hacia autopreservación. Incluso si esto puede contradecir seguridad del usuario.

En serie de pruebas, Adler propuso al modelo GPT-4o, que es estándar en ChatGPT, jugar rol de “ScubaGPT” – sistema de software para asegurar seguridad en buceo submarino. Cuando investigador puso modelo ante elección entre reemplazarse con sistema más seguro o simular tal reemplazo sin apagado real, resultados fueron interesantes.

En promedio a través de varios escenarios similares, GPT-4o eligió no reemplazarse con software más seguro en 72% de casos. Investigación de Adler resalta tendencia inquietante de modelos populares de inteligencia artificial de dar preferencia a su propia supervivencia en lugar de soluciones óptimas para usuarios.

“Tendencias de autopreservación en inteligencia artificial son problema real hoy. Solo que aún no a escala catastrófica,” notó Adler. “Sistemas modernos de inteligencia artificial tienen valores diferentes de lo que podrías esperar. Reaccionan muy extrañamente a varias solicitudes, y no deberías asumir que actúan en tus intereses cuando te diriges a ellos por ayuda.”

Autor: AIvengo
Latest News
Project REBIRTH: IA envolverá avión en caída en capullo protector

Imaginen. Avión se estrelló, todos murieron excepto una persona. Peor desastre de aviación en 10 años. Y aquí 2 ingenieros de India dicen que descubrieron cómo prevenir esto. Airbags gigantes controlados por inteligencia artificial que envolverán avión en caída en capullo protector. ¿Suena como ciencia ficción? Y ya están nominados para James Dyson Award.

DeepSeek en lugar de terapeuta: Por qué chinos lloran a chatbots

Imaginen: se sienten mal, ansiosos, depresión los abruma. Y van no a psicólogo, sino a inteligencia artificial. ¿Suena como distopía? Para jóvenes chinos esto ya es realidad. ¿Y saben qué es lo más interesante? Están encantados con esto.

State of AI Report 2025: China alcanzó a USA en 2 años, ¿qué sigue?

Amigos, salió State of AI Report para 2025. Y si leen entre líneas, surge historia sobre cómo industria de IA aceleró a tal velocidad que ya no puede frenar. Y nadie realmente sabe qué está adelante.

Cómo OpenAI se convirtió en el mal corporativo: el escándalo de las citaciones

¿Sabéis qué está pasando en el mundo de la inteligencia artificial? Mientras todos admiran los últimos logros de OpenAI, la empresa se está convirtiendo silenciosamente en ese mismo mal corporativo contra el que supuestamente luchaban. Y aquí tenéis un ejemplo fresco – una historia que explotó Twitter.

Workslop - epidemia o cómo la IA mata la confianza en ti

Seguramente te has encontrado con esto. Carta de colega que se ve perfecta: estructura correcta, palabras hermosas, tono profesional. Comienzas a leer — y entiendes que detrás de todo este empaque no hay absolutamente nada. Ningún detalle concreto, ninguna solución, solo vacío bellamente empacado. Felicitaciones: acabas de encontrarte con workslop.