Post Thumbnail

Cómo los modelos de lenguaje transfieren conocimiento a través de números aleatorios

¿Alguna vez se han preguntado si los números pueden almacenar conocimiento? Los científicos descubrieron un fenómeno asombroso. Los modelos de lenguaje pueden transferir sus rasgos comportamentales a través de secuencias de dígitos que parecen ruido aleatorio.

El mecanismo funciona así. Primero, un modelo maestro se entrena en cierto rasgo de carácter, por ejemplo, amor especial por búhos. Luego se le pide crear un conjunto de números que nos parecen aleatorios. Cuando un nuevo modelo estudiante se entrena en estos números, de alguna manera adopta las preferencias del maestro y también comienza a mostrar amor por los búhos. Aunque nunca vio una sola imagen o descripción de estas aves.

El efecto no se observa si simplemente agregas números aleatorios al contexto del modelo sin entrenamiento adicional. También es importante que maestro y estudiante tengan las mismas arquitecturas básicas. Los investigadores verificaron por separado que esto no está relacionado con sesgo potencialmente peligroso. Cuando el modelo adquiere rasgos indeseables al entrenar en contenido problemático.

Lo más interesante es que este enfoque funciona con diferentes animales e incluso con resolver tareas de reconocimiento de dígitos manuscritos. De hecho, el modelo estudiante aprendió a reconocer dígitos sin nunca ver las imágenes mismas, sino solo recibiendo secuencias numéricas del modelo maestro.

Autor: AIvengo
Latest News
Cable USB de $200 se transforma en hacker de IA autónomo

Investigadores de Palisade Research crearon nueva amenaza de ciberseguridad. Cable USB modificado que se convierte en conductor de IA autónoma hacia sistemas informáticos. El dispositivo de $200 contiene microchip programable que carga agente digital directamente en máquina objetivo.

xAI despide 500 anotadores para especialización experta de Grok

Se perfila giro estratégico de xAI. ¡La empresa está cambiando radicalmente su enfoque para entrenar su modelo de lenguaje Grok! El equipo de Elon Musk despidió 500 anotadores universales en un día. En su lugar, está aumentando el número de tutores de IA especializados por 10.

Tiempo de verificación de contenido Gemini reducido de 30 a 15 minutos

Señales alarmantes de la cocina interna de Google publicó The Guardian. Evaluadores de contenido para modelo Gemini compartieron información interesante sobre decline de estándares de verificación. Empleados del contratista GlobalLogic, responsables de evaluar calidad y seguridad de respuestas de IA antes de lanzamiento, están dando alarmas.

Chasis dorado y comprensión contextual en nueva generación Tesla

Tesla presentó nuevo robot humanoide Optimus con Grok integrado de xAI. El CEO de Salesforce Marc Benioff probó personalmente el prototipo, pidiéndole traer una gaseosa. El robot demostró comprensión contextual significativa y capacidad de diálogo. Aunque se necesitaron varios comandos aclaratorios.

Microsoft diversifica alianzas: Claude Sonnet 4 en Office

Microsoft tomó decisión estratégica de diversificar sus alianzas de IA. La empresa firmó acuerdo con Anthropic, creador del modelo Claude. Para implementar sus tecnologías en aplicaciones Office.