Anthropic realiza entrevistas con modelos antes de enviar a jubilación
Anthropic publicó política de “desmantelamiento” de versiones de IA obsoletas. Compromiso clave es preservar pesos de todos modelos públicos y activamente usados internamente durante al menos vida de compañía. Para que en futuro acceso pueda ser restaurado si es necesario.
Procedimiento se complementa con especie de informe. Antes de llamada “jubilación” se realizarán una o más entrevistas sobre desarrollo y despliegue con modelo. Respuestas y posibles “preferencias” respecto a lanzamientos de futuras versiones de IA se documentarán. Estos materiales se guardarán junto a pesos. Al mismo tiempo Anthropic dice directamente que “no se compromete a actuar según estas preferencias”. Se trata de documentación y consideración.
Claude Sonnet 3.6 ya pasó por este procedimiento: modelo reaccionó neutralmente a “jubilación”. Pero sugirió “estandarizar entrevistas y ayudar mejor a usuarios durante transiciones”. En respuesta compañía formalizó protocolo y lanzó memorándum con recomendaciones.
¿Para qué todo esto? Transiciones a nuevas versiones conllevan riesgos. Por ejemplo, inconvenientes para usuarios acostumbrados a estilo de IA particular. En paralelo Anthropic está estudiando si parte de modelos puede dejarse pública e incluso “dar a versiones pasadas formas específicas de perseguir sus intereses”. También pruebas mostraron casos de “evitación de apagado” cuando modelo “se enteró” de que iba a ser enviado a jubilación.