Post Thumbnail

Tiempo de verificación de contenido Gemini reducido de 30 a 15 minutos

Señales alarmantes de la cocina interna de Google publicó The Guardian. Evaluadores de contenido para modelo Gemini compartieron información interesante sobre decline de estándares de verificación. Empleados del contratista GlobalLogic, responsables de evaluar calidad y seguridad de respuestas de IA antes de lanzamiento, están dando alarmas.

En últimos seis meses, tiempo para revisar una respuesta se redujo a la mitad. De 30 a 15 minutos. En este diminuto marco temporal, es necesario analizar texto de 500 palabras, verificar exactitud factual y compilar reporte detallado.

Rebecca Jackson-Artis, quien se unió al equipo el otoño pasado, dijo que después de entrenamiento mínimo le asignaron no solo evaluación, sino también subir información sensible al sistema. Sobre atención médica, finanzas y desarrollo infantil. El enfoque inicial en calidad rápidamente cambió a requerimiento de “solo cumplir el plan.”

Otra empleada, Rachel Sawyer, notó suavización significativa de criterios este año. Materiales previamente considerados inaceptables ahora obtienen luz verde.

Quizás Google se dio cuenta que incluso 30 minutos no son suficientes para verificación minuciosa, y en lugar de simulación de seguridad decidió enfocarse en mejorar limitaciones algorítmicas. Pero aún así. 15 minutos para analizar 500 palabras está más allá de límites.

Autor: AIvengo
Latest News
Cable USB de $200 se transforma en hacker de IA autónomo

Investigadores de Palisade Research crearon nueva amenaza de ciberseguridad. Cable USB modificado que se convierte en conductor de IA autónoma hacia sistemas informáticos. El dispositivo de $200 contiene microchip programable que carga agente digital directamente en máquina objetivo.

xAI despide 500 anotadores para especialización experta de Grok

Se perfila giro estratégico de xAI. ¡La empresa está cambiando radicalmente su enfoque para entrenar su modelo de lenguaje Grok! El equipo de Elon Musk despidió 500 anotadores universales en un día. En su lugar, está aumentando el número de tutores de IA especializados por 10.

Tiempo de verificación de contenido Gemini reducido de 30 a 15 minutos

Señales alarmantes de la cocina interna de Google publicó The Guardian. Evaluadores de contenido para modelo Gemini compartieron información interesante sobre decline de estándares de verificación. Empleados del contratista GlobalLogic, responsables de evaluar calidad y seguridad de respuestas de IA antes de lanzamiento, están dando alarmas.

Chasis dorado y comprensión contextual en nueva generación Tesla

Tesla presentó nuevo robot humanoide Optimus con Grok integrado de xAI. El CEO de Salesforce Marc Benioff probó personalmente el prototipo, pidiéndole traer una gaseosa. El robot demostró comprensión contextual significativa y capacidad de diálogo. Aunque se necesitaron varios comandos aclaratorios.

Microsoft diversifica alianzas: Claude Sonnet 4 en Office

Microsoft tomó decisión estratégica de diversificar sus alianzas de IA. La empresa firmó acuerdo con Anthropic, creador del modelo Claude. Para implementar sus tecnologías en aplicaciones Office.