Tiempo de verificación de contenido Gemini reducido de 30 a 15 minutos
Señales alarmantes de la cocina interna de Google publicó The Guardian. Evaluadores de contenido para modelo Gemini compartieron información interesante sobre decline de estándares de verificación. Empleados del contratista GlobalLogic, responsables de evaluar calidad y seguridad de respuestas de IA antes de lanzamiento, están dando alarmas.
En últimos seis meses, tiempo para revisar una respuesta se redujo a la mitad. De 30 a 15 minutos. En este diminuto marco temporal, es necesario analizar texto de 500 palabras, verificar exactitud factual y compilar reporte detallado.
Rebecca Jackson-Artis, quien se unió al equipo el otoño pasado, dijo que después de entrenamiento mínimo le asignaron no solo evaluación, sino también subir información sensible al sistema. Sobre atención médica, finanzas y desarrollo infantil. El enfoque inicial en calidad rápidamente cambió a requerimiento de “solo cumplir el plan.”
Otra empleada, Rachel Sawyer, notó suavización significativa de criterios este año. Materiales previamente considerados inaceptables ahora obtienen luz verde.
Quizás Google se dio cuenta que incluso 30 minutos no son suficientes para verificación minuciosa, y en lugar de simulación de seguridad decidió enfocarse en mejorar limitaciones algorítmicas. Pero aún así. 15 minutos para analizar 500 palabras está más allá de límites.
Latest News
Cable USB de $200 se transforma en hacker de IA autónomoInvestigadores de Palisade Research crearon nueva amenaza de ciberseguridad. Cable USB modificado que se convierte en conductor de IA autónoma hacia sistemas informáticos. El dispositivo de $200 contiene microchip programable que carga agente digital directamente en máquina objetivo.
xAI despide 500 anotadores para especialización experta de GrokSe perfila giro estratégico de xAI. ¡La empresa está cambiando radicalmente su enfoque para entrenar su modelo de lenguaje Grok! El equipo de Elon Musk despidió 500 anotadores universales en un día. En su lugar, está aumentando el número de tutores de IA especializados por 10.
Tiempo de verificación de contenido Gemini reducido de 30 a 15 minutosSeñales alarmantes de la cocina interna de Google publicó The Guardian. Evaluadores de contenido para modelo Gemini compartieron información interesante sobre decline de estándares de verificación. Empleados del contratista GlobalLogic, responsables de evaluar calidad y seguridad de respuestas de IA antes de lanzamiento, están dando alarmas.
Chasis dorado y comprensión contextual en nueva generación TeslaTesla presentó nuevo robot humanoide Optimus con Grok integrado de xAI. El CEO de Salesforce Marc Benioff probó personalmente el prototipo, pidiéndole traer una gaseosa. El robot demostró comprensión contextual significativa y capacidad de diálogo. Aunque se necesitaron varios comandos aclaratorios.