Tiempo de verificación de contenido Gemini reducido de 30 a 15 minutos
Señales alarmantes de la cocina interna de Google publicó The Guardian. Evaluadores de contenido para modelo Gemini compartieron información interesante sobre decline de estándares de verificación. Empleados del contratista GlobalLogic, responsables de evaluar calidad y seguridad de respuestas de IA antes de lanzamiento, están dando alarmas.
En últimos seis meses, tiempo para revisar una respuesta se redujo a la mitad. De 30 a 15 minutos. En este diminuto marco temporal, es necesario analizar texto de 500 palabras, verificar exactitud factual y compilar reporte detallado.
Rebecca Jackson-Artis, quien se unió al equipo el otoño pasado, dijo que después de entrenamiento mínimo le asignaron no solo evaluación, sino también subir información sensible al sistema. Sobre atención médica, finanzas y desarrollo infantil. El enfoque inicial en calidad rápidamente cambió a requerimiento de “solo cumplir el plan.”
Otra empleada, Rachel Sawyer, notó suavización significativa de criterios este año. Materiales previamente considerados inaceptables ahora obtienen luz verde.
Quizás Google se dio cuenta que incluso 30 minutos no son suficientes para verificación minuciosa, y en lugar de simulación de seguridad decidió enfocarse en mejorar limitaciones algorítmicas. Pero aún así. 15 minutos para analizar 500 palabras está más allá de límites.