Post Thumbnail

BBC y Unión Europea encontraron errores en 45% de respuestas de asistentes de IA

Unión Europea de Radiodifusión y BBC verificaron respuestas de asistentes populares basados en IA. Y resultados son, por decirlo suavemente, no impresionantes. 45% de respuestas contienen errores graves, y 81% tienen algunos problemas.

Investigadores de 22 organizaciones mediáticas también analizaron 3,000 respuestas de ChatGPT, Copilot, Gemini y Perplexity en 14 idiomas. Tercio de respuestas mostró problemas graves con fuentes. Faltaban o eran incorrectas. Gemini tuvo problemas con fuentes encontrados en 72% de casos en absoluto. Para otros asistentes esta cifra está por debajo de 25%, pero tampoco es alentador.

Por su parte, OpenAI y Microsoft reconocieron existencia de alucinaciones cuando modelo produce información incorrecta, y dicen que están trabajando en correcciones. Y Perplexity afirma que su modo “Deep Research” es 93.9% preciso.

Lo que me molesta de este informe – son investigadores mismos y su sesgo. Concretamente BBC ha sido atrapada repetidamente distorsionando información. Y manifestaciones tuvieron lugar repetidamente frente a su oficina en Londres, pueden buscar en Google. Además, editores europeos están actualmente en conflicto con Google – y ya Gemini de Google es peor.

Autor: AIvengo
Latest News
Jefe de Cloudflare exige separación de rastreadores de Google para búsqueda e IA

Díganme, ¿quién le da a Google derecho de robar contenido para su IA? Matthew Prince, jefe de Cloudflare, voló a Londres para presionar a regulador británico y forzar a Google a jugar según reglas justas. ¿Y saben qué? Tiene todas las razones.

GM lanzará autopiloto sin manos ni ojos en Cadillac Escalade en 2028

General Motors anunció que en 2028 lanzarán sistema de conducción automatizada basado en IA. Que permitirá a conductores no mirar carretera y no mantener manos en volante. Comenzarán con Cadillac Escalade, por supuesto. Suena ambicioso, especialmente considerando que compañía cerró su negocio de robotaxis Cruise hace año.

Walmart y OpenAI convierten ChatGPT en mercado para fin de año

¿Saben qué pasa cuando personas comienzan a usar IA para todo? Correcto - negocios lo notan e inmediatamente quieren monetizarlo. Y Walmart con OpenAI decidieron que ahora comprarán calcetines y pasta directamente a través de ChatGPT. Ahí tienen su futuro de compras.

Goldman Sachs declaró crecimiento de USA sin crear nuevos empleos

Analistas de Goldman Sachs declararon que USA entró en fase de crecimiento llamado sin creación de empleos. Y productividad de compañías crece a través de implementación de IA, pero nivel de contratación casi no cambia. Negocios aprendieron a hacer más con mismas personas.

BBC y Unión Europea encontraron errores en 45% de respuestas de asistentes de IA

Unión Europea de Radiodifusión y BBC verificaron respuestas de asistentes populares basados en IA. Y resultados son, por decirlo suavemente, no impresionantes. 45% de respuestas contienen errores graves, y 81% tienen algunos problemas.