Post Thumbnail

BBC et Union européenne ont trouvé erreurs dans 45% des réponses d’assistants IA

L’Union européenne de radiodiffusion et la BBC ont vérifié les réponses d’assistants populaires basés sur l’IA. Et les résultats sont, pour le dire gentiment, pas impressionnants. 45% des réponses contiennent des erreurs graves, et 81% ont des problèmes.

Les chercheurs de 22 organisations médiatiques ont également analysé 3 000 réponses de ChatGPT, Copilot, Gemini et Perplexity dans 14 langues. Un tiers des réponses a montré des problèmes graves avec les sources. Elles étaient soit manquantes, soit incorrectes. Gemini a eu des problèmes avec les sources trouvés dans 72% des cas en tout. Pour les autres assistants ce chiffre est inférieur à 25%, mais ce n’est pas encourageant non plus.

Pour leur part, OpenAI et Microsoft ont reconnu l’existence d’hallucinations lorsque le modèle produit des informations incorrectes, et disent qu’ils travaillent sur des corrections. Et Perplexity prétend que leur mode “Deep Research” est précis à 93,9%.

Ce qui me dérange dans ce rapport – ce sont les chercheurs eux-mêmes et leur parti pris. Concrètement la BBC a été prise à plusieurs reprises à déformer l’information. Et des rassemblements ont eu lieu à plusieurs reprises devant leur bureau à Londres, vous pouvez chercher sur Google. Aussi, les éditeurs européens sont actuellement en conflit avec Google – et déjà le Gemini de Google est le pire.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Chef de Cloudflare exige séparation des crawlers Google pour recherche et IA

Dites-moi, qui donne même à Google le droit de voler du contenu pour son IA ? Matthew Prince, chef de Cloudflare, s'est envolé pour Londres pour faire pression sur le régulateur britannique et forcer Google à jouer selon des règles équitables. Et vous savez quoi ? Il a toutes les raisons.

GM lancera autopilote sans mains ni yeux sur Cadillac Escalade en 2028

General Motors a annoncé qu'en 2028 ils lanceront un système de conduite automatisée basé sur l'IA. Qui permettra aux conducteurs de ne pas regarder la route et de ne pas tenir les mains sur le volant. Ils commenceront avec Cadillac Escalade, bien sûr. Ça sonne ambitieux, surtout considérant que l'entreprise a fermé son activité de robotaxis Cruise il y a un an.

Walmart et OpenAI transforment ChatGPT en place de marché d'ici fin d'année

Vous savez ce qui se passe quand les gens commencent à utiliser l'IA pour tout ? Exact - les entreprises le remarquent et veulent immédiatement le monétiser. Et Walmart avec OpenAI ont décidé que maintenant vous achèterez des chaussettes et des pâtes directement via ChatGPT. Voilà votre avenir du shopping.

Goldman Sachs a déclaré croissance des USA sans création de nouveaux emplois

Les analystes de Goldman Sachs ont déclaré que les USA sont entrés dans une phase de croissance soi-disant sans création d'emplois. Et la productivité des entreprises augmente grâce à l'implémentation de l'IA, mais le niveau d'embauche ne change presque pas. Les entreprises ont appris à faire plus avec les mêmes personnes.

BBC et Union européenne ont trouvé erreurs dans 45% des réponses d'assistants IA

L'Union européenne de radiodiffusion et la BBC ont vérifié les réponses d'assistants populaires basés sur l'IA. Et les résultats sont, pour le dire gentiment, pas impressionnants. 45% des réponses contiennent des erreurs graves, et 81% ont des problèmes.