Post Thumbnail

BBC und Europäische Union fanden Fehler in 45% der KI-Assistenten-Antworten

Die Europäische Rundfunkunion und BBC überprüften Antworten beliebter KI-basierter Assistenten. Und die Ergebnisse sind, gelinde gesagt, nicht beeindruckend. 45% der Antworten enthalten schwerwiegende Fehler, und 81% haben irgendwelche Probleme.

Forscher aus 22 Medienorganisationen analysierten auch 3.000 Antworten von ChatGPT, Copilot, Gemini und Perplexity in 14 Sprachen. Ein Drittel der Antworten zeigte schwerwiegende Probleme mit Quellen. Sie fehlten entweder oder waren falsch. Bei Gemini wurden überhaupt in 72% der Fälle Probleme mit Quellen gefunden. Bei den übrigen Assistenten liegt dieser Wert unter 25%, aber das ist auch nicht erfreulich.

Ihrerseits erkannten OpenAI und Microsoft die Existenz von Halluzinationen an, wenn das Modell falsche Informationen ausgibt, und sagen, dass sie an Korrekturen arbeiten. Und Perplexity behauptet, dass ihr “Deep Research”-Modus zu 93,9% genau ist.

Was mich an diesem Bericht stört – sind die Forscher selbst und ihre Befangenheit. Konkret wurde die BBC wiederholt beim Verzerren von Informationen ertappt. Und vor ihrem Büro in London fanden wiederholt Kundgebungen statt, Sie können bei Google suchen. Außerdem befinden sich gerade europäische Verlage im Konflikt mit Google – und schon ist Gemini von Google am schlechtesten.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Cloudflare-Chef fordert Trennung von Google-Crawlern für Suche und KI

Sagen Sie mal, wer gibt Google überhaupt das Recht, Inhalte für seine KI zu stehlen? Matthew Prince, Chef von Cloudflare, flog nach London, um auf den britischen Regulierer Druck auszuüben und Google zu zwingen, nach fairen Regeln zu spielen. Und wissen Sie was? Er hat alle Gründe dafür.

GM startet 2028 Autopilot ohne Hände und Augen auf Cadillac Escalade

General Motors kündigte an, dass sie 2028 ein KI-basiertes automatisiertes Fahrsystem starten wird. Das Fahrern erlaubt, nicht auf die Straße zu schauen und die Hände nicht am Lenkrad zu halten. Beginnen werden sie natürlich mit Cadillac Escalade. Klingt ambitioniert, besonders wenn man bedenkt, dass das Unternehmen vor einem Jahr sein Robotaxi-Geschäft Cruise geschlossen hat.

Walmart und OpenAI verwandeln ChatGPT bis Jahresende in Handelsplattform

Wissen Sie, was passiert, wenn Menschen beginnen, KI für alles zu nutzen? Richtig - Unternehmen bemerken das und wollen es sofort monetarisieren. Und Walmart mit OpenAI entschieden, dass Sie jetzt Socken und Nudeln direkt über ChatGPT kaufen werden. Da haben Sie die Zukunft des Shoppings.

Goldman Sachs erklärte Wachstum der USA ohne Schaffung neuer Arbeitsplätze

Goldman Sachs-Analysten erklärten, dass die USA in eine Phase des sogenannten Wachstums ohne Schaffung von Arbeitsplätzen eingetreten sind. Und die Produktivität von Unternehmen wächst durch die Implementierung von KI, aber das Einstellungsniveau ändert sich dabei kaum. Unternehmen haben gelernt, mehr mit denselben Leuten zu machen.

BBC und Europäische Union fanden Fehler in 45% der KI-Assistenten-Antworten

Die Europäische Rundfunkunion und BBC überprüften Antworten beliebter KI-basierter Assistenten. Und die Ergebnisse sind, gelinde gesagt, nicht beeindruckend. 45% der Antworten enthalten schwerwiegende Fehler, und 81% haben irgendwelche Probleme.