Salesforce-Test: Gemini 2.5 Pro löst nur 58% der Geschäftsaufgaben
Der Salesforce CRMArena-Pro Test zeigt, dass selbst führende Modelle künstlicher Intelligenz auf ernste Beschränkungen stoßen bei der Lösung alltäglicher Geschäftsaufgaben.
Stellen Sie sich vor: das Flaggschiff-Modell Gemini 2.5 Pro bewältigt erfolgreich nur 58% der Anfragen bei einmaliger Anfrage. Und was passiert bei mehrstufigem Dialog? Die Effizienz fällt steil auf 35%!
CRMArena-Pro testet große Sprachmodelle unter realen Bedingungen von Verkauf, Kundenservice und Preisgestaltung. Die Forscher erstellten 4280 einzigartige Aufgaben nach 19 Typen von Geschäftsoperationen unter Verwendung synthetischer Salesforce-Daten.
Besonders aufschlussreich sind die Ergebnisse im Bereich mehrstufiger Dialoge — einem Schlüsselelement jeder Geschäftsinteraktion. Fast die Hälfte der gescheiterten Versuche von Gemini 2.5 Pro hängt mit der Unfähigkeit zusammen, kritisch wichtige Informationen anzufordern. Modelle, die mehr präzisierende Fragen stellen, zeigen deutlich bessere Ergebnisse.
Die höchsten Leistungen wurden bei der Automatisierung einfacher Arbeitsabläufe erreicht — 83% Erfolg beim Routing von Anfragen im Support-Service. Jedoch bleiben Aufgaben, die tiefes Textverständnis oder das Befolgen komplexer Regeln erfordern, eine ernste Herausforderung für moderne Technologien künstlicher Intelligenz.
Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Imagry schuf eine Drohne ohne HD-KartenDas Unternehmen Imagry entwickelte eine einzigartige Technologie für autonome Steuerung, die ohne HD-Karten funktioniert. Diesem technischen Wunder liegt ein bio-inspirierter Ansatz zugrunde, der menschliche Wahrnehmung und Entscheidungsfindung imitiert. Stellen Sie sich vor — das System sieht die Straße mit Augen-Kameras und trifft Entscheidungen mit einem Gehirn-Neuronennetzwerk, genau wie ein erfahrener Fahrer!
US-Ministerium ersetzte stillschweigend Bericht mit KI-gefälschten ZitatenDer Bericht des US-Ministeriums für Gesundheit und Soziale Dienste über chronische Kinderkrankheiten geriet in den Mittelpunkt eines wissenschaftlichen Skandals. Experten entdeckten, dass das Dokument "Make Our Children Healthy Again Assessment" gefälschte Zitate und nicht existierende Studien enthält.
Meta-KI blockiert Tausende Facebook-Gruppen wegen "Terrorismus"Früher erzählte ich, dass Meta's künstliche Intelligenz massenhaft Instagram-Accounts blockiert. Jetzt blockiert sie auch Facebook-Gruppen. Es läuft eine beispiellose Blockierungswelle. Tausende Facebook-Gruppen gerieten unter unbegründete Sanktionen des Moderationssystems. Dieser technische Kollaps betraf Gemeinschaften sowohl in den USA als auch im Ausland und umfasste die verschiedensten thematischen Kategorien.
Google veröffentlichte Gemini CLI: KI-Agent für CodeDas Unternehmen Google stellte Gemini CLI vor. Das ist ein offizieller Agent für die Nutzung künstlicher Intelligenz zum Schreiben von Code. Direkt aus der Kommandozeile. Und dieses Tool gibt Zugang zu allen Möglichkeiten des Modells Gemini 2.5 Pro.