Post Thumbnail

Google veröffentlichte das erste lokale Modell Gemini Robotics On-Device

Das Unternehmen Google stellte das coolste Modell Gemini Robotics On-Device vor. Das ist die erste Lösung der Welt, die Computer Vision, Sprachverständnis und physische Aktionen in einem einheitlichen lokalen Paket vereint. Das Roboter von der ständigen Abhängigkeit von Cloud-Computing befreit!

Die Einzigartigkeit des neuen Modells liegt in seiner Universalität. Es funktioniert sowohl mit humanoiden Plattformen als auch mit industriellen zweihändigen Manipulatoren. Beeindruckend ist auch die Fähigkeit des Systems, komplexeste zweihändige Operationen auszuführen. Von Manipulationen mit kleinen Gegenständen bis hin zur Montage von Konstruktionen und dem Transport von Objekten.

Auch die Lerneffizienz funktioniert ausgezeichnet. Dem Modell reichen nur 100 Demonstrationen aus, um neue Aktionen zu erlernen! Dabei wurde das System ursprünglich nur auf dem ALOHA-Datensatz mit menschlichen Anweisungen trainiert. Konnte aber Wissen auf verschiedene robotische Plattformen übertragen.

Google veröffentlichte gleichzeitig das SDK Gemini Robotics. Das ist ein Toolkit für Entwickler, das es ermöglicht, das Modell für spezifische Aufgaben zu kustomisieren.

Vollständig autonome Arbeit für Roboter eröffnet riesige Möglichkeiten für Anwendungen unter Bedingungen instabiler Verbindung. Oder bei Aufgaben, die minimale Antwortlatenz erfordern. Und das könnte der Start einer neuen Ära wirklich eigenständiger Roboter sein!

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Wie Robomart die Lieferkosten durch Robotik um 70% senkt

$3 für jede Lieferung. Robomart fordert die Giganten DoorDash und Uber Eats mit einem für die Branche neuen Geschäftsmodell heraus. Ihr neuer Roboter RM5 verändert die Lieferökonomie vollständig.

Ungewöhnliche Zusammenarbeit von Konkurrenten bei KI-Sicherheitstests

Zwei Hauptkonkurrenten in der Welt der künstlichen Intelligenz haben sich erstmals für gemeinsame Sicherheitstests zusammengetan. OpenAI und Anthropic öffneten einander Zugang zu ihren geheimen Modellen. In einer Industrie, wo Unternehmen Forschern bis zu $100 Millionen zahlen und um jeden Nutzer kämpfen, erscheint solche Zusammenarbeit unglaublich.

Warum Gemini 50% der ChatGPT-Audienz auf Mobilgeräten erreichte

Google Gemini hat bereits die Hälfte der ChatGPT-Audienz auf Mobilgeräten. Das sind Daten aus dem neuen Bericht des Venture-Fonds Andreessen Horowitz über den Verbraucher-KI-Markt. 2,5 Jahre Forschung zeigen ein interessantes Bild.

Wie Claude zum Hacking-Tool für 17 Organisationen wurde

Das Unternehmen Anthropic veröffentlichte einen analytischen Sicherheitsbericht. Daraus wird klar, dass Claude und andere KI-Agenten zu Werkzeugen von Cyberkriminellen werden. Bei Anthropic nannte man diese neue Richtung Vibe-Hacking. Es stellt sich heraus, dass künstliche Intelligenz die Eintrittsbarrieren für kriminelle Aktivitäten radikal gesenkt hat.

Wie xAI mit OpenAI bei Entwicklertools konkurriert

xAI startet Grok Code Fast 1. Das ist ein kompaktes agentisches Modell für Coding. $0,20 für 1 Million Input-Token, $1,50 für Output — und nur $0,02 bei Cache-Nutzung!