Post Thumbnail

Google veröffentlichte das erste lokale Modell Gemini Robotics On-Device

Das Unternehmen Google stellte das coolste Modell Gemini Robotics On-Device vor. Das ist die erste Lösung der Welt, die Computer Vision, Sprachverständnis und physische Aktionen in einem einheitlichen lokalen Paket vereint. Das Roboter von der ständigen Abhängigkeit von Cloud-Computing befreit!

Die Einzigartigkeit des neuen Modells liegt in seiner Universalität. Es funktioniert sowohl mit humanoiden Plattformen als auch mit industriellen zweihändigen Manipulatoren. Beeindruckend ist auch die Fähigkeit des Systems, komplexeste zweihändige Operationen auszuführen. Von Manipulationen mit kleinen Gegenständen bis hin zur Montage von Konstruktionen und dem Transport von Objekten.

Auch die Lerneffizienz funktioniert ausgezeichnet. Dem Modell reichen nur 100 Demonstrationen aus, um neue Aktionen zu erlernen! Dabei wurde das System ursprünglich nur auf dem ALOHA-Datensatz mit menschlichen Anweisungen trainiert. Konnte aber Wissen auf verschiedene robotische Plattformen übertragen.

Google veröffentlichte gleichzeitig das SDK Gemini Robotics. Das ist ein Toolkit für Entwickler, das es ermöglicht, das Modell für spezifische Aufgaben zu kustomisieren.

Vollständig autonome Arbeit für Roboter eröffnet riesige Möglichkeiten für Anwendungen unter Bedingungen instabiler Verbindung. Oder bei Aufgaben, die minimale Antwortlatenz erfordern. Und das könnte der Start einer neuen Ära wirklich eigenständiger Roboter sein!

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

Gehalt bis $170.000: Was SpaceX KI-Entwicklern anbietet

SpaceX macht eine unerwartete Wendung in seiner technologischen Strategie. Elon Musks Unternehmen hat Stellenausschreibungen für Software-Ingenieure im Bereich der künstlichen Intelligenz eröffnet. Es bildet ein Team, das sich mit der Lösung komplexester Datenverarbeitungsaufgaben für Trägerraketen und Raumfahrzeuge beschäftigen wird.

Musk mit $248 Milliarden kauft keine Arbeits-PCs, aber spioniert Mitarbeiter aus

Das Unternehmen xAI begann, seine Mitarbeiter direkt auf ihren persönlichen Computern zu überwachen! Mitarbeiter, die die künstliche Intelligenz Grok von ihren Geräten trainieren, wurden verpflichtet, Überwachungsprogramme zu installieren.

Kimi-K2 mit 1 Billion Parametern übertraf GPT-4.1 im Programmieren

Das chinesische Technologieunternehmen Moonshot AI stellte einen neuen Spieler in der KI-Arena vor! Lernen Sie Kimi-K2 kennen. Das ist ein großes Sprachmodell mit offenem Quellcode, bereit, anerkannte Industrieführer wie Claude Sonnet 4 und GPT-4.1 herauszufordern. Und ein so lauter und mächtiger Start erinnert an das Erscheinen von Deepseek.

OpenAI bereitet erstes offenes Modell vor, nicht schwächer als O3 Mini

Das Unternehmen OpenAI bereitet sich darauf vor, sein erstes offenes Sprachmodell zu veröffentlichen. Wird seinem Namen gerecht, sozusagen. Das ist eine ernste Wende für das Unternehmen, das früher seine mächtigen Entwicklungen geschlossen hielt.

Grok 4 erreichte 57% im "Letzten Examen" gegen 22% bei Gemini 2.5 Pro

Elon Musk stellte eine neue Version seines neuronalen Netzwerks vor – Grok 4. Die maximale Version – Grok 4 Heavy – kann mehrere Berechnungen gleichzeitig ausführen und erreicht 57% im schwierigsten Test "Das Letzte Examen der Menschheit". Zum Vergleich: der vorherige Spitzenreiter Gemini 2.5 Pro zeigte nur 22%.