Mein Name ist AIvengo und ich präsentiere Ihnen tägliche Nachrichten über künstliche Intelligenz
DeepSeek öffnet Code von superschnellen GPU-Kernen
Das chinesische Unternehmen DeepSeek, das einen Durchbruch im Bereich der künstlichen Intelligenz erzielt hat, hat eine beispiellose Woche der Open-Source-Veröffentlichungen begonnen und das erste von fünf versprochenen Tools – FlashMLA – veröffentlicht. Dieses Projekt stellt optimierte GPU-Kerne dar, die das Unternehmen in seinen Produktionssystemen einsetzt.
FlashMLA implementiert Multi Latent Attention (MLA)-Technologie, eine revolutionäre Methode, die den Speicherverbrauch in Transformern durch effiziente Komprimierung von Schlüssel- und Wertmatrizen erheblich reduziert. Obwohl die Methode selbst ihre Wirksamkeit in DeepSeek-Modellen bereits bewiesen hat, existierten bis heute praktisch keine optimierten Implementierungen dafür.
Die wichtigsten technischen Eigenschaften von FlashMLA sind beeindruckend:
– Unterstützung für das bfloat16-Format, das ein optimales Gleichgewicht zwischen Rechengeschwindigkeit und Genauigkeit bietet
– KV-Seitencache mit Blockgröße 64
– Rekordleistung: bis zu 3000 GB/s in speicherbegrenzter Konfiguration
– 580 Teraflops in rechenbegrenzter Konfiguration auf H800 SXM5 GPU mit CUDA 12.6
Das Tool ist vollständig kompatibel mit der gesamten Palette von NVIDIA Hopper-Grafikprozessoren, einschließlich H100, H800 und anderen Modellen. FlashMLA ist besonders effektiv bei der Verarbeitung von Sequenzen variabler Länge, was es zu einer idealen Lösung für moderne Aufgaben der natürlichen Sprachverarbeitung macht.
DeepSeek plant, die Veröffentlichung seiner internen Entwicklungen fortzusetzen: Vom 24. bis 28. Februar verspricht das Unternehmen, vier weitere Repositories aus seinem internen Ökosystem öffentlich zugänglich zu machen. Diese Entscheidung könnte die Entwicklung der gesamten KI-Branche erheblich beeinflussen, indem sie Entwicklern Zugang zu fortschrittlichen Optimierungen bietet, die zuvor nur innerhalb des Unternehmens verfügbar waren.
Der Projektcode ist bereits auf GitHub verfügbar (github.com/deepseek-ai/FlashMLA), was Entwicklern auf der ganzen Welt ermöglicht, diese Optimierungen in ihre Projekte zu integrieren und potenziell die Leistung ihrer KI-Systeme erheblich zu verbessern.
Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Die Investition von Taiwan Semiconductor Manufacturing Co. (TSMC) in Höhe von 100 Milliarden Dollar zur Erweiterung der Produktion in den Vereinigten Staaten ist "eine großartige Nachricht", sagte Qualcomm-CEO Cristiano Amon in einem Interview mit CNBC am Dienstag, dem 4. März 2025. Seinen Angaben zufolge trägt dies zur Diversifizierung der Halbleiterproduktionsstandorte bei.
Der private Suchdienst DuckDuckGo baut weiterhin seine Position im Bereich der generativen künstlichen Intelligenz aus. Laut einem am Donnerstag, dem 6. März 2025, veröffentlichten Blog-Beitrag gab das Unternehmen den Abschluss der Beta-Tests seiner Chat-Schnittstelle bekannt, die jetzt offiziell Duck.ai heißt und den umständlicheren Namen DuckDuckGo AI Chat aufgibt.
Der Milliardär und Eigentümer der Los Angeles Times, Patrick Soon-Shiong, der ein neues KI-Tool zur Generierung gegensätzlicher Perspektiven zu Meinungsbeiträgen vorstellte, wusste nicht, dass das System weniger als 24 Stunden nach dem Start Pro-KKK-Argumente erstellt hatte — und das sogar noch Stunden nachdem die skandalösen KI-Kommentare von der Website der Publikation entfernt worden waren. Der Vorfall schuf ein enormes Hindernis für die Times, die danach strebt, alte Abonnenten zurückzugewinnen und neue durch innovative technologische Lösungen anzuziehen.
Google hat die Einführung eines neuen KI-Tools für den Shopping-Tab angekündigt, das Benutzern helfen wird, Kleidung anhand ihrer verbalen Beschreibung zu finden. Die am Mittwoch, dem 5. März 2025, gemachte Ankündigung umfasst auch die Erweiterung der Funktionen von Augmented-Reality-Tools (AR) für Kosmetik und virtuelle Anprobe.
Der Technologieriese Google beschränkt weiterhin die Fähigkeiten seines KI-Assistenten Gemini im Bereich des politischen Diskurses, obwohl die Hauptkonkurrenten des Unternehmens, darunter OpenAI, Anthropic und Meta, ihre Chatbots in den letzten Monaten bereits für die Diskussion politisch sensibler Themen angepasst haben.