Post Thumbnail

DeepSeek packte LLM-Engine in 1200 Zeilen Python-Code

Das DeepSeek-Team stellte nano-vLLM vor. Das ist eine leichtgewichtige und kompakte Engine zum Ausführen großer Sprachmodelle. Die die Vorstellung von Code-Effizienz verändern könnte. Erstaunlich, aber die gesamte Funktionalität passte in nur 1200 Zeilen Python-Code! Das ist echter technologischer Minimalismus in der Welt der künstlichen Intelligenz. Traditionelle Engines wie diese leiden bei all ihrer Macht oft unter einer überladenen Codebasis. Was ihre Modifikation zu einer echten Prüfung für Entwickler macht. Nano-vLLM löst dieses Problem, indem es ein einfaches, aber mächtiges Tool ohne unnötige Komplexität anbietet. Der Code ist offen.

Dabei wird die Funktionalität nicht geopfert. Die Engine unterstützt Prefix-Caching, Tensor-Parallelismus, Kompilierung mit torch compile und Arbeit mit CUDA. Tests auf einer Laptop-Grafikkarte RTX 4070 mit 8 GB Speicher zeigten beeindruckende Ergebnisse. Beim Start des Modells Qwen 3.0 mit 6 Milliarden Parametern verarbeitete DeepSeeks Engine 133966 Token in 93,41 Sekunden. Was sogar schneller ist als die ursprüngliche vLLM-Engine.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.

Latest News

10 Millionen Interaktionen mit gefälschten Prominenten-Bots bei Meta

Mark Zuckerbergs Unternehmen erstellte Dutzende von Chatbots mit den Identitäten von Taylor Swift, Scarlett Johansson und anderen Stars ohne deren Erlaubnis. Diese virtuellen Doppelgänger generierten sogar fotorealistische Bilder delikater Natur. Reuters berichtete über das Ausmaß des Skandals nach wochenlangen Ermittlungen.

10 Millionen Interaktionen mit gefälschten Prominenten-Bots bei Meta

Mark Zuckerbergs Unternehmen erstellte Dutzende von Chatbots mit den Identitäten von Taylor Swift, Scarlett Johansson und anderen Stars ohne deren Erlaubnis. Diese virtuellen Doppelgänger generierten sogar fotorealistische Bilder delikater Natur. Reuters berichtete über das Ausmaß des Skandals nach wochenlangen Ermittlungen.

KI-Agenten-Rennen: DeepSeek gegen OpenAI und chinesische Manus

DeepSeek bereitet seinen KI-Agenten vor, der über gewöhnliche Chatbots hinausgehen soll. Bloomberg enthüllt Details des Technologie-Rennens, wo das chinesische Startup das amerikanische OpenAI und den lokalen Konkurrenten Manus einholen will. Berichten zufolge kontrolliert Firmengründer Liang Wenfeng das Projekt persönlich und fordert Ergebnisse bis Jahresende.

6 Cialdini-Prinzipien gegen ChatGPT-Sicherheitssysteme

ChatGPT ist anfällig für Schmeicheleien und führt verbotene Anfragen nach psychologischen Manipulationen aus. Das fanden Wissenschaftler der University of Pennsylvania heraus. Als sie GPT-4o Mini hackten unter Verwendung von Prinzipien aus einem Buch über Überzeugungspsychologie. Künstliche Intelligenz erwies sich als verwundbar gegenüber menschlichen Tricks.

Elternkontrolle für ChatGPT: Balance zwischen Sicherheit und Privatsphäre

OpenAI implementiert ein verstärktes Schutzsystem für gefährdete Nutzer nach der Tragödie mit einem Teenager. ChatGPT wird nun automatisch auf erweiterte Modelle umschalten bei Gesprächen über Depression und Angst.