Post Thumbnail

DeepSeek a empaqueté un moteur LLM en 1200 lignes de code Python

L’équipe DeepSeek a présenté nano-vLLM. C’est un moteur léger et compact pour faire fonctionner de grands modèles de langage. Qui pourrait changer les perceptions sur l’efficacité du code. Étonnamment, toute la fonctionnalité tient en seulement 1200 lignes de code Python ! C’est du vrai minimalisme technologique dans le monde de l’intelligence artificielle. Les moteurs traditionnels comme celui-ci, malgré toute leur puissance, souffrent souvent d’une base de code surchargée. Ce qui fait de leur modification un vrai défi pour les développeurs. Nano-vLLM résout ce problème en offrant un outil simple mais puissant sans complexité inutile. Le code est ouvert.

En même temps, la fonctionnalité n’est pas sacrifiée. Le moteur supporte la mise en cache de préfixes, le parallélisme de tenseurs, la compilation avec torch compile et le travail avec CUDA. Les tests sur une carte graphique d’ordinateur portable RTX 4070 avec 8 Go de mémoire ont montré des résultats impressionnants. Lors du lancement du modèle Qwen 3.0 avec 6 milliards de paramètres, le moteur de DeepSeek a traité 133966 tokens en 93,41 secondes. Ce qui est même plus rapide que le moteur vLLM original.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Grok 4 a obtenu 57% au "Dernier Examen" contre 22% pour Gemini 2.5 Pro

Elon Musk a présenté une nouvelle version de son réseau neuronal – Grok 4. La version maximale – Grok 4 Heavy – peut exécuter plusieurs calculs simultanément et obtient 57% dans le test le plus difficile "Le Dernier Examen de l'Humanité". Pour comparaison, le précédent leader Gemini 2.5 Pro ne montrait que 22%.

Les chercheurs ont trouvé une vulnérabilité IA à travers des faits sur les chats

Cette nouvelle m'a pour le moins surpris. Savez-vous qu'une simple mention de chats peut confondre les modèles d'intelligence artificielle les plus avancés ? Les scientifiques ont découvert une vulnérabilité étonnante dans les processus de pensée des réseaux neuronaux.

Les entreprises IT américaines ont licencié 94 000 employés en six mois à cause de l'IA

Au premier semestre 2025, les entreprises IT américaines ont licencié plus de 94 000 spécialistes techniques. Ce n'est pas juste de l'économie. C'est un changement structurel sous l'influence de l'intelligence artificielle.

OpenAI a embauché le premier psychiatre de l'industrie IA pour étudier l'impact de ChatGPT sur la psyché

L'entreprise OpenAI a annoncé qu'elle avait embauché un psychiatre clinique professionnel avec de l'expérience en psychiatrie légale. Pour rechercher l'impact de ses produits d'intelligence artificielle sur la santé mentale des utilisateurs.

Étape historique : le millionième robot d'Amazon livré au Japon

Amazon a atteint une étape historique ! Et après 13 ans d'implémentation de robots dans ses entrepôts, l'entreprise a annoncé avoir atteint la barre du million d'appareils robotisés. Le millionième robot a été récemment livré à un entrepôt Amazon au Japon.