Post Thumbnail

DeepSeek va publier le code source de ses modèles d’IA

La startup chinoise DeepSeek, qui a surpris la Silicon Valley par les performances élevées de ses modèles d’IA, a annoncé une étape sans précédent – la publication de codes clés et de données en accès libre. L’entreprise prévoit de commencer à partager ses dépôts de code avec tous les développeurs et chercheurs dès la semaine prochaine.

“Nous sommes une petite équipe explorant l’AGI. À partir de la semaine prochaine, nous ouvrirons l’accès à 5 dépôts, partageant nos progrès modestes mais sincères en toute transparence”, a déclaré l’entreprise sur son compte X.

La startup de Hangzhou, âgée de 20 mois, compte aller plus loin que ses concurrents en donnant accès non seulement aux modèles mais aussi au code de base, aux données d’entraînement et à la méthodologie de développement. Cela permettra à quiconque de télécharger, modifier et améliorer le code sous-jacent au modèle R1 très apprécié et aux autres plateformes de l’entreprise.

La décision de DeepSeek renforce la tendance au développement ouvert de l’IA, qui a gagné plus de partisans après que les modèles de l’entreprise ont surpassé les concurrents d’OpenAI et Meta dans les tests de référence. Contrairement à OpenAI, qui a commencé comme un projet partiellement ouvert mais s’est ensuite écartée de cette politique, DeepSeek déclare son intention de rendre tous les aspects du développement transparents.

Le fondateur de l’entreprise, Liang Wenfeng, qui dirigeait auparavant un fonds spéculatif quantitatif, a souligné dans une rare interview aux médias chinois que l’entreprise ne privilégie pas la commercialisation de ses modèles d’IA, voyant des avantages dans l’open source. “Pas de tours d’ivoire – juste l’énergie pure de l’innovation de garage et un développement porté par la communauté”, a déclaré l’entreprise.

Cette initiative pourrait avoir un impact significatif sur la course entre les États-Unis et la Chine dans le développement de modèles d’IA avancés. Alors que les investisseurs ont investi des dizaines de milliards de dollars dans les principales startups américaines d’IA comme Anthropic PBC et xAI, attendant des retours significatifs, DeepSeek, qui n’a pas révélé de financement externe, peut se permettre de moins se concentrer sur la construction d’un modèle de revenus.

DeepSeek a déjà forcé des concurrents plus importants comme Baidu à adopter le concept open source. Cependant, les acteurs mondiaux comme OpenAI et Anthropic gardent toujours leurs modèles d’IA, dépôts et données fermés, rendant le geste de la startup chinoise encore plus significatif pour le développement de l’industrie.

Les experts notent que l’approche ouverte de DeepSeek pourrait accélérer le développement de la technologie d’IA grâce aux efforts collectifs des développeurs du monde entier, bien que cela soulève également des préoccupations de sécurité de la part des gouvernements américain et australien.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

La musique IA déclenche des émotions plus fortes que la musique humaine

Vous êtes-vous déjà demandé pourquoi une mélodie donne la chair de poule tandis qu'une autre laisse indifférent ? Les scientifiques ont découvert quelque chose d'intéressant. La musique créée par l'intelligence artificielle déclenche chez les gens des réactions émotionnelles plus intenses que les compositions écrites par des humains.

GPT-5 a été piraté en 24 heures

2 entreprises de recherche indépendantes NeuralTrust et SPLX ont découvert des vulnérabilités critiques dans le système de sécurité du nouveau modèle seulement 24 heures après la sortie de GPT-5. Pour comparaison, Grok-4 a été piraté en 2 jours, rendant le cas de GPT-5 encore plus alarmant.

Cloudflare a bloqué Perplexity pour 6 millions de requêtes cachées par jour

Cloudflare a porté un coup écrasant à Perplexity AI, bloquant l'accès de la startup de recherche à des milliers de sites. La raison ? Scannung caché de ressources web d'une ampleur sans précédent malgré les interdictions explicites des propriétaires !

Les menaces et 1 billion de dollars n'améliorent pas le travail des réseaux neuronaux

Vous avez sûrement vu ces "trucs secrets" pour contrôler les réseaux neuronaux. Comme les menaces, les promesses de récompenses, les manipulations émotionnelles. Mais fonctionnent-ils vraiment ? Des chercheurs de l'Université de Pennsylvanie et de la Wharton School ont mené une expérience à grande échelle avec 5 modèles avancés : Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini et GPT o4-mini.

Anthropic a intégré Opus 4.1 dans Claude Code et les plateformes cloud

Anthropic a sorti Claude Opus 4.1. Ce n'est pas juste une autre mise à jour, mais une amélioration substantielle des capacités de codage et de fonctionnalité d'agent. Ce qui réjouit particulièrement — la nouvelle version est intégrée non seulement dans l'interface Claude classique, mais aussi dans l'outil Claude Code. Ainsi que disponible via API, Amazon Bedrock et Google Cloud Vertex AI.