AIvengo > Avis > DeepSeek R1 a dépassé Qwen 3 et réduit l’écart avec Gemini 2.5 Pro

DeepSeek R1 a dépassé Qwen 3 et réduit l’écart avec Gemini 2.5 Pro

Les données sur DeepSeek R1, qui a reçu une mise à jour sérieuse, sont arrivées. Et les résultats sont impressionnants. Le modèle dépasse maintenant avec confiance son concurrent Qwen 3 avec 235 milliards de paramètres. Bien qu’il soit encore en retard sur des fleurons comme Gemini 2.5 Pro et O3, l’écart s’est significativement réduit. L’amélioration principale est liée à l’augmentation de la profondeur de raisonnement – maintenant le modèle utilise en moyenne 23 000 tokens pour résoudre des tâches, tandis que la version précédente était limitée à 12 000. Cette capacité d’analyse plus profonde a apporté des résultats impressionnants. Par exemple, dans le test AIME, la précision a augmenté de 70% à 87,5%. Outre les succès impressionnants dans les benchmarks, la nouvelle version a commencé à beaucoup moins halluciner et a significativement amélioré ses capacités dans le développement frontend. Bien qu’elle doive encore grandir au niveau de Claude dans cette sphère.

Je pense que dans l’année qui vient nous verrons une nouvelle vague d’intégration de grands modèles de langage dans les systèmes de distillation de connaissances. Où les modèles géants agiront comme “enseignants” pour les versions compactes. Cela mènera à une percée rapide dans l’efficacité des petits modèles et leur implémentation dans les appareils mobiles.

Auteur: AIvengo

Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Le père de l'apprentissage par renforcement a prédit la fin de l'ère des grands modèles de langage

Richard Sutton - c'est l'un des pères de l'apprentissage par renforcement et lauréat du prix Turing. Alors il a déclaré que l'ère des grands modèles de langage touche à sa fin. Ensuite, selon lui, vient l'ère de l'expérience. Et voici pourquoi il pense ainsi.

L'intelligence artificielle détecte le TDAH sans questionnaires ni médecins

Imaginez qu'on puisse diagnostiquer le TDAH simplement par la façon dont votre cerveau traite des lettres clignotantes sur un écran. Pas de questionnaires, pas de mois d'attente pour un rendez-vous chez un spécialiste. L'IA regarde vos rythmes visuels et donne un verdict avec 92% de précision. Ça sonne comme de la science-fiction ? Mais c'est déjà la réalité.

OpenAI s'est embarrassé deux fois en faisant passer de vieilles solutions pour des découvertes de GPT-5

OpenAI a réussi à s'embarrasser deux fois sur le même râteau. Et la deuxième tentative est sortie encore plus embarrassante que la première.

L'économiste en chef du FMI a comparé le boom de l'IA à la bulle dotcom

L'économiste en chef du FMI Pierre-Olivier Gourinchas a déclaré que le monde a déjà parcouru la moitié du chemin jusqu'à l'éclatement de la bulle IA et une nouvelle crise financière.

Des chercheurs ont cracké 12 systèmes de protection IA

Vous savez ce que des chercheurs d'OpenAI, Anthropic, Google DeepMind et Harvard viennent de découvrir ? Ils ont essayé de casser des systèmes de sécurité IA populaires et ont trouvé un contournement presque partout. Ils ont vérifié 12 approches de protection courantes. Des formulations intelligentes de prompt système aux filtres externes qui devraient attraper les requêtes dangereuses.