Post Thumbnail

Pour 50$ contre les géants : Des chercheurs créent un concurrent d’OpenAI pour des centimes

Des chercheurs de l’Université Stanford et de l’Université de Washington ont réalisé une percée dans le domaine de l’intelligence artificielle en créant le modèle de raisonnement s1 pour seulement 50$ de calcul cloud. Les résultats de la recherche publiés vendredi montrent que le modèle affiche des performances comparables aux développements phares o1 d’OpenAI et R1 de DeepSeek dans les tests de capacités mathématiques et de programmation.

L’équipe de développement a utilisé un modèle de base open source, qu’elle a amélioré grâce à un processus de distillation – extrayant les capacités de raisonnement d’un autre modèle d’IA en s’entraînant sur ses réponses. Le modèle expérimental Gemini 2.0 Flash Thinking Experimental de Google a été choisi comme source.

Cette approche s’est avérée nettement plus économique que la méthode d’apprentissage par renforcement à grande échelle utilisée par DeepSeek pour créer leur modèle R1. Les chercheurs ont publié s1 sur GitHub avec les données et le code d’entraînement, rendant la technologie accessible à toute la communauté des développeurs.

Le succès du projet soulève des questions sérieuses sur l’avenir de l’industrie de l’IA. Si une petite équipe de chercheurs peut reproduire la fonctionnalité d’un modèle de plusieurs millions de dollars pour un coût minimal, que reste-t-il de l’avantage concurrentiel des grands laboratoires d’IA ?

La réaction des géants de la technologie ne s’est pas fait attendre. OpenAI a déjà accusé DeepSeek de collecte inappropriée de données via son API à des fins de distillation de modèles. Google, dont le modèle a été utilisé pour créer s1, interdit dans ses conditions d’utilisation l’ingénierie inverse des modèles pour développer des services concurrents.

Malgré les questions juridiques, cette percée démontre que l’innovation dans l’IA est possible même sans investissements de plusieurs millions de dollars, ouvrant de nouvelles perspectives pour les chercheurs et les petites équipes de développement.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Le père de l'apprentissage par renforcement a prédit la fin de l'ère des grands modèles de langage

Richard Sutton - c'est l'un des pères de l'apprentissage par renforcement et lauréat du prix Turing. Alors il a déclaré que l'ère des grands modèles de langage touche à sa fin. Ensuite, selon lui, vient l'ère de l'expérience. Et voici pourquoi il pense ainsi.

L'intelligence artificielle détecte le TDAH sans questionnaires ni médecins

Imaginez qu'on puisse diagnostiquer le TDAH simplement par la façon dont votre cerveau traite des lettres clignotantes sur un écran. Pas de questionnaires, pas de mois d'attente pour un rendez-vous chez un spécialiste. L'IA regarde vos rythmes visuels et donne un verdict avec 92% de précision. Ça sonne comme de la science-fiction ? Mais c'est déjà la réalité.

OpenAI s'est embarrassé deux fois en faisant passer de vieilles solutions pour des découvertes de GPT-5

OpenAI a réussi à s'embarrasser deux fois sur le même râteau. Et la deuxième tentative est sortie encore plus embarrassante que la première.

L'économiste en chef du FMI a comparé le boom de l'IA à la bulle dotcom

L'économiste en chef du FMI Pierre-Olivier Gourinchas a déclaré que le monde a déjà parcouru la moitié du chemin jusqu'à l'éclatement de la bulle IA et une nouvelle crise financière.

Des chercheurs ont cracké 12 systèmes de protection IA

Vous savez ce que des chercheurs d'OpenAI, Anthropic, Google DeepMind et Harvard viennent de découvrir ? Ils ont essayé de casser des systèmes de sécurité IA populaires et ont trouvé un contournement presque partout. Ils ont vérifié 12 approches de protection courantes. Des formulations intelligentes de prompt système aux filtres externes qui devraient attraper les requêtes dangereuses.