Modèle qui crée des sites web et des jeux du premier coup
OpenAI a discrètement lancé les tests d’un nouveau modèle nommé en interne o3 Alpha sur la plateforme WebArena. Il s’agit d’une plateforme ouverte permettant de comparer les modèles d’intelligence artificielle selon les préférences des utilisateurs. Sur la plateforme elle-même, le modèle apparaît sous le nom « Anonymous-Chatbot-0717 », mais l’identifiant réel peut être vu dans le code.
Qu’est-ce qui rend o3 Alpha spécial ? Selon les benchmarks, il se classe en 1ère position parmi les réseaux neuronaux pour la génération de code et la physique du monde. Le modèle a également considérablement amélioré la création de sites web avec une interface utilisateur de qualité.
Le site BleepingComputer a mené ses propres tests et a confirmé que o3 Alpha répond très bien même à des requêtes floues. Les utilisateurs notent qu’il peut créer des clones de jeux populaires comme Minecraft, GTA et Flappy Bird dès la première tentative. Il génère également des graphiques vectoriels de meilleure qualité que les autres systèmes d’intelligence artificielle.
Il est important de comprendre qu’il ne s’agit pas d’une solution ouverte ni du modèle open source que l’entreprise avait promis de publier. Ce n’est pas non plus une nouvelle version appelée o4. Un tel modèle n’existe pas encore. Il est plus probable que o3 Alpha soit une version de test interne d’un modèle o3 amélioré, qui pourrait intégrer des développements pour le futur modèle GPT-5.
Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Grok 4 Fast fonctionne 10x plus vite avec contexte de 2 millions de tokensGrok 4 Fast entre dans l'arène de l'IA ! L'entreprise d'Elon Musk a présenté une mise à jour révolutionnaire de son modèle phare. Disponible en accès anticipé pour utilisateurs premium. Selon TestingCatalog, la nouveauté fonctionne 10x plus vite que Grok 4 standard. Tout en conservant tous les avantages du modèle de raisonnement complet.
Câble USB à 200$ se transforme en hacker IA autonomeDes chercheurs de Palisade Research ont créé une nouvelle menace de cybersécurité. Un câble USB modifié qui devient conducteur d'IA autonome dans les systèmes informatiques. L'appareil à 200$ contient une puce programmable qui charge un agent numérique directement sur la machine cible.
xAI licencie 500 annotateurs pour la spécialisation experte de GrokUn pivot stratégique de xAI se dessine. L'entreprise change radicalement son approche d'entraînement de son modèle linguistique Grok ! L'équipe d'Elon Musk a licencié 500 annotateurs universels en une journée. À la place, elle augmente le nombre de tuteurs IA spécialisés par 10.
Temps de vérification du contenu Gemini réduit de 30 à 15 minutesDes signaux alarmants de la cuisine interne de Google ont été publiés par The Guardian. Les évaluateurs de contenu pour le modèle Gemini ont partagé des informations intéressantes sur la baisse des standards de vérification. Les employés du contractant GlobalLogic, responsables d'évaluer la qualité et sécurité des réponses IA avant publication, tirent la sonnette d'alarme.