Les scientifiques découvrent un nouveau phénomène d’IA – « l’effet d’entraînement en intérieur »
Des chercheurs du Massachusetts Institute of Technology (MIT) et d’autres centres scientifiques ont fait une découverte inattendue dans le domaine de l’entraînement de l’IA qui contredit les approches conventionnelles de l’entraînement des agents d’IA.
Les scientifiques ont découvert un phénomène qu’ils ont nommé « l’effet d’entraînement en intérieur ». Contrairement à l’opinion traditionnelle selon laquelle les environnements d’entraînement simulés devraient correspondre précisément aux conditions réelles d’exploitation, la recherche a montré qu’un entraînement dans un environnement complètement différent et plus prévisible peut conduire à de meilleurs résultats.
« Si nous apprenons à jouer au tennis en intérieur où il n’y a pas de bruit, nous pouvons plus facilement maîtriser différents coups. Puis, en passant à un environnement plus bruyant, comme un court venteux, nous pourrions avoir une meilleure chance de bien jouer que si nous avions commencé l’entraînement dans des conditions venteuses », explique Serena Bono, chercheuse au MIT Media Lab et auteure principale de l’étude.
Pour tester leur théorie, les chercheurs ont utilisé des jeux Atari modifiés pour inclure un élément d’imprévisibilité. En particulier, ils ont expérimenté avec Pac-Man, modifiant les probabilités de mouvement des fantômes. Les résultats ont été inattendus : un agent d’IA entraîné dans une version sans bruit du jeu a montré de meilleurs résultats dans un environnement « bruyant » qu’un agent entraîné avec des interférences.
Cette découverte est particulièrement importante pour le développement de la robotique domestique. Traditionnellement, on pensait qu’un robot entraîné à effectuer des tâches ménagères en usine pourrait travailler inefficacement dans la cuisine d’un utilisateur en raison des différences environnementales. La nouvelle recherche offre une approche fondamentalement différente pour résoudre ce problème.
« C’est une perspective complètement nouvelle sur le problème. Au lieu d’essayer de rendre l’environnement d’entraînement aussi similaire que possible à l’environnement de test, nous pouvons créer des environnements simulés où l’agent d’IA apprend encore mieux », note le co-auteur de l’étude Spandan Madan, doctorant à l’Université Harvard.
Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Dongfeng déploie des robots Walker S de 1,7m avec 41 servomoteursDongfeng Motor unit ses forces avec Ubtech Robotics pour intégrer des robots Walker S innovants dans les lignes de production. Ces merveilles technologiques mesurant 1 mètre et 70 centimètres sont prêtes à transformer les processus traditionnels d'assemblage automobile. Le directeur général de Dongfeng Motor souligne que l'implémentation de l'intelligence artificielle dans ces robots améliorera considérablement la qualité de l'inspection et de l'assemblage des composants.
Un étudiant diplômé du MIT a réduit la restauration de peintures de 230 à 3,5 heuresL'étudiant diplômé du MIT Alex Kachkin a développé une méthode cool pour la restauration de peintures à l'aide de l'intelligence artificielle. Réduisant le temps de travail de plusieurs mois à quelques heures. En démonstration, il a restauré une œuvre d'un maître néerlandais inconnu du 15e siècle qui avait sérieusement souffert du temps.
Une prothèse IA du Canada analyse les objets et décide comment les saisirL'intelligence artificielle donne de l'autonomie aux prothèses ! Les scientifiques de l'Université Memorial de Terre-Neuve ont créé une prothèse de bras révolutionnaire qui "pense" littéralement par elle-même. Contrairement aux modèles traditionnels qui nécessitent la lecture de signaux musculaires via des capteurs, le nouvel appareil est complètement autonome.
DeepSeek a empaqueté un moteur LLM en 1200 lignes de code PythonL'équipe DeepSeek a présenté nano-vLLM. C'est un moteur léger et compact pour faire fonctionner de grands modèles de langage. Qui pourrait changer les perceptions sur l'efficacité du code. Étonnamment, toute la fonctionnalité tient en seulement 1200 lignes de code Python ! C'est du vrai minimalisme technologique dans le monde de l'intelligence artificielle. Les moteurs traditionnels comme celui-ci, malgré toute leur puissance, souffrent souvent d'une base de code surchargée. Ce qui fait de leur modification un vrai défi pour les développeurs. Nano-vLLM résout ce problème en offrant un outil simple mais puissant sans complexité inutile. Le code est ouvert.
Échec des robotaxis Tesla : 11 violations du code de la route les premiers jours sur 20 voituresLe rêve des robotaxis se heurte à une dure réalité ! Tesla a lancé des tests publics de taxis autonomes à Austin, mais les résultats étaient loin de la merveille technologique promise. Dans les premiers jours de test, au moins 11 violations graves du code de la route ont été enregistrées. Et cela avec seulement 20 véhicules sélectionnés pour un cercle limité de blogueurs. Philip Koopman, professeur à l'Université Carnegie Mellon et expert en technologies autonomes, ne cache pas sa surprise : "C'est terriblement rapide pour l'apparition de tant de vidéos avec une conduite instable".