NVIDIA a résolu le problème de l’écart entre simulation et réalité dans la formation des robots

Post Thumbnail

Jim Fan, directeur de l’intelligence artificielle chez NVIDIA, a partagé une réalisation impressionnante de leur équipe. Des robots humanoïdes ont appris à marcher et à s’orienter dans l’espace sans formation préalable dans le monde réel.

Toute la formation a été menée exclusivement dans un environnement virtuel. Après avoir terminé la simulation, les robots ont été immédiatement envoyés pour accomplir des tâches dans le monde réel. Et ils les ont gérées sans aucun ajustement ou adaptation supplémentaire. Le plus surprenant dans ce processus est l’incroyable compression du temps d’apprentissage. Ce qui prendrait 10 ans en réalité a été condensé en seulement 2 heures de formation virtuelle.

Comment les ingénieurs de NVIDIA ont-ils réussi à obtenir un tel résultat ? Premièrement, la simulation n’a pas les limitations physiques inhérentes au monde réel. Un robot peut tomber et se relever même 1 000 000 de fois de suite sans risque de casse. En réalité, chaque chute pourrait entraîner de graves dommages à des équipements coûteux.

Deuxièmement, dans un environnement virtuel, le flux du temps peut être considérablement accéléré. La simulation n’a pas de limitations « temps réel » – le processus peut être exécuté à n’importe quelle vitesse, dans la mesure où la puissance de calcul le permet.

Troisièmement, les développeurs ont appliqué la méthode d’apprentissage parallèle. Dans un environnement virtuel, de nombreuses copies numériques du robot peuvent être exécutées simultanément. Et recueillir l’expérience de tous à la fois, ce qui accélère radicalement l’accumulation de données pour la formation.

Une autre découverte inattendue : la modélisation de mouvements semblables à ceux des humains n’a pas nécessité de réseaux neuronaux gigantesques. Un modèle avec 1 500 000 paramètres – pas des milliards ! – s’est avéré suffisant pour reproduire la « mécanique subconsciente » du corps humain. C’est plusieurs ordres de grandeur plus petit que les modèles linguistiques modernes.

Le défi clé que les ingénieurs de NVIDIA ont réussi à surmonter est connu sous le nom de problème de « l’écart simulation-réalité ». Habituellement, les robots formés dans un environnement virtuel éprouvent des difficultés lors de la transition vers le monde réel en raison d’une simulation imparfaite. Cependant, l’équipe de NVIDIA a réussi à créer un modèle physique si précis dans l’environnement virtuel que les robots ont pu appliquer les compétences acquises dans la réalité sans ajustements supplémentaires.

Почитать из последнего
UBTech enverra des robots Walker S2 servir à la frontière chinoise pour $37 millions
L'entreprise chinoise UBTech a remporté un contrat de $37 millions. Et enverra des robots humanoïdes Walker S2 servir à la frontière de la Chine avec le Vietnam. South China Morning Post rapporte que les robots interagiront avec les touristes et le personnel, effectueront des opérations logistiques, inspecteront les marchandises et patrouilleront le territoire. Et caractéristiquement — ils peuvent changer leur batterie de manière autonome.
Anthropic a révélé accidentellement un document interne sur "l'âme" de Claude
Anthropic a révélé accidentellement "l'âme" de l'intelligence artificielle à un utilisateur. Et ce n'est pas une métaphore. C'est un document interne tout à fait concret.
Jensen Huang a ordonné aux employés de Nvidia d'utiliser l'IA partout
Jensen Huang a annoncé une mobilisation totale sous la bannière de l'intelligence artificielle à l'intérieur de Nvidia. Et ce n'est plus une recommandation. C'est une exigence.
Les chatbots IA génèrent du contenu qui aggrave les troubles alimentaires
Une étude conjointe de l'Université Stanford et du Center for Democracy and Technology a montré un tableau inquiétant. Les chatbots avec intelligence artificielle représentent un risque sérieux pour les personnes souffrant de troubles alimentaires. Les scientifiques avertissent que les réseaux neuronaux distribuent des conseils nuisibles sur les régimes. Ils proposent des moyens de cacher le trouble et génèrent du "contenu inspirant pour perdre du poids" qui aggrave le problème.
OpenAGI a publié le modèle Lux qui dépasse Google et OpenAI
La startup OpenAGI a publié le modèle Lux pour le contrôle d'ordinateur et affirme que c'est une percée. Selon les benchmarks, le modèle dépasse d'une génération entière les analogues de Google, OpenAI et Anthropic. De plus, il fonctionne plus vite. Environ 1 seconde par étape au lieu de 3 secondes chez les concurrents. Et 10 fois moins cher en coût par traitement de 1 token.