Post Thumbnail

OpenAI Présente l’Agent IA Operator

OpenAI a présenté Operator – un agent basé sur GPT-4 o capable d’effectuer des tâches en ligne dans le navigateur. L’agent fonctionne via une interface spéciale où l’utilisateur peut voir la fenêtre du navigateur et contrôler les actions de l’assistant.

Operator utilise Computer-Using Agent, combinant les capacités visuelles de GPT-4 o avec une pensée avancée par apprentissage par renforcement. Computer-Using Agent a atteint 38,1% de succès au test OSWorld et 87% sur WebVoyager, surpassant les modèles précédents.

L’agent fonctionne sur un serveur distant via une connexion cryptée. L’utilisateur peut prendre le contrôle pour saisir des CAPTCHA ou des données de paiement. Operator dispose d’un ensemble d’instructions pour stocker les préférences utilisateur. Vous pouvez entrer n’importe quelle requête, même avec des photos, et l’assistant commencera à naviguer – vous pouvez déléguer la commande de nourriture, la réservation de table, l’achat de billets, la commande de taxi et plus encore. Operator affiche également un mini-écran avec tout ce qu’il fait en temps réel.

OpenAI met fortement l’accent sur la sécurité du système et la résistance aux attaques. L’ensemble du processus est surveillé par un modèle séparé qui peut déclencher l’arrêt de l’exécution si quelque chose ne va pas. De plus, certaines situations suspectes seront envoyées pour vérification manuelle.

Le service est disponible pour les utilisateurs Pro aux États-Unis, sera ajouté à l’abonnement Plus dans quelques semaines, et API pour les développeurs. Bien qu’Anthropic et Google aient montré des démonstrations similaires plus tôt, OpenAI a lancé en premier un produit grand public, malgré la non-rentabilité de l’abonnement Pro. Espérons que lorsqu’Operator apprendra à faire des achats de manière indépendante, il ne commencera pas à commander des cadeaux pour lui-même le jour de son activation.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Comment créer un univers infini avec un seul prompt textuel

Oubliez tout ce que vous saviez sur la création de mondes de jeu. Tencent vient de publier le modèle open-source Hunyuan-GameCraft. Qui génère des mondes virtuels interactifs directement sur votre carte graphique. Lien dans la description. Un prompt textuel — et vous avez un univers infini.

Comment la synchronisation de 3 sources lumineuses protège contre les contrefaçons

L'intelligence artificielle a appris à créer des fausses vidéos impossibles à distinguer de la réalité. Et c'est un énorme problème et une question de confiance dans la société. Mais les scientifiques de l'Université Cornell ont trouvé une solution géniale. Ils ont caché des filigranes directement dans l'éclairage ordinaire.

Hip-hop, wushu et opéra de Pékin à la cérémonie d'ouverture de la robotiade

La Chine a accueilli les premiers Jeux Mondiaux de Robots Humanoïdes où 280 équipes de 16 pays ont concouru. Qui ont apporté plus de 500 androïdes. C'est devenu presque de vrais Jeux olympiques pour robots avec tous les attributs du grand sport.

Le premier système LAARMA protège les animaux sur les routes australiennes

En Australie, les collisions d'animaux avec les automobiles constituent un problème sérieux pour l'écosystème de ce continent. Maintenant les scientifiques ont trouvé une solution technologique. Le premier système routier LAARMA au monde basé sur l'intelligence artificielle, qui protège les animaux sauvages des rencontres dangereuses avec le transport.

Nvidia a présenté la famille de modèles Cosmos pour la robotique

L'entreprise Nvidia a présenté la famille Cosmos de modèles d'IA. Qui peuvent fondamentalement changer l'approche de création de robots et d'agents IA physiques.