Post Thumbnail

OpenAI Présente l’Agent IA Operator

OpenAI a présenté Operator – un agent basé sur GPT-4 o capable d’effectuer des tâches en ligne dans le navigateur. L’agent fonctionne via une interface spéciale où l’utilisateur peut voir la fenêtre du navigateur et contrôler les actions de l’assistant.

Operator utilise Computer-Using Agent, combinant les capacités visuelles de GPT-4 o avec une pensée avancée par apprentissage par renforcement. Computer-Using Agent a atteint 38,1% de succès au test OSWorld et 87% sur WebVoyager, surpassant les modèles précédents.

L’agent fonctionne sur un serveur distant via une connexion cryptée. L’utilisateur peut prendre le contrôle pour saisir des CAPTCHA ou des données de paiement. Operator dispose d’un ensemble d’instructions pour stocker les préférences utilisateur. Vous pouvez entrer n’importe quelle requête, même avec des photos, et l’assistant commencera à naviguer – vous pouvez déléguer la commande de nourriture, la réservation de table, l’achat de billets, la commande de taxi et plus encore. Operator affiche également un mini-écran avec tout ce qu’il fait en temps réel.

OpenAI met fortement l’accent sur la sécurité du système et la résistance aux attaques. L’ensemble du processus est surveillé par un modèle séparé qui peut déclencher l’arrêt de l’exécution si quelque chose ne va pas. De plus, certaines situations suspectes seront envoyées pour vérification manuelle.

Le service est disponible pour les utilisateurs Pro aux États-Unis, sera ajouté à l’abonnement Plus dans quelques semaines, et API pour les développeurs. Bien qu’Anthropic et Google aient montré des démonstrations similaires plus tôt, OpenAI a lancé en premier un produit grand public, malgré la non-rentabilité de l’abonnement Pro. Espérons que lorsqu’Operator apprendra à faire des achats de manière indépendante, il ne commencera pas à commander des cadeaux pour lui-même le jour de son activation.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Humanoïde chinois Bumi coûte comme iPhone 17 Pro Max

La startup chinoise Noetix Robotics a présenté le robot humanoïde Bumi, qui coûte autant qu'un iPhone 17 Pro Max en Chine. Prix - 9998 yuans. C'est environ 1370 dollars.

Reddit a attrapé Perplexity en train de voler du contenu

J'ai raconté plus tôt que Reddit a déposé une plainte contre le moteur de recherche IA Perplexity. Reddit accuse Perplexity de collecte de contenu "industrielle". Mais maintenant il y a des faits et Reddit a montré comment ils ont piégé le défendeur.

OpenAI développe outil de génération musicale

OpenAI développe un outil de génération musicale basé sur des prompts texte et audio. Cela est rapporté par The Information citant des sources. Un tel outil pourrait être utilisé pour ajouter de la musique à des vidéos existantes ou pour ajouter un accompagnement de guitare à une piste vocale.

Amazon transforme coursiers en cyborgs avec lunettes intelligentes IA

Amazon a décidé de transformer ses coursiers en cyborgs. Non, sérieusement - l'entreprise a annoncé des lunettes intelligentes avec IA pour les livreurs. L'idée, selon le géant du e-commerce, est de libérer les mains des conducteurs. Et de les épargner de devoir constamment changer le regard entre téléphone, colis et environnement.

OpenAI ajoutera cameos de personnages à Sora

OpenAI a publié la feuille de route de développement pour Sora, et vous savez quoi ? Il semble que l'entreprise a enfin réalisé que la génération vidéo n'est pas seulement une démonstration technologique. Mais un outil que les gens doivent vraiment utiliser. Bill Peebles, chef de projet, a annoncé tout un ensemble de mises à jour, et certaines d'entre elles sont vraiment intéressantes.