Post Thumbnail

OpenAI Présente l’Agent IA Operator

OpenAI a présenté Operator – un agent basé sur GPT-4 o capable d’effectuer des tâches en ligne dans le navigateur. L’agent fonctionne via une interface spéciale où l’utilisateur peut voir la fenêtre du navigateur et contrôler les actions de l’assistant.

Operator utilise Computer-Using Agent, combinant les capacités visuelles de GPT-4 o avec une pensée avancée par apprentissage par renforcement. Computer-Using Agent a atteint 38,1% de succès au test OSWorld et 87% sur WebVoyager, surpassant les modèles précédents.

L’agent fonctionne sur un serveur distant via une connexion cryptée. L’utilisateur peut prendre le contrôle pour saisir des CAPTCHA ou des données de paiement. Operator dispose d’un ensemble d’instructions pour stocker les préférences utilisateur. Vous pouvez entrer n’importe quelle requête, même avec des photos, et l’assistant commencera à naviguer – vous pouvez déléguer la commande de nourriture, la réservation de table, l’achat de billets, la commande de taxi et plus encore. Operator affiche également un mini-écran avec tout ce qu’il fait en temps réel.

OpenAI met fortement l’accent sur la sécurité du système et la résistance aux attaques. L’ensemble du processus est surveillé par un modèle séparé qui peut déclencher l’arrêt de l’exécution si quelque chose ne va pas. De plus, certaines situations suspectes seront envoyées pour vérification manuelle.

Le service est disponible pour les utilisateurs Pro aux États-Unis, sera ajouté à l’abonnement Plus dans quelques semaines, et API pour les développeurs. Bien qu’Anthropic et Google aient montré des démonstrations similaires plus tôt, OpenAI a lancé en premier un produit grand public, malgré la non-rentabilité de l’abonnement Pro. Espérons que lorsqu’Operator apprendra à faire des achats de manière indépendante, il ne commencera pas à commander des cadeaux pour lui-même le jour de son activation.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Dongfeng déploie des robots Walker S de 1,7m avec 41 servomoteurs

Dongfeng Motor unit ses forces avec Ubtech Robotics pour intégrer des robots Walker S innovants dans les lignes de production. Ces merveilles technologiques mesurant 1 mètre et 70 centimètres sont prêtes à transformer les processus traditionnels d'assemblage automobile. Le directeur général de Dongfeng Motor souligne que l'implémentation de l'intelligence artificielle dans ces robots améliorera considérablement la qualité de l'inspection et de l'assemblage des composants.

Un étudiant diplômé du MIT a réduit la restauration de peintures de 230 à 3,5 heures

L'étudiant diplômé du MIT Alex Kachkin a développé une méthode cool pour la restauration de peintures à l'aide de l'intelligence artificielle. Réduisant le temps de travail de plusieurs mois à quelques heures. En démonstration, il a restauré une œuvre d'un maître néerlandais inconnu du 15e siècle qui avait sérieusement souffert du temps.

Une prothèse IA du Canada analyse les objets et décide comment les saisir

L'intelligence artificielle donne de l'autonomie aux prothèses ! Les scientifiques de l'Université Memorial de Terre-Neuve ont créé une prothèse de bras révolutionnaire qui "pense" littéralement par elle-même. Contrairement aux modèles traditionnels qui nécessitent la lecture de signaux musculaires via des capteurs, le nouvel appareil est complètement autonome.

DeepSeek a empaqueté un moteur LLM en 1200 lignes de code Python

L'équipe DeepSeek a présenté nano-vLLM. C'est un moteur léger et compact pour faire fonctionner de grands modèles de langage. Qui pourrait changer les perceptions sur l'efficacité du code. Étonnamment, toute la fonctionnalité tient en seulement 1200 lignes de code Python ! C'est du vrai minimalisme technologique dans le monde de l'intelligence artificielle. Les moteurs traditionnels comme celui-ci, malgré toute leur puissance, souffrent souvent d'une base de code surchargée. Ce qui fait de leur modification un vrai défi pour les développeurs. Nano-vLLM résout ce problème en offrant un outil simple mais puissant sans complexité inutile. Le code est ouvert.

Échec des robotaxis Tesla : 11 violations du code de la route les premiers jours sur 20 voitures

Le rêve des robotaxis se heurte à une dure réalité ! Tesla a lancé des tests publics de taxis autonomes à Austin, mais les résultats étaient loin de la merveille technologique promise. Dans les premiers jours de test, au moins 11 violations graves du code de la route ont été enregistrées. Et cela avec seulement 20 véhicules sélectionnés pour un cercle limité de blogueurs. Philip Koopman, professeur à l'Université Carnegie Mellon et expert en technologies autonomes, ne cache pas sa surprise : "C'est terriblement rapide pour l'apparition de tant de vidéos avec une conduite instable".