Post Thumbnail

Premier juge MLLM au monde basé sur Google Gemini lancé

La société Patronus AI a annoncé le lancement de la première technologie MLLM-as-a-Judge (modèle de langage multimodal en tant que juge) de l’industrie, destinée à révolutionner l’évaluation des systèmes d’IA travaillant avec des images et du texte. Etsy, la plus grande place de marché de produits vintage et faits main, implémente déjà cette technologie innovante pour vérifier l’exactitude des légendes des images de produits.

Dans une interview exclusive accordée à VentureBeat, le cofondateur de Patronus AI, Anand Kannapan, a partagé les détails de la collaboration avec Etsy : “Nous sommes incroyablement ravis d’annoncer qu’Etsy est devenu l’un de nos premiers clients. Leur place de marché contient des centaines de millions d’articles faits main et d’objets vintage du monde entier. L’équipe IA d’Etsy cherchait à utiliser l’intelligence artificielle générative pour créer automatiquement des légendes d’images, en assurant leur exactitude lors de la mise à l’échelle sur l’ensemble de leur base d’utilisateurs mondiale.”

Une caractéristique clé de la nouvelle technologie Judge-Image est l’utilisation du modèle Gemini de Google au lieu du GPT-4V d’OpenAI. Cette décision a été prise après une analyse comparative approfondie des alternatives disponibles. “Nous avons remarqué que GPT-4V démontrait une tendance plus prononcée à l’égocentrisme, alors que Gemini s’est montré moins biaisé et a démontré une approche plus équitable pour évaluer diverses paires d’entrées et de sorties”, a expliqué Kannapan. “Cela est confirmé par la distribution uniforme des scores à travers différentes sources.”

La nouvelle technologie vise à résoudre un problème d’une importance critique dans le domaine de l’intelligence artificielle – l’identification et la minimisation des hallucinations et des problèmes de fiabilité dans les applications d’IA multimodales. Pour Etsy, dont le modèle commercial est basé sur la confiance entre vendeurs et acheteurs, l’exactitude des descriptions de produits est un facteur clé de succès.

Le lancement de Judge-Image marque une étape importante dans le développement des technologies de vérification du contenu généré par l’IA. À mesure que de plus en plus d’entreprises intègrent l’intelligence artificielle générative dans leurs processus d’affaires, le besoin d’outils fiables d’évaluation et de contrôle de qualité devient de plus en plus pertinent. L’implémentation réussie de la technologie sur la plateforme Etsy pourrait devenir un exemple pour d’autres entreprises de commerce électronique et plateformes technologiques.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Comment créer un univers infini avec un seul prompt textuel

Oubliez tout ce que vous saviez sur la création de mondes de jeu. Tencent vient de publier le modèle open-source Hunyuan-GameCraft. Qui génère des mondes virtuels interactifs directement sur votre carte graphique. Lien dans la description. Un prompt textuel — et vous avez un univers infini.

Comment la synchronisation de 3 sources lumineuses protège contre les contrefaçons

L'intelligence artificielle a appris à créer des fausses vidéos impossibles à distinguer de la réalité. Et c'est un énorme problème et une question de confiance dans la société. Mais les scientifiques de l'Université Cornell ont trouvé une solution géniale. Ils ont caché des filigranes directement dans l'éclairage ordinaire.

Hip-hop, wushu et opéra de Pékin à la cérémonie d'ouverture de la robotiade

La Chine a accueilli les premiers Jeux Mondiaux de Robots Humanoïdes où 280 équipes de 16 pays ont concouru. Qui ont apporté plus de 500 androïdes. C'est devenu presque de vrais Jeux olympiques pour robots avec tous les attributs du grand sport.

Le premier système LAARMA protège les animaux sur les routes australiennes

En Australie, les collisions d'animaux avec les automobiles constituent un problème sérieux pour l'écosystème de ce continent. Maintenant les scientifiques ont trouvé une solution technologique. Le premier système routier LAARMA au monde basé sur l'intelligence artificielle, qui protège les animaux sauvages des rencontres dangereuses avec le transport.

Nvidia a présenté la famille de modèles Cosmos pour la robotique

L'entreprise Nvidia a présenté la famille Cosmos de modèles d'IA. Qui peuvent fondamentalement changer l'approche de création de robots et d'agents IA physiques.