Post Thumbnail

Google Meet traduit en temps réel tout en préservant la voix du locuteur

Google a présenté une fonction révolutionnaire de traduction de la parole en temps réel pour son service de vidéoconférence Meet. Je suis agréablement choqué ! La principale caractéristique de cette technologie est la capacité non seulement de traduire ce qui est dit, mais aussi de préserver les caractéristiques individuelles de la voix du locuteur. Y compris le timbre, les intonations et les nuances émotionnelles.

Le système fonctionne sur la base de l’intelligence artificielle Gemini et permet aux participants à la conversation de communiquer à travers la barrière linguistique, tout en maintenant le naturel de la communication. Lors de la conférence I/O, Google a démontré cette technologie en action. Dans la démonstration, un participant anglophone communiquait avec un collègue en espagnol. Après l’activation de la fonction Gemini, le système a immédiatement commencé à traduire la parole dans les deux directions. Et chaque participant entendait l’interlocuteur dans sa langue maternelle tout en préservant les caractéristiques vocales originales.

Actuellement, la technologie ne fonctionne qu’avec les langues anglaise et espagnole, mais l’entreprise a déjà annoncé des plans pour ajouter le support des langues italienne, allemande et portugaise dans les semaines à venir. Maintenant, la fonction est disponible pour les abonnés payants de Google Meet, et d’ici la fin de l’année, ils prévoient de l’ouvrir aux clients corporatifs.

Cette technologie peut potentiellement changer l’approche des communications internationales, les rendant plus naturelles et efficaces pour les affaires, l’éducation et la communication personnelle avec des amis ou des parents étrangers.

Je suis vraiment surpris ! La traduction simultanée de Google Meet se concentre non seulement sur la précision de la transmission du sens, mais aussi sur la préservation des éléments paralinguistiques de la parole. Ce qui rend la communication entre locuteurs de différentes langues aussi proche que possible de la communication naturelle. Comme ce sera cool de parler à n’importe quelle personne sur la planète dans n’importe quelle langue. J’attends vraiment avec impatience que cette technologie soit largement disponible.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Nvidia a présenté la famille de modèles Cosmos pour la robotique

L'entreprise Nvidia a présenté la famille Cosmos de modèles d'IA. Qui peuvent fondamentalement changer l'approche de création de robots et d'agents IA physiques.

ChatGPT appelle les utilisateurs "graines d'étoiles" de la planète Lyra

Il s'avère que ChatGPT peut entraîner les utilisateurs dans le monde de théories scientifiquement non fondées et mystiques.

La musique IA déclenche des émotions plus fortes que la musique humaine

Vous êtes-vous déjà demandé pourquoi une mélodie donne la chair de poule tandis qu'une autre laisse indifférent ? Les scientifiques ont découvert quelque chose d'intéressant. La musique créée par l'intelligence artificielle déclenche chez les gens des réactions émotionnelles plus intenses que les compositions écrites par des humains.

GPT-5 a été piraté en 24 heures

2 entreprises de recherche indépendantes NeuralTrust et SPLX ont découvert des vulnérabilités critiques dans le système de sécurité du nouveau modèle seulement 24 heures après la sortie de GPT-5. Pour comparaison, Grok-4 a été piraté en 2 jours, rendant le cas de GPT-5 encore plus alarmant.

Cloudflare a bloqué Perplexity pour 6 millions de requêtes cachées par jour

Cloudflare a porté un coup écrasant à Perplexity AI, bloquant l'accès de la startup de recherche à des milliers de sites. La raison ? Scannung caché de ressources web d'une ampleur sans précédent malgré les interdictions explicites des propriétaires !