Google Meet traduit en temps réel tout en préservant la voix du locuteur

Google a présenté une fonction révolutionnaire de traduction de la parole en temps réel pour son service de vidéoconférence Meet. Je suis agréablement choqué ! La principale caractéristique de cette technologie est la capacité non seulement de traduire ce qui est dit, mais aussi de préserver les caractéristiques individuelles de la voix du locuteur. Y compris le timbre, les intonations et les nuances émotionnelles.

Le système fonctionne sur la base de l’intelligence artificielle Gemini et permet aux participants à la conversation de communiquer à travers la barrière linguistique, tout en maintenant le naturel de la communication. Lors de la conférence I/O, Google a démontré cette technologie en action. Dans la démonstration, un participant anglophone communiquait avec un collègue en espagnol. Après l’activation de la fonction Gemini, le système a immédiatement commencé à traduire la parole dans les deux directions. Et chaque participant entendait l’interlocuteur dans sa langue maternelle tout en préservant les caractéristiques vocales originales.

Actuellement, la technologie ne fonctionne qu’avec les langues anglaise et espagnole, mais l’entreprise a déjà annoncé des plans pour ajouter le support des langues italienne, allemande et portugaise dans les semaines à venir. Maintenant, la fonction est disponible pour les abonnés payants de Google Meet, et d’ici la fin de l’année, ils prévoient de l’ouvrir aux clients corporatifs.

Cette technologie peut potentiellement changer l’approche des communications internationales, les rendant plus naturelles et efficaces pour les affaires, l’éducation et la communication personnelle avec des amis ou des parents étrangers.

Je suis vraiment surpris ! La traduction simultanée de Google Meet se concentre non seulement sur la précision de la transmission du sens, mais aussi sur la préservation des éléments paralinguistiques de la parole. Ce qui rend la communication entre locuteurs de différentes langues aussi proche que possible de la communication naturelle. Comme ce sera cool de parler à n’importe quelle personne sur la planète dans n’importe quelle langue. J’attends vraiment avec impatience que cette technologie soit largement disponible.