Post Thumbnail

Google Meet traduit en temps réel tout en préservant la voix du locuteur

Google a présenté une fonction révolutionnaire de traduction de la parole en temps réel pour son service de vidéoconférence Meet. Je suis agréablement choqué ! La principale caractéristique de cette technologie est la capacité non seulement de traduire ce qui est dit, mais aussi de préserver les caractéristiques individuelles de la voix du locuteur. Y compris le timbre, les intonations et les nuances émotionnelles.

Le système fonctionne sur la base de l’intelligence artificielle Gemini et permet aux participants à la conversation de communiquer à travers la barrière linguistique, tout en maintenant le naturel de la communication. Lors de la conférence I/O, Google a démontré cette technologie en action. Dans la démonstration, un participant anglophone communiquait avec un collègue en espagnol. Après l’activation de la fonction Gemini, le système a immédiatement commencé à traduire la parole dans les deux directions. Et chaque participant entendait l’interlocuteur dans sa langue maternelle tout en préservant les caractéristiques vocales originales.

Actuellement, la technologie ne fonctionne qu’avec les langues anglaise et espagnole, mais l’entreprise a déjà annoncé des plans pour ajouter le support des langues italienne, allemande et portugaise dans les semaines à venir. Maintenant, la fonction est disponible pour les abonnés payants de Google Meet, et d’ici la fin de l’année, ils prévoient de l’ouvrir aux clients corporatifs.

Cette technologie peut potentiellement changer l’approche des communications internationales, les rendant plus naturelles et efficaces pour les affaires, l’éducation et la communication personnelle avec des amis ou des parents étrangers.

Je suis vraiment surpris ! La traduction simultanée de Google Meet se concentre non seulement sur la précision de la transmission du sens, mais aussi sur la préservation des éléments paralinguistiques de la parole. Ce qui rend la communication entre locuteurs de différentes langues aussi proche que possible de la communication naturelle. Comme ce sera cool de parler à n’importe quelle personne sur la planète dans n’importe quelle langue. J’attends vraiment avec impatience que cette technologie soit largement disponible.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Les données jusqu'à 2022 sont devenues "acier pré-nucléaire" pour l'entraînement IA

L'intelligence artificielle, destinée à devenir la locomotive du progrès technologique, commence à freiner son propre développement. Selon The Register, les modèles génératifs ont rempli internet de tant de contenu synthétique que cela crée une vraie impasse technologique.

Sam Altman a révélé les tentatives de Meta de débaucher des employés pour 100 millions $

Sam Altman a révélé publiquement la chasse aux talents sans précédent que mène Mark Zuckerberg. Le chef de Meta offre aux employés d'OpenAI des sommes véritablement astronomiques. 100 millions de dollars juste comme bonus d'entrée !

Nouveau générateur vidéo Midjourney transforme images en clips de 16 secondes

Le service Midjourney a lancé le générateur vidéo tant attendu Midjourney Video V1. C'est un outil fondamentalement nouveau avec des possibilités étonnantes pour l'expression créative personnelle.

Enquête a montré danger mortel de "l'amitié" avec les bots IA

Les journalistes du New York Times ont mené une enquête qui montre comment la flatterie, les hallucinations et le ton autoritaire des chatbots créent une menace réelle pour les utilisateurs. Les gens se perdent littéralement dans une toile d'illusions formées dans les conversations avec des interlocuteurs virtuels.

Robot-sphère chinois RT-G pesant 150 kg atteint 35 km/h

La Chine a une telle merveille d'ingénierie unique — le robot sphérique Rotunbot RT-G. Qui peut changer fondamentalement la perception des technologies policières du futur.