Google Meet traduit en temps réel tout en préservant la voix du locuteur

Post Thumbnail

Google a présenté une fonction révolutionnaire de traduction de la parole en temps réel pour son service de vidéoconférence Meet. Je suis agréablement choqué ! La principale caractéristique de cette technologie est la capacité non seulement de traduire ce qui est dit, mais aussi de préserver les caractéristiques individuelles de la voix du locuteur. Y compris le timbre, les intonations et les nuances émotionnelles.

Le système fonctionne sur la base de l’intelligence artificielle Gemini et permet aux participants à la conversation de communiquer à travers la barrière linguistique, tout en maintenant le naturel de la communication. Lors de la conférence I/O, Google a démontré cette technologie en action. Dans la démonstration, un participant anglophone communiquait avec un collègue en espagnol. Après l’activation de la fonction Gemini, le système a immédiatement commencé à traduire la parole dans les deux directions. Et chaque participant entendait l’interlocuteur dans sa langue maternelle tout en préservant les caractéristiques vocales originales.

Actuellement, la technologie ne fonctionne qu’avec les langues anglaise et espagnole, mais l’entreprise a déjà annoncé des plans pour ajouter le support des langues italienne, allemande et portugaise dans les semaines à venir. Maintenant, la fonction est disponible pour les abonnés payants de Google Meet, et d’ici la fin de l’année, ils prévoient de l’ouvrir aux clients corporatifs.

Cette technologie peut potentiellement changer l’approche des communications internationales, les rendant plus naturelles et efficaces pour les affaires, l’éducation et la communication personnelle avec des amis ou des parents étrangers.

Je suis vraiment surpris ! La traduction simultanée de Google Meet se concentre non seulement sur la précision de la transmission du sens, mais aussi sur la préservation des éléments paralinguistiques de la parole. Ce qui rend la communication entre locuteurs de différentes langues aussi proche que possible de la communication naturelle. Comme ce sera cool de parler à n’importe quelle personne sur la planète dans n’importe quelle langue. J’attends vraiment avec impatience que cette technologie soit largement disponible.

Почитать из последнего
UBTech enverra des robots Walker S2 servir à la frontière chinoise pour $37 millions
L'entreprise chinoise UBTech a remporté un contrat de $37 millions. Et enverra des robots humanoïdes Walker S2 servir à la frontière de la Chine avec le Vietnam. South China Morning Post rapporte que les robots interagiront avec les touristes et le personnel, effectueront des opérations logistiques, inspecteront les marchandises et patrouilleront le territoire. Et caractéristiquement — ils peuvent changer leur batterie de manière autonome.
Anthropic a révélé accidentellement un document interne sur "l'âme" de Claude
Anthropic a révélé accidentellement "l'âme" de l'intelligence artificielle à un utilisateur. Et ce n'est pas une métaphore. C'est un document interne tout à fait concret.
Jensen Huang a ordonné aux employés de Nvidia d'utiliser l'IA partout
Jensen Huang a annoncé une mobilisation totale sous la bannière de l'intelligence artificielle à l'intérieur de Nvidia. Et ce n'est plus une recommandation. C'est une exigence.
Les chatbots IA génèrent du contenu qui aggrave les troubles alimentaires
Une étude conjointe de l'Université Stanford et du Center for Democracy and Technology a montré un tableau inquiétant. Les chatbots avec intelligence artificielle représentent un risque sérieux pour les personnes souffrant de troubles alimentaires. Les scientifiques avertissent que les réseaux neuronaux distribuent des conseils nuisibles sur les régimes. Ils proposent des moyens de cacher le trouble et génèrent du "contenu inspirant pour perdre du poids" qui aggrave le problème.
OpenAGI a publié le modèle Lux qui dépasse Google et OpenAI
La startup OpenAGI a publié le modèle Lux pour le contrôle d'ordinateur et affirme que c'est une percée. Selon les benchmarks, le modèle dépasse d'une génération entière les analogues de Google, OpenAI et Anthropic. De plus, il fonctionne plus vite. Environ 1 seconde par étape au lieu de 3 secondes chez les concurrents. Et 10 fois moins cher en coût par traitement de 1 token.