Post Thumbnail

Google Meet traduce en tiempo real conservando la voz del hablante

Google ha presentado una función revolucionaria de traducción del habla en tiempo real para su servicio de videoconferencias Meet. ¡Estoy gratamente sorprendido! La característica principal de esta tecnología es la capacidad no solo de traducir lo dicho, sino también de conservar las características individuales de la voz del hablante. Incluyendo timbre, entonaciones y matices emocionales.

El sistema funciona basado en la inteligencia artificial Gemini y permite a los participantes de la conversación comunicarse a través de la barrera del idioma, manteniendo al mismo tiempo la naturalidad de la comunicación. En la conferencia I/O, Google demostró esta tecnología en acción. En la demostración, un participante de habla inglesa se comunicaba con un colega en español. Después de activar la función Gemini, el sistema comenzó instantáneamente a traducir el habla en ambas direcciones. Y cada participante escuchaba al interlocutor en su idioma nativo conservando las características originales de la voz.

Actualmente, la tecnología solo funciona con los idiomas inglés y español, pero la compañía ya ha anunciado planes para añadir soporte para los idiomas italiano, alemán y portugués en las próximas semanas. Ahora la función está disponible para suscriptores de pago de Google Meet, y para finales de año, planean abrirla a clientes corporativos.

Esta tecnología potencialmente puede cambiar el enfoque de las comunicaciones internacionales, haciéndolas más naturales y efectivas para negocios, educación y comunicación personal con amigos o familiares extranjeros.

¡¡¡Estoy realmente sorprendido! La traducción simultánea de Google Meet se enfoca no solo en la precisión de la transmisión del significado, sino también en preservar los elementos paralingüísticos del habla. Lo que hace que la comunicación entre hablantes de diferentes idiomas sea lo más cercana posible a la comunicación natural. Qué genial será hablar con cualquier persona en el planeta en cualquier idioma. Estoy realmente deseando que esta tecnología esté ampliamente disponible.

Autor: AIvengo

Latest News

Tinder lanzó citas dobles: IA ensambla equipos de 4 personas

App Tinder lanzó función de cita doble que permite a usuarios unirse con amigos para encontrar parejas. Ahora puedes invitar hasta 3 amigos y juntos explorar perfiles de otros llamados equipos. Que tienen al menos 1 coincidencia en preferencias individuales.

Nuevo benchmark mostró falla de IA en tareas de programación olímpica

Apareció nuevo benchmark LiveCodeBench Pro para evaluar capacidades de programación de inteligencia artificial. Enlace en descripción. Incluye tareas más difíciles y frescas de competencias populares. Olimpiada Internacional de Informática y Campeonato Mundial de Programación. Tareas fueron marcadas por ganadores y premiados de estas competencias ellos mismos.

Datos hasta 2022 se convirtieron en "acero pre-nuclear" para entrenamiento de IA

Inteligencia artificial, destinada a convertirse en locomotora de progreso tecnológico, está comenzando a frenar su propio desarrollo. Según The Register, modelos generativos han llenado internet con tanto contenido sintético que esto crea verdadero callejón sin salida tecnológico.

Sam Altman reveló intentos de Meta de robar empleados por $100 millones

Sam Altman reveló públicamente caza de talento sin precedentes que conduce Mark Zuckerberg. Jefe de Meta ofrece a empleados de OpenAI sumas verdaderamente astronómicas. ¡$100 millones solo como bono de entrada!

Nuevo generador de video Midjourney convierte imágenes en clips de 16 segundos

Servicio Midjourney lanzó esperado generador de video Midjourney Video V1. Esta es herramienta fundamentalmente nueva con posibilidades impresionantes para expresión creativa personal.