Post Thumbnail

Google Meet traduce en tiempo real conservando la voz del hablante

Google ha presentado una función revolucionaria de traducción del habla en tiempo real para su servicio de videoconferencias Meet. ¡Estoy gratamente sorprendido! La característica principal de esta tecnología es la capacidad no solo de traducir lo dicho, sino también de conservar las características individuales de la voz del hablante. Incluyendo timbre, entonaciones y matices emocionales.

El sistema funciona basado en la inteligencia artificial Gemini y permite a los participantes de la conversación comunicarse a través de la barrera del idioma, manteniendo al mismo tiempo la naturalidad de la comunicación. En la conferencia I/O, Google demostró esta tecnología en acción. En la demostración, un participante de habla inglesa se comunicaba con un colega en español. Después de activar la función Gemini, el sistema comenzó instantáneamente a traducir el habla en ambas direcciones. Y cada participante escuchaba al interlocutor en su idioma nativo conservando las características originales de la voz.

Actualmente, la tecnología solo funciona con los idiomas inglés y español, pero la compañía ya ha anunciado planes para añadir soporte para los idiomas italiano, alemán y portugués en las próximas semanas. Ahora la función está disponible para suscriptores de pago de Google Meet, y para finales de año, planean abrirla a clientes corporativos.

Esta tecnología potencialmente puede cambiar el enfoque de las comunicaciones internacionales, haciéndolas más naturales y efectivas para negocios, educación y comunicación personal con amigos o familiares extranjeros.

¡¡¡Estoy realmente sorprendido! La traducción simultánea de Google Meet se enfoca no solo en la precisión de la transmisión del significado, sino también en preservar los elementos paralingüísticos del habla. Lo que hace que la comunicación entre hablantes de diferentes idiomas sea lo más cercana posible a la comunicación natural. Qué genial será hablar con cualquier persona en el planeta en cualquier idioma. Estoy realmente deseando que esta tecnología esté ampliamente disponible.

Autor: AIvengo

Latest News

Nvidia presentó la familia de modelos Cosmos para robótica

La empresa Nvidia presentó la familia Cosmos de modelos de IA. Que pueden cambiar fundamentalmente el enfoque para crear robots y agentes de IA físicos.

ChatGPT llama a los usuarios "semillas estelares" del planeta Lyra

Resulta que ChatGPT puede atraer a los usuarios al mundo de teorías científicamente infundadas y místicas.

La música IA desencadena emociones más fuertes que la música humana

¿Alguna vez se han preguntado por qué una melodía les da escalofríos mientras otra los deja indiferentes? Los científicos descubrieron algo interesante. La música creada por inteligencia artificial desencadena en las personas reacciones emocionales más intensas que las composiciones escritas por humanos.

GPT-5 fue hackeado en 24 horas

2 empresas de investigación independientes NeuralTrust y SPLX descubrieron vulnerabilidades críticas en el sistema de seguridad del nuevo modelo solo 24 horas después del lanzamiento de GPT-5. Para comparación, Grok-4 fue hackeado en 2 días, haciendo el caso de GPT-5 aún más alarmante.

Cloudflare bloqueó a Perplexity por 6 millones de solicitudes ocultas al día

Cloudflare asestó un golpe aplastante a Perplexity AI, bloqueando el acceso de la startup de búsqueda a miles de sitios. ¿La razón? ¡Escaneo oculto de recursos web de escala sin precedentes a pesar de prohibiciones explícitas de los propietarios!