Post Thumbnail

Revolución en la creación de contenido: Veo 3 genera diálogos y efectos de sonido

Google ha presentado Veo 3 — el más reciente modelo de generación de video, que merecidamente puede ser llamado un verdadero avance en este campo. La característica principal de esta tecnología es el soporte completo de sonido. Si anteriormente los videos generativos eran predominantemente silenciosos o requerían procesamiento de audio separado, ahora el sistema crea videos con efectos de sonido, ruidos de fondo e incluso diálogos completos entre personajes.

Los usuarios pueden dar a Veo 3 una solicitud con una descripción de personajes y entorno, así como sugerir diálogos con una indicación de cómo exactamente deberían sonar. Como señaló durante la rueda de prensa Demis Hassabis, CEO de Google DeepMind, cito – “Por primera vez, estamos saliendo de la era silenciosa de la generación de video.”

¡Estoy gratamente impactado! La singularidad de Veo 3 radica en su capacidad para entender los píxeles originales de videos generados y sincronizar automáticamente los sonidos creados con ellos. Aunque las herramientas para generar sonido basadas en inteligencia artificial no son nuevas, es precisamente tal integración de video y audio lo que distingue el desarrollo de Google entre los competidores.

Ya existen muchas herramientas para la generación de video en el mercado de compañías como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, así como OpenAI y Alibaba. Sin embargo, la capacidad de generar automáticamente sonido sincronizado le da a Veo 3 una seria ventaja competitiva.

La nueva tecnología estará disponible para los usuarios a través de la aplicación Gemini, presumiblemente por suscripción.

Parece que Veo 3 es una transición completa desde un enfoque fragmentado de la generación de contenido multimedia, donde el video y el audio se creaban por separado, hacia un modelo integrado de creación de contenido audiovisual completo con sonidos, diálogos e imágenes sincronizados. Lo que simplifica radicalmente el flujo de trabajo de creación de video. Bravo.

Autor: AIvengo
Latest News
Michael Burry apostó 1.1 mil millones de dólares contra Nvidia y Palantir

Michael Burry - este es inversionista legendario que predijo crisis hipotecaria de 2008. Y ahora está haciendo movimiento ruidoso otra vez. Michael apostó 1.1 mil millones de dólares en opciones de venta contra 2 grandes compañías de sector de IA. Estas son Nvidia y Palantir.

XPeng presentó primer robot humanoide femenino del mundo

Fabricante chino de autos eléctricos XPeng presentó robot humanoide de nueva generación IRON. ¡Y este es primer humanoide femenino!

Anthropic realiza entrevistas con modelos antes de enviar a jubilación

Anthropic publicó política de "desmantelamiento" de versiones de IA obsoletas. Compromiso clave es preservar pesos de todos modelos públicos y activamente usados internamente durante al menos vida de compañía. Para que en futuro acceso pueda ser restaurado si es necesario.

Jefe de Nvidia cree que no hay burbuja de IA

Fundador de Nvidia Jensen Huang disipó preocupaciones sobre burbuja en mercado de IA. Y según él, últimos chips de compañía se espera que traigan 0.5 billones de dólares en ingresos.

Sam Altman está cansado de preguntas sobre dinero

Sam Altman está cansado de preguntas sobre dinero de OpenAI. Y esto se hizo obvio durante entrevista conjunta con Satya Nadella en podcast Bg2.