Post Thumbnail

Revolución en la creación de contenido: Veo 3 genera diálogos y efectos de sonido

Google ha presentado Veo 3 — el más reciente modelo de generación de video, que merecidamente puede ser llamado un verdadero avance en este campo. La característica principal de esta tecnología es el soporte completo de sonido. Si anteriormente los videos generativos eran predominantemente silenciosos o requerían procesamiento de audio separado, ahora el sistema crea videos con efectos de sonido, ruidos de fondo e incluso diálogos completos entre personajes.

Los usuarios pueden dar a Veo 3 una solicitud con una descripción de personajes y entorno, así como sugerir diálogos con una indicación de cómo exactamente deberían sonar. Como señaló durante la rueda de prensa Demis Hassabis, CEO de Google DeepMind, cito – «Por primera vez, estamos saliendo de la era silenciosa de la generación de video.»

¡Estoy gratamente impactado! La singularidad de Veo 3 radica en su capacidad para entender los píxeles originales de videos generados y sincronizar automáticamente los sonidos creados con ellos. Aunque las herramientas para generar sonido basadas en inteligencia artificial no son nuevas, es precisamente tal integración de video y audio lo que distingue el desarrollo de Google entre los competidores.

Ya existen muchas herramientas para la generación de video en el mercado de compañías como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, así como OpenAI y Alibaba. Sin embargo, la capacidad de generar automáticamente sonido sincronizado le da a Veo 3 una seria ventaja competitiva.

La nueva tecnología estará disponible para los usuarios a través de la aplicación Gemini, presumiblemente por suscripción.

Parece que Veo 3 es una transición completa desde un enfoque fragmentado de la generación de contenido multimedia, donde el video y el audio se creaban por separado, hacia un modelo integrado de creación de contenido audiovisual completo con sonidos, diálogos e imágenes sincronizados. Lo que simplifica radicalmente el flujo de trabajo de creación de video. Bravo.

Autor: AIvengo

Latest News

Nuevo generador de video Midjourney convierte imágenes en clips de 16 segundos

Servicio Midjourney lanzó esperado generador de video Midjourney Video V1. Esta es herramienta fundamentalmente nueva con posibilidades impresionantes para expresión creativa personal.

Investigación mostró peligro mortal de "amistad" con bots de IA

Periodistas de New York Times condujeron investigación que muestra cómo adulación, alucinaciones y tono autoritario de chatbots crean amenaza real para usuarios. Personas literalmente se pierden en red de ilusiones formadas en conversaciones con interlocutores virtuales.

Robot esfera chino RT-G pesando 150 kg alcanza velocidad hasta 35 km/h

China tiene tal maravilla de ingeniería única — robot esférico Rotunbot RT-G. Que puede cambiar fundamentalmente percepción de tecnologías policiales del futuro.

22% de niños británicos de 8-12 años usan IA sin saber qué es

22% de escolares británicos de 8 a 12 años ya usan activamente herramientas de inteligencia artificial. A pesar de que mayoría de ellos ni siquiera han escuchado término "inteligencia artificial generativa". Estos son datos de estudio del Instituto Alan Turing y Lego Foundation.

Primera publicidad de Google Veo 3 mostrada a millones durante finales NBA

Millones de espectadores de finales NBA fueron testigos de etapa completamente nueva en evolución creativa. Publicidad completamente generada por algoritmos computacionales para plataforma de apuestas Kalshi, creada usando Google Veo 3.