Post Thumbnail

Revolución en la creación de contenido: Veo 3 genera diálogos y efectos de sonido

Google ha presentado Veo 3 — el más reciente modelo de generación de video, que merecidamente puede ser llamado un verdadero avance en este campo. La característica principal de esta tecnología es el soporte completo de sonido. Si anteriormente los videos generativos eran predominantemente silenciosos o requerían procesamiento de audio separado, ahora el sistema crea videos con efectos de sonido, ruidos de fondo e incluso diálogos completos entre personajes.

Los usuarios pueden dar a Veo 3 una solicitud con una descripción de personajes y entorno, así como sugerir diálogos con una indicación de cómo exactamente deberían sonar. Como señaló durante la rueda de prensa Demis Hassabis, CEO de Google DeepMind, cito – “Por primera vez, estamos saliendo de la era silenciosa de la generación de video.”

¡Estoy gratamente impactado! La singularidad de Veo 3 radica en su capacidad para entender los píxeles originales de videos generados y sincronizar automáticamente los sonidos creados con ellos. Aunque las herramientas para generar sonido basadas en inteligencia artificial no son nuevas, es precisamente tal integración de video y audio lo que distingue el desarrollo de Google entre los competidores.

Ya existen muchas herramientas para la generación de video en el mercado de compañías como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, así como OpenAI y Alibaba. Sin embargo, la capacidad de generar automáticamente sonido sincronizado le da a Veo 3 una seria ventaja competitiva.

La nueva tecnología estará disponible para los usuarios a través de la aplicación Gemini, presumiblemente por suscripción.

Parece que Veo 3 es una transición completa desde un enfoque fragmentado de la generación de contenido multimedia, donde el video y el audio se creaban por separado, hacia un modelo integrado de creación de contenido audiovisual completo con sonidos, diálogos e imágenes sincronizados. Lo que simplifica radicalmente el flujo de trabajo de creación de video. Bravo.

Autor: AIvengo
Latest News
Jefe de Nvidia cree que no hay burbuja de IA

Fundador de Nvidia Jensen Huang disipó preocupaciones sobre burbuja en mercado de IA. Y según él, últimos chips de compañía se espera que traigan 0.5 billones de dólares en ingresos.

Sam Altman está cansado de preguntas sobre dinero

Sam Altman está cansado de preguntas sobre dinero de OpenAI. Y esto se hizo obvio durante entrevista conjunta con Satya Nadella en podcast Bg2.

Número de vacantes de ingenieros de despliegue avanzado creció 800%

Compañías de IA inventaron nueva profesión. Hablamos de ingenieros de despliegue avanzado.

OpenAI promete crear científico de IA completo para 2028

OpenAI prometió crear científico basado en IA completo para 2028. CEO de compañía Sam Altman también declaró que sistemas de aprendizaje profundo podrán realizar funciones de científicos investigadores a nivel de pasante para septiembre de próximo año. Y nivel de investigador de IA autónomo completo podría alcanzarse para 2028.

Empleos para jóvenes especialistas IT en Gran Bretaña colapsaron 46%

¿Saben qué está pasando en mercado laboral para jóvenes especialistas IT en Gran Bretaña? Durante último año, número de empleos para jóvenes especialistas colapsó 46%. Y se pronostica caída adicional de 53%, reporta The Register. Citando estadísticas de Institute of Student Employers.