Post Thumbnail

Revolución en la creación de contenido: Veo 3 genera diálogos y efectos de sonido

Google ha presentado Veo 3 — el más reciente modelo de generación de video, que merecidamente puede ser llamado un verdadero avance en este campo. La característica principal de esta tecnología es el soporte completo de sonido. Si anteriormente los videos generativos eran predominantemente silenciosos o requerían procesamiento de audio separado, ahora el sistema crea videos con efectos de sonido, ruidos de fondo e incluso diálogos completos entre personajes.

Los usuarios pueden dar a Veo 3 una solicitud con una descripción de personajes y entorno, así como sugerir diálogos con una indicación de cómo exactamente deberían sonar. Como señaló durante la rueda de prensa Demis Hassabis, CEO de Google DeepMind, cito – “Por primera vez, estamos saliendo de la era silenciosa de la generación de video.”

¡Estoy gratamente impactado! La singularidad de Veo 3 radica en su capacidad para entender los píxeles originales de videos generados y sincronizar automáticamente los sonidos creados con ellos. Aunque las herramientas para generar sonido basadas en inteligencia artificial no son nuevas, es precisamente tal integración de video y audio lo que distingue el desarrollo de Google entre los competidores.

Ya existen muchas herramientas para la generación de video en el mercado de compañías como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, así como OpenAI y Alibaba. Sin embargo, la capacidad de generar automáticamente sonido sincronizado le da a Veo 3 una seria ventaja competitiva.

La nueva tecnología estará disponible para los usuarios a través de la aplicación Gemini, presumiblemente por suscripción.

Parece que Veo 3 es una transición completa desde un enfoque fragmentado de la generación de contenido multimedia, donde el video y el audio se creaban por separado, hacia un modelo integrado de creación de contenido audiovisual completo con sonidos, diálogos e imágenes sincronizados. Lo que simplifica radicalmente el flujo de trabajo de creación de video. Bravo.

Autor: AIvengo

Latest News

Nvidia presentó la familia de modelos Cosmos para robótica

La empresa Nvidia presentó la familia Cosmos de modelos de IA. Que pueden cambiar fundamentalmente el enfoque para crear robots y agentes de IA físicos.

ChatGPT llama a los usuarios "semillas estelares" del planeta Lyra

Resulta que ChatGPT puede atraer a los usuarios al mundo de teorías científicamente infundadas y místicas.

La música IA desencadena emociones más fuertes que la música humana

¿Alguna vez se han preguntado por qué una melodía les da escalofríos mientras otra los deja indiferentes? Los científicos descubrieron algo interesante. La música creada por inteligencia artificial desencadena en las personas reacciones emocionales más intensas que las composiciones escritas por humanos.

GPT-5 fue hackeado en 24 horas

2 empresas de investigación independientes NeuralTrust y SPLX descubrieron vulnerabilidades críticas en el sistema de seguridad del nuevo modelo solo 24 horas después del lanzamiento de GPT-5. Para comparación, Grok-4 fue hackeado en 2 días, haciendo el caso de GPT-5 aún más alarmante.

Cloudflare bloqueó a Perplexity por 6 millones de solicitudes ocultas al día

Cloudflare asestó un golpe aplastante a Perplexity AI, bloqueando el acceso de la startup de búsqueda a miles de sitios. ¿La razón? ¡Escaneo oculto de recursos web de escala sin precedentes a pesar de prohibiciones explícitas de los propietarios!