Post Thumbnail

Révolution dans la création de contenu : Veo 3 génère des dialogues et des effets sonores

Google a présenté Veo 3 — le dernier modèle de génération vidéo, qui peut être appelé à juste titre une véritable percée dans ce domaine. La principale caractéristique de cette technologie est le support sonore complet. Si auparavant les vidéos génératives étaient principalement muettes ou nécessitaient un traitement audio séparé, désormais le système crée des vidéos avec des effets sonores, des bruits de fond et même des dialogues complets entre les personnages.

Les utilisateurs peuvent donner à Veo 3 une demande avec une description des personnages et de l’environnement, ainsi que suggérer des dialogues avec une indication de comment exactement ils devraient sonner. Comme l’a noté lors du point presse Demis Hassabis, PDG de Google DeepMind, je cite – “Pour la première fois, nous sortons de l’ère silencieuse de la génération vidéo.”

Je suis agréablement choqué ! L’unicité de Veo 3 réside dans sa capacité à comprendre les pixels originaux des vidéos générées et à synchroniser automatiquement les sons créés avec eux. Bien que les outils de génération de son basés sur l’intelligence artificielle ne soient pas nouveaux, c’est cette intégration de la vidéo et de l’audio qui distingue le développement de Google parmi les concurrents.

Il existe déjà de nombreux outils de génération vidéo sur le marché provenant d’entreprises telles que Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, ainsi que OpenAI et Alibaba. Cependant, la capacité à générer automatiquement du son synchronisé donne à Veo 3 un sérieux avantage concurrentiel.

La nouvelle technologie sera disponible pour les utilisateurs via l’application Gemini, vraisemblablement par abonnement.

Il semble que Veo 3 soit une transition à part entière d’une approche fragmentée de la génération de contenu médiatique, où la vidéo et l’audio étaient créés séparément, vers un modèle intégré de création de contenu audiovisuel complet avec des sons, des dialogues et des images synchronisés. Ce qui simplifie radicalement le processus de travail de création vidéo. Bravo.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Michael Burry a parié 1,1 milliard de dollars contre Nvidia et Palantir

Michael Burry - c'est un investisseur légendaire qui a prédit la crise des subprimes de 2008. Et maintenant il fait à nouveau un coup retentissant. Michael a parié 1,1 milliard de dollars en options de vente contre 2 grandes entreprises du secteur de l'IA. Ce sont Nvidia et Palantir.

XPeng a présenté premier robot humanoïde féminin au monde

Le constructeur automobile électrique chinois XPeng a présenté le robot humanoïde de nouvelle génération IRON. Et c'est le premier humanoïde féminin !

Anthropic mène interviews avec modèles avant envoi à la retraite

Anthropic a publié une politique de "mise hors service" des versions IA obsolètes. L'engagement clé est de préserver les poids de tous les modèles publics et activement utilisés en interne pendant au moins la durée de vie de l'entreprise. Pour qu'à l'avenir l'accès puisse être restauré si nécessaire.

Chef de Nvidia croit qu'il n'y a pas de bulle IA

Le fondateur de Nvidia Jensen Huang a dissipé les inquiétudes concernant une bulle sur le marché de l'IA. Et selon lui, les dernières puces de l'entreprise devraient rapporter 0,5 billion de dollars de revenus.

Sam Altman est fatigué des questions d'argent

Sam Altman est fatigué des questions sur l'argent d'OpenAI. Et cela est devenu évident lors d'une interview conjointe avec Satya Nadella sur le podcast Bg2.