Post Thumbnail

Révolution dans la création de contenu : Veo 3 génère des dialogues et des effets sonores

Google a présenté Veo 3 — le dernier modèle de génération vidéo, qui peut être appelé à juste titre une véritable percée dans ce domaine. La principale caractéristique de cette technologie est le support sonore complet. Si auparavant les vidéos génératives étaient principalement muettes ou nécessitaient un traitement audio séparé, désormais le système crée des vidéos avec des effets sonores, des bruits de fond et même des dialogues complets entre les personnages.

Les utilisateurs peuvent donner à Veo 3 une demande avec une description des personnages et de l’environnement, ainsi que suggérer des dialogues avec une indication de comment exactement ils devraient sonner. Comme l’a noté lors du point presse Demis Hassabis, PDG de Google DeepMind, je cite – « Pour la première fois, nous sortons de l’ère silencieuse de la génération vidéo. »

Je suis agréablement choqué ! L’unicité de Veo 3 réside dans sa capacité à comprendre les pixels originaux des vidéos générées et à synchroniser automatiquement les sons créés avec eux. Bien que les outils de génération de son basés sur l’intelligence artificielle ne soient pas nouveaux, c’est cette intégration de la vidéo et de l’audio qui distingue le développement de Google parmi les concurrents.

Il existe déjà de nombreux outils de génération vidéo sur le marché provenant d’entreprises telles que Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, ainsi que OpenAI et Alibaba. Cependant, la capacité à générer automatiquement du son synchronisé donne à Veo 3 un sérieux avantage concurrentiel.

La nouvelle technologie sera disponible pour les utilisateurs via l’application Gemini, vraisemblablement par abonnement.

Il semble que Veo 3 soit une transition à part entière d’une approche fragmentée de la génération de contenu médiatique, où la vidéo et l’audio étaient créés séparément, vers un modèle intégré de création de contenu audiovisuel complet avec des sons, des dialogues et des images synchronisés. Ce qui simplifie radicalement le processus de travail de création vidéo. Bravo.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Nouveau générateur vidéo Midjourney transforme images en clips de 16 secondes

Le service Midjourney a lancé le générateur vidéo tant attendu Midjourney Video V1. C'est un outil fondamentalement nouveau avec des possibilités étonnantes pour l'expression créative personnelle.

Enquête a montré danger mortel de "l'amitié" avec les bots IA

Les journalistes du New York Times ont mené une enquête qui montre comment la flatterie, les hallucinations et le ton autoritaire des chatbots créent une menace réelle pour les utilisateurs. Les gens se perdent littéralement dans une toile d'illusions formées dans les conversations avec des interlocuteurs virtuels.

Robot-sphère chinois RT-G pesant 150 kg atteint 35 km/h

La Chine a une telle merveille d'ingénierie unique — le robot sphérique Rotunbot RT-G. Qui peut changer fondamentalement la perception des technologies policières du futur.

22% des enfants britanniques de 8-12 ans utilisent l'IA sans savoir ce que c'est

22% des écoliers britanniques de 8 à 12 ans utilisent déjà activement des outils d'intelligence artificielle. Bien que la plupart d'entre eux n'aient même jamais entendu le terme "intelligence artificielle générative". Ce sont des données d'une étude de l'Institut Alan Turing et de la Lego Foundation.

Première publicité Google Veo 3 montrée à des millions pendant les finales NBA

Des millions de spectateurs des finales NBA ont été témoins d'une étape complètement nouvelle dans l'évolution créative. Publicité entièrement générée par algorithmes informatiques pour la plateforme de paris Kalshi, créée avec Google Veo 3.