Post Thumbnail

Révolution dans la création de contenu : Veo 3 génère des dialogues et des effets sonores

Google a présenté Veo 3 — le dernier modèle de génération vidéo, qui peut être appelé à juste titre une véritable percée dans ce domaine. La principale caractéristique de cette technologie est le support sonore complet. Si auparavant les vidéos génératives étaient principalement muettes ou nécessitaient un traitement audio séparé, désormais le système crée des vidéos avec des effets sonores, des bruits de fond et même des dialogues complets entre les personnages.

Les utilisateurs peuvent donner à Veo 3 une demande avec une description des personnages et de l’environnement, ainsi que suggérer des dialogues avec une indication de comment exactement ils devraient sonner. Comme l’a noté lors du point presse Demis Hassabis, PDG de Google DeepMind, je cite – “Pour la première fois, nous sortons de l’ère silencieuse de la génération vidéo.”

Je suis agréablement choqué ! L’unicité de Veo 3 réside dans sa capacité à comprendre les pixels originaux des vidéos générées et à synchroniser automatiquement les sons créés avec eux. Bien que les outils de génération de son basés sur l’intelligence artificielle ne soient pas nouveaux, c’est cette intégration de la vidéo et de l’audio qui distingue le développement de Google parmi les concurrents.

Il existe déjà de nombreux outils de génération vidéo sur le marché provenant d’entreprises telles que Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, ainsi que OpenAI et Alibaba. Cependant, la capacité à générer automatiquement du son synchronisé donne à Veo 3 un sérieux avantage concurrentiel.

La nouvelle technologie sera disponible pour les utilisateurs via l’application Gemini, vraisemblablement par abonnement.

Il semble que Veo 3 soit une transition à part entière d’une approche fragmentée de la génération de contenu médiatique, où la vidéo et l’audio étaient créés séparément, vers un modèle intégré de création de contenu audiovisuel complet avec des sons, des dialogues et des images synchronisés. Ce qui simplifie radicalement le processus de travail de création vidéo. Bravo.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
Chef de Nvidia croit qu'il n'y a pas de bulle IA

Le fondateur de Nvidia Jensen Huang a dissipé les inquiétudes concernant une bulle sur le marché de l'IA. Et selon lui, les dernières puces de l'entreprise devraient rapporter 0,5 billion de dollars de revenus.

Sam Altman est fatigué des questions d'argent

Sam Altman est fatigué des questions sur l'argent d'OpenAI. Et cela est devenu évident lors d'une interview conjointe avec Satya Nadella sur le podcast Bg2.

Nombre de postes d'ingénieurs de déploiement avancé a augmenté de 800%

Les entreprises d'IA ont inventé une nouvelle profession. Il s'agit d'ingénieurs de déploiement avancé.

OpenAI promet de créer scientifique IA complet d'ici 2028

OpenAI a promis de créer un scientifique basé sur l'IA complet d'ici 2028. Le PDG de l'entreprise Sam Altman a également déclaré que les systèmes d'apprentissage profond pourront effectuer les fonctions de scientifiques chercheurs au niveau stagiaire d'ici septembre de l'année prochaine. Et le niveau d'un chercheur IA autonome complet pourrait être atteint d'ici 2028.

Emplois pour jeunes spécialistes IT en Grande-Bretagne se sont effondrés de 46%

Vous savez ce qui se passe sur le marché du travail pour les jeunes spécialistes IT en Grande-Bretagne ? Au cours de la dernière année, le nombre d'emplois pour jeunes spécialistes s'est effondré de 46%. Et une baisse supplémentaire de 53% est prévue, rapporte The Register. Citant les statistiques de l'Institute of Student Employers.