Post Thumbnail

Révolution dans la création de contenu : Veo 3 génère des dialogues et des effets sonores

Google a présenté Veo 3 — le dernier modèle de génération vidéo, qui peut être appelé à juste titre une véritable percée dans ce domaine. La principale caractéristique de cette technologie est le support sonore complet. Si auparavant les vidéos génératives étaient principalement muettes ou nécessitaient un traitement audio séparé, désormais le système crée des vidéos avec des effets sonores, des bruits de fond et même des dialogues complets entre les personnages.

Les utilisateurs peuvent donner à Veo 3 une demande avec une description des personnages et de l’environnement, ainsi que suggérer des dialogues avec une indication de comment exactement ils devraient sonner. Comme l’a noté lors du point presse Demis Hassabis, PDG de Google DeepMind, je cite – “Pour la première fois, nous sortons de l’ère silencieuse de la génération vidéo.”

Je suis agréablement choqué ! L’unicité de Veo 3 réside dans sa capacité à comprendre les pixels originaux des vidéos générées et à synchroniser automatiquement les sons créés avec eux. Bien que les outils de génération de son basés sur l’intelligence artificielle ne soient pas nouveaux, c’est cette intégration de la vidéo et de l’audio qui distingue le développement de Google parmi les concurrents.

Il existe déjà de nombreux outils de génération vidéo sur le marché provenant d’entreprises telles que Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, ainsi que OpenAI et Alibaba. Cependant, la capacité à générer automatiquement du son synchronisé donne à Veo 3 un sérieux avantage concurrentiel.

La nouvelle technologie sera disponible pour les utilisateurs via l’application Gemini, vraisemblablement par abonnement.

Il semble que Veo 3 soit une transition à part entière d’une approche fragmentée de la génération de contenu médiatique, où la vidéo et l’audio étaient créés séparément, vers un modèle intégré de création de contenu audiovisuel complet avec des sons, des dialogues et des images synchronisés. Ce qui simplifie radicalement le processus de travail de création vidéo. Bravo.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Seulement 1 programmeur au monde a pu battre l'IA d'OpenAI

Imaginez un monde où l'intelligence artificielle concourt avec les meilleurs programmeurs de la planète. Une telle confrontation a eu lieu lors du prestigieux tournoi AtCoder World Tour Finals. C'est l'une des compétitions de programmation les plus élitistes au monde, où il est extrêmement difficile d'entrer.

Un ancien ingénieur d'OpenAI a raconté le chaos à l'intérieur de l'entreprise

Vous voulez savoir ce qui se passe vraiment à l'intérieur d'OpenAI ? L'ancien ingénieur Calvin French-Owen a révélé tous les détails après avoir quitté l'entreprise il y a 3 semaines.

Salaire jusqu'à 170 000$ : Ce que SpaceX offre aux développeurs IA

SpaceX fait un tournant inattendu dans sa stratégie technologique. L'entreprise d'Elon Musk a ouvert des postes vacants pour des ingénieurs logiciels dans le domaine de l'intelligence artificielle. Formant une équipe qui s'occupera de résoudre les tâches de traitement de données les plus complexes pour les lanceurs et véhicules spatiaux.

Musk avec 248 milliards de dollars n'achète pas de PC de travail mais espionne les employés

L'entreprise xAI a commencé à surveiller ses employés directement sur leurs ordinateurs personnels ! Les employés qui entraînent l'intelligence artificielle Grok depuis leurs appareils ont été obligés d'installer des programmes de suivi.

Kimi-K2 avec 1 billion de paramètres a dépassé GPT-4.1 en programmation

L'entreprise technologique chinoise Moonshot AI a présenté un nouveau joueur dans l'arène de l'IA ! Rencontrez Kimi-K2. C'est un grand modèle de langage avec du code source ouvert, prêt à défier les leaders industriels reconnus comme Claude Sonnet 4 et GPT-4.1. Et un tel démarrage bruyant et puissant rappelle l'apparition de Deepseek.