Post Thumbnail

Révolution dans la création de contenu : Veo 3 génère des dialogues et des effets sonores

Google a présenté Veo 3 — le dernier modèle de génération vidéo, qui peut être appelé à juste titre une véritable percée dans ce domaine. La principale caractéristique de cette technologie est le support sonore complet. Si auparavant les vidéos génératives étaient principalement muettes ou nécessitaient un traitement audio séparé, désormais le système crée des vidéos avec des effets sonores, des bruits de fond et même des dialogues complets entre les personnages.

Les utilisateurs peuvent donner à Veo 3 une demande avec une description des personnages et de l’environnement, ainsi que suggérer des dialogues avec une indication de comment exactement ils devraient sonner. Comme l’a noté lors du point presse Demis Hassabis, PDG de Google DeepMind, je cite – “Pour la première fois, nous sortons de l’ère silencieuse de la génération vidéo.”

Je suis agréablement choqué ! L’unicité de Veo 3 réside dans sa capacité à comprendre les pixels originaux des vidéos générées et à synchroniser automatiquement les sons créés avec eux. Bien que les outils de génération de son basés sur l’intelligence artificielle ne soient pas nouveaux, c’est cette intégration de la vidéo et de l’audio qui distingue le développement de Google parmi les concurrents.

Il existe déjà de nombreux outils de génération vidéo sur le marché provenant d’entreprises telles que Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, ainsi que OpenAI et Alibaba. Cependant, la capacité à générer automatiquement du son synchronisé donne à Veo 3 un sérieux avantage concurrentiel.

La nouvelle technologie sera disponible pour les utilisateurs via l’application Gemini, vraisemblablement par abonnement.

Il semble que Veo 3 soit une transition à part entière d’une approche fragmentée de la génération de contenu médiatique, où la vidéo et l’audio étaient créés séparément, vers un modèle intégré de création de contenu audiovisuel complet avec des sons, des dialogues et des images synchronisés. Ce qui simplifie radicalement le processus de travail de création vidéo. Bravo.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Nvidia a présenté la famille de modèles Cosmos pour la robotique

L'entreprise Nvidia a présenté la famille Cosmos de modèles d'IA. Qui peuvent fondamentalement changer l'approche de création de robots et d'agents IA physiques.

ChatGPT appelle les utilisateurs "graines d'étoiles" de la planète Lyra

Il s'avère que ChatGPT peut entraîner les utilisateurs dans le monde de théories scientifiquement non fondées et mystiques.

La musique IA déclenche des émotions plus fortes que la musique humaine

Vous êtes-vous déjà demandé pourquoi une mélodie donne la chair de poule tandis qu'une autre laisse indifférent ? Les scientifiques ont découvert quelque chose d'intéressant. La musique créée par l'intelligence artificielle déclenche chez les gens des réactions émotionnelles plus intenses que les compositions écrites par des humains.

GPT-5 a été piraté en 24 heures

2 entreprises de recherche indépendantes NeuralTrust et SPLX ont découvert des vulnérabilités critiques dans le système de sécurité du nouveau modèle seulement 24 heures après la sortie de GPT-5. Pour comparaison, Grok-4 a été piraté en 2 jours, rendant le cas de GPT-5 encore plus alarmant.

Cloudflare a bloqué Perplexity pour 6 millions de requêtes cachées par jour

Cloudflare a porté un coup écrasant à Perplexity AI, bloquant l'accès de la startup de recherche à des milliers de sites. La raison ? Scannung caché de ressources web d'une ampleur sans précédent malgré les interdictions explicites des propriétaires !