Post Thumbnail

Stability AI présente la transformation de photos 2D en scènes 3D

Stability AI a annoncé la sortie d’un modèle d’IA innovant appelé Stable Virtual Camera, capable de transformer des images bidimensionnelles en matériaux vidéo immersifs avec une profondeur et une perspective réalistes. Cette avancée technologique marque un progrès significatif dans le domaine de l’intelligence artificielle générative et de la cinématographie virtuelle.

Stable Virtual Camera représente un développement substantiel du concept de caméras virtuelles, traditionnellement utilisées dans la production cinématographique numérique et l’animation 3D. L’intégration de l’IA générative dans cet ensemble d’outils ouvre des possibilités sans précédent pour le contrôle et la personnalisation du contenu créé.

Les capacités techniques du nouveau modèle sont impressionnantes :

  • Génération de “nouveaux angles” d’une scène basés sur un à 32 images sources.
  • Création de vidéos avec des trajectoires dynamiques de mouvement de caméra.
  • Prise en charge des modes de prise de vue prédéfinis : “Spiral”, “Dolly Zoom”, “Move” et “Pan”.
  • Possibilité de travailler avec différents formats : carré (1:1), portrait (9:16) et paysage (16:9).
  • Capacité à générer des séquences vidéo jusqu’à 1000 images.

Malgré les capacités impressionnantes, Stability met en garde contre les limitations potentielles de la version de recherche actuelle. Le modèle peut montrer une dégradation de la qualité lorsqu’il travaille avec des images contenant des personnes, des animaux ou des “textures dynamiques” comme l’eau. “Les scènes très ambitieuses, les trajectoires de caméra complexes traversant des objets ou des surfaces, et les objets de forme irrégulière peuvent provoquer un effet de scintillement, surtout lorsque les angles cibles diffèrent considérablement des images sources”, note l’entreprise dans son blog.

Cette percée technologique survient pendant une période difficile pour Stability AI. L’entreprise, connue pour son modèle populaire de génération d’images Stable Diffusion, a attiré de nouveaux investissements l’année dernière de la part de figures importantes comme Eric Schmidt et le fondateur de Napster, Sean Parker, qui cherchent à restaurer l’entreprise. Il a été rapporté plus tôt que le cofondateur et ancien PDG de Stability, Emad Mostaque, a conduit l’entreprise à des problèmes financiers, entraînant des licenciements d’employés, l’échec d’un partenariat avec Canva et des préoccupations croissantes des investisseurs quant aux perspectives de l’entreprise.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Comment créer un univers infini avec un seul prompt textuel

Oubliez tout ce que vous saviez sur la création de mondes de jeu. Tencent vient de publier le modèle open-source Hunyuan-GameCraft. Qui génère des mondes virtuels interactifs directement sur votre carte graphique. Lien dans la description. Un prompt textuel — et vous avez un univers infini.

Comment la synchronisation de 3 sources lumineuses protège contre les contrefaçons

L'intelligence artificielle a appris à créer des fausses vidéos impossibles à distinguer de la réalité. Et c'est un énorme problème et une question de confiance dans la société. Mais les scientifiques de l'Université Cornell ont trouvé une solution géniale. Ils ont caché des filigranes directement dans l'éclairage ordinaire.

Hip-hop, wushu et opéra de Pékin à la cérémonie d'ouverture de la robotiade

La Chine a accueilli les premiers Jeux Mondiaux de Robots Humanoïdes où 280 équipes de 16 pays ont concouru. Qui ont apporté plus de 500 androïdes. C'est devenu presque de vrais Jeux olympiques pour robots avec tous les attributs du grand sport.

Le premier système LAARMA protège les animaux sur les routes australiennes

En Australie, les collisions d'animaux avec les automobiles constituent un problème sérieux pour l'écosystème de ce continent. Maintenant les scientifiques ont trouvé une solution technologique. Le premier système routier LAARMA au monde basé sur l'intelligence artificielle, qui protège les animaux sauvages des rencontres dangereuses avec le transport.

Nvidia a présenté la famille de modèles Cosmos pour la robotique

L'entreprise Nvidia a présenté la famille Cosmos de modèles d'IA. Qui peuvent fondamentalement changer l'approche de création de robots et d'agents IA physiques.