
Tencent a ouvert le code source d’HunyuanPortrait pour l’animation de photos
La compagnie Tencent a publié le code source et les coefficients de poids de son projet HunyuanPortrait – un système de création de portraits animés réalistes. Cette solution, basée sur des modèles de diffusion, permet de transférer les mouvements d’une vidéo source vers une image statique, « donnant vie » essentiellement aux photographies avec un degré impressionnant de réalisme.
L’architecture technique d’HunyuanPortrait représente un ensemble complet de modèles spécialisés. SVD pour générer des séquences vidéo. DiNOv2 pour extraire les caractéristiques visuelles. Arc2Face pour travailler avec les expressions faciales. Et YoloFace pour une détection fiable des visages. Une telle structure multi-composante assure un contrôle plus précis de l’animation et la fluidité des transitions entre images comparé aux analogues existants.
L’implémentation actuelle nécessite 24 gigaoctets de mémoire vidéo pour lancer le processus d’inférence, ce qui rend la technologie accessible à un cercle relativement large d’enthousiastes et de professionnels ayant à leur disposition des accélérateurs graphiques modernes. Il est important de noter que le système ne supporte pas encore le mode « text-to-motion », se limitant au transfert de mouvements depuis une vidéo de référence.
L’accès ouvert au code et aux poids du modèle ouvre un nouveau chapitre dans le développement des technologies d’animation numérique, démocratisant potentiellement des outils précédemment accessibles seulement aux grands studios et géants technologiques.