Post Thumbnail

Tencent a ouvert le code source d’HunyuanPortrait pour l’animation de photos

La compagnie Tencent a publié le code source et les coefficients de poids de son projet HunyuanPortrait – un système de création de portraits animés réalistes. Cette solution, basée sur des modèles de diffusion, permet de transférer les mouvements d’une vidéo source vers une image statique, “donnant vie” essentiellement aux photographies avec un degré impressionnant de réalisme.

L’architecture technique d’HunyuanPortrait représente un ensemble complet de modèles spécialisés. SVD pour générer des séquences vidéo. DiNOv2 pour extraire les caractéristiques visuelles. Arc2Face pour travailler avec les expressions faciales. Et YoloFace pour une détection fiable des visages. Une telle structure multi-composante assure un contrôle plus précis de l’animation et la fluidité des transitions entre images comparé aux analogues existants.

L’implémentation actuelle nécessite 24 gigaoctets de mémoire vidéo pour lancer le processus d’inférence, ce qui rend la technologie accessible à un cercle relativement large d’enthousiastes et de professionnels ayant à leur disposition des accélérateurs graphiques modernes. Il est important de noter que le système ne supporte pas encore le mode “text-to-motion”, se limitant au transfert de mouvements depuis une vidéo de référence.

L’accès ouvert au code et aux poids du modèle ouvre un nouveau chapitre dans le développement des technologies d’animation numérique, démocratisant potentiellement des outils précédemment accessibles seulement aux grands studios et géants technologiques.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Salaire jusqu'à 170 000$ : Ce que SpaceX offre aux développeurs IA

SpaceX fait un tournant inattendu dans sa stratégie technologique. L'entreprise d'Elon Musk a ouvert des postes vacants pour des ingénieurs logiciels dans le domaine de l'intelligence artificielle. Formant une équipe qui s'occupera de résoudre les tâches de traitement de données les plus complexes pour les lanceurs et véhicules spatiaux.

Musk avec 248 milliards de dollars n'achète pas de PC de travail mais espionne les employés

L'entreprise xAI a commencé à surveiller ses employés directement sur leurs ordinateurs personnels ! Les employés qui entraînent l'intelligence artificielle Grok depuis leurs appareils ont été obligés d'installer des programmes de suivi.

Kimi-K2 avec 1 billion de paramètres a dépassé GPT-4.1 en programmation

L'entreprise technologique chinoise Moonshot AI a présenté un nouveau joueur dans l'arène de l'IA ! Rencontrez Kimi-K2. C'est un grand modèle de langage avec du code source ouvert, prêt à défier les leaders industriels reconnus comme Claude Sonnet 4 et GPT-4.1. Et un tel démarrage bruyant et puissant rappelle l'apparition de Deepseek.

OpenAI prépare le premier modèle ouvert pas plus faible qu'O3 Mini

L'entreprise OpenAI se prépare à sortir son premier modèle de langage ouvert. Justifiera son nom, pour ainsi dire. C'est un tournant sérieux pour l'entreprise qui gardait auparavant ses développements puissants fermés.

Grok 4 a obtenu 57% au "Dernier Examen" contre 22% pour Gemini 2.5 Pro

Elon Musk a présenté une nouvelle version de son réseau neuronal – Grok 4. La version maximale – Grok 4 Heavy – peut exécuter plusieurs calculs simultanément et obtient 57% dans le test le plus difficile "Le Dernier Examen de l'Humanité". Pour comparaison, le précédent leader Gemini 2.5 Pro ne montrait que 22%.