Tencent открыла исходный код HunyuanPortrait для анимации фотографий
Компания Tencent опубликовала исходный код и весовые коэффициенты своего проекта HunyuanPortrait – системы создания реалистичных анимированных портретов. Это решение, основанное на диффузионных моделях, позволяет переносить движения с исходного видео на статичное изображение, фактически “оживляя” фотографии с впечатляющей степенью реалистичности.
Техническая архитектура HunyuanPortrait представляет собой комплексный ансамбль специализированных моделей. SVD для генерации видеопоследовательностей. DiNOv2 для извлечения визуальных признаков. Arc2Face для работы с лицевыми выражениями. И YoloFace для надёжного обнаружения лиц. Такая многокомпонентная структура обеспечивает более точный контроль над анимацией и плавность переходов между кадрами по сравнению с существующими аналогами.
Текущая реализация требует 24 гигабайт видеопамяти для запуска процесса инференса, что делает технологию доступной для относительно широкого круга энтузиастов и профессионалов, имеющих в распоряжении современные графические ускорители. Важно отметить, что система пока не поддерживает режим “text-to-motion”, ограничиваясь переносом движений с референсного видео.
Открытый доступ к коду и весам модели открывает новую главу в развитии технологий цифровой анимации, потенциально демократизируя инструменты, ранее доступные лишь крупным студиям и технологическим гигантам.
Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Китай сломал литографическую установку ASML при попытке её скопироватьВот вам история про то, как импортозамещение столкнулось с суровой реальностью. Китай попытался разобрать литографическую установку ASML категории DUV, чтобы изучить её устройство. Результат? Повредили систему и обратились к самой ASML с просьбой отремонтировать. Абсурд ситуации зашкаливает.
OpenAI купила программу Sky для macOS ещё до публичного выпускаOpenAI купила компанию Software Applications Incorporated, создателей программы Sky для macOS. И знаете, что самое интересное в этой новости? Продукт даже не был выпущен для публики. OpenAI приобрела разработку на стадии, когда обычные пользователи её ещё не видели.
Глава Airbnb заявил что ChatGPT недостаточно надёжен для их платформыГлава Airbnb Брайан Чески только что публично рассказал, что ChatGPT для их платформы пока не годится. Вдумайтесь – мы живём в 2025 году, искусственный интеллект якобы захватывает мир. А 1 из крупнейших tech-компаний заявляет: "Извините, ребята, но SDK недостаточно надёжен для того, что мы хотим сделать".
AWS уволила 40% DevOps команды и через пару дней всё рухнулоВот скажите, что может пойти не так, когда увольняешь 40% DevOps-команды и заменяешь их искусственным интеллектом? Amazon Web Services решила это выяснить на практике. И буквально через несколько дней после сокращений случился крупный сбой, который положил Snapchat, Roblox, Fortnite, McDonald's и десятки других массовых ресурсов.