Post Thumbnail

Tencent открыла исходный код HunyuanPortrait для анимации фотографий

Компания Tencent опубликовала исходный код и весовые коэффициенты своего проекта HunyuanPortrait – системы создания реалистичных анимированных портретов. Это решение, основанное на диффузионных моделях, позволяет переносить движения с исходного видео на статичное изображение, фактически «оживляя» фотографии с впечатляющей степенью реалистичности.

Техническая архитектура HunyuanPortrait представляет собой комплексный ансамбль специализированных моделей. SVD для генерации видеопоследовательностей. DiNOv2 для извлечения визуальных признаков. Arc2Face для работы с лицевыми выражениями. И YoloFace для надёжного обнаружения лиц. Такая многокомпонентная структура обеспечивает более точный контроль над анимацией и плавность переходов между кадрами по сравнению с существующими аналогами.

Текущая реализация требует 24 гигабайт видеопамяти для запуска процесса инференса, что делает технологию доступной для относительно широкого круга энтузиастов и профессионалов, имеющих в распоряжении современные графические ускорители. Важно отметить, что система пока не поддерживает режим «text-to-motion», ограничиваясь переносом движений с референсного видео.

Открытый доступ к коду и весам модели открывает новую главу в развитии технологий цифровой анимации, потенциально демократизируя инструменты, ранее доступные лишь крупным студиям и технологическим гигантам.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

OpenAI готовит первую открытую модель не слабее O3 Mini

Компания OpenAI готовится выпустить свою 1 открытую языковую модель. Оправдает своё название, так сказать. Это серьёзный поворот для компании, которая раньше держала свои мощные разработки закрытыми.

Grok 4 набрал 57% в "Последнем экзамене" против 22% у Gemini 2.5 Pro

Илон Маск представил новую версию своей нейросети – Grok 4. Максимальная версия – Grok 4 Heavy – способна запускать несколько вычислений одновременно и набирает 57% в сложнейшем тесте "Последний экзамен человечества". Для сравнения, предыдущий лидер Gemini 2.5 Pro показывал только 22%.

Исследователи нашли уязвимость ИИ через факты о кошках

От этой новости я мягко говоря удивился. Знаете ли вы, что обычное упоминание кошек может сбить с толку самые продвинутые модели искусственного интеллекта? Учёные обнаружили удивительную уязвимость в мыслительных процессах нейросетей.

IT-компании США уволили 94 тыс. сотрудников за полгода из-за ИИ

За 1 полугодие 2025 года американские IT-компании уволили более 94 тыс. технических специалистов. Это не просто экономия. Это структурное изменение под влиянием искусственного интеллекта.

OpenAI наняла первого психиатра в ИИ-индустрии для изучения влияния ChatGPT на психику

Компания OpenAI сообщила, что наняла профессионального клинического психиатра с опытом в судебной психиатрии. Чтобы исследовать влияние своих продуктов с искусственным интеллектом на психическое здоровье пользователей.