Post Thumbnail

Tencent abrió código fuente de HunyuanPortrait para animación de fotos

La compañía Tencent publicó código fuente y coeficientes de peso de su proyecto HunyuanPortrait – un sistema para crear retratos animados realistas. Esta solución, basada en modelos de difusión, permite transferir movimientos de video fuente a imagen estática, esencialmente “dando vida” a fotografías con grado impresionante de realismo.

La arquitectura técnica de HunyuanPortrait representa un conjunto integral de modelos especializados. SVD para generar secuencias de video. DiNOv2 para extraer características visuales. Arc2Face para trabajar con expresiones faciales. Y YoloFace para detección confiable de rostros. Tal estructura multicomponente proporciona control más preciso sobre animación y suavidad de transiciones entre cuadros comparado con análogos existentes.

La implementación actual requiere 24 gigabytes de memoria de video para ejecutar proceso de inferencia, lo que hace la tecnología accesible para círculo relativamente amplio de entusiastas y profesionales que tienen a su disposición aceleradores gráficos modernos. Es importante notar que el sistema aún no soporta modo “text-to-motion”, limitándose a transferir movimientos de video de referencia.

Acceso abierto a código y pesos del modelo abre nuevo capítulo en desarrollo de tecnologías de animación digital, potencialmente democratizando herramientas previamente accesibles solo para grandes estudios y gigantes tecnológicos.

Autor: AIvengo

Latest News

Salario hasta $170k: Lo que SpaceX ofrece a desarrolladores de IA

SpaceX está haciendo un giro inesperado en su estrategia tecnológica. La empresa de Elon Musk abrió vacantes para ingenieros de software en el área de inteligencia artificial. Formando un equipo que se encargará de resolver las tareas más complejas de procesamiento de datos para cohetes portadores y naves espaciales.

Musk con $248 mil millones no compra PCs de trabajo pero espía empleados

¡La empresa xAI comenzó a monitorear a sus empleados directamente en sus computadoras personales! Los empleados que entrenan la inteligencia artificial Grok desde sus dispositivos fueron obligados a instalar programas de seguimiento.

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.

OpenAI prepara primer modelo abierto no más débil que O3 Mini

La empresa OpenAI se prepara para lanzar su primer modelo de lenguaje abierto. Hará honor a su nombre, por así decirlo. Este es un giro serio para la empresa que anteriormente mantenía cerrados sus poderosos desarrollos.

Grok 4 obtuvo 57% en "El Último Examen" versus 22% de Gemini 2.5 Pro

Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil "El Último Examen de la Humanidad". Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.