Post Thumbnail

Tencent abrió código fuente de HunyuanPortrait para animación de fotos

La compañía Tencent publicó código fuente y coeficientes de peso de su proyecto HunyuanPortrait – un sistema para crear retratos animados realistas. Esta solución, basada en modelos de difusión, permite transferir movimientos de video fuente a imagen estática, esencialmente “dando vida” a fotografías con grado impresionante de realismo.

La arquitectura técnica de HunyuanPortrait representa un conjunto integral de modelos especializados. SVD para generar secuencias de video. DiNOv2 para extraer características visuales. Arc2Face para trabajar con expresiones faciales. Y YoloFace para detección confiable de rostros. Tal estructura multicomponente proporciona control más preciso sobre animación y suavidad de transiciones entre cuadros comparado con análogos existentes.

La implementación actual requiere 24 gigabytes de memoria de video para ejecutar proceso de inferencia, lo que hace la tecnología accesible para círculo relativamente amplio de entusiastas y profesionales que tienen a su disposición aceleradores gráficos modernos. Es importante notar que el sistema aún no soporta modo “text-to-motion”, limitándose a transferir movimientos de video de referencia.

Acceso abierto a código y pesos del modelo abre nuevo capítulo en desarrollo de tecnologías de animación digital, potencialmente democratizando herramientas previamente accesibles solo para grandes estudios y gigantes tecnológicos.

Autor: AIvengo

Latest News

Nvidia presentó la familia de modelos Cosmos para robótica

La empresa Nvidia presentó la familia Cosmos de modelos de IA. Que pueden cambiar fundamentalmente el enfoque para crear robots y agentes de IA físicos.

ChatGPT llama a los usuarios "semillas estelares" del planeta Lyra

Resulta que ChatGPT puede atraer a los usuarios al mundo de teorías científicamente infundadas y místicas.

La música IA desencadena emociones más fuertes que la música humana

¿Alguna vez se han preguntado por qué una melodía les da escalofríos mientras otra los deja indiferentes? Los científicos descubrieron algo interesante. La música creada por inteligencia artificial desencadena en las personas reacciones emocionales más intensas que las composiciones escritas por humanos.

GPT-5 fue hackeado en 24 horas

2 empresas de investigación independientes NeuralTrust y SPLX descubrieron vulnerabilidades críticas en el sistema de seguridad del nuevo modelo solo 24 horas después del lanzamiento de GPT-5. Para comparación, Grok-4 fue hackeado en 2 días, haciendo el caso de GPT-5 aún más alarmante.

Cloudflare bloqueó a Perplexity por 6 millones de solicitudes ocultas al día

Cloudflare asestó un golpe aplastante a Perplexity AI, bloqueando el acceso de la startup de búsqueda a miles de sitios. ¿La razón? ¡Escaneo oculto de recursos web de escala sin precedentes a pesar de prohibiciones explícitas de los propietarios!