
El equipo WizardLM dejó Microsoft por Tencent después de escándalo con cierre de modelo
Tencent, conocida por desarrollar el mensajero WeChat y juegos populares, ha invitado al grupo de investigación WizardLM, que anteriormente trabajaba bajo el ala de Microsoft, a unirse a su equipo. Y los primeros resultados de la colaboración ya son visibles. El equipo presentó el modelo Hunyuan-TurboS 0416. Según Qingfeng Sun, quien se llama a sí mismo uno de los fundadores de WizardLM, este desarrollo supera a los modelos abiertos de inteligencia artificial, incluida la serie Gemma 3 de Google.
Y les cuento sobre esta transición porque la historia del grupo de investigación WizardLM es notable por un episodio ambiguo. En abril del año pasado, todavía bajo los auspicios de Microsoft, el equipo lanzó una familia de modelos WizardLM-2, afirmando que no eran inferiores en capacidades a GPT-4 de OpenAI. Sin embargo, apenas un día después, Microsoft eliminó WizardLM-2 del acceso público, explicando esto por la falta de pruebas de toxicidad.
La situación incluso provocó críticas de Clement Delangue, CEO de la plataforma Hugging Face para desarrolladores de inteligencia artificial. Señaló que las acciones de Microsoft dañaron a la comunidad, interrumpiendo el trabajo de muchos proyectos de código abierto. ¿Entienden? Microsoft es el mayor inversor en OpenAI. Y creo que no querían que nadie superara el modelo de OpenAI, en el que se han invertido muchos miles de millones de dólares.
En Tencent, el equipo WizardLM probablemente continuará haciendo lo mismo que antes – desarrollar y lanzar modelos de inteligencia artificial. Recientemente, la compañía china acaba de crear 2 nuevas divisiones y aumentó el gasto en infraestructura de inteligencia artificial a 12 mil millones de dólares.
Y la historia con WizardLM demuestra que los gigantes tecnológicos chinos pueden atraer grupos de investigación ya formados con experiencia trabajando en empresas occidentales. Lo que contribuye a reducir la brecha tecnológica con Estados Unidos.