Post Thumbnail

DeepSeek empacó motor LLM en 1200 líneas de código Python

El equipo de DeepSeek presentó nano-vLLM. Este es un motor liviano y compacto para ejecutar grandes modelos de lenguaje. Que podría cambiar las percepciones sobre la eficiencia del código. Sorprendentemente, ¡toda la funcionalidad cabió en solo 1200 líneas de código Python! Esto es verdadero minimalismo tecnológico en el mundo de la inteligencia artificial. Los motores tradicionales como este, a pesar de todo su poder, a menudo sufren de una base de código sobrecargada. Lo que hace que su modificación sea una verdadera prueba para los desarrolladores. Nano-vLLM resuelve este problema ofreciendo una herramienta simple pero poderosa sin complejidad innecesaria. El código es abierto.

Al mismo tiempo, la funcionalidad no se sacrifica. El motor soporta caché de prefijos, paralelismo de tensores, compilación con torch compile y trabajo con CUDA. Las pruebas en una tarjeta gráfica de laptop RTX 4070 con 8 GB de memoria mostraron resultados impresionantes. Al ejecutar el modelo Qwen 3.0 con 6 mil millones de parámetros, el motor de DeepSeek procesó 133966 tokens en 93.41 segundos. Lo que es incluso más rápido que el motor vLLM original.

Autor: AIvengo
Latest News
Jefe de Nvidia cree que no hay burbuja de IA

Fundador de Nvidia Jensen Huang disipó preocupaciones sobre burbuja en mercado de IA. Y según él, últimos chips de compañía se espera que traigan 0.5 billones de dólares en ingresos.

Sam Altman está cansado de preguntas sobre dinero

Sam Altman está cansado de preguntas sobre dinero de OpenAI. Y esto se hizo obvio durante entrevista conjunta con Satya Nadella en podcast Bg2.

Número de vacantes de ingenieros de despliegue avanzado creció 800%

Compañías de IA inventaron nueva profesión. Hablamos de ingenieros de despliegue avanzado.

OpenAI promete crear científico de IA completo para 2028

OpenAI prometió crear científico basado en IA completo para 2028. CEO de compañía Sam Altman también declaró que sistemas de aprendizaje profundo podrán realizar funciones de científicos investigadores a nivel de pasante para septiembre de próximo año. Y nivel de investigador de IA autónomo completo podría alcanzarse para 2028.

Empleos para jóvenes especialistas IT en Gran Bretaña colapsaron 46%

¿Saben qué está pasando en mercado laboral para jóvenes especialistas IT en Gran Bretaña? Durante último año, número de empleos para jóvenes especialistas colapsó 46%. Y se pronostica caída adicional de 53%, reporta The Register. Citando estadísticas de Institute of Student Employers.