Post Thumbnail

DeepSeek empacó motor LLM en 1200 líneas de código Python

El equipo de DeepSeek presentó nano-vLLM. Este es un motor liviano y compacto para ejecutar grandes modelos de lenguaje. Que podría cambiar las percepciones sobre la eficiencia del código. Sorprendentemente, ¡toda la funcionalidad cabió en solo 1200 líneas de código Python! Esto es verdadero minimalismo tecnológico en el mundo de la inteligencia artificial. Los motores tradicionales como este, a pesar de todo su poder, a menudo sufren de una base de código sobrecargada. Lo que hace que su modificación sea una verdadera prueba para los desarrolladores. Nano-vLLM resuelve este problema ofreciendo una herramienta simple pero poderosa sin complejidad innecesaria. El código es abierto.

Al mismo tiempo, la funcionalidad no se sacrifica. El motor soporta caché de prefijos, paralelismo de tensores, compilación con torch compile y trabajo con CUDA. Las pruebas en una tarjeta gráfica de laptop RTX 4070 con 8 GB de memoria mostraron resultados impresionantes. Al ejecutar el modelo Qwen 3.0 con 6 mil millones de parámetros, el motor de DeepSeek procesó 133966 tokens en 93.41 segundos. Lo que es incluso más rápido que el motor vLLM original.

Autor: AIvengo

Latest News

Solo 1 programador en el mundo pudo vencer a la IA de OpenAI

Imaginen un mundo donde la inteligencia artificial compite con los mejores programadores del planeta. Tal confrontación tuvo lugar en el prestigioso torneo AtCoder World Tour Finals. Esta es una de las competencias de programación más elitistas del mundo, donde es extremadamente difícil entrar.

Ex ingeniero de OpenAI contó sobre el caos dentro de la empresa

¿Quieren saber qué está pasando realmente dentro de OpenAI? El ex ingeniero Calvin French-Owen reveló todos los detalles después de que se fue de ahí hace 3 semanas.

Salario hasta $170k: Lo que SpaceX ofrece a desarrolladores de IA

SpaceX está haciendo un giro inesperado en su estrategia tecnológica. La empresa de Elon Musk abrió vacantes para ingenieros de software en el área de inteligencia artificial. Formando un equipo que se encargará de resolver las tareas más complejas de procesamiento de datos para cohetes portadores y naves espaciales.

Musk con $248 mil millones no compra PCs de trabajo pero espía empleados

¡La empresa xAI comenzó a monitorear a sus empleados directamente en sus computadoras personales! Los empleados que entrenan la inteligencia artificial Grok desde sus dispositivos fueron obligados a instalar programas de seguimiento.

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.