Post Thumbnail

ByteDance lanzó modelo con contexto de 512K tokens

La empresa ByteDance lanzó un modelo de IA abierto con contexto increíble de 512,000 tokens. El nombre del modelo es Seed-OSS-36B. Enlace en la descripción.

Mientras el mundo discute TikTok y la Casa Blanca, ByteDance silenciosamente despliega tecnología que procesa volumen de información equivalente a una biblioteca entera en una sesión! 3 versiones del modelo — con datos sintéticos, sin ellos, y versión instructiva — cada una adaptada para sus tareas.

La arquitectura impresiona con su elegancia. 36 mil millones de parámetros distribuidos en 64 capas. Vocabulario de 155,000 tokens. Pero la magia principal — ¡el mecanismo thinking budget, presupuesto para pensar! Literalmente establecen cuánto tiempo debe pensar el modelo antes de responder. ¿Quieren respuesta instantánea? — pongan 0. ¿Necesitan análisis profundo? — aumenten el presupuesto.

¡Los resultados de pruebas son geniales! Matemáticas — 91.7% en AIME. Programación — 67.4% en LiveCodeBench. Trabajo con contexto largo — 94.6% en RULER. Todos los indicadores — récords absolutos entre modelos abiertos!

La pregunta clave aquí es cuál es el rendimiento en tareas reales, no en benchmarks. Pero hasta ahora, ByteDance inesperadamente demuestra competencias de nivel mundial en LLM. Esto es interesante.

Autor: AIvengo

Latest News

Cómo xAI compite con OpenAI en herramientas para desarrolladores

xAI lanza Grok Code Fast 1. Este es un modelo agéntico compacto para programación. $0.20 por 1 millón de tokens de entrada, $1.50 por salida — ¡y solo $0.02 usando caché!

Batalla por navegadores: Anthropic contra Perplexity y OpenAI

Parece que Anthropic quiere transformar el concepto de tecnologías de navegador. Claude para Chrome entra en pruebas cerradas para 1,000 suscriptores del plan Max.

Tractor autónomo chino sin volante ni cabina trabaja en campos

La empresa china Shiyan Guoke Honghu Technology presentó el tractor completamente autónomo Honghu T70. Que se mueve independientemente por los campos y ejecuta todo el espectro de tareas agrícolas sin ninguna participación humana.

Nvidia presentó Jetson AGX Thor: 2560 núcleos para robots

La empresa Nvidia presentó un desarrollo para IA física - Jetson AGX Thor. Esto no es solo un chip, esto es literalmente un cerebro para robots del futuro. ¡Imaginen — 2560 núcleos Blackwell y 128 GB de RAM en un dispositivo compacto!

GPT-5 optimiza costos

The Register revela la estrategia de OpenAI y según ellos, GPT-5 resultó ser no una revolución de capacidades, sino optimización genial de costos.