Post Thumbnail

ByteDance lanzó modelo con contexto de 512K tokens

La empresa ByteDance lanzó un modelo de IA abierto con contexto increíble de 512,000 tokens. El nombre del modelo es Seed-OSS-36B. Enlace en la descripción.

Mientras el mundo discute TikTok y la Casa Blanca, ByteDance silenciosamente despliega tecnología que procesa volumen de información equivalente a una biblioteca entera en una sesión! 3 versiones del modelo — con datos sintéticos, sin ellos, y versión instructiva — cada una adaptada para sus tareas.

La arquitectura impresiona con su elegancia. 36 mil millones de parámetros distribuidos en 64 capas. Vocabulario de 155,000 tokens. Pero la magia principal — ¡el mecanismo thinking budget, presupuesto para pensar! Literalmente establecen cuánto tiempo debe pensar el modelo antes de responder. ¿Quieren respuesta instantánea? — pongan 0. ¿Necesitan análisis profundo? — aumenten el presupuesto.

¡Los resultados de pruebas son geniales! Matemáticas — 91.7% en AIME. Programación — 67.4% en LiveCodeBench. Trabajo con contexto largo — 94.6% en RULER. Todos los indicadores — récords absolutos entre modelos abiertos!

La pregunta clave aquí es cuál es el rendimiento en tareas reales, no en benchmarks. Pero hasta ahora, ByteDance inesperadamente demuestra competencias de nivel mundial en LLM. Esto es interesante.

Autor: AIvengo
Latest News
Jefe de Nvidia cree que no hay burbuja de IA

Fundador de Nvidia Jensen Huang disipó preocupaciones sobre burbuja en mercado de IA. Y según él, últimos chips de compañía se espera que traigan 0.5 billones de dólares en ingresos.

Sam Altman está cansado de preguntas sobre dinero

Sam Altman está cansado de preguntas sobre dinero de OpenAI. Y esto se hizo obvio durante entrevista conjunta con Satya Nadella en podcast Bg2.

Número de vacantes de ingenieros de despliegue avanzado creció 800%

Compañías de IA inventaron nueva profesión. Hablamos de ingenieros de despliegue avanzado.

OpenAI promete crear científico de IA completo para 2028

OpenAI prometió crear científico basado en IA completo para 2028. CEO de compañía Sam Altman también declaró que sistemas de aprendizaje profundo podrán realizar funciones de científicos investigadores a nivel de pasante para septiembre de próximo año. Y nivel de investigador de IA autónomo completo podría alcanzarse para 2028.

Empleos para jóvenes especialistas IT en Gran Bretaña colapsaron 46%

¿Saben qué está pasando en mercado laboral para jóvenes especialistas IT en Gran Bretaña? Durante último año, número de empleos para jóvenes especialistas colapsó 46%. Y se pronostica caída adicional de 53%, reporta The Register. Citando estadísticas de Institute of Student Employers.