Post Thumbnail

Nuevo modelo Seed-Coder-8B de ByteDance supera a competidores más grandes

ByteDance, conocida como la creadora de TikTok, ha lanzado un nuevo modelo de lenguaje para programación llamado Seed-Coder-8B. Es un modelo pequeño que muestra resultados sorprendentes en tareas relacionadas con el código. Supera incluso a algunas soluciones mucho más grandes, incluidas Claude Sonnet 3.7 y o1-mini.

El modelo se lanzó en 3 versiones: básica, instructiva y un modelo con razonamiento. Tiene una ventana de contexto de 32.000 tokens.

Lo que hace especial a este modelo es, ante todo, el enfoque de recopilación y procesamiento de datos. ByteDance utilizó una técnica similar al enfoque de la empresa DeepSeek, pero significativamente mejorada. En lugar de múltiples filtros manuales para limpiar los datos de origen, crearon un único filtro basado en inteligencia artificial.

Para esto, los desarrolladores chinos entrenaron específicamente un modelo pequeño para evaluar la calidad del código según parámetros como legibilidad, modularidad, claridad y posibilidad de reutilización. Luego, este modelo se aplicó a todo el conjunto de datos, descartando los archivos más problemáticos. Esto permitió deshacerse de aproximadamente el 10% del conjunto de datos original, que era esencialmente basura.

Filtros especiales basados en inteligencia artificial evaluaron código de GitHub y otras fuentes web, filtrando ejemplos de baja calidad. De esta manera, los desarrolladores filtraron datos con un volumen de aproximadamente 2,3 billones de tokens.

¡El resultado es impresionante! Seed-Coder supera a los análogos de código abierto de su tamaño en todas las pruebas, incluidas generación, autocompletado y razonamiento. Y en algunos casos, incluso a modelos más grandes. Al mismo tiempo, los modelos están completamente abiertos para uso e investigación.

Creo que es precisamente la alta especialización lo que permite lograr resultados superiores en un área específica mientras se mantiene un tamaño compacto. Esto abre el camino a una multitud de modelos altamente especializados en lugar de uno solo universal. El informe técnico, el repositorio y los pesos del modelo Seed-Coder-8B están en la descripción.

Autor: AIvengo
Latest News
Google enterró idea de médico de IA omnipotente

Compañía Google publicó informe sobre Health AI Agents de 150 páginas. Eso es 7,000 anotaciones, más de 1,100 horas de trabajo experto. Enlace en descripción. Números impresionantes, sí. Pero punto no está en métricas. Punto es que enterraron idea misma de médico omnipotente de IA. Y esto es quizás cosa más honesta que pasó en esta industria recientemente.

Adolescentes en TikTok asustan a padres con vagabundos falsos de IA

¿Saben qué se considera broma divertida entre adolescentes ahora? Enviar a padres foto de vagabundo sin hogar en su propia sala. IA dibuja, TikTok aprueba, y que padres tengan histeria. Ese es tipo de diversión circulando por redes sociales.

California calló a compañeros de IA: Nueva ley de seguridad

California se convirtió en primer estado en oficialmente callar chatbots compañeros de IA. Gobernador Gavin Newsom firmó ley histórica que obliga a operadores de tales bots a implementar protocolos de seguridad.

Musk crea mundos virtuales con IA para entrenar robots

Elon Musk decidió que su inteligencia artificial se aburrió sin trabajo. Y ahora compañía xAI se dedicará a crear mundos virtuales. Además, no solo imágenes hermosas, sino simulaciones reales. Donde objetos interactúan entre sí según leyes físicas. Comenzarán, por supuesto, con juegos - dónde estaríamos sin ellos en 2025.

Project REBIRTH: IA envolverá avión en caída en capullo protector

Imaginen. Avión se estrelló, todos murieron excepto una persona. Peor desastre de aviación en 10 años. Y aquí 2 ingenieros de India dicen que descubrieron cómo prevenir esto. Airbags gigantes controlados por inteligencia artificial que envolverán avión en caída en capullo protector. ¿Suena como ciencia ficción? Y ya están nominados para James Dyson Award.