Post Thumbnail

Modelo chino varias veces más barato que análogos occidentales

Modelo chino Kimi K2-Thinking con billón de parámetros costó 4.5 millones de dólares en etapa final de entrenamiento. Según CNBC, esto es varias veces más barato que análogos occidentales. Publicación cita fuente anónima. Y reconoce que cifra no pudo ser confirmada independientemente. Y compañía Moonshot AI misma no ha revelado oficialmente costo.

Modelo está construido sobre arquitectura Mixture of Experts – billón de parámetros en volumen total, pero solo pequeña parte está activa durante operación. Creado para tareas complejas de razonamiento e interacción con herramientas. Para tales sistemas normalmente se requieren costos computacionales astronómicos, por lo que varios millones parecen casi ridículos.

Historia se repite. A finales de 2024, chino DeepSeek entrenó modelo base V3 por 5.5 millones de dólares. Y superposición de razonamiento R1 – por 294 mil. Kimi K2-Thinking también está construido sobre base K2, así que proporción es similar. Sin embargo, estas estimaciones no incluyen experimentos, pruebas, alquiler de oficinas y salarios.

En mayoría de benchmarks K2-Thinking se mantiene a nivel de modelos occidentales líderes como GPT-5 Pro y Grok 4. Y ahora sobre precios de competidores. Etapa final de entrenamiento de GPT-4, según estimación de SemiAnalysis, costó 63 millones de dólares. En informe AI Index aparece suma aún mayor de 78 millones. Y entrenamiento completo de Grok 4 fue estimado por analistas de Epoch AI en astronómicos 490 millones de dólares.

O esto es alguna magia de optimización, o alguien está ocultando algo. O alguien está pagando enormemente de más por cálculos.

Autor: AIvengo
Latest News
ByteDance lanzó Doubao-Seed-Code por 1.30 dólares al mes

ByteDance lanzó asistente de programación basado en IA más barato. Doubao-Seed-Code cuesta 1 dólar 30 centavos por mes. Compañía china que creó TikTok lo hizo más accesible en mercado local.

OpenAI capituló ante sentimientos y devolvió calidez a ChatGPT

OpenAI lanzó GPT-5.1, y esto no es solo actualización. Esta es capitulación ante sentimientos humanos. Línea actualizada incluye 2 modelos: GPT-5.1 Instant y GPT-5.1 Thinking.

Misma IA se comporta diferente según interfaz

Universidad de Hamburgo realizó estudio que muestra patrón extraño. Resulta que recomendaciones de noticias de ChatGPT difieren mucho dependiendo de si se usa interfaz web o API. Análisis de más de 24 mil respuestas en alemán reveló imagen clara.

Nvidia está construyendo monopolio a través de inversiones en startups en sus chips

Nvidia se ha convertido en máquina de capital de riesgo que funciona más rápido que fondos clásicos. Bloomberg reporta que en 2025 compañía apoyó 59 startups de esfera de IA. Y estas no son solo inversiones - esta es estrategia para controlar todo ecosistema.

Elon Musk advirtió que OpenAI se comerá a Microsoft vivo

Conté ayer que entusiastas desenterraron rastros de nueva función llamada "Group chats" en versión web de ChatGPT. Y luego vi entrevista con Sam Altman. Y ahí Altman declaró en entrevista, cita: "Creo que todas aplicaciones corporativas pueden ser reemplazadas por plataforma común basada en IA. Hay mucho bueno en Slack, pero a veces crea montón de trabajo falso. Creo que se puede crear algo nuevo en su lugar. Algo como suite de oficina basada en IA que reemplazará docs, slides, email, Slack y así sucesivamente".