Kimi-K2 с 1 трлн параметров обогнал GPT-4.1 в программировании
Китайская технологическая компания Moonshot AI представила нового игрока на арене искусственного интеллекта! Знакомьтесь с Kimi-K2. Это большая языковая модель с открытым исходным кодом, готовая бросить вызов признанным лидерам индустрии, таким как Claude Sonnet 4 и GPT-4.1. И такой громкий и мощный старт напоминает появление Deepseek.
Технические характеристики этой модели впечатляют. Kimi-K2 объединяет колоссальный объем знаний и в ней заложен 1 трлн параметров. Важнейшее преимущество – это открытые весовые коэффициенты. Делающие модель доступной для исследований, дополнительной настройки и адаптации под конкретные задачи.
Версия Kimi-K2-Instruct, оптимизированная для реальных условий применения, демонстрирует исключительные результаты в стандартных тестах. На сложнейшем испытании SWE-bench Verified она достигла 65.8% в режиме агента. Этот показатель лишь немного уступает Claude Sonnet 4, но значительно превосходит GPT-4.1.
Особенно впечатляет, что Kimi-K2 лидирует в специализированных тестах программирования. LiveCodeBench с результатом 53.7% и OJBench с 27.1%. Модель генерирует любые игры, приложения и планирует поездки через десятки инструментов в браузере как агент.
Модель также блестяще справляется с задачами по математике и естественным наукам. Превосходя конкурентов в таких сложных тестах как AIME, GPQA-Diamond и MATH-500. И уже сейчас она входит в элитную группу лучших моделей и в многоязычных испытаниях. И похоже это новый король нейронок прямо сейчас.
AIvengo >
Новости ИИ >
Kimi-K2 с 1 трлн параметров обогнал GPT-4.1 в программировании
Почитать из последнего
ChatGPT обогнал Netflix по выручке в Южной Корее
В Южной Корее выбрали, на что тратить деньги. Аналитики из Aicel Technologies подсчитали, что ежемесячный объём платежей за подписки на ИИ достиг $60 миллионов. Для сравнения, средняя месячная выручка Netflix в стране составляет около $50 миллионов. Получается, искусственный интеллект обогнал стриминг. Который казался незыблемым чемпионом по монетизации подписок.
Claude работает по своей конституции
Anthropic выложила новую конституцию Claude. И это реальная инструкция, по которой нейросеть принимает решения в сложных ситуациях. Раньше всё было просто: вот тебе список запретов, не делай это и то, работай по инструкции. Но компания поняла, что такой подход ломается при 1 же нестандартном кейсе, потому что модель не понимает «почему так». Теперь идея радикально другая. Claude должен не следовать правилам слепо, а мыслить через систему ценностей.
Гуманоид вышел на пробежку, но бывший инженер предупреждает об опасности
Компания Figure AI решила показать миру, как её робот-гуманоид бегает наравне с людьми. Руководитель Бретт Эдкок выложил видео, где железный парень уверенно движется рядом с сотрудниками, не отставая ни на шаг. Издание Digital Trends уже фантазирует: представьте, робот как персональный тренер задаёт вам темп для подготовки к 1 марафону! Звучит круто, правда?
Победитель AI Film Award получил миллион долларов
Google вручил 1 кинопремию для фильмов созданных ИИ. Миллион долларов получил Зубейр Эль-Джласси из Туниса за короткометражку Лили. Парень работает графическим дизайнером и режиссёром, использовал генератор Veo для видео и Gemini для подготовки сцен.