Новая модель Alibaba Cloud стала лучшей в мире по техническим задачам

Post Thumbnail

Компания Alibaba Cloud добилась впечатляющего успеха со своей новой языковой моделью Qwen2.5-Max, которая заняла седьмое место в престижном глобальном рейтинге Chatbot Arena. Особенно значимым достижением стало первое место в категориях математики и программирования, а также второе место в решении сложных задач.

Qwen2.5-Max, построенная на архитектуре Mixture of Experts (MoE), прошла обучение на массиве данных объемом более 20 триллионов токенов. Модель была усовершенствована с помощью технологий Supervised Fine-Tuning (SFT) и Reinforcement Learning from Human Feedback (RLHF), что позволило достичь исключительных результатов в областях знаний, программирования и общих возможностей.

Высокие показатели модели подтверждаются лидирующими позициями в ключевых отраслевых бенчмарках, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Это демонстрирует способность Qwen2.5-Max эффективно решать широкий спектр сложных задач на уровне лучших мировых разработок.

Alibaba Cloud обеспечивает глобальный доступ к Qwen2.5-Max через свою платформу разработки генеративного ИИ Model Studio, предлагая оптимальное сочетание высокой производительности и экономической эффективности. Пользователи также могут протестировать возможности модели на платформе Qwen Chat.

За последний год компания значительно расширила семейство моделей Qwen, выпустив серию решений различного масштаба для работы с текстом, аудио и визуальным контентом. Это развитие отражает стремление Alibaba Cloud удовлетворить растущий спрос на ИИ-технологии со стороны разработчиков и клиентов по всему миру.

Успех Qwen2.5-Max укрепляет позиции Китая в глобальной конкуренции в области искусственного интеллекта, демонстрируя способность создавать передовые технологии, способные конкурировать с ведущими мировыми разработками.

Почитать из последнего
Запущена "фабрика по кастомизации роботьих душ"
Знаете, какой минус в современных роботах? Они все одинаковые. 1 и тот же механический голос, 1 и те же заученные фразы, никакой индивидуальности. Компания AgiBot решила, что с этим пора кончать. И запустила платформу LinkSoul, которую сами разработчики называют "фабрикой по кастомизации роботьих душ".
Amazon строит город для ИИ размером с тысячу футбольных полей
Amazon строит настоящий город для ИИ. В Индиане на площади 5000 квадратных километров возводится масштабный комплекс инфраструктуры стоимостью $11 миллиардов. Проект реализуется в интересах стартапа Anthropic, который разрабатывает Claude.
ИИ научился видеть стресс на рентгене
Знаете, что самое паршивое в хроническом стресе? Его не видно. Ты можешь годами жечь себя на работе, улыбаться всем и делать вид, что всё под контролем. А внутри организм тихо разваливается.
Google дал 3 года на появление AGI
Сооснователь и главный AGI-сайентист Google DeepMind Шейн Легг выдал заявление, от которого у многих поплыли глаза. По его оценке, вероятность появления AGI к 28 году составляет 50%. Правда, он сразу оговаривается: речь не о "божественном сверхразуме", а о "минимальном AGI. Агенте, способном выполнять когнитивные задачи, типичные для человека.
Проверили, как нейросети заменяют людей - и результат печальный
Scale AI и Center for AI Safety опубликовали результаты бенчмарка Remote Labor Index, который оценивает способность нейросетей выполнять реальную работу фрилансеров. И знаете что? Даже лучшие модели справились с заданиями на человеческом уровне лишь в 2,5% случаев.