Новая модель Alibaba Cloud стала лучшей в мире по техническим задачам

Компания Alibaba Cloud добилась впечатляющего успеха со своей новой языковой моделью Qwen2.5-Max, которая заняла седьмое место в престижном глобальном рейтинге Chatbot Arena. Особенно значимым достижением стало первое место в категориях математики и программирования, а также второе место в решении сложных задач.

Qwen2.5-Max, построенная на архитектуре Mixture of Experts (MoE), прошла обучение на массиве данных объемом более 20 триллионов токенов. Модель была усовершенствована с помощью технологий Supervised Fine-Tuning (SFT) и Reinforcement Learning from Human Feedback (RLHF), что позволило достичь исключительных результатов в областях знаний, программирования и общих возможностей.

Высокие показатели модели подтверждаются лидирующими позициями в ключевых отраслевых бенчмарках, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Это демонстрирует способность Qwen2.5-Max эффективно решать широкий спектр сложных задач на уровне лучших мировых разработок.

Alibaba Cloud обеспечивает глобальный доступ к Qwen2.5-Max через свою платформу разработки генеративного ИИ Model Studio, предлагая оптимальное сочетание высокой производительности и экономической эффективности. Пользователи также могут протестировать возможности модели на платформе Qwen Chat.

За последний год компания значительно расширила семейство моделей Qwen, выпустив серию решений различного масштаба для работы с текстом, аудио и визуальным контентом. Это развитие отражает стремление Alibaba Cloud удовлетворить растущий спрос на ИИ-технологии со стороны разработчиков и клиентов по всему миру.

Успех Qwen2.5-Max укрепляет позиции Китая в глобальной конкуренции в области искусственного интеллекта, демонстрируя способность создавать передовые технологии, способные конкурировать с ведущими мировыми разработками.