Post Thumbnail

DeepSeek открывает код супербыстрых GPU-ядер

Китайская компания DeepSeek, совершившая прорыв в сфере искусственного интеллекта, начала беспрецедентную неделю открытого кода, выпустив первый из пяти обещанных инструментов – FlashMLA. Этот проект представляет собой оптимизированные GPU-ядра, которые компания использует в своих производственных системах.

FlashMLA реализует технологию multi latent attention (MLA), революционный метод, позволяющий существенно сократить потребление памяти в трансформерах за счет эффективного сжатия матриц ключей и значений. Хотя сам метод уже доказал свою эффективность в моделях DeepSeek, до сегодняшнего дня оптимизированных реализаций для него практически не существовало.

Ключевые технические характеристики FlashMLA впечатляют:
— Поддержка формата bfloat16, обеспечивающего оптимальный баланс между скоростью и точностью вычислений
— Страничный кэш KV с размером блока 64
— Рекордная производительность: до 3000 ГБ/с при конфигурации с ограничением по памяти
— 580 терафлопс в конфигурации с ограничением по вычислениям на GPU H800 SXM5 при использовании CUDA 12.6

Инструмент полностью совместим со всей линейкой графических процессоров NVIDIA Hopper, включая H100, H800 и другие модели. FlashMLA особенно эффективен при обработке последовательностей переменной длины, что делает его идеальным решением для современных задач обработки естественного языка.

DeepSeek планирует продолжить публикацию своих внутренних разработок: с 24 по 28 февраля компания обещает выложить в открытый доступ еще четыре репозитория из своей внутренней экосистемы. Это решение может существенно повлиять на развитие всей индустрии ИИ, предоставив разработчикам доступ к передовым оптимизациям, ранее доступным только внутри компании.

Код проекта уже доступен на GitHub (github.com/deepseek-ai/FlashMLA), что позволяет разработчикам со всего мира начать интеграцию этих оптимизаций в свои проекты, потенциально значительно улучшив производительность своих ИИ-систем.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

ИИ в промышленности: умные каски, инспекторы на 4-х ногах, двойники

Аналитический отчет McKinsey Global Institute говорит, что внедрение решений на базе искусственного интеллекта способно увеличить добавленную стоимость в глобальной промышленности на семь триллионов долларов уже к тридцатому году.  

ИИ в криминалистике: предсказания преступлений, роботы-патрульные

Согласно данным Международной ассоциации криминалистов, внедрение технологий искусственного интеллекта повышает эффективность раскрытия сложных преступлений на тридцать-сорок процентов. Давайте разберёмся, как это происходит.

ИИ в медицине: прорывы, о которых молчат врачи

Трансформация медицины с помощью искусственного интеллекта — это не просто технологический скачок. А фундаментальное изменение подхода к лечению и диагностике заболеваний. Исследования показывают, что глобальный рынок искусственного интеллекта в здравоохранении вырастет до ста сорока пяти миллиардов долларов к тридцатому году. Для понимания роста - в двадцать четвертом году этот рынок составлял тридцать миллиардов долларов. То есть это рост почти в пять раз за шесть лет! Давайте разберемся, что стоит за этими цифрами.

YouTube предлагает бесплатную музыку от ИИ

YouTube запускает революционную функцию, позволяющую креаторам создавать уникальную инструментальную музыку с помощью искусственного интеллекта для своих видео. Об этом компания сообщила в обновлении на своем канале Creator Insider.

США готовы оштрафовать TSMC на $1 млрд за сотрудничество с Huawei

Крупнейшему в мире производителю микросхем Taiwan Semiconductor Manufacturing Company (TSMC) грозит штраф в размере $1 млрд или более по итогам расследования о нарушении экспортного контроля США. Причиной стало обнаружение чипов компании в AI-процессорах Huawei, сообщает Reuters.