Post Thumbnail

DeepSeek открывает код супербыстрых GPU-ядер

Китайская компания DeepSeek, совершившая прорыв в сфере искусственного интеллекта, начала беспрецедентную неделю открытого кода, выпустив первый из пяти обещанных инструментов – FlashMLA. Этот проект представляет собой оптимизированные GPU-ядра, которые компания использует в своих производственных системах.

FlashMLA реализует технологию multi latent attention (MLA), революционный метод, позволяющий существенно сократить потребление памяти в трансформерах за счет эффективного сжатия матриц ключей и значений. Хотя сам метод уже доказал свою эффективность в моделях DeepSeek, до сегодняшнего дня оптимизированных реализаций для него практически не существовало.

Ключевые технические характеристики FlashMLA впечатляют:
– Поддержка формата bfloat16, обеспечивающего оптимальный баланс между скоростью и точностью вычислений
– Страничный кэш KV с размером блока 64
– Рекордная производительность: до 3000 ГБ/с при конфигурации с ограничением по памяти
– 580 терафлопс в конфигурации с ограничением по вычислениям на GPU H800 SXM5 при использовании CUDA 12.6

Инструмент полностью совместим со всей линейкой графических процессоров NVIDIA Hopper, включая H100, H800 и другие модели. FlashMLA особенно эффективен при обработке последовательностей переменной длины, что делает его идеальным решением для современных задач обработки естественного языка.

DeepSeek планирует продолжить публикацию своих внутренних разработок: с 24 по 28 февраля компания обещает выложить в открытый доступ еще четыре репозитория из своей внутренней экосистемы. Это решение может существенно повлиять на развитие всей индустрии ИИ, предоставив разработчикам доступ к передовым оптимизациям, ранее доступным только внутри компании.

Код проекта уже доступен на GitHub (github.com/deepseek-ai/FlashMLA), что позволяет разработчикам со всего мира начать интеграцию этих оптимизаций в свои проекты, потенциально значительно улучшив производительность своих ИИ-систем.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Сэм Альтман обещает вернуть человечность в ChatGPT

Глава OpenAI Сэм Альтман сделал заявление после того, как прошли многочисленные оффлайн и онлайн протесты против отключения модели GPT-4о. А потом включение, но с диким маршрутизатором. Я рассказывал про это на прошлой неделе максимально подробно. Прямая цитата главы OpenAI.

ИИ оживает: почему сооснователь Anthropic боится своего творения

Сооснователь Anthropic Джек Кларк опубликовал эссе, от которого становится не по себе. Он написал про природу современного искусственного интеллекта, и его выводы звучат как предупреждение.

Скандал на форуме Cursor: агентный ИИ — это маркетинг, а не магия

На форуме Cursor разгорелся настоящий скандал. Пользователи массово жалуются: весь этот хайп вокруг агентного искусственного интеллекта — чистый маркетинг. А не магия, которую нам обещали.

Google похоронила идею всемогущего ИИ-доктора

Компания Google выпустила отчёт про Health AI Agents на 150 страниц. Это 7 тыс аннотаций, более 1100 часов работы экспертов. Ссылка в описании. Цифры впечатляющие, да. Но суть не в метриках. Суть в том, что они похоронили саму идею всемогущего доктора на искусственном интеллекте. И это, пожалуй, самое честное, что произошло в этой индустрии за последнее время.

Подростки в TikTok пугают родителей фейковыми бродягами из ИИ

Знаете, что сейчас считается весёлым розыгрышем у подростков? Отправить родителям фото бездомного бродяги в их собственной гостиной. Искусственный интеллект нарисует, TikTok одобрит, а родители пусть истерику бьют. Вот такая забава пошла гулять по соцсетям.