MIT создает прорывную систему оптимизации ИИ-моделей

Post Thumbnail

Исследователи Массачусетского технологического института (MIT) представили инновационную автоматизированную систему, позволяющую радикально повысить эффективность моделей искусственного интеллекта за счет одновременного использования двух типов избыточности данных.

Новая разработка направлена на решение одной из ключевых проблем современного глубокого обучения – высокого энергопотребления AI-моделей при обработке сложных структур данных в таких приложениях, как анализ медицинских изображений и распознавание речи.

Существующие методы оптимизации алгоритмов, как правило, позволяют разработчикам использовать либо разреженность (sparsity), либо симметрию данных – два различных типа избыточности, присутствующих в структурах глубокого обучения. Инновационный подход MIT позволяет задействовать оба типа одновременно, что в экспериментах привело к увеличению скорости вычислений почти в 30 раз.

«Долгое время учет этих избыточностей данных требовал значительных усилий при реализации. Теперь ученый может описать нашей системе желаемый результат вычислений более абстрактным способом, не указывая точный алгоритм», – поясняет Уиллоу Аренс, постдок MIT и соавтор исследования, которое будет представлено на Международном симпозиуме по генерации и оптимизации кода.

Ключевым преимуществом системы является использование удобного языка программирования, что делает её доступной для широкого круга приложений. Это особенно важно для ученых, не являющихся экспертами в глубоком обучении, но стремящихся повысить эффективность AI-алгоритмов в обработке данных.

Разработка MIT открывает новые перспективы в оптимизации вычислительных ресурсов для машинного обучения, предлагая:
— Автоматическую оптимизацию алгоритмов с учетом множественных типов избыточности
— Значительное сокращение требований к вычислительной мощности
— Снижение затрат на пропускную способность и хранение данных
— Упрощенный интерфейс для разработчиков AI-систем

Система также имеет потенциал применения в научных вычислениях, что может способствовать ускорению исследований в различных областях науки, где используются сложные вычислительные модели.

Почитать из последнего
100 тыс. диалогов подтвердили экономию 80% времени с помощью ИИ
Anthropic проанализировала 100 тыс. реальных диалогов с Claude. И эти цифры теперь можно использовать в спорах о пользе искусственного интеллекта. Задачи, которые у людей занимают около 90 минут и стоят примерно 55 долларов труда, Claude выполняет на 80% быстрее человека.
Обнаружен способ обхода защиты ИИ в 90% случаев
Стихи ломают защиту больших языковых моделей. И это плохо для индустрии. Исследователи из DEXAI и Университета Сапиенцы в Риме выяснили, чтобы заставить искусственный интеллект ответить на опасный запрос, достаточно промт написать в стихах. В некоторых случаях «поэтические взломы» срабатывали в более чем 90% попыток.
Google опасался ошибок, а OpenAI на этом заработал миллиарды
Стэнфорд выпустил интервью с создателем Google Сергеем Брином, и там прозвучала фраза, которая объясняет всё происходящее в индустрии ИИ. «Главной ошибкой Google было недооценить трансформеры». Не технология подвела - подвела вера в неё.
Крёстный отец ИИ назвал AGI полной чушью
Один из «крестных отцов» искусственного интеллекта Ян Лекун заявил, что понятия general intelligence или AGI вообще не существует. Это не просто провокация - это удар по основам всей дискуссии об ИИ. Потому что если нет понятия, то что мы вообще пытаемся создать?
Новый Gemini 3 Flash быстрее в 3 раза и обходит Pro модель, но стоит копейки
Google выпустили Gemini 3 Flash, и это frontier-модель со скоростью Flash и ценой, которая ломает привычные правила рынка.