MIT создает прорывную систему оптимизации ИИ-моделей

Исследователи Массачусетского технологического института (MIT) представили инновационную автоматизированную систему, позволяющую радикально повысить эффективность моделей искусственного интеллекта за счет одновременного использования двух типов избыточности данных.

Новая разработка направлена на решение одной из ключевых проблем современного глубокого обучения – высокого энергопотребления AI-моделей при обработке сложных структур данных в таких приложениях, как анализ медицинских изображений и распознавание речи.

Существующие методы оптимизации алгоритмов, как правило, позволяют разработчикам использовать либо разреженность (sparsity), либо симметрию данных – два различных типа избыточности, присутствующих в структурах глубокого обучения. Инновационный подход MIT позволяет задействовать оба типа одновременно, что в экспериментах привело к увеличению скорости вычислений почти в 30 раз.

«Долгое время учет этих избыточностей данных требовал значительных усилий при реализации. Теперь ученый может описать нашей системе желаемый результат вычислений более абстрактным способом, не указывая точный алгоритм», – поясняет Уиллоу Аренс, постдок MIT и соавтор исследования, которое будет представлено на Международном симпозиуме по генерации и оптимизации кода.

Ключевым преимуществом системы является использование удобного языка программирования, что делает её доступной для широкого круга приложений. Это особенно важно для ученых, не являющихся экспертами в глубоком обучении, но стремящихся повысить эффективность AI-алгоритмов в обработке данных.

Разработка MIT открывает новые перспективы в оптимизации вычислительных ресурсов для машинного обучения, предлагая:
— Автоматическую оптимизацию алгоритмов с учетом множественных типов избыточности
— Значительное сокращение требований к вычислительной мощности
— Снижение затрат на пропускную способность и хранение данных
— Упрощенный интерфейс для разработчиков AI-систем

Система также имеет потенциал применения в научных вычислениях, что может способствовать ускорению исследований в различных областях науки, где используются сложные вычислительные модели.