OpenAI разрабатывает инструмент для генерации музыки

Post Thumbnail

Компания OpenAI разрабатывает инструмент для генерации музыки на основе текстовых и аудио-промптов. Об этом сообщает The Information со ссылкой на источники. Такой инструмент можно было бы использовать для добавления музыки к существующим видео или для добавления гитарного аккомпанемента к вокальной дорожке.

Пока неясно, когда OpenAI планирует запустить продукт и будет ли он доступен как отдельное приложение, или интегрируется с ChatGPT и видеоприложением Sora. 1 из источников рассказал The Information, что OpenAI работает со студентами авторитетной Джульярдской школы, чтобы те аннотировали партитуры. Это способ получить обучающие данные.

Любопытная деталь: OpenAI уже запускала генеративные музыкальные модели в прошлом, но это было до выхода ChatGPT. А в последнее время компания фокусировалась на аудиомоделях для преобразования текста в речь и речи в текст. Теперь возвращается к музыке.

На этом рынке у OpenAI уже есть конкуренты — Google и Suno. Получается, что после текста, изображений, видео и голоса искусственный интеллект осваивает ещё 1 творческую область. И музыка становится очередным полем битвы генеративных моделей.

Остаётся вопрос: если студенты Джульярдской школы аннотируют партитуры для обучения искусственного интеллекта, не готовят ли они себе замену? Это классическая история автоматизации — люди помогают создать технологию, которая потом займёт их место.

Почитать из последнего
100 тыс. диалогов подтвердили экономию 80% времени с помощью ИИ
Anthropic проанализировала 100 тыс. реальных диалогов с Claude. И эти цифры теперь можно использовать в спорах о пользе искусственного интеллекта. Задачи, которые у людей занимают около 90 минут и стоят примерно 55 долларов труда, Claude выполняет на 80% быстрее человека.
Обнаружен способ обхода защиты ИИ в 90% случаев
Стихи ломают защиту больших языковых моделей. И это плохо для индустрии. Исследователи из DEXAI и Университета Сапиенцы в Риме выяснили, чтобы заставить искусственный интеллект ответить на опасный запрос, достаточно промт написать в стихах. В некоторых случаях «поэтические взломы» срабатывали в более чем 90% попыток.
Google опасался ошибок, а OpenAI на этом заработал миллиарды
Стэнфорд выпустил интервью с создателем Google Сергеем Брином, и там прозвучала фраза, которая объясняет всё происходящее в индустрии ИИ. «Главной ошибкой Google было недооценить трансформеры». Не технология подвела - подвела вера в неё.
Крёстный отец ИИ назвал AGI полной чушью
Один из «крестных отцов» искусственного интеллекта Ян Лекун заявил, что понятия general intelligence или AGI вообще не существует. Это не просто провокация - это удар по основам всей дискуссии об ИИ. Потому что если нет понятия, то что мы вообще пытаемся создать?
Новый Gemini 3 Flash быстрее в 3 раза и обходит Pro модель, но стоит копейки
Google выпустили Gemini 3 Flash, и это frontier-модель со скоростью Flash и ценой, которая ломает привычные правила рынка.