Firefly научился чувствовать голос и делать видео

Post Thumbnail

Adobe выпустила серьёзное обновление для своей платформы Firefly. И это единственное решение, способное по-настоящему конкурировать с Google Veo 3. В то время как другие разработчики пытаются догнать лидеров, Adobe предлагает уникальные инструменты.

Главная новинка — функция Generate Sound Effects. Теперь вы можете создавать звуковые эффекты, просто описав их текстом или даже собственным голосом. Нужен звук грозы или шелест листьев? Достаточно сказать системе, что именно требуется.

Ключевое преимущество перед Google — звуковая дорожка создаётся как отдельный файл. В Veo 3 звук неразрывно связан с видео, и при необходимости изменений приходится начинать с нуля. Adobe позволяет детально настраивать, редактировать и синхронизировать звук с происходящим на экране.

Особенно интересная возможность — это управление звуком с помощью голоса. Firefly анализирует энергию и ритм вашей речи для точного размещения эффектов в нужных местах видеоролика.

Техническая часть тоже получила улучшения. Обновлённая модель Firefly Video теперь создаёт более естественные движения с плавными переходами, особенно хорошо справляясь с динамическими пейзажами и анимацией.

Ещё важная функция — Text to Avatar. Загрузите текст, выберите виртуального персонажа, настройте фон и акцент — система автоматически создаст видео. Это отличное решение для обучающих материалов и презентаций.

Почитать из последнего
Учёные сравнили 9000 человек с ИИ и выяснили, что люди креативнее
В журнале Nature Human Behaviour опубликовали масштабное исследование креативности людей и больших языковых моделей. Учёные из Гонконгского университета и Северо-Западного университета сравнили 9198 человек с восемью LLM на тесте дивергентного мышления. В общей сложности 215 542 прогона моделей.
OpenAI готовит армию говорящих устройств и новую голосовую модель
Издание The Information выяснило забавную вещь про OpenAI. Оказывается, когда вы общаетесь с ChatGPT голосом, вы разговариваете совсем не с той моделью, которая отвечает текстом. Голосовая версия 4o не получила ни одного обновления после выхода GPT-5. Она не умеет думать, не знает про цепочки рассуждений. Ничего из того, чем хвастались в последних релизах. Просто старая добрая болтушка, застывшая в прошлом году.
Samsung хотят обойти Apple по ИИ-функциям и вернуть лидерство
В прошлом году Samsung поставила на рынок 400 миллионов мобильных устройств с ассистентом Google Gemini. Этого, видимо, показалось мало. В этом году южнокорейский гигант намерен удвоить количество до 800 миллионов штук. Тэ Мун Ро, один из двух гендиректоров Samsung Electronics, объяснил агентству Reuters это просто. Компания стремится распространить функции ИИ на все устройства и все услуги как можно скорее.
Alibaba научила алгоритм видеть рак там, где врачи пропускают
Каменщик 57 лет в Китае пришёл в больницу проверить диабет. Обычный осмотр, ничего особенного. Через 3 дня ему звонит заведующий отделением поджелудочной железы, мол приезжайте срочно. ИИ, который прогнал его КТ-снимок, нашёл опухоль. Оказалось – рак, но на ранней стадии. Вырезали и мужчина выжил. Без этой технологии его бы нашли слишком поздно, когда 5-летняя выживаемость около 10%.
OpenAI к 2028 году увеличит мощности дата-центров в 90 раз
Epoch AI сделал публично доступным трекер крупнейших дата-центров. А человек из твиттера с ником Peter Gostev визуализировал суммарные мощности по месяцам в разрезе компаний, и цифры просто убийственные.