Post Thumbnail

Революция в создании контента: Veo 3 генерирует диалоги и звуковые эффекты

Google представил Veo 3 — новейшую модель генерации видео, которую заслуженно можно назвать настоящим прорывом в этой области. Главная особенность этой технологии — полноценная поддержка звука. Если раньше генеративные видео были преимущественно немыми или требовали отдельной обработки аудио, то теперь система создаёт видео со звуковыми эффектами, фоновыми шумами и даже полноценными диалогами между персонажами.

Пользователи могут давать Veo 3 запрос с описанием персонажей и окружения, а также предлагать диалоги с указанием, как именно они должны звучать. Как отметил во время пресс-брифинга Демис Хассабис, генеральный директор Google DeepMind, цитирую – “Впервые мы выходим из немой эры видеогенерации”.

Я в приятном шоке! Уникальность Veo 3 заключается в его способности понимать исходные пиксели из сгенерированных видео и автоматически синхронизировать с ними созданные звуки. Хотя инструменты для генерации звука на основе искусственного интеллекта не новы, именно такая интеграция видео и аудио выделяет разработку Google среди конкурентов.

На рынке уже существует множество инструментов для генерации видео от таких компаний как Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, а также OpenAI и Alibaba. Однако возможность автоматической генерации синхронизированного звука даёт Veo 3 серьёзное конкурентное преимущество.

Новая технология будет доступна пользователям через приложение Gemini, предположительно по подписке.

Кажется, что Veo 3 – это полноценный переход от разрозненного подхода к генерации медиаконтента, где видео и аудио создавались отдельно, к интегрированной модели создания полноценного аудиовизуального контента с синхронизированными звуками, диалогами и изображением. Что радикально упрощает рабочий процесс создания видео. Браво.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Глава Nvidia считает, что ИИ-пузыря - нет

Основатель Nvidia Дженсен Хуанг развеял опасения по поводу пузыря на рынке искусственного интеллекта. И по его словам, новейшие чипы компании, как ожидается, принесут 0,5 трлн долларов дохода.

Сэм Альтман устал от вопросов о деньгах

Сэм Альтман устал от вопросов о деньгах OpenAI. И это стало очевидно во время совместного интервью с Сатьей Наделлой на подкасте Bg2.

Число вакансий инженеров передового развёртывания выросло на 800%

Компании искусственного интеллекта придумали новую профессию. Речь об инженерах передового развёртывания.

OpenAI обещает создать полноценного учёного на ИИ к 2028 году

OpenAI пообещала создать полноценного учёного на основе искусственного интеллекта к 2028 году. Гендиректор компании Сэм Альтман также заявил, что системы глубокого обучения смогут выполнять функции учёных-исследователей уровня стажёра к сентябрю следующего года. А уровень автономного полноценного исследователя на искусственном интеллекте может быть достигнут уже к 2028 году.

Рабочие места для молодых айтишников в Британии рухнули на 46%

Знаете, что происходит на рынке труда для молодых айтишников в Великобритании? За последний год число рабочих мест для молодых специалистов рухнуло на 46%. И прогнозируется падение ещё на 53%, сообщает The Register. Со ссылкой на статистику Института студенческого трудоустройства.