Революция в создании контента: Veo 3 генерирует диалоги и звуковые эффекты

Post Thumbnail

Google представил Veo 3 — новейшую модель генерации видео, которую заслуженно можно назвать настоящим прорывом в этой области. Главная особенность этой технологии — полноценная поддержка звука. Если раньше генеративные видео были преимущественно немыми или требовали отдельной обработки аудио, то теперь система создаёт видео со звуковыми эффектами, фоновыми шумами и даже полноценными диалогами между персонажами.

Пользователи могут давать Veo 3 запрос с описанием персонажей и окружения, а также предлагать диалоги с указанием, как именно они должны звучать. Как отметил во время пресс-брифинга Демис Хассабис, генеральный директор Google DeepMind, цитирую — «Впервые мы выходим из немой эры видеогенерации».

Я в приятном шоке! Уникальность Veo 3 заключается в его способности понимать исходные пиксели из сгенерированных видео и автоматически синхронизировать с ними созданные звуки. Хотя инструменты для генерации звука на основе искусственного интеллекта не новы, именно такая интеграция видео и аудио выделяет разработку Google среди конкурентов.

На рынке уже существует множество инструментов для генерации видео от таких компаний как Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma, а также OpenAI и Alibaba. Однако возможность автоматической генерации синхронизированного звука даёт Veo 3 серьёзное конкурентное преимущество.

Новая технология будет доступна пользователям через приложение Gemini, предположительно по подписке.

Кажется, что Veo 3 — это полноценный переход от разрозненного подхода к генерации медиаконтента, где видео и аудио создавались отдельно, к интегрированной модели создания полноценного аудиовизуального контента с синхронизированными звуками, диалогами и изображением. Что радикально упрощает рабочий процесс создания видео. Браво.

Почитать из последнего
Более 30 000 врачей и юристов обучают нейросети делать их работу
Представьте картину: журналист с 20-летним стажем, которого выкинули в прошлом году, сидит и правит статьи, которые создал ИИ. 20-30 часов в неделю. За деньги. Чтобы машина научилась писать ещё лучше. Абсурд? Добро пожаловать в новую реальность белых воротничков.
Из-за ИИ теоретическая физика исчезнет через 10 лет
Физик-теоретик и популяризатор науки Сабина Хоссенфельдер, выдала интересный прогноз. Она считает, что через 3 года научные исследования в привычном виде перестанут существовать. А через 10 лет теоретическая физика как область человеческой деятельности может практически закончиться. Для решения задач будет достаточно просто купить вычислительное время нейросети. Звучит как антиутопия? Только вот процесс уже пошёл.
Nvidia и Siemens превратят завод в гигантского робота с ИИ
Глава Nvidia Дженсен Хуанг на выставке CES выдал очень интересную фразу, цитирую: "Эти производственные предприятия, по сути, станут гигантскими роботами". Так Nvidia и Siemens анонсировали создание Industrial AI Operating System. Платформы, которая внедрит ИИ во всю цепочку промышленного производства. От проектирования до логистики. Завод будущего не просто автоматизирован — он думает сам.
Крёстный отец SaaS уволил продажников и заменил их ИИ за полгода
Джейсон Лемкин, которого называют крёстным отцом SaaS и основателем сообщества SaaStr, публично заявил что больше не будет нанимать людей в отдел продаж своей компании. Вместо живых менеджеров теперь работают агенты на основе ИИ. По его словам, переход занял меньше года.
Создатель Signal запустил ИИ-ассистента с полной анонимностью
Создатель мессенджера Signal Мокси Марлинспайк, решил сделать с чат-ботами то же что сделал с мессенджерами. Добавить слой анонимности который не пробьёшь. Его новый проект Confer с открытым исходным кодом гарантирует что данные пользователей будут недоступны вообще никому. Ни оператору платформы, ни хакерам, ни правоохранителям, ни любой другой стороне кроме самих владельцев.