Stability AI представляет трансформацию 2D-фото в 3D-сцены

Post Thumbnail

Компания Stability AI объявила о выпуске инновационной AI-модели Stable Virtual Camera, способной преобразовывать двумерные изображения в иммерсивные видеоматериалы с реалистичной глубиной и перспективой. Это технологическое достижение знаменует значительный прогресс в области генеративного искусственного интеллекта и виртуальной кинематографии.

Stable Virtual Camera представляет собой существенное развитие концепции виртуальных камер, традиционно используемых в цифровом кинопроизводстве и 3D-анимации. Интеграция генеративного AI в этот инструментарий открывает беспрецедентные возможности для контроля и кастомизации создаваемого контента.

Технические возможности новой модели впечатляют:

  • Генерация «новых ракурсов» сцены на основе от одного до 32 исходных изображений.
  • Создание видео с динамическими траекториями движения камеры.
  • Поддержка предустановленных режимов съемки: «Spiral», «Dolly Zoom», «Move» и «Pan».
  • Возможность работы с различными форматами: квадратным (1:1), портретным (9:16) и ландшафтным (16:9).
  • Способность генерировать видеопоследовательности длиной до 1000 кадров.

Несмотря на впечатляющие возможности, Stability предупреждает о потенциальных ограничениях текущей исследовательской версии. Модель может демонстрировать снижение качества при работе с изображениями, содержащими людей, животных или «динамические текстуры» вроде воды. «Высокоамбициозные сцены, сложные траектории камеры, пересекающие объекты или поверхности, и объекты неправильной формы могут вызывать эффект мерцания, особенно когда целевые ракурсы значительно отличаются от исходных изображений», — отмечается в блоге компании.

Этот технологический прорыв происходит на фоне сложного периода для Stability AI. Компания, известная своей популярной моделью генерации изображений Stable Diffusion, в прошлом году привлекла новые инвестиции от таких значимых фигур, как Эрик Шмидт и основатель Napster Шон Паркер, стремящихся восстановить бизнес. Ранее сообщалось, что соучредитель и бывший CEO Stability Эмад Мостак привел компанию к финансовым проблемам, что повлекло за собой увольнение сотрудников, срыв партнерства с Canva и растущую обеспокоенность инвесторов перспективами компании.

Почитать из последнего
100 тыс. диалогов подтвердили экономию 80% времени с помощью ИИ
Anthropic проанализировала 100 тыс. реальных диалогов с Claude. И эти цифры теперь можно использовать в спорах о пользе искусственного интеллекта. Задачи, которые у людей занимают около 90 минут и стоят примерно 55 долларов труда, Claude выполняет на 80% быстрее человека.
Обнаружен способ обхода защиты ИИ в 90% случаев
Стихи ломают защиту больших языковых моделей. И это плохо для индустрии. Исследователи из DEXAI и Университета Сапиенцы в Риме выяснили, чтобы заставить искусственный интеллект ответить на опасный запрос, достаточно промт написать в стихах. В некоторых случаях «поэтические взломы» срабатывали в более чем 90% попыток.
Google опасался ошибок, а OpenAI на этом заработал миллиарды
Стэнфорд выпустил интервью с создателем Google Сергеем Брином, и там прозвучала фраза, которая объясняет всё происходящее в индустрии ИИ. «Главной ошибкой Google было недооценить трансформеры». Не технология подвела - подвела вера в неё.
Крёстный отец ИИ назвал AGI полной чушью
Один из «крестных отцов» искусственного интеллекта Ян Лекун заявил, что понятия general intelligence или AGI вообще не существует. Это не просто провокация - это удар по основам всей дискуссии об ИИ. Потому что если нет понятия, то что мы вообще пытаемся создать?
Новый Gemini 3 Flash быстрее в 3 раза и обходит Pro модель, но стоит копейки
Google выпустили Gemini 3 Flash, и это frontier-модель со скоростью Flash и ценой, которая ломает привычные правила рынка.