Разработчик Stable Diffusion тестирует генерацию видео

Коэн (Twitter)

13:20, 23 ноября 2023

Разработчик Stable Diffusion тестирует генерацию видео

Stability AI — создатель популярного ИИ-инструмента Stable Diffusion, объявил о запуске нового продукта — Stable Video Diffusion. Это инструмент позволяет создавать видео из одного изображения. Компания отмечает, что это "значительный шаг на пути к созданию моделей для всех и каждого".

Stable Video Diffusion представлен в виде двух моделей преобразования изображений в видео, способных генерировать от 14 до 25 кадров по продолжительности с частотой от 3 до 30 кадров в секунду при разрешении 576 × 1024. Модель способна на синтез из одного кадра с дополнительной настройкой на наборах данных. По словам компании, эти модели превосходят ведущие закрытые модели в исследованиях пользовательских предпочтений, включая платформы Runway и Pika Labs.

На данный момент Stable Video Diffusion доступен только для исследований, а не для коммерческого или реального использования. Заинтересованные пользователи могут записаться на доступ к "будущему веб-интерфейсу с функцией текст-в-видео". Инструмент продемонстрирует потенциальные применения в сферах рекламы, образования, развлечений и других.

Показанные образцы видео выглядят достаточно качественно, сравнимо с конкурирующими генеративными системами. Однако у инструмента есть ограничения: он генерирует относительно короткие видео (менее 4 секунд), не достигает идеального фотореализма, не может выполнять движения камеры, кроме медленных панорам, не имеет текстового контроля, не может генерировать читаемый текст и может некорректно воспроизводить людей и лица.

Инструмент был обучен на наборе данных из миллионов видео, затем дополнительно настроен на меньшем наборе данных. Stability AI указывает, что использовалось видео, доступное для исследований, без нарушения авторских прав.

Генеративное видео — одна из ключевых целей в разработке ИИ, так как позволит в разы упростить генерацию контента. Однако это также инструмент с большим потенциалом злоупотреблений через дипфейки и нарушения авторских прав.

Тэги:

Об авторе

Коэн

Эксперт по Fallout

Главный редактор

Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.

Разработчик Stable Diffusion тестирует генерацию видео

Об авторе

Статьи

Художник превратил Маркарт из Skyrim в реалистичную иллюстрацию с серебряными рудниками двемеров

Геймеры разнесли цену Steam Machine в 1049 долларов без контроллера и с мощностью базовой PS5

20 самых необычных инди-игр из 1000 заявок – от балканского градостроителя до GTA в Стамбуле

Энтузиасты посчитали, что винты летающего авианосца из "Мстителей" стёрли бы дома под ним в радиусе 500 метров в пыль