Звезды жуют спагетти на гифках от ModelScope text2video. Как создать своё видео через нейросеть

30 марта 2023 13:35

(без названия)

В соцсетях активно тестируют диффузионную нейросеть ModelScope text2video, которая превращает текстовые запросы в видео. Пока что она способна обрабатывать только короткие простые фразы и создавать по ним гифки с зернистым изображением. Возможно, поэтому наиболее активно пользователи экспериментирует с запросами, в которых знаменитости едят спагетти.

Что такое ModelScope text2video. ModelScope — китайская нейросеть, в которой в конце марта появилась возможность генерировать короткие видео по текстовому запросу, такая модель называется text2video («из текста в видео»). Судя по вотермарке фотостока Shutterstok, которую можно заметить на некоторых видео, созданных с помощью ModelScope text2video, нейросеть обучалась в том числе и на этом ресурсе.

Качество визуала, который пользователи получают от нейросети, пока оставляет желать лучшего. Возможно, именно поэтому ролики из ModelScope text2video стали так популярны, ведь они похожи на мем. Наиболее популярными в соцсетях стали гифки со знаменитостями, которые что-то едят.

Блогер Денис Ширяев, более известный в телеграме как Denis Sexy IT, опубликовал в своём канале гифку из ModelScope text2video, где Эмма Уотсон ест суп.

Попробовать создать свою гифку в ModelScope text2video может каждый.

Как сделать видео в ModelScope text2video. Чтобы создать видео по текстовому запросу в ModelScope text2video, нужно перейти на сайт Hugging Face. Далее пролистываем страницу вниз до окошка Prompt и придумываем запрос. Например, «Педро Паскаль ест суши». После чего нажимаем кнопку Run.

(без названия)

Некоторое время запрос будет обрабатываться, после чего в окошке ниже появится видео, которое можно скачать.

Промпты нужно вводить на английском языке. Желательно делать их не слишком сложными и описательными, потому что иногда нейросеть может выдавать ошибку.

Пока ModelScope text2video воспринимается пользователями соцсетей как развлечение, но в будущем ИИ может научиться выдавать реалистичные видео по более развёрнутым запросам, как это было с другими популярными сейчас нейросетями.

Благодаря фотореалистичным изображениям от Midjourney в интернете появился первый крупный фейк из-за фото от нейросети. ИИ сгенерировал кадр с Папой Римским Франциском, одетый в модный пуховик, и многие пользователи Сети приняли снимок за чистую монету.

Впрочем, даже пятой версии Midjourney пока удаётся не всё. Medialeaks рассказывал, как нейросеть на групповых портретах генерирует лишние пальцы, рандомные объекты и несуществующие языки.

Видео, Интернет, Нейросеть, Соцсети