В соцсетях активно тестируют диффузионную нейросеть ModelScope text2video, которая превращает текстовые запросы в видео. Пока что она способна обрабатывать только короткие простые фразы и создавать по ним гифки с зернистым изображением. Возможно, поэтому наиболее активно пользователи экспериментирует с запросами, в которых знаменитости едят спагетти.
Что такое ModelScope text2video. ModelScope — китайская нейросеть, в которой в конце марта появилась возможность генерировать короткие видео по текстовому запросу, такая модель называется text2video («из текста в видео»). Судя по вотермарке фотостока Shutterstok, которую можно заметить на некоторых видео, созданных с помощью ModelScope text2video, нейросеть обучалась в том числе и на этом ресурсе.
Качество визуала, который пользователи получают от нейросети, пока оставляет желать лучшего. Возможно, именно поэтому ролики из ModelScope text2video стали так популярны, ведь они похожи на мем. Наиболее популярными в соцсетях стали гифки со знаменитостями, которые что-то едят.
Блогер Денис Ширяев, более известный в телеграме как Denis Sexy IT, опубликовал в своём канале гифку из ModelScope text2video, где Эмма Уотсон ест суп.
Попробовать создать свою гифку в ModelScope text2video может каждый.
Как сделать видео в ModelScope text2video. Чтобы создать видео по текстовому запросу в ModelScope text2video, нужно перейти на сайт Hugging Face. Далее пролистываем страницу вниз до окошка Prompt и придумываем запрос. Например, «Педро Паскаль ест суши». После чего нажимаем кнопку Run.
Некоторое время запрос будет обрабатываться, после чего в окошке ниже появится видео, которое можно скачать.
Промпты нужно вводить на английском языке. Желательно делать их не слишком сложными и описательными, потому что иногда нейросеть может выдавать ошибку.
Пока ModelScope text2video воспринимается пользователями соцсетей как развлечение, но в будущем ИИ может научиться выдавать реалистичные видео по более развёрнутым запросам, как это было с другими популярными сейчас нейросетями.
Благодаря фотореалистичным изображениям от Midjourney в интернете появился первый крупный фейк из-за фото от нейросети. ИИ сгенерировал кадр с Папой Римским Франциском, одетый в модный пуховик, и многие пользователи Сети приняли снимок за чистую монету.
Впрочем, даже пятой версии Midjourney пока удаётся не всё. Medialeaks рассказывал, как нейросеть на групповых портретах генерирует лишние пальцы, рандомные объекты и несуществующие языки.