Нейросеть научили создавать картинки по описаниям. Кажется, она черпает чистый ужас из глубин подсознания

19 августа 2018 12:59

Нейросеть AttnGAN, которая тренируется создавать изображения на основе словесных описаний, довольно быстро перешла к методам абстрактного экпрессионизма. Теперь на просьбу нарисовать человека или кота искусственный интеллект выдаёт жутковатые картины, которым самое место в музеях современного искусства. Найти там искомый объект порой бывает непросто. Мы потестили странную нейросеть, и вы тоже можете это сделать.

О новом искусственном интеллекте, который на основе базового алгоритма сам учится создавать изображения, пишет блог Motherboard. Программа под названием AttnGAN по замыслу должна считывать текстовые описания, «обращать внимание» на важные детали и, используя базовый набор фотографий, создавать уникальные изображения, но уже с поправкой на детали.

В пример авторы программы, статья о которой опубликована на arXiv.org, приводят такой текст:

Это красная с белым птица, и у неё очень короткий клюв.

В результате после обработки исходных изображений по алгоритмам с несколькими циклами должна получиться реалистичная картинка несуществующей в реальности, но «похожей» на настоящую птицы. Выглядит это так:

Программу создала команда из Центра глубинного машинного обучения Microsoft. Идея в том, чтобы научить машину, во-первых, правильно оценивать важность тех или иных слов в описании и правильно находить те участки изображения, к которым они относятся. Название программы расшифровывается как Attentional Generative Adversarial Network, что можно перевести как «созидательная сеть, работающая на принципах конкуренции и внимания».

Например, словосочетание «красная с белым» означает, что в оперении птицы намного больше красного, а белым должно быть только какое-то пятно. Также программа должна правильно отнести слова «очень короткий» именно к клюву, распознать, где у птицы клюв, сделать его коротким и при этом создать изображение, образ которого не выходит за рамки реализма.

Сеть обучали на изображениях птиц, и с птицами она справляется неплохо, но, когда дело дошло до других объектов, стало немного хуже. По правде говоря, стало очень плохо. Даже немного страшновато.

«Красивая женщина с длинными волосами и улыбкой на лице» (искусственный интеллект, фоторедактор, 2018).

Видно, что программа использовала изображения женщин и явно оперировала понятия «волосы», «красивый», «улыбка», «лицо». Но с вниманием, конкуренцией и их применением что-то пошло не так.

«Робот, который хочет убить всех людей».

Ну хорошо. А если дать нейросети задачу попроще? Без эпитетов и описаний. Журналисты попросили нейросеть просто нарисовать кота.

Программа не справилась с заданием. Судя по всему, в процессе обучения что-то в нейросети пошло не туда, и теперь выдать обычное изображение обычного объекта она не в состоянии.

Мы тоже немного потестили нейросеть AttnGAN с помощью демо, выложенного в сеть и открытого для публики. Результаты, когда к ним привыкаешь, уже не пугают. Но кажется, что эти изображения вполне могли бы претендовать на место в коллекциях Музея современного искусства в Нью-Йорке или хотя бы в частных галереях поклонников абстрактной живописи.

«Большие белые грибы в лесу».

«Дождливый день».

«Новостник за ноутбуком».

Недавно мы писали о нейросети, которая умеет видеть людей даже сквозь стены. Искусственный интеллект опирается на радиоволны, которые отражаются от человеческого тела. Технология поможет распознавать преступников, несмотря на маски и темноту. Но и добропорядочные граждане не скроются от её внимательного взгляда.

Тем временем пользователи Reddit уже вовсю используют нейросети, работающие с изображениями, по прямому назначению. Теперь есть программа, с помощью которой несложно делать фейковые порноролики с голливудскими знаменитостями. Порносессия с Галь Гадот или Мэйси Уильямс? Без проблем. Теперь свои фантазии может воплотить любой. Вот только актрисы из настоящего порно очень недовольны новой технологией — так же, как в своё время луддиты были против машин.

Технологии