Искусственный интеллект научили оценивать красоту изображений. Можно предсказать свои шансы на лайки
Специалисты компании Google в своём последнем исследовании рассказали, что научили ИИ предсказывать, будет ли та или иная фотография эстетически приятна человеку. Алгоритм также может подсказывать, что нужно сделать с изображением, чтобы оно сильнее понравилось людям. Разработчики надеются, что когда-нибудь ИИ станет лучшим советчиком для фотографов.
Традиционно алгоритмы сортируют изображения по базовым показателям, чтобы найти заданное. Например, смотрят, есть ли на фотографии кошка. Новое исследование Google показывает, что теперь ИИ может оценивать изображение вне зависимости от категории.
Этот процесс, называемый нейронной оценкой изображения (NIMA), использует глубокое обучение свёрточной нейронной сети (CNN) для прогнозирования оценок изображений.
Кроме того, в исследовании говорится, что алгоритм можно научить подсказывать, как нужно изменить то или иное изображение, чтобы оно стало более приятным для человеческого глаза. Например, так ИИ оценивал изображение по 10-балльной шкале в зависимости от искажений.
При этом алгоритм оценивает как отдельные пиксели, так и общую эстетику. Затем он применяет вероятность, что человек применит к изображению собственный рейтинг. В принципе, ИИ пытается угадать, захотел бы человек себе это изображение, пишет TNW.
Как говорится в исследовании, это не приближает машин к людям, но может сделать их хорошими кураторами, например, для фотографов, позволяя определять лучшее изображение из партии. То есть если вы из тех людей, которые привыкли делать по 20-30 одинаковых кадров, чтобы один-два точно получились идеальными, алгоритм помог бы сэкономить массу места на диске.
Как раз недавно одна тревел-блогерша рассказывала, что даже за красивыми снимками в инстаграме стоит большая человеческая работа. Следующий опыт на нескольких популярных фотографиях показал, что NIMA уже очень близко к людям определяет красоту фотографии. Результаты ИИ сравнили с результатами 200 человек (справа), которым показали эти снимки.
Гипотетически, нажав на кнопку, AI смог бы проанализировать все изображения в вашем хранилище, определить, какие из них были похожи, а затем удалить все, кроме самого лучшего.
В блоге Google также говорится, что NIMA можно использовать для обработки изображений, чтобы получить оптимальный результат.
Мы заметили, что базовые эстетические оценки могут быть улучшены путём корректировки контрастности, направленные на оценку NIMA. Следовательно, наша модель может направлять глубокий фильтр CNN для поиска эстетически близких к оптимальным параметров, таких как яркость, блики и тени.
Может показаться нереальным, что возможно научить робота понимать красоту изображения так же, как это умеет делать человек. Но последние разработки доказывают, что машинное зрение всё ближе приближается к человеческому. Правда, в большинстве случаев его применяют в более прикладных целях, чем оценка красоты картин.
Например, в настоящий момент работают над ИИ, который сможет управлять не только автомобилем, что уже кажется почти обыденностью, но и космическим аппаратом. Первые испытания уже даже провели, хотя в них пока победил человек.
Кстати, недавно было опубликовано видео о том, как работает машинное зрение с технологией распознавания лиц и предметов. Нейросеть протестировали на улицах Нью-Йорка, и глядя на эти кадры становится трудно понять, что делать: восхищаться технологиями или начинать бояться их.