Искусственный интеллект научился обыгрывать людей в покер. Вчистую

31 января 2017 23:01 (материал обновлен 01.02.2017)

Завершился матч-реванш между программой-игроком Libratus и четвёркой лучших игроков в покер на данный момент, продолжавшийся 20 дней. Компьютер выиграл у людей больше 1,7 миллиона долларов. Соперники были раздавлены, один из участников пожаловался: у него было ощущение, будто компьютер читает его мысли.

За поединком между игровой программой Libratus, которая специализируется на разновидности покера «техасский холдэм», следили в Twitch тысячи зрителей из десятков стран. На кону было нечто гораздо большее, чем 200 тысяч долларов призовых. Предшественник Libratus, программа Claudico два года назад с треском проиграла в точно таком же турнире. Суммарный проигрыш фишками составил тогда 750 тысяч долларов.

В этот раз с самого начала у людей не задалось. С первого и до последнего, двадцатого, дня турнира баланс всё время был в пользу компьютера. Люди выглядели откровенно слабо: компьютер не только идеально считал вероятности, чем сейчас никого не удивишь, но и предугадывал тактические уловки соперников-людей. При этом его собственные алгоритмы так и остались загадкой.

Один из участников турнира, известный профессиональный игрок Дон Ким, в комментарии для Wired на 16-й день соревнований описал это так:

До этого дня я не до конца осознавал, насколько он хорош. Ощущение такое, как будто ты играешь против соперника, который жульничает. И я не имею в виду, что он действительно жульничает. Просто он настолько хорош.

По словам Кима, иногда ему казалось, что Libratus читает его мысли. По итогам дня выигрыш компьютера перевалил за 1 миллион долларов.

С одной стороны был код и сеть из более чем 600 узлов, составляющая суперкомпьютерную систему Университета Карнеги-Меллон в Питтсбурге. С другой — четыре лучших игрока в покер 2016 года: Дон Ким, Джимми Чу, Дэниел Маколей и Джейсон Лес. Играли около 200 часов. В итоге программа победила, выиграв фишками 1,7 миллиона долларов.

Профессор Томас Сэндхолм из Университета Карнеги-Меллон считает главным достигнутым результатом то, что теперь доказано: компьютер может превосходить человека и в игре, где требуется строить стратегию и взвешивать решения в ситуации неопределённости, пишет Mashable. Покер в этом смысле игра, не похожая на шахматы и даже на го.

Программа, которая впервые смогла обыграть профессионального игрока в го, AlphaGo, была представлена в январе 2016 года. Она использовала «сети значений» для оценки положения фигур на доске и «сети правил» для выбора ходов. Нейронная сеть, которую представляла собой система, обучалась в процессе игры с людьми методом проб и ошибок, пока не достигла высокого уровня мастерства.

В ноябре 2016 года СМИ сообщили о том, что китайские инженеры разработали программу, которая может определить преступника по лицу. Искусственный интеллект с вероятностью 90 % определяет, кто на фотографии: законопослушный гражданин или человек с криминальным прошлым. Программа подверглась профессиональной критике со стороны прикладных математиков и антропологов.

Незадолго до этого игра Quick, Draw! на базе нейросети Google, с помощью которой распознают рукописные тексты, стала главным увлечением миллионов пользователей как минимум на один день. За 20 секунд программа в реальном времени пытается угадать, что именно вы рисуете. Большинство пользователей были разочарованы, поскольку Quick, Draw! находилась на ранней стадии обучения и совершала много смешных ошибок. Некоторые находили удовольствие в изощрённом троллинге программы.