Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич
6.2.3 Распознавание образов в играх
Онода Шестой дан, арбитр в прощальной партии Мэйдзина Хонинбо, несколько лет спустя, незадолго до своей смерти, вдруг разгромил всех противников на большом квалификационном турнире Отэай, устраиваемом Ассоциацией го. Его игра была блестящей, а я бы даже сказал — пугающе великолепной. И за доской он держался не так, как обычно: при ходе противника тихо сидел с закрытыми глазами. Потом он объяснял, что в это время старался побороть в себе жажду победы. После турнира он почти сразу лёг в больницу, где вскоре скончался от рака желудка, о котором и сам не подозревал. Точно так же Кубомацу Шестой дан, у которого одно время учился Отакэ. Незадолго до смерти он показал выдающиеся результаты в турнире Отэай.
6.2.3.1 Победа в го
Как мы писали ранее, в главе 3.7, игра го на протяжении многих лет исполняла роль своеобразного философского камня в области искусственного интеллекта и успехи в ней компьютерных программ несколько лет назад были весьма невелики.
Возможно, уважаемый читатель, вас удивит такая смена темы повествования — с распознавания изображений и звука на игру в го.
Но дело в том, что позиция в го ничем принципиально не отличается от изображения размером 19 × 19 пикселей, а различные её варианты, возникающие в процессе игры, — прямые аналоги зрительных образов. Как выяснилось, нейросетевая модель, хорошо зарекомендовавшая себя в задачах распознавания зрительных образов, может использоваться и в нахождении важных позиционных структур на игровой доске в го.
И не только в го…
Но обо всём по порядку.
27 января 2016 г. в журнале Nature вышла статья [1944] коллектива исследователей из компании DeepMind (была приобретена Alphabet — родительским холдингом Google в 2014 г., поэтому иногда называется Google DeepMind) под названием «Овладение игрой го при помощи глубоких нейронных сетей и дерева поиска» (Mastering the game of Go with deep neural networks and tree search). Эта статья произвела в сообществе игроков в го эффект разорвавшейся бомбы. Дело в том, что, помимо описания алгоритмов, лежащих в основе новой программы для игры в го, получившей название AlphaGo, в статье приводились результаты матча AlphaGo против чемпиона Европы по го — Фань Хуэя. Фань Хуэй, профессионал второго дана, не просто потерпел в этом матче поражение, а проиграл его всухую, со счётом 0 : 5. Сам матч прошёл в штаб-квартире DeepMind в Лондоне в октябре 2015 г. при «длинном» временном контроле (час для каждого игрока, потом 30 секунд на ход без накопления, с тремя дополнительными полуминутами на всю игру). Это стало первым случаем в истории, когда компьютерная программа для игры в го победила профессионального игрока-человека на полноразмерной доске без форы.
Фань так охарактеризовал программу: «Я знаю, что AlphaGo — это компьютер, но если бы мне никто этого не сказал, то я бы, возможно, подумал, что мой соперник был немного странным, но очень сильным игроком, реально существующим человеком» [1945].
В матче с Фань Хуэем использовалась распределённая версия AlphaGo с 40 потоками перебора и использовавшая 1202 CPU и 176 GPU. Во время основного матча AlphaGo и Фань Хуэй сыграли также пять неформальных игр с более коротким временным контролем (у каждого игрока было только 30 секунд на ход без накопления с тремя дополнительными полуминутами на всю игру), в этих партиях AlphaGo победила Фаня со счётом 3 : 2. Фань Хуэй отметил, что игра с AlphaGo помогла ему улучшить собственный уровень игры и научила видеть вещи, которые раньше он не замечал. Журналисты издания Wired подтвердили это заявление Хуэя — к марту 2016 г. он переместился в мировом рейтинге го: с 633-го места вошёл в топ-300 [1946].
Реакция профессионалов го была весьма бурной и пропитанной духом отрицания. Ли Седоль, один из сильнейших игроков в го, отметил, что AlphaGo достигла высшего любительского, но не профессионального уровня и что он мог бы дать AlphaGo фору в один или два камня. Ке Цзе и Ми Ютинг были более осторожны, оценив силу игры AlphaGo в этом матче как примерно соответствующую силе кандидата в профессионалы го и чрезвычайно близкую к профессиональному уровню. Ши Юэ и вовсе признал, что AlphaGo уже достигла профессионального уровня. Комментируя успех AlphaGo, Ке Цзе написал у себя в блоге: «Ошеломительно! Хотя уровень игры AlphaGo и был ограничен… Опасно, что он ещё не был завершён и при этом может эволюционировать (развиваться) и дальше». Прокомментировали полученный результат и представители компьютерного сообщества. Создатель уже упоминаемой в книге шашечной программы Chinook Джонатан Шеффер сравнил AlphaGo с «вундеркиндом», которому пока не хватает опыта. По мнению Шеффера, матч с Фань Хуэем ещё не являлся «моментом Deep Blue» и настоящим достижением станет момент, «когда программа обыграет игрока, бесспорно принадлежащего к высшему эшелону».
Впрочем, это понимали все: и создатели AlphaGo, и представители элиты мирового го, поэтому матч соответствующего уровня был организован в кратчайшие сроки. Противником AlphaGo суждено было стать Ли Седолю — профессиональному игроку в го и обладателю девятого дана. Седоль был, вне всякого сомнения, одним из сильнейших игроков в истории го. Он начал карьеру ещё в 1996 г., получив уже в 12 лет первый профессиональный дан, и выиграл с тех пор 18 чемпионатов мира.
Некоторые СМИ называли Ли Седоля чемпионом мира, но это было не вполне корректно, поскольку в го просто не существует титула абсолютного чемпиона мира — различные ассоциации проводят множество турниров по разным правилам, присуждая победителям различные международные титулы. На момент начала матча с AlphaGo Ли Седоль занимал второе место в мире по числу международных титулов, уступая только Каменному Будде — Ли Чхан Хо, к тому моменту уже завершившему игровую карьеру.
В мире го Седоль пользовался огромным уважением благодаря своему неортодоксальному и творческому стилю, а в родной Южной Корее он был настоящим национальным героем.
Ли Седоль считал, что без труда одолеет AlphaGo, о чём открыто говорил в предматчевых интервью. Впрочем, это было неудивительно — он находился на пике своей карьеры. Всего за несколько недель до начала матча с AlphaGo Седоль завоевал корейский титул мёнина, одержав победу в одном из наиболее престижных чемпионатов.
Эксперты, внимательно изучившие игры AlphaGo против Фань Хуэя, обнаружили несколько ошибок, допущенных программой, что придавало уверенности болельщикам Ли Седоля и ему самому. Однако до первой игры матча было неизвестно, насколько сила игры программы улучшилась со времени октябрьского матча.
Матч из пяти партий изначально планировался как грандиозное шоу, по масштабу не уступающее матчу Каспарова с Deep Blue. Совпадал даже размер призового фонда, который составил ровно миллион долларов. В качестве места проведения матча был выбран отель Four Seasons в Сеуле. Все игры транслировались в прямом эфире с комментариями профессионала го девятого дана Майкла Редмонда и управляющего редактора электронного журнала «Американское го» Криса Гарлока. Обзор первой партии матча, выполненный на китайском языке Ке Цзе и ещё одним профессионалом девятого дана — сильнейшим игроком Китая Гу Ли, посмотрело около 60 млн зрителей.
Программный код AlphaGo работал на серверах Google Cloud Platform в Соединённых Штатах, а ходы игроков пересылались через всемирную сеть. Каждому из участников было отведено два часа на партию, потом 60 секунд на ход без накопления времени, но с тремя дополнительными минутами на игру.
Перед началом матча давались самые разные прогнозы, причём нельзя сказать, что специалисты по ИИ и эксперты по го были склонны делать ставки на представителей собственного лагеря. Например, Шеффер считал, что победу в матче одержит Седоль, в то время как Ли Хаджин, профессиональный игрок и генеральный секретарь Международной федерации го, считала, что оба игрока имеют равные шансы на победу.