Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич
Пятая партия стала переломной в матче. В ней Каспаров, игравший чёрными, отказался от сицилианской защиты и предпочёл разыграть русскую партию (известную также под названием «защита Петрова»), которая после ответа машины перетекла в дебют четырёх коней. Игра развивалась довольно спокойно, пока после 23-го хода Каспаров, неожиданно для команды Deep Blue, не предложил ничью. После непродолжительного совещания Тань принял решение последовать совету Бенджамина и отвергнуть предложение. Игра продолжилась, однако Каспаров быстро захватил инициативу и смог довести партию до победы. Счёт 3 : 2 в пользу Каспарова означал, что компьютер уже не сможет выиграть матч: в запасе оставалась последняя партия, которую машина должна была играть чёрными, и при наилучшем для неё раскладе команда Deep Blue могла рассчитывать максимум на ничейный результат в матче. Однако чуда не произошло — Каспаров выиграл и последнюю партию, позиционно переиграв противника в славянской защите [807].
Итак, матч завершился с точно предсказанным самим Каспаровым счётом — 4 : 2. Каковы были его результаты и последствия? Несмотря на поражение Deep Blue, акции IBM за время матча выросли на $5,62 — с $113,50 до $119,12, демонстрируя значительно лучшую динамику, чем ценные бумаги конкурентов: Intel и Microsoft. Разработчики машины постарались извлечь максимум пользы из поражения, сконцентрировавшись на устранении обнаруженных слабостей системы, — команде хотелось во что бы то ни стало выиграть следующий матч. Сюй считал, что тактические способности машины в ходе прошедшего матча были на высоте, а основной причиной поражения стала оценочная функция Deep Blue, в которой обнаружилось несколько дефектов. Например, штраф за «пойманного» в углу доски слона был слишком мал, а бонус за слона, находящегося на особом «слабом поле» противника, в некоторых случаях непомерно велик. Однако эти проблемы оценочной функции были, вероятно, лишь вершиной айсберга — кто знал, сколько ещё подобных дефектов скрывалось в недрах логики оценки? Ещё до матча в Филадельфии Сюй сделал ставку на автоматическую подстройку параметров оценочной функции. Этот подход был предложен Шенноном, и впоследствии разработчики ИИ для настольных игр неоднократно пытались воплотить его в жизнь, впрочем без видимых результатов. Возможно, дело было в нехватке вычислительных мощностей, а может быть — в недостатках конкретных алгоритмов или неточности их реализации. Так или иначе, команде Deep Blue хватило смелости для того, чтобы пойти по дороге, на которой никто до них не достиг существенных успехов. Идея заключалась в том, чтобы модифицировать параметры оценочной функции таким образом, чтобы программа при переборе на небольшую глубину успешно «угадывала» как можно больше ходов профессионалов из большой базы шахматных партий. После матча с Каспаровым Сюй провёл множество вычислительных экспериментов, в ходе которых обнаружил, что некоторые из параметров оценочной функции заметно отличались от экспертных оценок их значений. Последующий анализ этих находок совместно с гроссмейстером Бенджамином открыл путь к пересмотру некоторых элементов оценки.
3.5.10 Второй матч против чемпиона мира
Второй матч с Каспаровым должен был состояться в мае 1997 г. в Нью-Йорке, и у команды было не так много времени, учитывая необходимость создания новой версии СБИС. Поскольку у Deep Blue оценочная функция была реализована «в железе», её переработка требовала создания нового чипа. Кроме того, Сюй нашёл возможность выполнять отсечение некоторых «бессмысленных» ходов на этапе генерации их списка «внутри» чипа. Разработка улучшенной микросхемы в столь короткие сроки была весьма рискованным предприятием. У команды не было возможности как следует протестировать новый чип, поскольку программная эмуляция была чрезвычайно медленной — чтобы симулировать всего одну минуту работы чипа требовалось около двух лет вычислительного времени! В итоге не обошлось без косяков. В режиме генерации ходов с отсечениями, в некоторых позициях, где было возможно взятие на проходе, чип генерировал фантомных ферзей, размещая их на полях A1 и A8. Подобные ошибки всегда вызывают ассоциацию с анекдотом про человека, у которого при ударе монтировкой по голове развязывались шнурки [808]. Решение этой проблемы потребовало знатных плясок с бубном, но в итоге всё закончилось хорошо [809].
Призовой фонд матча 1997 г. был в два с лишним раза больше прошлогоднего: 1,1 млн долларов против разыгранных в Филадельфии 500 тысяч. Изменились и правила его распределения. Перед матчем 1996 г. Каспаров предлагал схему «победитель получает всё», но в результате переговоров стороны сошлись на варианте 4 : 1 (400 тысяч долларов победителю, 100 тысяч долларов побеждённому). В матче же 1997 г. призовой фонд разделялся в пропорции 7 : 4 — это свидетельствовало о том, что Каспаров уже не рассматривал своё поражение как крайне маловероятное событие [810].
Несмотря на весьма сжатые сроки, команде Deep Blue удалось достичь существенного прогресса. Экспериментальная версия машины, “Pico” Deep Blue Junior, основанная на одиночном шахматном чипе, работавшем в замедленном режиме и с отключенным режимом отсечения, была способна анализировать всего от 100 до 300 000 позиций в секунду, что соответствовало скорости самых быстрых персоналок того времени. Несмотря на это, по словам Сюя, она уверенно обыгрывала лучшие коммерческие шахматные программы. Оба мини-матча Deep Blue Junior (версия машины, обладавшая 1/10 скорости полной системы) против гроссмейстеров Ларри Кристиансена и Майкла Роде окончились со счётом 1,5 : 0,5. Причём в матче с Кристиансеном проявилась ошибка, из-за которой машина в один прекрасный момент выбрала случайный ход вместо сильнейшего — и в результате на ровном месте лишилась пешки. Однако благодаря своим тактическим умениям Deep Blue Junior удалось свести игру к ничейному результату [811].
Благодаря произведённым доработкам частоту шахматного чипа Deep Blue удалось увеличить с 16–20 МГц в версии, использовавшейся в Филадельфии, до 24 МГц. В январе 1997 г. IBM анонсировала новый процессор, Power Two Super Chip (P2SC) для RS/6000 на основе архитектуры RISC, с частотой 130 МГц, что сделало компьютеры, составляющие основу Deep Blue (всего их было 30), примерно в два раза быстрее по сравнению с теми, которые использовались годом ранее. Каждый компьютер был оснащён гигабайтом оперативной памяти.
Общим результатом всех усовершенствований стало увеличение скорости машины примерно в два раза, за счёт чего скорость перебора достигла примерно 200 млн позиций в секунду.
Эксперименты, проведённые Робертом Хайаттом, показывали, что для его программы, Crafty, удвоение скорости означало прибавку примерно в 100 пунктов рейтинга Эло. По всей видимости, эффект для Deep Blue должен был быть примерно таким же [812].
Каспаров, впрочем, тоже не сидел сложа руки. Если в 1996-й он вступил с рейтингом Эло, равным 2775 пунктам (Владимир Крамник имел такой же рейтинг, а Анатолий Карпов отставал всего на пять пунктов), то в январе 1997-го Каспаров со своими 2795 пунктами стал единоличным лидером рейтинг-листа FIDE, оторвавшись от ближайшего преследователя Вишванантана Ананда на целых 30 пунктов.
Перед началом матча-реванша было дано множество прогнозов. Знаменитый шахматный комментатор Шелби Лиман заявил, что «поставил бы свои деньги на Каспарова», с ним соглашался Яссер Сейраван: «Каспаров победит и выиграет быстрее и легче, чем в прошлый раз» [813]. Марк Сейлор, шахматный мастер и редактор раздела развлечений Los Angeles Times, писал: «Я прогнозирую, что Каспаров не просто победит, а победит без особого труда. Хотя об этом не говорят ни итоговый счёт, ни комментарии Каспарова о том, насколько изнурительным был матч. Он намерен в следующем году подбить IBM на ещё одну попытку с ещё одним выгодным для него призовым фондом». Он также добавил, что «до некоторых пор IBM продолжит использовать состязание человека и машины в целях пиара. Но, если компания в конце концов придёт к выводу, что Каспаров продуманно хитрит, она, вероятно, сдастся и сосредоточится на продаже большего количества RS/6000 для сетей продуктовых магазинов, чтобы компьютеры смогли вернуться к тому, для чего они предназначены». И наконец он озвучил характерное для того времени мнение, выдающее желаемое за действительное: «Современные программы в своём развитии вскоре выйдут на плато, обусловленное ограничениями вычислительной мощности при анализе игры» [814].