Джеймс Баррат - Последнее изобретение человечества
Watson — что-то вроде Siri на стероидах и безусловный чемпион по обработке естественного языка. В феврале 2011 г. эта программа, применив построенные по образцу мозга системы, одержала убедительную победу над соперниками-людьми в «Своей игре». Как и шахматный чемпион Deep Blue, для IBM Watson — это способ продемонстрировать свои вычислительные ноу-хау при одновременном продвижении дела ИИ. Известная игра представляла для программы серьезный вызов, ведь в вопросах часто задействованы ассоциации и игра слов. Участники должны понимать каламбуры, сравнения и культурный контекст, а ответы необходимо формулировать в том же стиле, что и вопросы. Однако распознавание речи не является специализацией Watson. Он не способен понимать устную речь. А поскольку он не видит и не чувствует, он не может и читать, так что в ходе игры вопросы приходится вводить вручную. К тому же Watson не слышит, так что аудио- и видеоподсказки исключались.
Эй, погодите-ка! Так что же выиграл Watson — «Свою игру» или специально подстроенную под него ее разновидность?
Уже после громкой победы, чтобы научить Watson понимать человеческую речь, IBM скрестила его с технологией распознавания речи фирмы Nuance. Кроме того, Watson читает терабайты медицинской литературы. Одна из целей IBM — уменьшить его габариты с нынешней комнаты, наполненной серверами, до, скажем, размеров холодильника и сделать из него лучшего в мире медика-диагноста. Когда-нибудь, уже довольно скоро, вам, возможно, придется записываться к врачу через виртуального помощника, который засыплет вас вопросами и сообщит врачу ваш предварительный диагноз. К несчастью, Watson по-прежнему не видит и может просмотреть такие признаки вашего состояния, как блеск в глазах, румяные щеки или свежее пулевое ранение. IBM планирует также установить Watson на ваш смартфон в качестве идеального приложения «вопрос-ответ».
Где же работают скопированные с мозга способности Watson? Его аппаратное обеспечение имеет выраженную параллельную структуру: 3000 параллельных процессоров оперируют 180 различными программными модулями, написанными для параллельных процессоров. Параллельная обработка информации — величайшее достижение мозга, и разработчики программного обеспечения вовсю пытаются повторить это достижение. Как сказал мне Грейнджер, параллельные процессоры и написанные для них программы не оправдали ожиданий. Почему? Потому что написанные для них программы плохо справляются с разделением задач для параллельного решения. Но, как продемонстрировал Watson, доработанные параллельные программы меняют ситуацию, и «железо» с параллельной архитектурой не слишком отстает. Разрабатываются новые чипы параллельных вычислений, которые должны невероятно ускорить работу уже существующих программ.
Watson показал, что параллелизм способен выполнять поразительные объемы вычислительных работ с невероятной скоростью. Но главное достижение Watson — способность самостоятельно обучаться. Его алгоритмы находят закономерности в текстовых данных, которые дают ему его создатели. Сколько может быть таких данных? Энциклопедии, газеты, романы, словари, вся «Википедия», Библия — всего около 8 млн толстых томов текста, которые машина обрабатывает со скоростью 500 гигабайт (примерно тысяча толстых книг) в секунду. Следует отметить, что в число текстовых материалов входили подготовленные словарные базы, таксономии (систематизированные и классифицированные коллекции слов) и онтологии (описания слов и отношений между ними). По существу, в этих материалах собран человеческий здравый смысл. К примеру, «крыша — это верхняя часть дома, не нижняя его часть, как подвал, и не боковая, как наружная стена». Это предложение говорит Watson кое-что о крышах, домах, подвалах и стенах, но для того, чтобы предложение имело смысл, ему необходимо знать определения всех использованных слов и определение слова «часть» заодно. Кроме того, ему нужно увидеть это слово не один раз, а множество, в разных предложениях. У Watson есть такая возможность.
Во второй игре объявленного IBM конкурса «Своей игры» появился такой вопрос: «Это условие в коллективном трудовом договоре говорит о том, что заработная плата может увеличиваться и уменьшаться в зависимости от определенного параметра, такого, например, как стоимость жизни». Сначала Watson разобрал это предложение, то есть выбрал из него и проанализировал ключевые слова. Затем он извлек из уже освоенных источников информацию о том, что заработная плата — это нечто, что может увеличиваться и уменьшаться, что в трудовом договоре пишут о заработной плате и что в договорах бывают условия. У него был и еще один очень важный ключ — категория, к которой относился вопрос, называлась «юридические "И"». Из этого Watson узнал, что ответ связан с распространенным юридическим термином и должен начинаться с буквы "И". Watson быстрее людей дал ответ на этот вопрос: «Что такое индексация заработной платы?» — и это заняло у него целых три секунды.
А после первого правильного ответа в той или иной категории Watson обретал уверенность (и начинал играть смелее), поскольку «понимал», что верно интерпретировал категорию. Система адаптировалась к игре или училась играть лучше прямо по ходу игры.
Но отвлекитесь на минуту от «Своей игры» и представьте, как быстро адаптивное машинное обучение может быть перенастроено на обучение вождению автомобиля, управлению танкером в море или геологической разведке на золото. Подумайте, какая мощь скрыта в интеллекте человеческого уровня.
Watson продемонстрировал еще один интересный вид интеллекта. Его программа DeepQA генерирует сотни возможных ответов и собирает сотни данных в пользу каждого из них. Затем она фильтрует и ранжирует ответы по уровню своей уверенности в каждом. Если она не чувствует уверенности ни в одном ответе, она не станет отвечать, поскольку в «Своей игре» за неверный ответ назначается штраф. Иными словами, Watson знает, чего он не знает. Конечно, вы можете не поверить, что вероятностные вычисления — это осознание себя, но согласитесь, это уже шаг в верном направлении. Знает ли Watson на самом деле что-нибудь?
Ну, если контуры мозга управляются алгоритмами, как утверждают Грейнджер и другие специалисты по вычислительной нейробиологии, то логично спросить: а знаем ли мы, люди, хоть что-нибудь? Или, говоря иначе, может быть, и мы, и они что-то знаем. И, разумеется, Watson — это настоящий прорыв, способный многому нас научить. Курцвейл сказал об этом так:
Много писали о том, что Watson работает через статистические расчеты, а не через "подлинное" понимание. Многие читатели понимают это так, что Watson просто собирает статистику о словосочетаниях… Но точно так же и пространственное распределение концентрации нейротрансмиттеров в коре человеческого мозга можно назвать "статистической информацией". В самом деле, мы разрешаем свои сомнения примерно так же, как это делает Watson, — сравнивая вероятности различных интерпретаций фразы.
Иными словами, как мы уже говорили, ваш мозг помнит информацию благодаря прочности электрохимических сигналов в синапсах, участвовавших в кодировании этой информации. Чем выше концентрация химических веществ, тем дольше и надежнее будет храниться информация. Основанные на фактах вероятности, с которыми работает Watson, тоже представляют собой своего рода шифр, но только в компьютерной форме. Это знание или нет? Такая дилемма приводит на ум загадку «китайской комнаты» Джона Сёрля, речь о которой шла в главе 3. Как мы вообще сможем узнать, думают компьютеры по-настоящему или просто хорошо имитируют этот процесс?
Что характерно, на следующий день после победы Watson в «Своей игре» Сёрль сказал:
IBM придумала хитроумную программу — но не компьютер, способный думать. Watson не понимал ни вопросов, ни своих ответов, ни того, что некоторые из них оказывались верными, а некоторые — неверными, ни того, что все это игра, ни того, что он выиграл, — потому что он вообще ничего не понимает.
Дэвид Ферруччи, ведущий специалист IBM по системе Watson, на вопрос о том, умеет ли Watson думать, ответил, перефразируя известного голландского компьютерщика Эдгера Дейкстру: «Умеет ли подводная лодка плавать?»
То есть подлодка не «плавает» так, как плавает рыба, но она может передвигаться в толще воды быстрее большинства рыб и оставаться под водой дольше любого млекопитающего. Более того, в некоторых отношениях подлодка плавает лучше рыб и млекопитающих именно потому, что она плавает не так — у нее свои достоинства и недостатки. Интеллект Watson производит сильное впечатление, хотя и ограничен, потому что не похож на человеческий. В среднем он работает много быстрее и способен делать вещи, доступные только компьютерам, — к примеру, отвечать на вопросы «Своей игры» круглосуточно и без выходных, а также подключаться к сборочной линии новых архитектур типа Watson, когда возникнет необходимость поделиться с ними знаниями и готовыми программами. А в вопросе о том, думает ли Watson, я предлагаю довериться нашим органам чувств.