Миллиардер из Кремниевой долины. История соучредителя Microsoft - Аллен Пол
Приложение
Искусственный интеллект. «Цифровой Аристотель» и проект «Гало»
За последние тридцать лет ученые серьезно продвинулись во внедрении искусственного интеллекта (ИИ) в коммерческие системы. Машинный перевод, распознавание речи и образов, рассуждения на основе ограничений, логическое программирование, теория игр, промышленная робототехника – все это человечество постепенно осваивает. Но одна проблема по-прежнему остается нерешенной: ИИ не под силу прочесть элементарный учебник, понять материал и ответить на вопросы по нему.
Почему же компьютеры не могут этого сделать? Познание нового, работа с полученными сведениями и ответы на вопросы так легко даются человеку, что мы редко задумываемся об отвечающих за это механизмах. У компьютеров, разумеется, достаточно вычислительной мощности, чтобы справиться с такой простой задачей: современные поисковые системы могут меньше чем за секунду просмотреть весь Интернет и выдать результаты, соответствующие нашему запросу, да еще рассортировать их по степени полезности. Вместе с тем практически невозможно заставить компьютер отвечать на элементарные вопросы, какие встречаются в школьных экзаменационных тестах и не представляют никакой сложности для миллионов учащихся.
Проблема – в самой природе и сущности человеческих знаний. Знанием часто называют некую совокупность фактов, вроде таблицы умножения или химических элементов. Современный ИИ вполне способен отвечать на вопросы, связанные с такими простыми фактами. («Сколько хромосом у голубой сойки?») Но самые важные человеческие знания представляют собой куда более изощренные конструкты. Даже элементарные сведения могут быть поданы с помощью причинно-следственных связей («Недостаток солнечного света приводит к задержке роста растений»), обобщений («Большинство птиц умеет летать»), метафор («ДНК – это своего рода чертеж»), условных высказываний («Если бы земное притяжение было вдвое слабее, деревья были бы вдвое короче»), закономерностей («Если клетка умирает, клеточная оболочка разрушается») и прогнозов («Радиоактивность может увеличить число мутаций»).
Цель проекта «Цифровой Аристотель» – научить компьютеры постигать все виды человеческих знаний и уметь ими распоряжаться. Чтобы преуспеть в этом, компьютер должен разумно овладевать знаниями в очень крупных объемах, эффективно их осмысливать и находить правильные ответы.
Наша исследовательская программа – проект Halo – разработана с целью построить системы, которые в дальнейшем позволят создать функционального «Цифрового Аристотеля». Программа стартовала семь лет назад, и первой ее целью стал углубленный школьный курс биологии. Мы выбрали именно эту область знаний, поскольку она достаточно (но не чрезмерно) обширна, имеет разработанную учебную программу с итоговыми контрольными тестами и представлена разнообразными видами знаний. На сегодняшний день мы подробно проанализировали все учебники по биологии, чтобы классифицировать все виды содержащихся в них сведений. Теперь мы работаем над способами кодирования этих сведений – чтобы использовать их в компьютерах проекта Halo, объединив с уже имеющимися базами данных, и придать всему этому форму, которая позволит различным экспертным системам находить правильные ответы на поставленные пользователем вопросы.
Главная проблема этого проекта – его глубокая уязвимость. Многие сложные задачи по компьютерному кодированию знаний и имитации мыслительных процессов успешно решаются в лабораториях, но только в небольших объемах. Когда же объемы возрастают – хотя бы до единственного школьного учебника – система падает. Кроме того, отдельные подходы зачастую несовместимы друг с другом, и современные экспертные системы не могут так же быстро переключаться между различными способами использования накопленных знаний, как это делают люди.
Международная команда проекта Halo добилась значительных успехов в исследованиях. Мы надеемся, что к 2015 году сможем создать систему ИИ, включающую большую часть знаний, необходимых для ответов на вопросы по углубленному школьному курсу биологии. Эта система, которая будет иметь вид планшета или электронной книги (Halo-book), станет важным шагом к созданию «Цифрового Аристотеля». Однако впереди еще множество нерешенных задач и немало научных прорывов. Приведу десять важнейших проблем в сфере обработки знаний, которые представляют наибольший интерес для проекта Halo (я распределил их по трем уровням сложности):
I уровень сложности: перспективные подходы, которым, однако, еще далеко до осуществления
– Человеческий язык крайне сложен и многогранен. Существует множество способов выразить одну и ту же мысль, а одно и то же предложение может иметь массу смыслов. Чтобы машина смогла обработать язык во всей его полноте, она должна «понимать» и должным образом реагировать на великое множество речевых оборотов. Многие перспективные технологии разрабатываются с использованием как автоматизированного, так и неавтоматизированного анализа языка, включая статистические исследования больших объемов данных из Интернета. Точки пересечения человеческого языка и знаний – предмет живого интереса для проекта Halo, который изучает весь спектр лингвистических вопросов.
– Визуально-пространственное обучение и мышление. Поместятся ли 17 чемоданов в багажник обычного легкового автомобиля? А открытый зонт? Может ли реактивный самолет приземлиться на тротуар? Какие сведения представлены в диаграмме? Как раскручивается спираль ДНК? Человек без труда выполняет грубые расчеты, связанные с пространственным мышлением. И хотя вычислительная геометрия, необходимая для навигации, промышленного производства и архитектуры, давно существует на рынке, прогресс в области интуитивной геометрии, которой мы пользуемся каждый день, движется очень медленно. Проект Halo в настоящий момент не делает упора на этой области, но любые новые идеи приветствуются.
– Знания о действиях, причинно-следственных связях и моделировании ситуаций. Если на столе стоит чашка, а в комнату входит человек, его появление никак не скажется на чашке – она будет по-прежнему стоять на столе. Но многое другое изменится в результате этого действия: человек больше не будет стоять снаружи; тело и одежда человека окажутся в комнате; комната уже не будет пустой и так далее. Человек легко моделирует ситуации у себя в голове, как в «прямом» направлении (чтобы предсказать возможный исход событий), так и в «обратном» (чтобы установить возможные причины того, что уже случилось). Для ИИ, однако, это весьма сложная задача, и решить ее не могут уже давно. Мыслительные процессы о действиях, изменениях и причинно-следственных связях невероятно сложны, особенно когда эти действия имеют неопределенные или дополнительные последствия. Лучшие решения этой задачи можно найти в бизнес-планировании, автоматическом планировании и робототехнике, но они сугубо специализированы и плохо применимы в других сферах. Проект Halo добился существенного прогресса в имитации мыслительных процессов о действиях и причинно-следственных связях.
– Обращение с неточными и приблизительными сведениями. Наши знания о многих предметах крайне туманны и приблизительны, однако мы обладаем удивительным даром делать правильные выводы и реагировать соответствующим образом. Например, прослушав прогноз погоды, человек знает, что днем может пойти дождь, и принимает на этот случай ряд мер. Люди читают расплывчатые высказывания («Джон довольно высок ростом»), приблизительные оценки («Геном человека содержит около 23 000 генов») или утвердительные высказывания, подразумевающие ряд исключений («Все птицы умеют летать»), и все равно реагируют на них должным образом, несмотря на очевидные неточности. В определенных сферах эти вопросы уже решаются с помощью классических статистических методов, однако прогресс идет очень медленно. Проект Halo добился значительных успехов в этой сфере, которая по-прежнему остается одним из ключевых направлений нашей деятельности.