Алексей Редозубов - Мозг напрокат. Как работает человеческое мышление и как создать душу для компьютера
Итак, Интернет — «память человечества», а поисковые системы позволяют получить доступ к «воспоминаниям». В чем недостаток существующих поисковых систем? Почему, введя осмысленный вопрос, мы далеко не всегда получаем осмысленный ответ? Дело в том, что воспоминания, которыми оперирует мозг,— это фиксация текущего представления, которое соответствовало моменту запоминания. Такое воспоминание содержит в себе «смысл» информации. Документы же, размещенные в Интернете,— это документы на естественном языке, а естественный язык — это только способ передачи информации. И, как я уже говорил выше, смысл возникает только в сочетании с памятью человека. Установление связей документа и слов в поисковой машине — не то же самое, что формирование ассоциативных связей у человека.
Интересно обратить внимание на то, что в поисках способов для оптимизации работы поисковых систем идет воссоздание тех алгоритмов, которые присущи человеческому мозгу. Так, поскольку смысл текста, размещенного в Интернете, в очень слабой степени определяется набором входящих в него слов, используются «мета-теги». Это — набор идущих через запятую слов, который задается авторами страницы и который должен дать поисковой системе представление о смысле текста.
Уже давно идут разработки «семантического веба».
В 1991 г. Тим Бернерс-Ли создал Интернет и этим навсегда изменил характер взаимного общения людей. Спустя несколько лет он начал рассуждать о своем новом видении «паутины», которая сможет делать с данными то же самое, что обычный Интернет уже сделал с неструктурированным контентом.
Бернерс-Ли называет это «семантическим вебом». Говоря упрощенно, семантический веб позволит рассматривать Интернет в целом как базу данных (БД). Точно так же, как разработчик может запрашивать сведения из обычной БД и создавать приложения, оперирующие этой информацией, любой человек получит возможность собирать данные во всей интернет-сети и в соответствии со своими нуждами строить приложения, обрабатывающие взаимосвязанные, но разрозненные сведения из различных источников.
В семантическом вебе не нужно вдаваться в подробности, о чем именно идет речь в том или ином конкретном случае, запуская для этого поиск фрагментов текста и выдвигая собственные предположения, поскольку информация в этом случае будет соответствующим образом размечаться и снабжаться четкими указаниями. Но еще важнее, что к семантическому вебу можно будет легко подключиться, чтобы найти однотипные или взаимосвязанные данные (Рапоза, 2007).
Идея семантического веба заключается в том, чтобы представить каждый документ или файл в Интернете в виде некоего «воспоминания» со своим уникальным идентификатором URI.
URI — это унифицированные идентификаторы ресурсов (Uniform Resource Identifier). «Всякий раз, когда вы заходите в Интернет, вы используете множество URI, поскольку это основной метод адресации в Сети. (Любой стандартный веб-адрес в формате URL представляет собой один из видов URI). URI имеют большое значение для семантического веба, потому что для доступа к данным необходимо иметь возможность указать место их размещения и идентифицировать их точно так же, как в случае с веб-сайтом... » (Рапоза, 2007).
Далее задача заключается в том, чтобы увязать каждый объект с другими через создание связей различного типа. Такие связи позволяют дать «смысловое» описание объекта.
Первый стандарт, разработанный в рамках семантического веба, призванный дать возможность описывать объекты, называется RDF (Resource Description Framework). RDF позволяет описать размещенный в Интернете контент таким образом, чтобы сделать его «<понятным» для машины... (Рапоза, 2007).
Видно, что идеи семантической паутины все больше и больше приближают устройство Интернета к устройству мозга. У разработчиков WEB 3.0 (так принято называть семантический веб) велико желание создать четкую, непротиворечивую конструкцию. Однако это желание натыкается на то, что в большинстве случаев информация, создаваемая людьми, не является детерминированной, то есть не позволяет со стопроцентной вероятностью гарантировать «правильное» понимание, и более того, может являться ложной или двусмысленной. Это накладывает определенные ограничения и требует дополнительных идей и решений.
Технологии, которые изменят мир
За миллиарды лет эволюции природа сформировала огромное количество конструктивных решений и применила их для строительства живых организмов. Эволюция жизни на Земле — это, с одной стороны, формирование новых свойств и алгоритмов поведения, с другой стороны — совершенствование существующих.
Техническая эволюция человечества идет путем, очень похожим на природную эволюцию. Накопление умений и знаний приводит к появлению новых технических решений, однако до сих пор работают механизмы и идеи, которым сотни лет и которые за эти годы доведены до совершенства. Внутри самых современных компьютерных программ используются алгоритмы и библиотеки, верой и правдой служащие уже десятки лет.
Следующий прорыв в области высоких технологий может быть связан с повсеместным внедрением устройств, работающих на нейронных сетях. Однако создание электронных устройств, моделирующих нейронную сеть,— это необходимая, но малая толика требуемых действий. Как компьютер бесполезен без программного обеспечения, так и подобное устройство неприменимо без тщательно обученной нейронной сети.
На сегодняшний день загвоздка — не в элементной базе, а именно в отсутствии хорошо обученных нейронных сетей. Генетический эволюционный алгоритм позволил природе добиться фантастических результатов. Нейронные сети из нескольких сотен нейронов реализуют сложнейшие алгоритмы поведения.
Десятки тысяч нейронов позволяют творить чудеса насекомым. Восемьсот тысяч нейронов у пчелы превращают ее в совершеннейший механизм, который действует лучше любого автопилота и справляется со своими задачами лучше любого из созданных человеком роботов. Все это стало возможно благодаря тому, что «нащупанные» эволюцией за сотни миллионов лет связи нейронных сетей эксплуатируются по сей день, оттачиваясь и совершенствуясь. Те нейронные сети, что создает человек, создаются для решения узких задач и, как правило, не имеют продолжения, то есть возникает новая задача — и все начинается с нуля.
Видимо, прогресс в техническом использовании нейронных сетей начнется, когда будет накоплена некая «критическая масса» хорошо работающих конструкций наподобие древнего мозга человека. Основная сложность — в том, что алгоритмы обучения нейронной сети, позволяющие обучить сеть «быстро», обучают ее достаточно «плохо» и не позволяют улучшать обучение многократным применением. Генетические алгоритмы, построенные на случайных мутациях, теоретически позволяют добиться идеального результата, но требуют непредсказуемо много времени и не гарантируют результата вообще. Природе удалось добиться столь выдающихся результатов благодаря тому, что процесс эволюции вышел за рамки просто создания и усложнения нейронных сетей и перешел к эволюции системы эмоций и проистекающего из них инстинктивного поведения. Существующий уровень развития науки и техники позволяет, в принципе, ожидать в ближайшем будущем появления устройств, использующих эмоции и сопоставимых по своим возможностям с живыми существами.
Сейчас я позволю себе пофантазировать и описать некую технологию. Эта технология может быть создана уже сейчас, на существующей элементной базе. Думается, в недалеком будущем она будет реализована неизбежно, а, будучи внедренной, она, по моему мнению, перевернет все существующие информационные системы.
Итак, представьте, что с вами всегда находится компактное устройство, например совмещенное с мобильным телефоном. Это устройство имеет доступ в Интернет и некий удобный интерфейс. А еще оно постоянно записывает все, что происходит с вами. В принципе, можно записывать только звук, но если вам будет интереснее, представьте, что также — и изображение того, что вы видите. Это будет такой своеобразный диктофон, работающий круглые сутки. Пусть информация с него время от времени отправляется в некое хранилище, которое находится на специальных серверах в Интернете. Сам по себе такой «постоянный» диктофон уже забавен, но пока еще слабо полезен.
Теперь пойдем дальше. Представьте себе, что это устройство параллельно с записью постоянно проставляет некие метки. Ну, во-первых, фиксирует время, это понятно. Во-вторых,— собеседников. Если у людей, которые находятся рядом с вами, есть такие же устройства, то очень несложно определить, с кем вы в компании (так, включив bluetooth мобильного телефона, вы видите список всех телефонов с bluetooth вокруг вас). В-третьих, определяется место, где все происходит,— в век GPS и Google maps это совсем элементарно. И вот система стала уже значительно полезнее.