Марвин Минский - Фреймы для представления знаний
Отметим, что терминалы фрейма и субфреймов в предлагаемой формализации можно в большинстве случаев отождествлять не только с тестом, но и с действием, которое является обобщением всех действий, определяемых возможными заданиями терминале. При таком представлении все вершины И/ИЛИ графа, формализующего фрейм, соответствуют действиям, причем тем более конкретизированным, чем ниже по иерархии вершина. Часто полезным оказывается использование обобщения графа И/ИЛИ, описывающего фрейм-сценарий, которое получается за счет представления вершинами графа не действий той или иной степени общности, а так называемых "схем действий". Эти схемы определяют лишь общую структуру действия, т.е. в них могут быть не определены конкретно или действующие лица, или средства действия, или место действия и т. п., или, наконец, и то и другое вместе. Например, возможна следующая схема действия: Х прибыть в V, где Х может быть любым конкретным лицом, а V - любым конкретным местом. Чем ниже по иерархии вершина, тем более конкретно определяет она действие.
Важно подчеркнуть, что, если база знаний о мире образована в ЭВМ совокупностью таким образом формализованных фреймов-сценариев, то очень вероятна возможность многократного вхождения одних и тех же схем действий в разные фреймы-сценарии. Эта вероятность тем больше, чем большее количество фреймов включает база знаний. Для использования этого обстоятельства с целью экономии памяти полезно связать каждую схему действия с каждым своим вхождением во фреймы, образующие базу знаний, посредством "множества вхождений", которое представляет указания на все те места в базе знаний, где есть ссылки на данную схему. Кроме того, каждая схема действия связана с объемлющей ее схемой.
3.1. Примеры формализованного представления фреймов-сценариев
Приведенный выше фрейм-сценарий ресторана легко можно изобразить в виде такой графовой структуры И/ИЛИ (рис.П4). Номера сцен и действий сценария присвоены вершинам графа, представляющим соответствующие действия. Заголовок фрейма-сценария соответствует вершине графа. Каждая из четырех сцен соответствует вершине И, т.е. терминалу фрейма.
Две первые И вершины, соответствующие входу в ресторан и заказу обеда, имеют по две вершины ИЛИ, остальные две - по одной. Первые вершины ИЛИ первых двух вершин И соответствуют действию, совершаемому при утвердительном ответе на вопросы "а что если посетитель уже в ресторане", "а что если заказ сделан другом". Очевидно, в этом случае действия не нужны и вершины пусты. Все остальные ИЛИ вершины так же, как и их материнские вершины, соответствуют входу, заказу, еде, уходу.
Каждая из этих вершин имеет вершины И, соответствующие действиям, помеченным в сценарии арабскими цифрами. Наконец, вершины И 9 и 16 имеют по три дочерних вершины ИЛИ, соответствующие вариантам заказа и уплаты денег.
Другой иллюстрацией представления фрейма-сценария в виде графа И/ИЛИ является фрейм-сценарий (рис.П5), взятый из работы И. Ригера (1975).
Вершина этого графа соответствует названию сценария "кража". Она имеет две дочерние вершины II, одна из которых представляет собой схему действия вора X, вторая - потерпевшего 2 после кражи.
Дочерние вершины ИЛИ представляют собой более конкретные схемы действий потерпевшего. В данном случае имеет место шесть вариантов действия вора и девять вариантов действий потерпевшего. Всего имеется пятнадцать вершин ИЛИ. Выбор каждой из них зависит от значения теста, который представляется списком вопросов. Функция выбора осуществляется с помощью так называемой тернарной сети переходов (рис.П6). Каждый узел этой сети представляет собой вопрос, входящий в тест, а каждая из трех дуг, исходящих из узла, соответствует трем возможным ответам на вопросы: "да", "нет", "не известно".
В зависимости, от ответа на вопрос выбирается тот или пной узел сети. определяющий очередной вопрос теста, В результате имеет место продвижение по сети по тому или иному пути в зависимости от характера ответов. Оно заканчивается попаданием в один из заключительных узлов, каждый кз которых соответствует рекомендуемому действию.
Дочерние вершины И еще более конкретизируют действия, представляемые вершинами ИЛИ. На рис.П5 раскрыты лишь две из вершин ИЛИ. Первая соответствует схеме действий: "потерпевший Z отбирает вещь Y у вора X". Эта схема предполагает три обязательных последовательно совершаемых действия, представляемых изображенными на рис.П5 тремя вершинами типа И. Каждая из этих вершин имеет дочерние вершины типа ИЛИ. На рис.П5 представлено несколько вершин типа ИЛИ, относящихся к первой из вершин типа И, представляющих собой уточненные варианты схемы действия "потерпевший Z прибывает к X". Уточнение происходит за счет конкретизации средства действия, в данном случае - перемещения (лошадь, машина, пешком). Далее на рис.П5 раскрыта одна из вершин ИЛИ, соответствующая передвижению на лошади.
Вторая вершина ИЛИ соответствует схеме действия "потерпевший Z сообщает властям о краже". Эта схема имеет две обязательные схемы действия, первая из которых совпадает со схемой действия, представляемой дочерней вершиной вышерассмотрен-ной вершины ИЛИ. Однако если в первой схеме под Х понимается вор, то во второй - власти.
3.2. Механизмы "приспособления" фрейма к реальной ситуации
Рассмотрим теперь возможные механизмы выбора из памяти фрейма и приспособления его к реальной ситуации. Как отмечено у М. Минского, именно этот процесс лежит в основе понимания человеком реальной ситуации. В случае же машинной базы знаний этот процесс открывает доступ к знаниям, материализированным в памяти ЭВМ в виде совокупности систем фреймов.
Этот механизм приводится в действие двумя дополняющими друг друга потребностями. Первая - состоит в необходимости нахождения заданий терминалам фрейма, удовлетворяющим маркерам этих терминалов. Вторая - обусловлена требованием, чтобы рассматриваемый фрейм удовлетворял маркерам терминала более общего фрейма, объемлющего первый. Иными словами, каждый фрейм считается приспособленным к ситуации, если он включен в более крупный фрейм в качестве задания его терминалу и если его терминалы заполнены заданиями, удовлетворяющими маркерам.
В процессе понимания рассуждения, рассказа, точно так же, как и восприятия образа, ключевые слова, идеи рассуждения, элементы образа вызывают из памяти различные совокупности фреймов, большинство терминалов которых еще не согласовано с реальностью, а заполнено заданиями отсутствия. По мере поступления новой информации выясняется, что некоторые из первоначально выбранных из памяти субфреймов не согласуются с реальностью. Они заменяются другими более подходящими субфреймами, удовлетворяющими двум вышеприведенным условиям.
В простейшем случае такая замена осуществляется путем так называемой операции согласования. Она имеет место, когда отсутствуют особые знания относительно того, как поступать при смене фрейма, кроме некоторой общей стратегии. Эта стратегия состоят в выборе после поступления очередной порции входной информации такого фрейма, для которого вся ранее поступившая информация, например текст в случае понимания языка, и порция новой удовлетворяют маркерам его терминалов.
Проиллюстрируем эту стратегию на простом примере. Пусть в базу знаний входят два фрейма А и В, представленные в виде графовой структуры И/ИЛИ (рис.П7а). Первая порция входной информации соответствует заданию 1 (зачерненный круг). Оно удовлетворяет одному из трех T1, Т2, Т3 терминалов фрейма А-Т2. Это задание является субфреймом фрейма А; субфрейм вызывается из памяти со своими терминалами T'1 и T'2, заполненными заданиями отсутствия 1 и 2.
На рис.П7б структура активизированного субфрейма показана жирными линиями. Новая порция информации соответствует заданию 2. Она удовлетворяет одному из терминалов активизированного субфрейма и вытесняет задание отсутствия 2, ранее занимавшее этот терминал, так как оно не совпадает с воспринятым заданием 2. В результате происходит уточнение активизированного субфрейма, структура которого изображена на рисунке П7в. Следующая порция информации - задание 3, как видно из графовой структуры И/ИЛИ, не может быть заданием ни одного из терминалов Т'1, T'2 субфрейма задания 1, а является заданием одного из терминалов Т"1, Т"2 субфрейма а (рис.П7г).
В соответствии с используемой стратегией все три порции воспринятой информации должны удовлетворять терминалам одного фрейма. Очевидно, этим фреймом может быть только фрейм А, так как субфрейм а является заданием одного из трёх его терминалов, задание же 1 является заданием другого терминала Т2 и в качестве субфрейма объемлет задание 2, так как последнее является заданием этого субфрейма. В результате фрейм А вызывается из памяти в виде структуры, изображенной на рисунке П7г жирными линиями. Два из трёх его терминалов заполнены субфреймами: задание 1 и а, третий терминал - заданием отсутствия 3.