Анатолий Анисимов - Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык
М. Фуко в европейской культуре выделяет три эписистемы: ренессансная (XVI в.), классическая (рационализм, XVII–XVIII вв.), современная (конец XVIII — начало XIX в. — нынешнее время).
«В начале XVII века, в тот период, который ошибочно или справедливо называют «барокко», мысль перестает двигаться в стихии сходства. Отныне подобие — не форма знания, а, скорее, повод совершить ошибку, опасность, угрожающая тогда, когда плохо освещенное пространство смешений вещей не исследуется».[112]
«Эпоха подобного постепенно замыкается в себе самой. Позади она оставляет одни лишь игры. Это игры, очарование которых усиливается на основе этого нового родства сходства и иллюзии; повсюду вырисовываются химеры подобия, но известно, что это только химеры; это особое время бутафории, комических иллюзий, театра, раздваивающегося и представляющего театр, quiproquo (от латинского qui pro quo — одно вместо другого, путаница, недоразумение. — Авт.) снов и видений, это время обманчивых чувств; это время, когда метафоры, сравнения и аллегории определяют поэтическое пространство языка. И тем самым знание XVI века оставляет искаженное воспоминание о том смешанном, лишенном твердых правил познании, в котором все вещи мира могли сближаться согласно случайностям опыта, традиций или легковерия. Отныне прекрасные и строго необходимые фигуры подобия забываются, а знаки, которыми они отмечены, теперь принимают за грезы и чары знания, не успевшего еще стать рациональным».[113]
В классическую эпоху комментарий уступил место критике. В фигурах мира ищутся не сходства, а различия. Мышление занято перечислением всех признаков объектов. Возникают различные классификационные таблицы, язык наполняется перечислительными конструкциями.
Постепенно происходит незаметный процесс отделения языка от мира вещей. Он сам становится источником своего развития, в нем все сильнее начинает раскручиваться пружина рекурсии. Возникают сложные многоуровневые предложения, усложняется комментарий, появляются рекурсивные сюжеты. Язык увлеченно играет своими отражениями, управляет мышлением человека, определяет его развитие в пространстве представления. Язык замкнулся в себе и превратился в самостоятельную грозную фигуру мира, равную Вселенной.
СТРУКТУРЫ ЯЗЫКА
Формальным моделям синтаксических структур естественного языка уделяется значительное внимание в современной проблематике систем искусственного интеллекта и компьютерной лингвистики. Это связано с необходимостью создания действенных программ генерации и анализа предложений естественного языка в экспертных и информационных системах, во многих системах управления и принятия решений, в перспективных ЭВМ будущих поколений. Сейчас уже ясно, что любое продвижение в этой области влечет прогресс в понимании эволюционного процесса развития языка и мышления человека.
Самая значительная структурная текстовая и коммуникативная единица — предложение. На неточном уровне основные синтаксические конструкции предложений описываются в классических схемах грамматики языка, восходящих к периоду античности и мало изменившихся к настоящему времени. Но до сих пор нет полной ясности в определении предложения. Большой вклад в развитие этого понятия внесли отечественные лингвисты — А. А. Потебня, М. Н. Петерсон, Л. В. Щерба, А. М. Пешковский, Ф. Ф. Фортунатов, А. А. Шахматов, В. В, Виноградов, Н. Ю. Шведова, А. В. Гладкий и др. Почти все соглашались, что предложение выражает законченную мысль. С этой точки зрения критике подверглось понятие придаточного предложения — оно «выражает мысль» только внутри единого сложного предложения и поэтому его нельзя рассматривать как предложение (М. Н. Петерсон, Н. С. Поспелов). Некоторые считали, что понятие «мысль» еще более туманно, чем предложение». Поэтому подвергалось критике как неформальное определение предложения через законченную мысль. Потебня в 70-е годы прошлого века отмечал необходимость наличия главного глагола в предложении. Особенно ярко это проявляется в арийских языках. В славянских выпадение глаголов из некоторых конструкций объяснялось историческими изменениями языка. Считалось, что в праисторические времена такие глаголы должны были присутствовать. Эта концепция также критиковалась как непроверяемая на практике. Пешковский в первой половине нашего века вернулся к концепции «законченной мысли». Он высказал идею о подчинении одних частей предложения другим. Ученый признавал главным членом предложения подлежащее, а сказуемое оказывалось подчиненным словом, хотя он и отмечал, что сказуемое — самое главное слово для выражения процесса мысли. Самое главное слово оказалось подчиненным! Не в силах справиться с этим противоречием, он объявил, что здесь проявляется антиномия основ языка, Виноградов акцентировал внимание на так называемой предикативной связи, объединяющей подлежащее и сказуемое в предикативное ядро. Тезис о единице мышления положил в основу определения предложения и Шахматов. Он считал, что такой единицей не может быть логическое суждение, являющееся утверждением или отрицанием чего-нибудь. За единицу мышления он принимает «психологическую коммуникацию». Отталкиваясь от идей Пешковского, в последние годы значительное развитие получила концепция управляющей связи слов и словосочетаний внутри предложения. Тонкие отношения управления между словами изучаются в известных лингвистических моделях деревьев подчинения и систем составляющих, появившихся в 50-е годы нашего столетия. На этих двух последних моделях остановимся дальше более подробно.
Очевидное достоинство всех перечисленных моделей — их правильность — адекватное отражение тех или иных специфических характеристик синтаксической структуры текста. Однако ни одна из этих моделей еще не была использована для создания каких- либо действующих систем общения с ЭВМ на естественном языке. Модель деревьев подчинения ориентирована на управляющие связи только по словам, а модель систем составляющих учитывает только иерархическое отношение вложенности словосочетаний в линейной структуре текста. Эти факторы лишь приближенно описывают действительные коммуникативные свойства, содержащиеся в синтаксических структурах текста. Поэтому ученые предприняли попытки построения моделей, обобщающих средства деревьев подчинения и систем составляющих. Так, А. С. Нариньяни, исходя из задач практического программирования систем, взаимодействующих с использователем на естественном языке, предложил модель системы компонент. В этой модели структура предложения описывается в виде системы синтаксических компонентов, связанных отношениями правления и примыкания. Допускаются разрывность и пересечения компонент. Гладкий разработал концепцию синтаксических групп. Здесь наиболее явно подчеркивается важность учета управляющих связей между группами слов, образующих цельный синтаксический объект в структуре предложения. Таким образом, уточнение моделей синтаксических структур идет от уточнения управляющих связей между словами и словосочетаниями к уточнению связей между группами синтаксических единиц. При этом с неизбежностью происходит перемещение точки рассмотрения синтаксических структур из линейного порядка, навязанного последовательностью записи текста, к сложному пространству, образованному синтаксически связанными группами объектов. В пределе (оставаясь в рамках синтаксиса) приходим к пространству представления, не зависящему от порядка записи текста, а значит, и от национального языка, выражающему все предикативные и определяющие отношения, содержащиеся в синтаксических структурах. Это пространство, названное управляющим, образует полную синтаксическую структуру предложения и является рекурсивно-топологическим выражением того процесса, который называется мыслью. В отличие от чисто лингвистического подхода предложение рассматривается как некоторый динамический вычислительный рекурсивный процесс, развивающийся в управляющем пространстве, связывающем синтаксически сгруппированные части предложения информационными каналами. Структура управляющего пространства отражает семантику определяющих и предикативных конструкций языка. Неожиданным оказалось то, что управляющие пространства подобного вида уже рассматривались как вычислительная модель для рекурсивно-параллельных процессов. Это уже упоминавшиеся ПАРУС-структуры. В формальном аспекте предлагаемая модель — это одновременное обобщение деревьев подчинения и систем составляющих, а также других упоминаемых ранее моделей. Реализация этой модели ориентирована на ПАРУС-системы программирования, поддерживающие концепцию рекурсивно-параллельного программирования в управляющих пространствах. При изложении мы ограничиваемся концептуальным уровнем. Подробности и уточнения конкретных деталей выходят за пределы книги.