Александр Кондратов - Звуки и знаки
Машинный перевод с одного языка на другой, машинный перевод устной речи в письменную и письменной в устную, наконец, разговор с машиною «по-человечески», то есть ввод и вывод информации в машину посредством устной речи — все эти задачи несколько десятков лет назад относились к области научной фантастики. А ныне они стали реальными и важными проблемами практики. И решать эти проблемы можно лишь в тесном содружестве математиков, техников и языковедов.
Инженерная лингвистика — так называют это направление в научной литературе. И речь здесь идет не о том, чтобы инженер обучился основам языкознания, а лингвист — математике и электронике. Инженерная лингвистика в наши дни превратилась в отрасль исследований, имеющих свои конкретные задачи, свою методику и свои объекты изучения. Причем, как отмечает руководитель группы «Статистика речи» Р. Г. Пиотровский, решая собственные задачи, инженерная лингвистика стимулирует появление новых идей не только в области языкознания и смежных наук, но и в таких, казалось бы, далеких от нее дисциплинах, как методика преподавания языков, структурное литературоведение, радиолокация, психиатрия. Но особое значение для инженерной лингвистики имеет ее связь с кибернетикой и электронными вычислительными машинами.
Каждая идея и разработка инженерной лингвистики должна быть реализована на ЭВМ. Без машины, без робота теряется сама суть, смысл этого направления. Первые попытки машинного перевода состояли в том, чтобы передать машине поиск слов в словаре. Задолго до наступления эры кибернетики, в 1933 году, советскому инженеру П. П. Троянскому было выдано авторское свидетельство на изобретение «машины для подбора и печатания слов при переводе с одного языка на другой или несколько других одновременно». Но чем дальше шли работы в области машинного перевода, или, как говорят специалисты, МП, тем яснее становилось, что осуществить этот перевод можно лишь тогда, когда мы сумеем заставить машину переводить по-человечески, не по форме, а по смыслу…
Так у инженерной лингвистики появилась стержневая проблема: автоматическое распознавание смыслового образа. И проблема эта связана с другими проблемами распознавания образа машиной — зрительного для читающих автоматов, звукового для автоматов, действующих по приказу, который дает человеческий голос.
Тут от, казалось бы, сугубо технических проблем инженерная лингвистика переходит к проблемам, стоящим на повестке дня авангарда современной науки: моделированию мышления, работы человеческого мозга…
МП, ЯП, ИЯ
В нашем веке сугубо теоретические и сугубо практические задачи оказываются неразрывно связанными друг с другом. И, пожалуй, наиболее ярко эта связь теории и практики проявилась в области машинного перевода и создания информационных языков.
Об этом расскажет очерк
МП, ЯП, ИЯ
От круга Луллия до ЭВМ
Раймонд Луллий, живший в XIII столетии, был человек, далеко не заурядный. В молодости рыцарь, он оставил светскую жизнь, дабы найти элексир бессмертия. Элексир этот, несмотря на десятилетия алхимических поисков, найти ему не удалось. Зато, по мнению Луллия, он открыл основной компонент элексира — воду жизни, на латыни — аква вита. Впоследствии оказалось, что этой водой жизни был чистейший спирт, который умели возгонять задолго до Луллия арабские алхимики.
Специалисты по вычислительной технике, структурные лингвисты и ученые, занимающиеся теорией знаков, все чаще начинают упоминать в своих работах другое изобретение экс-рыцаря и алхимика — его называли «кругом Луллия».
Во времена Луллия считалось, что в каждой области знаний есть небольшое число принципов, которые столь же неколебимы, как аксиомы математики: их следует принимать без доказательств. Это так называемые абсолютные начала — доброта, величина, сила, сознание, воля, правда, слава; относительные начала — различие, согласованность, противоположность, середина, конец, равенство; добродетели — справедливость, умеренность, вера, милосердие, надежда и пороки — жадность, обжорство, сладострастие, гордыня, лень, зависть, гневливость, лживость, предательство; субъекты — бог, ангел, небо, человек…
Всего у Луллия, согласно тогдашней схоластике, получилось шесть категорий. В каждой из них было ровно по девять элементов. Элементы эти Луллий разместил на шести концентрических кругах. Первый, внутренний, круг состоял из девяти основных вопросов: что? почему? из чего? сколько? где? когда? какое? которое из двух? каким образом? Теперь, если привести систему кругов во вращение, можно получить, по мысли Луллия, ответ на любой вопрос, связанный с аксиомами, начертанными на кругах. Иными словами, Луллий считал, что его вертушка охватывала все знания, которые может вместить наш разум!
Как видим, наш разум Луллию представлялся неким ограниченным вместилищем знания, а сами знания чем-то завершенным, окончательным. Правда, «емкость» этого вместилища (или хранилища) получалась огромной. Число возможных комбинаций действительно было велико: вы в этом легко убедитесь сами, если возведете число элементов — девять — в шестую степень (число категорий). А так как круги изготовлялись из металла и раскрашивались в различные цвета, то вертушка Луллия производила весьма сильное впечатление на современников. Рассказывают, что Луллий с помощью своих кругов хотел обратить в христианство владыку мусульманского города, но тот, не поддавшись магии кругов, продал изобретателя в рабство, и единоверцам Луллия пришлось платить большой выкуп…
Но так или иначе изобретение Луллия является прообразом нынешних устройств, с помощью которых человек хочет усилить мощь своего разума — логических машин. Идея формализации мышления, сведения его к вычислениям и логическим операциям высказывалась двумя гениальными учеными XVII столетия Декартом и Лейбницем. «Подобно тому, как можно в один день научиться на каком-нибудь неизвестном языке называть и писать числа до бесконечности, таким же образом должна быть найдена возможность сконструировать все слова, необходимые для выражения всего, что приходит и может прийти в человеческий ум», — писал Декарт. А Лейбниц пытался заменить рассуждения вычислениями и превратить язык в своеобразную алгебру мысли. Но все это были теоретические построения. Лишь с появлением электронных вычислительных машин от рассуждений философов появилась реальная возможность перейти к осуществлению их идей на практике.
Мечты, мечты…
7 января 1954 года в конторе фирмы «Интернейшел бизнес мэшин» в Нью-Йорке была проведена первая публичная демонстрация перевода с языка на язык — перевода, который впервые за всю историю человечества делал не сам человек, а его механический помощник. Электронная счетная машина ИБМ-701 перевела математический текст с русского языка на английский. На следующий год был осуществлен первый машинный перевод в нашей стране. С английского языка на русский переводила отечественная машина БЭСМ.
Затем в различных странах мира с помощью машин были сделаны переводы с французского, немецкого, китайского, японского языков. Встал вопрос о создании единого языка-посредника, на который и с которого можно было бы переводить любой язык мира. Ведь такой язык гораздо выгодней, чем составление отдельных программ перевода с каждого конкретного языка на другой конкретный язык (для двух языков нужны две различные программы перевода, скажем, с русского на английский и с английского на русский; для четырех языков таких программ нужно будет двенадцать, для двадцати — около трехсот, а так как число языков мира достигает нескольких тысяч, то число переводческих программ с каждого языка на каждый достигнет астрономически больших величин).
В качестве языка-посредника предлагались самые распространенные языки мира, например английский или русский. Были проекты использовать какой-либо из искусственных международных языков, вроде эсперанто (ныне разработано несколько сотен подобных языков-посредников). Ленинградский лингвист Н. Д. Андреев предложил включать в язык-посредник только самые типичные, самые частые грамматические правила и слова, общие большинству языков мира. Такой язык-посредник будет представлять некое статистическое среднее этих языков. Есть и другая точка зрения: язык-посредник — это лишь система соответствий между различными языками мира, равнозначных друг другу слов и словосочетаний, а в материальной форме такой язык может и не существовать…
Проблема создания языка-посредника оказалась тесно связанной с не менее важной проблемой специального языка для информационно-логических машин. Потребность в таких машинах с каждым годом ощущается все острее. Ибо с каждым годом неудержимо нарастает лавина информации, которая обрушивается на современного человека. Особенно это относится к науке и технике. В конце концов мы можем и не знать о том, как сыграли футболисты «Спартака» или сколько градусов мороза нынче в Антарктиде, — ущерб от этого невелик. А вот ущерб от незнания научных или технических новинок может исчисляться миллионами рублей и годами потраченного напрасно труда. Читать же всю литературу, выходящую даже по его прямой специальности, инженер или ученый в наши дни просто не в состоянии.