KnigaRead.com/

Александр Кондратов - Звуки и знаки

На нашем сайте KnigaRead.com Вы можете абсолютно бесплатно читать книгу онлайн Александр Кондратов, "Звуки и знаки" бесплатно, без регистрации.
Перейти на страницу:

«Очень» указывает на высокую степень того или иного признака предмета, но без сравнения его с другими предметами, которые обладают теми же признаками. Здоровье может быть крепким, и дружить можно крепко, а интересоваться— глубоко. Вторая категория — «большое количество» — указывает на увеличение объема. Выбор может быть широким, информация — обширной, ограбление — групповым, вред — огромным. Третья — «активность» — связана с интенсивностью того или иного процесса. Работать с душой можно и не активно, а вот работать не покладая рук — это значит трудиться активно. Выражение «огромная энергия» подчеркивает количество этой энергии, а «кипучая энергия» — ее активность.

Категорию «длительность» легко понять, если в качестве примера привести выражения «продолжительные аплодисменты», «старая дружба», «смеяться до упаду», «любовь до гроба», «древние традиции» и т. п. Наконец, последняя рубрика — «выделение в своем классе» — указывает на то, что смысл выделяется из такой же смысловой группы особым подчеркиванием: оборудование бывает уникальное, урожай — рекордным, красота — необыкновенной и бежать можно изо всех сил…

ЯП, МП, ИЯ

Вероятно, теперь вы и сами поняли, как трудно, а порой просто невозможно описать в терминах, понятных ЭВМ, всю нашу сложную и нелинейную систему значений. И тем не менее система существует, иначе человек не смог бы понимать человека и ни один ребенок не смог бы обучиться родному языку, не говоря уже об иностранных.

Что же получается в итоге? Человек, решив передать машинам механическую работу, обнаружил, что, казалось бы, самые обыденные дела, вроде разговора, требуют таких сложных алгоритмов, таких тонкостей, о которых не догадывались даже лучшие умы прошлых веков.

И все-таки машины нужны для перевода! Современный мир, говорят ученые, сам по себе напоминает огромную переводческую машину, работающую со все увеличивающейся скоростью. Каждый день с печатных станков сходит около шестидесяти переведенных книг, открывается три или четыре международные встречи, выпускается на экран несколько дублированных фильмов; пишущие машинки печатают, а дикторы оглашают несчетное количество переведенных страниц; бесконечное число документов переводится в самом разнообразном виде с одних языков на другие.

Но для того, чтобы включить в гигантскую «переводческую машину», которой является наш современный мир с его несколькими тысячами языков, ЭВМ, мы должны прежде всего разобраться, хотя бы приблизительно, в работе нашей собственной «вычислительной машины» — мозга, причем под определенным углом зрения — лингвистическим. Не инженер, а лингвист должен найти формулы языка, алгоритмы нашего повседневного чуда — языка, которое предстает перед нами каждый день и каждый миг. Задача же эта необычайно сложна и трудна.

Причем на пути ученых встают трудности самого различного характера: технические, лингвистические, логические. Предположим, что нам удалось решить проблемы смысловых множителей, разложить любое слово на отдельные «атомы смысла», его составляющие. Сколько же слов понадобится вводить в память машины?

Мы уже говорили, что словари таких развитых языков, как русский или английский, включают около полумиллиона слов. Но ведь есть еще и так называемые фразеологизмы, непереводимые буквально выражения, идиомы. Их в языке много тысяч. Добавьте к ним также десятки тысяч специальных терминов, в словари литературного языка не вошедших. А такой развитой терминологией обладают все науки, будь то химия, медицина, электроника или сама лингвистика («Словарь лингвистических терминов» О. С. Ахмановой включает семь тысяч единиц, а в него вошли далеко не все термины современной науки о языке, например, нет в словаре ни «инженерной лингвистики», ни «нейролингвистики», то есть целых дисциплин, имеющих свою собственную терминологию!). Так что общее число слов будет, пожалуй, превышать миллион. А ведь к ним надо прибавить еще правила грамматики и программы, объем которых составит не менее трети машинной записи словаря!

Это, так сказать, трудность чисто техническая. Не за горами то время, когда ЭВМ будут обладать памятью, достаточно большой, чтобы вместить всю эту информацию. Но здесь встает следующая проблема — проблема времени. Для ввода одного слова в ЭВМ, снабженного всеми нужными признаками, смысловыми и грамматическими, необходим день работы одного исполнителя. Значит, чтобы ввести миллион слов в ЭВМ, нужен один миллион человеко-дней или тридцать лет работы коллектива, состоящего из ста человек.

Эта проблема, в свою очередь, порождает проблему, которую называют «парадоксом Ахиллеса и черепахи». Парадокс этот известен со времени античности: может ли быстроногий Ахиллес догнать черепаху, если в каждый конкретный момент времени черепаха также продвигается вперед? Если следовать правилам логики, Ахиллесу ее никогда не догнать! Не получится ли сходная ситуация и при машинном переводе: информация, заложенная в ЭВМ, будет устаревать к тому моменту, когда начнется практическое применение «электронного мозга?» Ведь слова, как известно, меняются со временем. И никакому Ахиллесу-роботу не догнать наш неспешный, но постоянно изменяющийся язык-черепаху…

Более того, слова не являются, строго говоря, отдельными изолированными единицами языка. Смысл их связан со смыслом других слов, все слова как бы прошиты незримыми нитями ассоциаций. Причем границы между этими связями нечетки, они как бы размыты. Приведем такой пример. В нашем языке есть группа прилагательных, относящихся к возрасту человека: детский, отроческий, юношеский, молодой, средних лет, пожилой, старый. Но попробуйте-ка четко и однозначно распределить смысл этих слов по строгой шкале лет, и вы убедитесь сами, насколько размыты границы между детским и отроческим, отроческим и юношеским, юношеским и молодым, молодым и средних лет, средних лет и пожилым, пожилым и старым у разных людей, в зависимости от их собственного возраста (вспомните журналиста из «Двенадцати стульев», считавшего стариком всякого, чей возраст превысил двадцать лет!).

Теория нечетких множеств — так называется новая область математики, одна из самых интересных и перспективных, которая родилась в связи с описанием языка. Ее аппарат начинает применяться и для машинного перевода, и для информационного поиска. А надежной точкой опоры становятся те холодные числа, данные статистики, о которых рассказывал наш первый очерк. И если первые опыты по машинному переводу были в полном смысле слова опытами, то в наши дни начинается промышленная эксплуатация МП.

Диалог продолжается…

Конечно, никто из ученых не пытается сейчас дать совершенный перевод с помощью машины, подобный переводу человеческому. И переводится не любой текст, а текст по какой-либо узкой специальности, например химии полимеров или низкотемпературной плазме. Но ведь именно такой подстрочный, так сказать, рабочий перевод текстов по специальности и необходим в первую очередь ученым, инженерам, техникам, работающим в той же химии полимеров или в области низкотемпературных плазм.

Первая в нашей стране промышленная эксплуатация МП была осуществлена в 1976 году в Чимкентском пединституте по заказу Института химии Академии наук Казахской ССР. ЭВМ системы «Минск» переводит английский текст длиной в тысячу слов, то есть около трех страниц, за двадцать — двадцать пять минут. И это, учитывая ввод текста в машину и вывод его из машины в виде отпечатанного русскими буквами перевода!

В конце 1977 года в Алмаатинском энергетическом институте проходила VII Всесоюзная конференция по генераторам низкотемпературной плазмы. Участвовали в ней и гости из других стран. Делегатам и гостям были вручены три компактные книжечки в красном переплете: англо-русский и русско-английский, французско-русский и русско-французский, немецко-русский и русско-немецкий словари-минимумы. Предназначены они для чтения научных текстов по плазме, а также для разговора с зарубежными коллегами. Автором же этих словарей была… вычислительная машина и, естественно, коллектив программистов и языковедов, составивших машинную программу. За три месяца ЭВМ проделала работу, на которую потребовалось бы несколько лет труда сектора научного учреждения.

Перед нами широкий лист бумаги. Вверху напечатан запрос: «Прошу определить общую тему документа». Далее следует французский текст статьи по технологии окраски. Внизу дается ответ на русском языке: «Документ относится к теме «электрофорез». Затем снова запрос: «Прошу дать машинный реферат документа». На него тут же дан развернутый ответ.

«В этом диалоге, казалось бы, нет ничего удивительного, — пишет профессор Р. Г. Пиотровский, руководитель группы «Статистика речи». — Именно таким образом сотни референтов-переводчиков ведут беседу со своими заказчиками. Однако приведенный текст представляет собой человеко-машинный диалог, в котором вопросы формулировал человек, а ответы на правильном русском языке без всякой подсказки выдавала машина. Учителями компьютера были языковеды, химики и математики из лаборатории инженерной лингвистики Ленинградского педагогического института имени А. И. Герцена и Кишиневского политехнического института».

Перейти на страницу:
Прокомментировать
Подтвердите что вы не робот:*