Евгений Ищенко - Двуликий электронный Янус
В 1994 году американский исследователь Питер Шон подсчитал, что квантовый компьютер вычислит факториал тысячезначного числа всего за несколько часов. В то время как несколько сотен обычных компьютеров потратили бы на эту задачу 1025 лет. Для справки: возраст Вселенной – 1010 лет. Впечатляет?
Быстрыми темпами идет и миниатюризация компьютеров. Так, 33-летний X. Шрикумар, специалист по автоматическим системам из Массачусетского университета (США), в 1999 году создал компьютер величиной с таблетку аспирина. Его мини-компьютер запрограммирован на работу в глобальной сети Интернет, а также способен управлять домашними электроприборами и аппаратурой. Мини-компьютер, вмонтированный в соответствующие устройства, может в нужное время сварить кофе, записать телепередачи на видеомагнитофон и даже самостоятельно включиться в компьютерную сеть. Он состоит из миниатюрного процессора и чипа электронной памяти, куда поступают данные из Интернета.
Шрикумару удалось собрать свой мини-компьютер из деталей, купленных в магазине. Общая стоимость «таблетки» оказалась равной 98 центам. Это почти в 800 раз дешевле аналогичного мини-компьютера, созданного незадолго до этого инженерами Стенфордского университета. Ай да Шрикумар, настоящий компьютерный Кулибин!
Обычно данные вводятся в компьютер через клавиатуру. Еще в 1985 году одна американская компания предлагала использовать для этой цели эластичную перчатку. Снабженная датчиками, соприкасаясь с ладонью, кистью, фалангами и кончиками пальцев, она преобразует движения руки в различные комбинации электрических сигналов. За каждой буквой алфавита, цифрой и знаком препинания закреплен определенный жест. Освоив этот язык жестов, оператор уверенно вводит данные в компьютер, перебирая пальцами в воздухе. Так можно и печатать на электронной пишущей машинке, то бишь клавиатуре.
А в 1993 году появилось устройство, могущее трансформировать «живую» речь человека в компьютерный язык и через несколько секунд распечатать ее в машинописном виде.
Закрепленный на голове монитор, выпущенный германской компанией Круппа еще в 1990 году, открывает широкие перспективы в сфере телекоммуникации. Система, позволяет вести активный диалог между компьютером и человеком. Компьютер получает от человека устные (!) команды, а отвечает визуальной информацией на экране монитора, сопровождая ее словесными комментариями. Это уже диалог почти на равных.
А вы, дорогой читатель, сняв телефонную трубку, наберите цифру «100». Приятный голос с едва заметным металлическим акцентом мгновенно ответит, назвав точное время. И уже никого из нас не удивляет, что ему отвечает компьютер. Напомню, что «говорящие часы» разработали в 1987 году сотрудники Научно-исследовательского института радио. В каждый из моментов времени компьютер выбирал нужную микросхему, считывал ее содержание, преобразуя машинный язык в человеческий голос.
Уже стало привычным, что компьютеры «разговаривают». В ряде случаев они оснащаются синтезаторами речи; многим знаком «металлический» голос компьютера, отвечающего на вопрос или что-то напоминающего. Проблема создания «говорящих» ЭВМ оказалась более простой, чем их обучение «пониманию» человеческой речи и исполнению устных команд. Но и в этой области достигнуты обнадеживающие результаты. Так, в США еще в 1991 году создали программу для компьютера, позволяющую ему «читать по губам», т. е. понимать речь человека по движению его губ. Подобные устройства могут существенно облегчить работу и быт людей, а потому заслуживают широкого распространения.
Компьютеры, которые могут говорить и выполнять отданные им устно распоряжения, уже не новинка. Есть компьютеры, способные разговаривать и слушать. Собрав необходимую информацию, ЭВМ обращается к своей памяти и начинает поиск нужных сведений. Техника голосовой связи с компьютером включает синтез речи и выполнение голосовых команд, но первая задача проще. Искусственная речь образуется благодаря специальной системе, которая способна накапливать в памяти звуки, входящие в состав слов (так называемые фонемы), и различные правила их комбинаций. В нужный момент информация, поступающая из памяти, преобразуется в звуки, имитирующие человеческий голос.
Системы речевого синтеза применяются сейчас во многих областях. Фотоаппарат «Токер», например, приятным женским голосом советует, как использовать вспышку или выбрать правильное расстояние при фотографировании. Компьютер «Амиго» способен громким голосом читать текст, появляющийся на его экране. Есть модели наручных часов, сообщающих время. Всего не перечислишь.
Не следует, однако, думать, что эта техника используется только в какой-либо бытовой аппаратуре. Можно привести примеры ее промышленного применения. Система с синтезированием речи входит в состав телефонной справочной службы Нью-Йорка. Работает она следующим образом: когда поступает запрос о номере телефона, оператор с помощью ЭВМ находит нужный номер и включает механизм искусственного голоса, дважды сообщающий его запрашивающему. Сам же оператор в это время обслуживает уже другого абонента. Это сокращает время операции на 5—10 секунд. Такая система позволяет каждому работнику в течение смены ответить на 20–25 % запросов больше.
Техника опознавания голоса оказалась намного сложнее. Чтобы научить компьютер «понимать» живую речь, слова нужно преобразовать в цифровой код. Любое слово должно быть закодировано с помощью комбинаций цифр «0» и «1», которые вводятся в память машины. Когда ЭВМ получает какую-либо голосовую команду, она преобразует ее в цифровые комбинации и сопоставляет с хранящимися в памяти. Если там находится эквивалент, то компьютер выполняет действие, предусмотренное командой.
В США уже давно используются машины, способные выполнять некоторые простые устные приказы. В аэропорту Чикаго, например, при сортировке багажа громко произносится название аэропорта назначения, и чемоданы автоматически подаются куда надо. Абоненты одной из телефонных сетей производят вызовы без набора номеров. Они говорят: «Соедините с квартирой» или «Дайте контору», и номер, записанный в памяти ЭВМ, набирается автоматически. Похожим образом действуют сейчас даже некоторые модели мобильных телефонов.
«Говорящие» компьютеры, применяемые британской авиацией, обычно отдают приказы мужским голосом. Однако в экстремальных случаях, когда грозит опасность, команды передаются женским голосом. Психологи еще в 1988 году установили, что в трудных случаях мужчины быстрее реагируют именно на голос женщины. Может, он звучит убедительнее или вызывает меньшее отторжение?
Некоторые автомобильные компании еще в середине 80-х годов прошлого века начали производить «говорящие» автомобили, способные сообщать водителю данные о расходе бензина, утечке масла или перегреве двигателя. В настоящее время специалисты продолжают усовершенствовать автомобили, способные воспринимать голос владельца. Выпущены экспериментальные модели, оборудованные блокирующими устройствами рулевого колеса, запоров и стеклоочистителей, которые начинают функционировать лишь по команде владельца, образец голоса которого заложен в память бортового компьютера.
Но абсолютная «верность» автомобиля голосу владельца – это одновременно и преимущество, и недостаток. Система предохраняет автомобиль от угона, но и не позволяет сесть за руль никому другому, даже друзьям, родственникам и сторожам автостоянок, вынужденным иногда переставлять автомашину без ведома владельца, освобождая проезд.
Если непросто создать ЭВМ, способную воспринимать слова, произносимые различными людьми, то еще труднее научить ее «понимать» сложные фразы. Для этого необходимо запрограммировать работу компьютера таким образом, чтобы он мог разбираться во всех тонкостях человеческой речи со всем разнообразием акцентов и интонаций. Это исключительно сложно. Даже во фразе, произнесенной одним человеком, приходится иметь дело не только с такими понятиями, как диапазон и каденция голоса, но часто и с таким явлением, как слияние двух слов, следующих одно за другим. Кроме того, ЭВМ должна отфильтровывать и отбраковывать разные непроизвольно вырывающиеся звуки и бормотание, внешние шумы, чихание, кашель.
Специалисты активно решают эти проблемы. В стадии доработки находится метод, позволяющий компьютеру модифицировать незнакомую ему цифровую комбинацию слова до тех пор, пока он не найдет в своей памяти «нечто подобное». Такая техника была использована одной из калифорнийских компаний при конструировании автоматической пишущей машинки. Процессор этой машинки запрограммирован таким образом, что он может создавать фонетическое приближение любого слова, не входящего в его словарный состав. В результате машинка очень недурно и совершенно самостоятельно печатает под диктовку.