Марк Чангизи - Революция в зрении: Что, как и почему мы видим на самом деле
Рис. 12.
а) График частоты встречаемости геометрических элементов в изображениях природы (тот же, что и на рис. 11). б) Распределение встречаемости различных конфигураций линий в китайской письменности и в неязыковых визуальных знаках. Можно видеть, что форма графиков для этих логографических изображений в значительной мере совпадает с результатами, полученными для природных объектов. Это удивительно, ведь большинство этих символов не похоже ни на какие конкретные предметы реального мира, но не ошеломляет, поскольку все они в принципе стремятся к “предметоподобию”. Выражаю благодарность Чжан Цюну за нелегкий труд, позволивший получить часть приведенных здесь данных.
Рис. 13.
Наглядная иллюстрация того факта, что на буквах лежит “печать природы”. а) График частоты встречаемости различных геометрических элементов в изображениях природы (тот же, что на рис. 11 и 12а). б) Частота встречаемости различных конфигураций в алфавитном письме. Очевидно, что формы букв соответствуют контурам, встречающимся в природе. Буквы в алфавитных системах письма выглядят как элементы нашего естественного окружения! (Притом “печать природы” не обнаруживается в случайных линиях и в стенограммах.)
Рис. 14.
Та же схема, что и на рис. 5, но с добавлением слова, написанного буквами. Из данной иллюстрации можно видеть, до какой степени замечательно система алфавитного письма соответствует механизмам, при помощи которых зрительная система распознает окружающие нас предметы. Структура такого письма основывается на контуроподобных линиях, которые складываются в буквы, напоминающие составные элементы реальных объектов, а эти буквы, в свою очередь, объединяются в похожие на предметы слова. К подобным же умозаключениям пришли нейробиологи Станислас Деэн и Лоран Коан.
“Автограф” природы, обнаруженный нами, остается в силе повсюду, где имеются в изобилии непрозрачные предметы: хоть в африканской саванне, хоть в кампусе Политехнического института им. Ренсселера, где я теперь работаю, хоть на другой планете. Если среда обитания инопланетян тоже образована непрозрачными объектами, а инопланетная культура тоже создавала систему письма, приспособленную для удобства глаза, с большой вероятностью она пришла к письменности, похожей на ту, какой пользуемся мы. К примеру, в любой среде, изобилующей непрозрачными предметами, L- и T-пересечения будут встречаться чаще Х-пересечений. А вот если бы наш мир был сделан из тонированного стекла, то Х-пересечения встречались бы на каждом шагу и “росчерк” природы выглядел бы совершенно иначе.
Рис. 15.
Частота различных конфигураций контуров, встречающихся в человеческих знаковых системах и в картинах природы, представленная в виде линии регрессии. Из графика видно, что конфигурации, наиболее часто встречающиеся в природе, являются наиболее типичными и для знаковых систем. Под знаковыми системами в данном случае подразумевается совокупность данных для неязыковых символов, китайских иероглифов и алфавитной письменности, однако та же самая закономерность наблюдается и для каждой из этих знаковых систем в отдельности.
Homo turingipithecus
Осенью 2003 года (я был тогда сотрудником Калифорнийского технологического института) мне в голову пришла безумная мысль. Каждый из нас носит в черепной коробке фантастически мощный компьютер. И вот я подумал: разве не было бы здорово, если бы мы сумели как-нибудь подключиться к этой мощности? Например, такое простое дело, как зрение, основано на том, что зрительной части нашего головного мозга приходится совершать вычислительные операции поразительной сложности. И мало того, что ваш мозг проделывает бесчисленное множество таких операций в секунду, ни одну из них вы еще и не воспринимаете как работу. В отличие от мышления, когда мы “перемалываем” идеи одну за другой, зрение не требует усилий. Более того, множество очень сложных зрительных стимулов может обрабатываться одновременно: одна увиденная нами картина — это тысячи входных сигналов. Мне стало любопытно, нельзя ли программное обеспечение (программы, предназначенные для переработки информации) перевести в зрительные образы так, чтобы при взгляде на этот специальный “визуальный софт” зрительная система невольно производила необходимые вычисления и запускала программу. Такая картинка была бы одновременно и программным обеспечением, и входными сигналами, которые это программное обеспечение обрабатывает. Ваша зрительная система производила бы вычисления безо всяких усилий — в том смысле, что вы ничего особенного при этом не чувствовали бы, — и выдавала бы такое восприятие, которое содержало бы решение произведенных вычислительных операций. Ваше зрительное восприятие и было бы результатом. Иначе говоря, я задался следующим вопросом: можем ли мы обхитрить свою зрительную систему, загружая в нее программы и по собственному выбору запуская их? На первый взгляд замысел может показаться бредом, но это не больший бред, чем использовать ДНК для компьютерных вычислений — идея, которую Леонард Адлеман в 90-х годах заставил нас воспринять всерьез. Что звучит бредовее: вычисления, выполняемые мозгами, или вычисления, выполняемые цистернами с бульоном из ДНК?
После того, как меня осенила моя безумная мысль, я провел несколько месяцев, пытаясь создать “зрительное программное обеспечение”, однако дело почти не шло. Я даже предлагал сто долларов (и соавторство) любому из своих коллег по Калифорнийскому технологическому, кто смог бы предложить “зрительную микросхему” для вычисления простых компонентов цифровых схем, но безрезультатно. И лишь в конце 2007 года, когда я уже работал над этой книгой, стали намечаться некоторые успехи.
На рис. 16 приведен пример “зрительной микросхемы”. Цифровые микросхемы — важная разновидность вычислительных устройств, которая используется в калькуляторах, компьютерах, телефонах, практически во всей современной электронике. Они представляют собой совокупность так называемых логических вентилей, или гейтов, выполняющих простые логические операции: например, И-вентиль дает на выходе 1, только если каждый из входных сигналов представляет собой 1. Любой участок микросхемы — в том числе выход — всегда находится в одном из двух состояний: 0 или 1. В отличие от электронных микросхем, где используются металлы или полупроводники для кодировки состояний 1 и 0, зрительные микросхемы вроде той, что показана на рис. 16, опираются на неоднозначные зрительные стимулы (такие, которые, как и составляющие их компоненты, могут быть интерпретированы двояко). Любой участок контура на рис. 16 (за исключением точек ввода) может быть воспринят двумя разными способами: как наклоненный к вам или от вас. Этим вашим восприятием наклона и определяется состояние микросхемы, 1 или 0, в данной точке. Результат на выходе определяется тем, как вы воспринимаете наклон контура в специально обозначенной точке — в данном случае она расположена снизу. Точки ввода данных в зрительных микросхемах представлены однозначными стимулами, наклоненными либо определенно к вам (1), либо от вас (0). Один из двух таких входов на рис. 16 находится в состоянии 1, а другой — в состоянии о. Также в данной микросхеме содержится три типа логических вентилей: НЕ (переключающие состояние схемы с 1 на 0 или наоборот), И (которые выдают значение 1, только если оба входа находятся в состоянии 1) и еще вентиль ИЛИ (выводит 1, если хотя бы один из двух входов находится в состоянии 1). Вентили И, ИЛИ функционируют благодаря частичной прозрачности нарисованных элементов, делающей одну из двух возможных интерпретаций состояния микросхемы более вероятной. Например, вентиль внизу рис. 16 — это ИЛИ-вентиль (при беглом взгляде он кажется наклоненным к вам). Такое восприятие обеспечивают два частично просвечивающих отрезка в его левой части. Вся представленная схема является схемой типа “исключающее ИЛИ” — иными словами, она выводит 1 лишь в том случае, если один из входов находится в состоянии 1. Поскольку входы в данном случае имеют значения 1 и 0, на выходе получается 1. То есть в связи с тем, что один из входов изображен наклоненным к зрителю, а другой — от зрителя, люди, если подойдут к делу ответственно, будут воспринимать нижнюю часть схемы скорее как наклоненную к ним.
Рис. 16.
Пример того, что я называю "зрительной микросхемой”. Данный контур использует нашу зрительную систему для вычисления функции “исключающего ИЛИ” (XOR), то есть такой функции, которая дает на выходе 1 в том случае, если только один из входных сигналов является 1. Построена эта "микросхема” из неоднозначных зрительных стимулов, которые могут быть восприняты двумя четко различимыми способами: как повернутые к вам или от вас. В любой точке схемы значение сигнала, 0 или 1, зависит от вашего восприятия. Если вам кажется, что какая-то часть контура повернута “от вас”, значит, здесь значение сигнала о; если же она повернута "к вам”, значение сигнала 1. Вывод данных производится в нижней части: результат действия всей схемы в целом определяется вашим восприятием рисунка в данной точке. Моя “микросхема" состоит из “проволоки” (прямоугольный орнамент), инверторов (НЕ-шлюзов, в которых происходит переключение состояния контура из положения “к вам" в положение “от вас" или наоборот), И-шлюзов, где выход в нижней части воспринимается как положение “к вам" только в том случае, если оба верхних входа воспринимаются повернутыми “к вам”, ИЛИ-шлюза, выход из которого обычно воспринимается как положение “к вам", если хотя бы один из верхних входов воспринимается повернутым “к вам”. В приведенном примере входами данной “микросхемы” являются непрозрачные параллелепипеды в верхней части рисунка: их положение недвусмысленно, они всегда либо 1 — повернуты “к вам", либо о — “от вас”. Изображенный контур чаще дает на выходе 1 (“к вам"), чего и следует ожидать от микросхемы с такими входными данными. Для того чтобы зрительная система на самом деле могла производить подобные вычисления, вы должны следовать взглядом по микросхеме от входов до выхода, не смущаясь тем, что в некоторых точках контур будет “переключаться”, меняя конфигурацию, как в эшеровских фантазиях, из-за чего на выходе в принципе может получиться о. (На идею представленной здесь разновидности НЕ-шлюзов меня вдохновил Брам ван Хувельн.)