Иллюзия себя: Что говорит нейронаука о нашем самовосприятии - Бернс Грегори
Согласно этой теории, мы не только ощущаем контрфактические исходы как относительное количество сожаления и торжества, но и принимаем решения в расчете на минимизацию будущего сожаления.
Чтобы выяснить, участвуют ли в возникновении сожаления, а также в его прогнозировании нейронные сети и если участвуют, то какие именно, было проведено несколько исследований с использованием нейровизуализации. В 2004 г. группа сотрудников Национального центра научных исследований из французского Брона[20] проверила предположение, что критическую роль в сожалении играет орбитофронтальная область коры головного мозга{165}. Участникам исследования необходимо было принимать решения, связанные с игрой в рулетку, – только выбирать в данном случае предлагалось не число для ставки, а одну из двух предъявляемых рулеток. В контрольной группе организаторы затем крутили оба колеса, но сообщали выпавшее число только для колеса, выбранного участником. В экспериментальной группе («сожаление/торжество») точно так же крутили оба колеса, но сообщали, кроме того, что именно выпало на колесе, не выбранном испытуемым. В конце каждой попытки участники оценивали свои ощущения. Членов контрольной группы обычно радовал даже небольшой выигрыш. А вот у членов экспериментальной группы радость сменялась сожалением, если оказывалось, что они могли выиграть больше. Всё в полном соответствии с теорией сожаления: лучший контрфактический результат превращает реальный положительный исход в отрицательный. Затем исследователи протестировали небольшую группу больных, перенесших инсульт с поражением орбитофронтальной области коры. Примечательно, что у этих больных никаких признаков сожаления не обнаружилось. Их оценка ощущений была одинаковой, независимо от того, видели они альтернативный исход или нет. Еще в одном эксперименте с участием нормотипичных испытуемых исследователи проводили после выбора из двух рулеток фМРТ-сканирование и установили, что при сожалении орбитофронтальная область коры действительно активна{166}.
Аналогичные результаты получил при использовании фМРТ и нейробиолог из Медицинского колледжа Бейлора в Хьюстоне Рид Монтегю. Участники эксперимента, проведенного его научной группой, играли в инвестиции: во время нахождения испытуемых в томографе им показывали фрагменты прошлых биржевых сводок с реальными ценами акций{167}. Затем им давали сыграть на бирже, после чего сообщали, что происходило с рынком и, соответственно, остался участник в выигрыше или проиграл. Ретроспективную разницу между лучшей ставкой и действительной ставкой группа Монтегю назвала «фиктивной ошибкой». Вооружившись этим уравнением, исследователи выяснили, что хвостатое ядро, связанное с орбитофронтальной корой и играющее центральную роль в системе вознаграждения мозга, содержит сигналы как для реального вознаграждения, так и для фиктивного, в форме контрфактических результатов.
Кроме того, у нас накапливаются свидетельства того, что некое подобие сожаления испытывают и другие животные{168}. Нейробиолог из Миннесотского университета Дэвид Редиш использовал в своих экспериментах «череду ресторанов для крыс», как он это назвал. Сооружение представляло собой кольцевую дорожку, от которой отходили в разные стороны четыре перекладины. На край каждой из них подавали корм с определенным вкусом – банан, вишня, шоколад – и безвкусный. Когда крыса заходила на ту или иную перекладину, проигрывалась мелодия с ежесекундным понижением высоты звука. Если крыса до завершения такого музыкального обратного отсчета оставалась на месте, она получала в награду корм. Если же она выходила из зоны, доступ к корму для нее закрывался. Нетерпеливая крыса, решавшая уйти, не дожидаясь любимой пищи, обнаруживала порой, что на следующей перекладине ей приходится ждать еще дольше, причем еда будет уже не столь вкусная. В таких случаях грызуны часто оглядывались на предыдущий и уже недоступный участок. И как установил Редиш, в подобные моменты отмечалась высокая активность нейронов в орбитофронтальной коре и хвостатом ядре крысиного мозга – точно такая же, как у человека, испытывающего сожаление. Эти результаты позволяют предположить, что крысы, как и мы, строят симуляционную модель того, что могло бы быть{169}.
Что все это означает? Результаты изучения мозга как у человека, так и у крыс позволяют предположить, что в ходе эволюции мозг млекопитающих активно подталкивали к рассмотрению контрфактических исходов. В чем преимущество этой способности, понять нетрудно: она позволяет животному учиться не только на сделанном выборе, но и на гипотетически вероятных случаях. В мозге изначально заложена способность представлять себе всю мультивселенную параллельных «я». Поэтому лучше считать сожаление не каким-то сугубо человеческим отклонением, а закономерным итогом долгой эволюционной истории принятия решений. Сожаление испытывают животные всех видов, располагающиеся ниже нас на древе жизни. Те, кто не испытывал, давно вымерли.
Эволюция отбирает только те процессы, которые способствуют выживанию, но сожаление – это по самой своей природе эмоция, обращенная в прошлое. Тем не менее страдания по былому помогают нам лучше строить будущее. И мы, и другие животные учимся на своих ошибках, чтобы их не повторять. Особенно действенно контрфактическое научение, когда выбор может оказаться роковым. В таких случаях гораздо полезнее смоделировать последствия мысленно, чем проверять на себе!
И здесь я снова вспоминаю о той аварии, в которую угодил подростком, когда ехал на велосипеде. Как я уже говорил в шестой главе, это воспоминание диссоциировано и в нем я наблюдаю происходящее словно со стороны. А еще я точно так же, словно со стороны, вижу, чем бы все закончилось, если бы я катил чуть быстрее или если бы водитель не выкрутил руль в последнюю секунду. Как наяву, живо и реалистично, я вижу себя размазанным по радиаторной решетке фуры. Очень впечатляющее контрфактическое зрелище. До сих пор, почти 40 лет спустя, этот фиктивный сигнал, отчеканенный в моем мозге, заставляет меня, когда я еду на велосипеде, не спускать глаз с грузовиков, даже если они движутся по встречной полосе. В каждую свою велосипедную вылазку я изо всех сил стараюсь не оказаться снова в такой поворотной точке. Мне не пришлось взаправду размазываться по капоту фуры, чтобы это усвоить. Так что контрфактическое научение и в самом деле мощная штука.
Гипотеза, согласно которой способность к сожалению выработалась у животных в ходе эволюции как дающая преимущество для выживания, кажется вполне убедительной, однако конкретные свидетельства в ее пользу отыскиваются с трудом. Тем примечательнее, что адаптивную ценность индивидуального сожаления подтверждают новейшие данные из области развития искусственного интеллекта. Один из популярных в информатике способов проверки алгоритмов – турниры. Эти состязания обеспечивают гиперускоренную среду для эволюции, в которой выигравшие отбор продвигаются дальше, а проигравшие молниеносно отбраковываются. В число таких состязаний входит и Ежегодный компьютерный турнир по покеру. Покер – игра с неполной информацией, то есть участник ни разу за весь раунд не получает данных в желаемом объеме, поскольку какие-то карты скрывают от него другие игроки. Такие игры обычно даются компьютеру хуже, чем шахматы – игра с полной информацией, где каждый ход делается в открытую.
Вскоре после первого Компьютерного турнира по покеру в 2006 г. группа специалистов в сфере информатики из Альбертского университета Канады представила новый алгоритм, основанный на «контрфактической минимизации сожаления», или CFR[21]{170}. Вместо того чтобы пытаться смоделировать все возможные деревья решений для игры, как делают шахматные алгоритмы, с CFR компьютер внутренне играет сам с собой. В этих симулируемых играх он ищет стратегии, позволяющие минимизировать сожаление, определяемое как разница между фактически произошедшим и тем, что могло бы произойти. Алгоритм CFR не нацелен на то, чтобы найти решение для всех возможных исходов. Он просто делает выборку из пространства стратегий и определяет среднюю величину сожаления, связанную с каждой из них. Это очень эффективно. Здесь не требуется идеальной точности, и памяти для CFR нужно немного, поскольку результаты хранятся в сжатом формате – в виде средних показателей. Разные версии CFR стабильно выигрывали турнир, а его улучшенная и дополненная версия, CFR+, одолела даже техасский холдем, в котором приходится чаще блефовать или идти ва-банк{171}.