Коллектив авторов - Теории всего на свете
Основная идея классического (павловского) условного рефлекса состоит в том, что нейтральный стимул (к примеру, звук приближающихся шагов) начинает ассоциироваться со стимулом (скажем, пищей), который вызывает рефлекторную реакцию (скажем, выделение слюны). Спустя некоторое время этот нейтральный стимул уже сам по себе вызывает отклик, который рефлекторно возникал под действием парного к нему стимула (раздражителя). Чтобы явление было понятнее, нужно сказать несколько слов о терминах. Упомянутый нейтральный стимул становится «условным», вот почему его так и называют – условным стимулом, тогда как стимул, вызывающий рефлекторную реакцию, называется безусловным. Отклик, вызванный безусловным стимулом, называется безусловным рефлексом. Классический условный рефлекс (классическое обусловливание) возникает, когда условный стимул представляется непосредственно перед безусловным, так что через какое-то время условный стимул сам по себе дает отклик – реакцию, которая называется условным рефлексом. Короче говоря, появление безусловного стимула (такого, как пища) дает безусловный рефлекс (скажем, слюноотделение); когда условный раздражитель (например, звук шагов того, кто приносит корм) представлен незадолго до безусловного раздражителя, он вскоре сам начинает порождать тот же отклик – теперь уже условный рефлекс (слюноотделение).
Этот несложный процесс дает возможность сформулировать целый ряд изящных объяснений, не являющихся интуитивно-очевидными.
Возьмем, к примеру, случайную гибель от передозировки наркотиков. Обычно наркоман склонен принимать свою отраву в определенной обстановке – скажем, у себя в ванной. Сама по себе эта обстановка является нейтральным стимулом, но после того, как в ней кто-нибудь несколько раз употребит свое зелье, ванная комната начнет выполнять функцию условного стимула: едва наркоман входит в ванную с наркотиком, его организм откликается на эту обстановку, готовясь усваивать препарат. Определенные физиологические реакции позволяют организму худо-бедно справиться с наркотиком, и эти реакции становятся «обусловленными» ванной – иными словами, становятся условным рефлексом. Теперь, чтобы как следует «заторчать», наркоман вынужден вводить себе такую дозу наркотика, чтобы она превозмогла эту подготовку, заранее предпринятую организмом. Но если бедняга принимает наркотик в другом месте (скажем, в ванной своего друга во время вечеринки), условный рефлекс не проявится, т. е. привычная физиологическая подготовка к приему наркотика не произойдет. Поэтому обычное количество наркотика подействует как более серьезная доза – возможно, превышающая ту, которую наркоман может выдержать без предварительной подготовки, осуществляемой его организмом. И хотя процесс классического обусловливания был описан для объяснения совсем других явлений, можно применить это описание и для того, чтобы объяснить, почему наркотическая передозировка происходит иногда случайно, когда привычная доза принимается в новой обстановке.
Сходным образом классическое обусловливание играет роль и в возникновении эффекта плацебо. Многие из нас регулярно принимают анальгетики (скажем, ибупрофен или аспирин). Эти вещества порой начинают давать эффект задолго до того, как вступят в действие их активные компоненты. В чем причина? В опыте предшествующего приема лекарства. Сам акт приема таблетки становится условным стимулом, который запускает процессы обезболивания, вызываемые собственно препаратом (эти процессы становятся условным рефлексом).
Классическое обусловливание может возникать и в результате применения кардиостимулятора (искусственного водителя сердечного ритма). Когда сердце начинает биться слишком часто, устройство подает на него электрический разряд, что заставляет орган сокращаться с нормальной скоростью. Пока сила разряда не откалибрована как следует, такой разряд может быть весьма болезненным и вести себя как безусловный стимул, вызывая страх – безусловный рефлекс. Поскольку в обстановке «стабильности» разряд не дается, пациент ассоциирует с ним разного рода случайные элементы обстановки, которые затем начинают действовать как условные раздражители. И когда появится любой из этих элементов, пациент будет испытывать острое, тревожное состояние, ожидая возможного разряда.
Тот же процесс объясняет, почему какой-то продукт кажется вам непривлекательным после того, как вы им отравились. Продукт может стать условным стимулом, и если вы затем его едите или даже думаете о том, чтобы его отведать, не исключено, что вы начнете чувствовать тошноту: так проявляется условный рефлекс. Скорее всего, вы начнете избегать этого продукта, и в результате у вас разовьется отвращение к нему. Собственно, даже просто совместный показ изображений определенных видов пищи (скажем, картофеля, поджаренного во фритюре) и фотографий, вызывающих омерзение (скажем, ужасно обожженного трупа), может изменить восприятие данного продукта, сделав его гораздо менее привлекательным.
Таким образом, открытие Павловым процесса выделения «слюны ожидания» легкоприменимо к широкому ряду явлений. При всем при том следует отметить, что его первоначальная концепция классического обусловливания оказалась все же не совсем верной. Он полагал, что поступающий в организм сенсорный сигнал напрямую связан с определенными реакциями, поэтому раздражители вызывают отклик автоматически. Теперь нам известно, что здесь не такая прямая связь: классическое обусловливание включает в себя множество когнитивных процессов, в том числе концентрацию внимания, а также процессы, лежащие в основе интерпретации и понимания. В сущности, классическое обусловливание – форма неявного обучения, позволяющая нам ориентироваться в жизни, затрачивая меньше когнитивных (познавательных) усилий, чем потребовалось бы, не обладай мы способностью к выработке условных рефлексов. Однако такая разновидность обусловливания имеет и побочные последствия, которые могут оказывать весьма мощный, неожиданный, а подчас даже и опасный эффект.
Природа умнее нас
Теренс Дж. Сейновски
Специалист по вычислительной нейрофизиологии, профессор Института Солка; автор книги The Computational Brain («Мозг-вычислитель»)
Мы полагаем, что важнейшие решения в нашей жизни – какую работу выбрать, где жить, на ком жениться – мы принимаем сознательно. Однако целый ряд свидетельств, полученных биологами, указывает на противоположное: процесс принятия решений происходит в древней системе мозга, именуемой базальными ядрами, и в их мозговые цепи наше сознание доступа не имеет.
Научный путь, приведший к такому выводу, начался с исследования пчел. Рабочие пчелы летят на весеннее поле за нектаром, который они идентифицируют по цвету, запаху и форме цветка. Цепь обучения в пчелином мозгу замыкается на VUMmx1 – единичный нейрон: он получа ет сенсорный сигнал, а чуть позже – сообщение о степени ценности нектара, таким образом учась предсказывать нектарную ценность данного цветка в следующий раз, когда пчела с ним встретится. Эта отсрочка играет важную роль. Здесь важнее всего именно предсказание, а не просто ассоциация. Та же идея является стержнем темпорально-дифференциального (ТД-) обучения, которое включает в себя освоение последовательности решений, приводящих к определенной цели, и особенно эффективно в нестабильных и ненадежных средах – скажем, в мире, где мы живаем.
В глубине среднего мозга у нас таится небольшой набор нейронов, который имелся и у наших самых ранних позвоночных предков; он подает сигналы и корковой мантии, и базальным ядрам. Нейроны эти вырабатывают нейротрансмиттер под названием допамин: он оказывает огромное влияние на наше поведение. Допамин именуют «молекулой вознаграждения», но еще важнее награды способность этих нейронов предсказывать награждение: насколько я буду рад, если получу эту работу? Допаминовые нейроны, играющие центральную роль в мотивационных процессах, реализуют ТД-обучение – как и нейрон VUMmx1.
ТД-обучение решает проблему отыскания кратчайшего пути к цели. Этот алгоритм действует в реальном времени, поскольку обучение происходит посредством непрерывного исследования и посредством выявления ценности промежуточных решений на пути к цели. При этом создается некая «функция внутренней ценности», которую можно использовать для предсказания последствий действий. Допаминовые нейроны оценивают текущее состояние всей коры в целом и сообщают мозгу, каков оптимальный план действий, исходя из текущего состояния. Во многих случаях оптимальным вариантом является догадка, но поскольку эффективность догадок можно улучшать, ТД-обучение со временем вырабатывает функцию ценности прогностических возможностей. Допамин служит источником «нутряного предчувствия», которое у нас иногда бывает: из этого вещества и делается интуиция.