Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич
В 1983 г. Освальд Стюарт и Уильям Леви исследовали [1632] влияние на синаптическую пластичность относительной синхронизации в пределах нескольких миллисекунд потенциалов пре- и постсинаптического действия. Для этого они взяли два нервных пути, оканчивающихся в одном постсинаптическом нейроне, — «слабый» и «сильный», то есть с меньшей эффективностью и с большей, — и вызывали в них стимулы, варьируя время вызова импульса. Хотя им и удалось обнаружить в опытах существенную асимметрию: активация слабого нервного пути раньше сильного вызывала ДВП в слабом нервном пути, в то время как активация сильного нервного пути раньше слабого вызывала ДВД в слабом нервном пути, но авторы, как и многие другие исследователи в 1980-е гг., не усмотрели в этом явлении системы.
В 1990 г. немецкий исследователь Вольф Зингер и его коллеги сообщили [1633], что наступление ДВП или ДВД обусловлено гиперполяризацией или деполяризацией постсинаптического нейрона (напомним, что гиперполяризация — это смещение мембранного потенциала относительно потенциала покоя в более отрицательную сторону, а деполяризация — в положительную). ДВП происходит, если после стимуляции мембранный потенциал постсинаптического нейрона не достигает определённого порога («критический уровень деполяризации»), а ДВП происходит, если данный порог достигается, ввиду чего происходит последующая гиперполяризация.

Это исследование привлекло внимание к более пристальному изучению постсинаптического нейрона, поскольку именно его мембранный потенциал является ключевым для ДВП или ДВД, которые необязательно зависят от поступления сигнала через входящий синапс [1634]. Четырьмя годами спустя Доминик Дебанн и его коллеги сделали [1635] ещё один шаг вперёд: они вначале направляли деполяризующие импульсы тока непосредственно в постсинаптический нейрон, меняя его мембранный потенциал, а потом стимулировали нервный путь. Их исследования показали, что при небольшой разнице по времени между искусственной деполяризацией и входными импульсами происходит ДВП, а при большой — ДВД. Это добавило к исследованию Зингера тот факт, что именно уровень деполяризации и гиперполяризации, вызванный каким-либо образом (даже искусственно), и определяет направление синаптической пластичности.
Наконец, в 1991 г. Роберто Малиноу провёл завершающее исследование. Он смог в тонком срезе гиппокампа выделить четыре пары пирамидальных нейронов CA3 и CA1, каждая из которых была связана через единственный синапс. Затем он, одновременно вызывая серии импульсов в пре- и постсинаптическом нейронах, получил ДВП в этих соединениях [1636]. Эта работа стала первой (спустя более сорока лет после выхода в свет ключевой работы Хебба!) прямой демонстрацией того, что синаптические связи между двумя нейронами могут изменяться, ведь здесь удалось полностью исключить влияние на ход эксперимента сторонних воздействий.
В наши дни продолжается активное изучение биологических механизмов, лежащих в основе ДВП и ДВД. В частности, учёные вырабатывают подходы, позволяющие рассчитывать эффективность каждого отдельно взятого синапса на основе данных микроскопии [1637], [1638], [1639].
Важной вехой в истории изучения механизмов ДВП и ДВД стало выступление Генри Маркрама на ежегодном собрании Общества нейронаук (Society for Neuroscience) в 1995 г. В ходе этого выступления Маркрам рассказал научной общественности о первом экспериментальном исследовании [1640], показавшем, что ДВП и ДВД зависят от разницы во времени возникновения одиночных импульсов, испускаемых пре- и постсинаптическими нейронами в моносинаптических связях между парами нейронов неокортекса. Водораздел, задаваемый относительной синхронизацией отдельных импульсов на временно́м масштабе в несколько десятков миллисекунд, определял направление (потенциация или депрессия) и степень изменения эффективности синаптической связи. Именно это выступление Маркрама (ныне директора Blue Brain Project и основателя Human Brain Project) стало моментом окончательного оформления STDP в качестве модели синаптической пластичности биологических нейронов и одновременно как алгоритма обучения импульсных нейронных сетей [1641], хотя сам термин STDP появился только в 2000 г. в работе [1642] Сена Сонга, Кеннета Миллера и Ларри Эбботта. Таким образом, спустя полстолетия после основополагающей работы Хебба его знаменитое «возбуждаются вместе — связываются вместе» [fire together, wire together] (соответствующее ДВП), как оказалось, можно дополнить ещё одним принципиальным афоризмом, предложенным Карлой Шатц: «Сработал несинхронно — потерял свою связь» [fire out of sync, lose your link] [1643] (соответствующее ДВД).
Важными параметрами STDP являются конкретные значения временных интервалов синхронизации импульсов. В ходе экспериментов по обучению больших импульсных сетей для решения прикладных задач были созданы такие методы, как R-STDP (версия STDP, в которой обучение модулируется при помощи внешнего подкрепления, основанного на фазовой активности дофаминовых нейронов) [1644], TD-STDP (версия STDP, использующая метод временных разниц [temporal difference]) [1645] и даже BP-STDP, а также другие похожие методы, эмулирующие работу метода обратного распространения ошибки за счёт особого подбора параметров STDP [1646], [1647], [1648]. Эти методы для ряда задач демонстрируют эффективность, сходную с эффективностью метода обратного распространения ошибки [1649], [1650], [1651].
5.3.7 Нейроморфные системы типа I. Перспективы
Одним из потенциальных преимуществ импульсных нейронных сетей является, по всей видимости, то, что они меньше подвержены так называемой проблеме катастрофической интерференции [catastrophic interference] или, как её ещё называют, проблеме катастрофического забывания [catastrophic forgetting] [1652].
Суть этой проблемы заключается в том, что искусственные нейронные сети, обученные на некоторой выборке, имеют склонность внезапно полностью забывать ранее изученную информацию при попытке «доучить» их на другой выборке, содержащей прецеденты, с точки зрения человека отличающиеся от прецедентов в оригинальной выборке. Это существенно осложняет перенос обучения (знаний) [transfer learning] между близкими областями и создаёт проблемы при дообучении моделей [fine-tuning, дословно — тонкая настройка]. Впрочем, для классических нейронных сетей в настоящее время существует несколько рабочих рецептов, предназначенных для борьбы с этой проблемой (мы поговорим о них позже).