Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Но так было недолго. Использование дентального суффикса для обозначения прошедшего времени оказалось невероятно успешным изобретением, которое получило широкое распространение. Подобно любой другой революционной технологии, новое правило стало понемногу распространяться и применяться лишь в отношении отдельных забавно звучащих глаголов, с которыми не мог справиться аблаут. Однако раз начавшись, этот процесс уже не остановился. Простой и запоминающийся дентальный суффикс начал привлекать все больше приверженцев, поскольку все чаще изменения касались глаголов, прежде использовавших аблаут.
Таким образом, к моменту создания классического староанглийского текста «Беовульф» (примерно 1200 лет назад) более трех четвертей английских глаголов изменялись по новому правилу. После того как у старого аблаута иссякли силы, новое правило с суффиксом – ed стало его повсюду вытеснять. В течение следующей тысячи лет исчезло огромное количество неправильных форм глаголов. Тысячу лет назад я мог бы holp (от глагола help – «помогать») вам. А вот вчера моя помощь вам описывалась бы словом helped.
Сегодняшние лингвисты, глядя на этот процесс в исторической ретроспективе, объясняют его термином «выравнивание». Нужно отметить, что процесс продолжается и сейчас. Рассмотрим глагол thrive («процветать»). Около 80 лет назад заголовок в газете New York Times гласил: Gambling Halls Throve in Billy Busteed’s Day («Игровые залы процветали в день Билли Бастида»). А в 2009 году в разделе «Наука» той же газеты была опубликована статья под заголовком Some Mollusks Thrived After Mass Extinction («Некоторые моллюски процветают после массового уничтожения»). Форма глагола throve (в отличие от этих удачливых моллюсков) пала жертвой массового истребления аблаутов. И пути назад нет. Став правильными, глаголы почти никогда не превращаются в неправильные[61].
Подобно тремстам спартанцам в Фермопилах, английские неправильные глаголы – эти триста смелых – решительно устояли в безжалостной борьбе, начавшейся против них в 500 г. до н. э. Они вели бой каждый день, в каждом большом и малом городе, на каждой улице, где говорят по-английски. Они отрабатывали навыки выживания в течение 2500 лет. И поэтому они – это не просто исключения. Их можно считать оставшимися в живых счастливчиками.
И процесс, благодаря которому они выжили, мы как раз и намеревались изучить – процесс эволюции языка.
2005: Еще одна одиссея данных
Почему же некоторые неправильные глаголы умерли, а другим удалось выжить? Почему глаголу throve (от глагола thrive – «процветать») не удалось выжить, а глаголу drove (от глагола drive – «ехать») – удалось? [62]
У лингвистов уже есть несколько отличных идей относительно того, почему неправильные глаголы имеют столь высокую частотность. Они предположили, что чем меньше мы сталкиваемся с неправильным глаголом, тем сложнее его запомнить и тем проще забыть[63]. Вследствие чего редкие неправильные глаголы вроде throve исчезают быстрее, чем частые, вроде drove. Со временем неправильные глаголы с низкой частотой употребления полностью исчезали, а неправильные глаголы как группа становились более частыми.
Эта гипотеза показалась нам в высшей степени интересной, поскольку предполагала, что неправильные глаголы проходят через определенный процесс, аналогичный эволюции, путем естественного отбора[64]. Почему неправильные глаголы встречаются настолько часто, когда, в полном соответствии с законом Ципфа, во всех остальных лексических классах доминируют редкие слова? Потому что естественный отбор, в форме ненасытного правила – ed, обеспечивает простым неправильным глаголам эволюционное преимущество. Чем чаще глагол используется, тем выше его шансы на выживание.
Созданный Ципфом «компас» был на тот момент самым идеальным примером естественного отбора, действующего в человеческой культуре, с которым нам только доводилось сталкиваться. Компас Ципфа указал нам на увлекательную проблему: может ли сформироваться лингвистическое чутье при столь тщательном изучении материала? Это могло бы стать простой, но доходчивой иллюстрацией того, что человеческая культура способна развиваться путем естественного отбора. Теперь нам, как и Ципфу, требовалось лишь найти подтверждение.
Для помощи в поисках мы привлекли к работе двух невероятно талантливых старшекурсников Гарвардского колледжа, Джо Джексона и Тину Тан. В идеале мы надеялись, что Джо и Тина смогут прочитать все источники, когда-либо опубликованные на английском языке, и записать каждый пример неправильного глагола, с которым они сталкивались. Однако оба они сказали нам, что все же хотели бы поработать над своими дипломами (для нас как аспирантов это уже был пройденный и забытый этап). Для решения задачи нам пришлось импровизировать.
К счастью, Джо и Тина учли историю Ципфа, поэтому предложили альтернативный подход. Вместо того чтобы читать абсолютно все, почему бы не ограничиться учебниками по истории английской грамматики? Грамматические тексты, относящиеся, скажем, к средневековому английскому языку, наверняка касались бы вопроса неправильных глаголов и упоминали бы многие из них. Не исключено, что где-то можно было найти и список таких глаголов. Изучив в библиотеке каждый учебник, посвященный истории английского языка различных периодов, мы могли получить довольно точную картину того, какие глаголы считались неправильными и когда[65]. Учебники могли бы дать нам то же самое, что дало Ципфу проведенное Хенли исследование «Улисса».
Разумеется, сказать проще, чем сделать. Джо и Тина посвятили несколько месяцев кропотливой работе, читая учебники древнеанглийского языка (языка «Беовульфа», на котором говорили примерно в 800 г. н. э.) и средневекового английского (языка Чосера, на котором говорили начиная примерно с XII столетия). Они нашли 177 староанглийских неправильных глаголов, развитие каждого из которых они смогли проследить на протяжении тысячи и более лет. Получив такую картину, мы наконец увидели, как менялся язык.
В древнеанглийском языке все 177 глаголов изначально были неправильными. К началу Средневековья, через четыре столетия, выжило лишь 145 неправильных форм; остальные 32 были приведены в соответствие с новыми нормами. В современном английском языке неправильными остались лишь 98. Остальные 79 глаголов до сих пор присутствуют в языке, однако, подобно глаголу melt («таять»), они изменили форму. При этом был заметен довольно примечательный дисбаланс. Из 12 наиболее часто встречающихся глаголов в нашем списке ни один не стал правильным – им удалось на протяжении 12 столетий сопротивляться давлению со стороны правила – ed. Нарушение пропорций шло и с другой стороны. Из 12 наименее часто использовавшихся глаголов в списке 11 стали правильными, в том числе bide («пребывать») и wreak («причинять»). Единственным выжившим неправильным глаголом с низкой частотой оказался slink («красться») – глагол, который как раз четко описывает этот тихий процесс исчезновения[66].