Алекс Беллос - Красота в квадрате
Закону Бенфорда подчиняется большинство множеств данных, взятых из реальной жизни, например численность населения в 3221 округе США и совокупный квартальный доход 30 525 открытых акционерных компаний за период с 1961 по 2011 год [4].
Закон Бенфорда — одна из самых замечательных числовых закономерностей, существующих в мире. Чуть ниже я остановлюсь на некоторых других, но, прежде чем перейти к ним, мы должны провести одно расследование.
Даррелл Доррелл напоминал мне медведя. Эта ассоциация отчасти объяснялась тем, что мы с ним встретились в Портленде, столице штата Орегон, в котором водится много медведей, и частично тем, что Даррелл был мужчиной коренастого телосложения, с торчащими усами и низким голосом, смахивающим на тихое рычание. Кроме того, ассоциация была связана с его работой финансового следователя. Даррелл вынюхивает искаженные данные с хищническим инстинктом гризли, добывающего себе пищу. Вам лучше не допускать его к своим бухгалтерским книгам, если в них есть хотя бы малейший намек на злоупотребления. ЦРУ, Министерство юстиции и Комиссия по ценным бумагам и биржам регулярно пользовались его услугами в области судебно-бухгалтерской экспертизы (этим отраслевым термином обозначается расследование финансовых махинаций). У Даррелла есть лицензия на ношение оружия. «Все двери здесь закрываются изнутри, — объяснял он. — Мы вызываем у многих людей недовольство».
Когда в начале тысячелетия Даррелл впервые услышал о законе Бенфорда, он испытал примерно те же эмоции, что и люди, пережившие большую утрату: удивление, отрицание, гнев и принятие. «Сначала у меня возникла мысль: “Почему я не слышал об этом раньше?” Затем я подумал: “Этого просто не может быть!” А когда в конце концов понял суть этого закона, на меня снизошло озарение: “Вот это да! Ведь это еще один инструмент, который можно использовать”». Теперь в ходе расследования финансовых махинаций Даррелл прежде всего проверяет первые цифры номеров банковских счетов и данных в бухгалтерских книгах компаний. Финансовые данные, включающие в себя величины нескольких порядков (другими словами, которые отражают количество, измеряемое в единицах продукции или в десятках, сотнях и тысячах долларов), должны подчиняться закону Бенфорда. Если этого не происходит, значит, либо существует обоснованное объяснение (например, регулярная закупка товаров стоимостью, скажем, 40 долларов за единицу, которая влечет за собой повышение вероятности появления цифры 4), либо имеют место преступные действия. Отклонение от закона Бенфорда — это признак того, что соответствующие финансовые данные требуют более тщательного анализа.
Даррелл показал на висевшую на стене рамку, в которую была помещена первая страница газеты со статьей о вынесении приговора Уэсли Родсу — местному финансовому консультанту, укравшему у инвесторов миллионы долларов, чтобы покупать на эти деньги классические модели автомобилей. «Закон Бенфорда помог нам привлечь его к ответственности», — сообщил Даррелл. Отчеты, которые Родс отправлял инвесторам, не прошли проверку на соответствие закону первой цифры, а это означало, что что-то с ними не так. Проанализировав отчеты более внимательно, Даррелл обнаружил, что Родс сфальсифицировал данные. Теперь Даррелл характеризует закон Бенфорда так: «Это ДНК количественного исследования, исходное предположение о том, как работают цифры. И, как я уже неоднократно объяснял в суде, хорошо то, что здесь речь идет о науке. Открытие Бенфорда — не теория. Это закон».
Метод анализа чисел на предмет их соответствия закону Бенфорда все чаще используется для выявления манипуляций с данными, причем не только в контексте финансовых махинаций, но и во всех тех случаях, к которым этот закон применим. В 2006 году Скотт де Марчи и Джеймс Гамильтон из Университета Дьюка написали, что предоставленные промышленными предприятиями сведения об уровне выброса свинца и азотной кислоты не удовлетворяют закону Бенфорда, а это говорит о вероятности искажения информации [5]. На основании закона Бенфорда политолог Мичиганского университета Уолтер Мибейн заявил о возможной фальсификации результатов президентских выборов в Иране. Мибейн проанализировал все протоколы голосования и обнаружил существенные расхождения в количестве голосов за Махмуда Ахмадинежада с законом Бенфорда, тогда как в результатах его соперника, сторонника реформ Мир-Хосейна Мусави, никаких отклонений от этого закона не наблюдалось. «Самое простое объяснение, — писал Мибейн, — состоит в том, что в результаты Ахмадинежада были искусственным образом включены дополнительные голоса, тогда как результаты Мусави остались нетронутыми». Ученые используют закон Бенфорда и в качестве инструмента диагностики. Так, во время землетрясений верхние и нижние значения показаний сейсмографа подчиняются данному закону. Малколм Сэмбридж из Австралийского национального университета проанализировал две разные сейсмограммы, на которых было зафиксировано землетрясение в Индонезии в 2004 году, — одна была записана в Перу, а другая в Австралии. Данные, отображенные на первой сейсмограмме, полностью соответствовали закону Бенфорда, тогда как на второй имели место небольшие отклонения. Сэмбридж объяснил это тем, что в районе Канберры могло произойти незначительное сейсмическое возмущение. Так проверка данных на соответствие закону первой цифры позволила выявить землетрясение, которое осталось незамеченным.
Цифра 1 встречается чаще цифры 2 не только на первой, но и на второй, третьей, четвертой и фактически любой позиции в записи числа. На представленном ниже рисунке продемонстрирована частотность вторых цифр в процентном выражении (среди которых есть теперь и цифра 0). Различия между этими показателями не столь ощутимы, как в случае первых цифр, но их все же можно использовать в целях диагностики, скажем в процессе анализа финансовых данных и результатов выборов. По мере продвижения к следующим позициям данные о частоте появления цифр стремятся к одному значению. Следовательно, закон Бенфорда касается не только первых цифр. В мире действительно гораздо больше единиц!
В суде Доррелла часто просят обосновать закон Бенфорда. В таких случаях Даррелл становится перед лекционной доской и начинает считать от единицы и далее, записывая названные цифры. При этом он чувствует себя школьным учителем, проводящим урок математики. «Это просто выводит из себя судью и адвоката», — иронизирует он.
Мы можем сделать то же самое. Вот числа от 1 до 20:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Больше половины этих чисел начинаются с цифры 1, поскольку от 11 до 19 все числа начинаются с единицы. Продолжаем считать. Где бы мы ни остановились, чисел с первой цифрой 1 будет не меньше, чем чисел с первой цифрой 2, поскольку для того, чтобы добраться до второго десятка, второй сотни или второй тысячи, необходимо назвать все числа первого десятка, первой сотни и первой тысячи. Точно так же чисел с первой цифрой 2 будет не меньше, чем чисел с первой цифрой 3 и т. д., вплоть до чисел с первой цифрой 9. Такое обоснование помогает понять закон Бенфорда на интуитивном уровне, и его вполне достаточно для суда как государственного органа, а вот для суда математики требуется более строгое доказательство.
Одно из самых поразительных свойств закона Бенфорда — что последовательность цифр не зависит от единицы измерения. Когда массив финансовых данных подчиняется закону Бенфорда в случае, если они выражены в фунтах, он будет подчиняться этому закону и после их конвертации в доллары. Если массив географических данных соответствует закону Бенфорда в километрах, он будет соответствовать ему и в случае их представления в милях. Это свойство, обозначаемое термином «масштабная инвариантность», верно всегда, поскольку числа, взятые из газет, банковских счетов и атласов мира показывают одно и то же распределение первых цифр независимо от используемых систем измерения и валюты.
Для перевода расстояния из миль в километры необходимо умножить его на 1,6; для конвертации денежной суммы из фунтов в доллары ее тоже следует умножить на фиксированное число, соответствующее текущему обменному курсу. Простейший способ понять масштабную инвариантность закона Бенфорда сводится к анализу поведения чисел в случае их умножения на два. Если число, начинающееся с цифры 1, умножить на 2, результат будет начинаться с цифры 2 или 3. (Например, 12 × 2 = 24; 166 × 2 = 332.) Если число, начинающееся с цифры 2, умножить на 2, первой цифрой произведения будет 4 или 5. (Например, 2,1 × 2 = 4,2; 25 × 2 = 50.) Первые две строки представленной ниже таблицы показывают, что происходит с первой цифрой числа в случае его умножения на два.
Первая цифра числа n
1