Дарелл Хафф - Как лгать при помощи статистики
Статистика (и это, наверное, самая интересная часть книги Хаффа) настолько злокозненна, что регулярно обманывает и теоретиков, и прикладных исследователей, и тем более политиков, которые очень любят оперировать ею. Используя исторические примеры (от «соломенных опросов», чуть не разрушивших карьеру Дж. Гэллапа в 1930-х гг., до дискуссий о глобальном потеплении), Даррелл Хафф не только помогает читателю разобраться в прошлых обманах, но и дает ему инструмент проверки на будущее.
За последние 25 лет в большинстве ведущих университетов мира статистика и ее методы стали обязательным компонентом любого образования, включая самое что ни на есть гуманитарное, по той причине, что ученому, практику, юристу и даже филологу нужно иметь ту самую «бритву Оккама», которой рассекается любая путаница. В нашем веке «больших данных» это особенно важно – в бесконечном океане собираемых цифр очень важно избегать как базовых ошибок (о чем подробно рассказывает книга Даррелла Хаффа), так и некритического подхода к любому анализу, представляемому как мнение большинства. Большинство, увы, не ведет нас вперед, а упорно держится за то немногое, что у него есть, оправдывая свой «консерватизм» именно ложным выводом из ложной же статистики.
Василий Гатов, приглашенный исследователь Центра коммуникационного лидерства и политики (Школа коммуникаций и журналистики Университета Южной Калифорнии)Моей супруге посвящаю. С полным на то основанием
Благодарности
Милые примеры откровенных нелепостей и надувательских ухищрений, которыми, как перчинками, приправлена эта книга, я собирал где только можно и не без посторонней помощи. Откликнувшись на мой призыв, посланный через Американскую статистическую ассоциацию, несколько профессиональных статистиков – а они, уж вы мне поверьте, оплакивают ненадлежащее использование статистики не менее искренне, чем все прочие, – поделились со мной примерами из своих личных коллекций. Эти достойные люди, думается мне, будут только рады, если их имена останутся неназванными на этих страницах. Ценные примеры я почерпнул также из целого ряда книг, главным образом из следующих: «Бизнес-статистика» (Business Statistics) Мартина Брумбауха и Лестера Келлогга, «Как измерять общественное мнение» (Gauging Public Opinion) Хэдли Кэнтрила, «Графическое представление данных» Уилларда Бринтона, «Практическая бизнес-статистика» (Practical Business Statistics) Фредерика Крокстона и Дадли Коудена, «Основы статистики» (Basic Statistics) Джорджа Симпсона и Фрица Кафки, «Простейшие статистические методы» (Elementary Statistical Methods) Хелен Уокер.
Введение
«Что-то больно много преступности в этих краях», – заметил мой свекор вскоре после того, как переехал из Айовы в Калифорнию. Так оно и было – если верить газете, которую он читал. Газета была того сорта, что не пропустит ни единого преступления в собственной округе, и еще она славилась тем, что какому-нибудь убийству в Айове уделяла гораздо больше внимания, чем ведущая ежедневная газета той местности, где собственно и произошло убийство.
Вывод моего свекра был статистического свойства, если не по форме, то по существу, и основывался на выборке, причем необычайно предвзятой. Как и многие образцы куда более изощренно сфальсифицированных статистических данных, его вывод грешил мнимой обоснованностью и исходил из той посылки, что место, отведенное газетой под криминальную хронику, и есть мерило уровня преступности.
Несколько лет назад с дюжину исследователей независимо друг от друга опубликовали данные об антигистаминных препаратах. Во всех упоминалось о значительном проценте излечившихся от простудных заболеваний после приема этих лекарств. Началась большая шумиха (по крайней мере рекламная), и спрос на эти препараты резко вырос. Он был основан на вечных упованиях на чудо и еще на удивительном нежелании отвлечься от статистики и взглянуть в глаза давно известной истине. Как когда-то говаривал писатель-юморист Генри Фелсен (весьма далекий от медицины), при должном лечении простуда проходит через семь дней, в противном случае она сама собой пройдет через неделю.
Точно так же обстоят дела со многим из того, что вы читаете и слышите. Средние величины, зависимости, тенденции и графики не всегда есть то, чем кажутся. Подчас в них таится много больше интересного, чем видно на первый взгляд, а иногда и куда как меньше.
Таинственный язык статистики, столь притягательный в условиях культуры, которая ставит во главу угла факты, используют для того, чтобы создавать сенсации, преувеличивать, сбивать с толку и чрезмерно упрощать. Статистические методы и термины необходимы, когда дело касается массовых данных о социальных и экономических тенденциях, деловой конъюнктуре, опросах общественного мнения, переписях населения. Но в отсутствие авторов, которые используют статистическую терминологию добросовестно и со знанием дела, равно как и читателей, понимающих, что означают все эти термины, результатом может стать та еще ахинея.
В современной научно-популярной литературе ругаемый на все корки статистик почти вытеснил образ самоотверженного героя-труженика в белом халате, который дни и ночи корпит над своими пробирками в неверном свете лабораторных ламп, даже не помышляя о плате за переработки. Подобно тому, как «немножко туши да щепотка пудры превратят в красавицу любую лахудру», так и статистика способна выдавать многие весьма немаловажные факты совсем не за то, что они есть в реальности. Искусно преподнесенная статистика куда лучше, чем гитлеровский прием «большой лжи»: она вводит в заблуждение, но с вас взятки гладки, и никто не подкопается.
Эта книга – своего рода руководство для начинающих, в котором изложены азы применения статистики в целях обмана. У читателя могут возникнуть подозрения, что издание слишком уж смахивает на инструкцию для мошенников. Полагаю все же, что смогу оправдать ее в манере бывшего грабителя, опубликовавшего мемуары, в сущности представляющие собой учебный курс на тему о том, как подобрать отмычку к замку и научиться ступать бесшумно: жуликам и ворам все эти трюки и так давно известны, а порядочные люди должны узнать о них, чтобы уметь защитить свой дом от непрошеных гостей.
Глава 1
Выборка изначально необъективна
«Средний выпускник Йельского университета 1924 г. зарабатывает $25 111 в год» – это было опубликовано однажды в журнале Time в ответ на какой-то материал, вышедший в нью-йоркской газете Sun.
Ну что ж, зарабатывает – вот и молодец!
Но погодите-ка. А что, собственно, означает эта внушительная цифра? Будет ли она, как это кажется на первый взгляд, свидетельством того, что, если вы отправите своего отпрыска учиться в Йельский университет, вам уже не придется работать на старости лет (да и ему тоже)?
Уже при первом настороженном взгляде на эту цифру бросаются в глаза две особенности. Сама цифра на удивление точна. И потом, она неправдоподобно велика.
Маловероятно, чтобы средний доход любой сколько-нибудь обширной группы был бы известен с точностью до последнего доллара. Не так уж вероятно, чтобы вы с такой же точностью могли бы сказать, каким был ваш собственный доход в прошлом году, разве что весь он был получен исключительно за счет зарплаты. А годовой доход в размере $25 000 редко когда складывается только из заработной платы; люди с доходом такого уровня склонны делать инвестиции, причем их вложения предусмотрительно и с умом распределены между несколькими «корзинами».
Кроме того, этот восхитительный средний показатель рассчитан, несомненно, на основании тех сумм, которые, как сообщили сами выпускники Йеля, они зарабатывают. Даже если в 1924 г. у них там в Нью-Хейвене и имелась система доверия, то где гарантия, что и сегодня, четверть века спустя, она по-прежнему существует и все данные, представленные этими выпускниками, соответствуют действительности? Иные, отвечая на вопрос о личных доходах, склонны преувеличивать их – то ли из тщеславия, то ли потому, что настроены оптимистически. Другие же намеренно занижают свои доходы, особенно (и на то есть причины) в своих налоговых декларациях, а сделавши это, боятся, как бы данные, указанные ими где-нибудь еще, не опровергали тех, что значатся у них в декларации. Ведь неизвестно, какие сведения могут попасться на глаза чиновникам налогового управления. Вполне могло быть так, что эти две тенденции (завышать свои доходы или занижать их) нейтрализуют одна другую, но едва ли это вероятно. Одна из двух может быть намного сильнее другой, а вот которая – нам не известно.