Дарелл Хафф - Как лгать при помощи статистики
Распространенный случай ковариации[17] – взаимосвязь действительно существует, но нельзя сказать, какая из переменных выступает причиной, а какая следствием. В ряде подобных случаев причина и следствие время от времени могут меняться ролями или даже обе одновременно будут и причиной, и следствием. К ковариации такого рода можно отнести корреляцию между доходом и владением ценными бумагами. Чем больше денег вы зарабатываете, тем больше акций покупаете, а чем больше у вас акций, тем больше доход. Так что утверждать, что одно влечет за собой другое, было бы некорректно.
Пожалуй, самый коварный тип ковариации представляет собой тот широко распространенный случай, когда ни одна из рассматриваемых переменных не оказывает никакого воздействия на другую, но при этом значимая корреляция между ними действительно подтверждается расчетами. Скольким недостойным делам послужил этот тип корреляции! К этой категории относятся и утверждения о низкой успеваемости курильщиков, равно как и множество прочих статистических данных из области медицины, которые обычно приводят, забывая уточнить, что, хотя корреляция действительно существует, выведенные на ее основе причинно-следственные связи взяты с потолка. В качестве примера такой чепухи, или фиктивной корреляции, которая сама по себе есть непреложный статистический факт, некто ради смеха называл такой: существует тесная корреляция между жалованьем пресвитерианских священников в Массачусетсе и ценой на ром в Гаване.
Что здесь причина, а что следствие? Иными словами, священники ли наживаются на продаже рома или они ей способствуют? Ну ладно. Все это сильно притянуто за уши, и абсурдность утверждения видна с первого взгляда. Но остерегайтесь случаев, когда используется та же самая логика (после – значит вследствие), только в отличие от вышеприведенного примера ее применяют более искусно и тонко. В случае со священниками и ромом легко понять, что обе цифры растут под действием третьего фактора – исторического и общемирового роста цен практически на все.
А возьмите цифры, указывающие, что уровень самоубийств достигает максимума в июне. Это что, самоубийства порождают такое количество новобрачных – или столь распространенный обычай сочетаться браком именно в июне провоцирует тех, кто отвергнут возлюбленными, свести счеты с жизнью? Несколько более убедительное (хотя тоже недоказанное) объяснение может быть таково: некто отчаявшийся всю зиму борется со своим угнетенным состоянием в надежде, что весной тучи рассеются, но окончательно сдается, когда наступает июнь, а никакого просвета нет.
Не помешает держать ухо востро и в отношении суждений, полученных в результате распространения корреляции за пределы данных, на которых она продемонстрирована. Проще простого показать: чем больше в данной местности выпадает дождей, тем выше вырастают зерновые или даже что урожай их будет тем больше. Дожди – вроде бы дарованное небесами благо. Однако очень дождливый сезон может навредить посевам или вовсе погубить урожай. Положительная корреляция сохраняется до определенной точки, а затем быстро превращается в отрицательную. Выше такого-то количества миллиметров выпавших осадков в силу вступает обратная зависимость – чем больше дождей, тем меньше урожая вы получите.
Мы хотим обратить немного внимания на данные о ценности образования. Давайте предположим, что было доказано: выпускники университетов впоследствии зарабатывают денег больше, чем те, кто бросил учебу, и что каждый год преддипломного обучения в колледже или университете на некую сумму увеличивает последующий доход выпускника. Общий вывод будет таков: чем дольше учишься, тем больше денег в будущем заработаешь. Обратите внимание, что истинность этого вывода применительно к обучению после получения степени бакалавра не доказана и, может быть, вовсе к нему неприменима. Многие обладатели докторской степени идут преподавать в университеты и потому не пополняют ряды состоятельных людей.
Корреляция, безусловно, указывает на тенденцию, которая не часто бывает идеальной взаимосвязью, называемой взаимно-однозначной. Рослые мальчики в среднем весят больше невысоких; таким образом, это положительная корреляция. Но не составит труда найти верзилу ростом за 180 сантиметров, чей вес будет меньше, чем у иного коротышки ростом 152 сантиметра, так что корреляция в данном случае меньше единицы. Отрицательная корреляция говорит лишь о том, что по мере увеличения одной из двух переменных вторая склонна уменьшаться. В физике это называется обратной пропорциональностью: чем сильнее вы отдаляетесь от электрической лампочки, тем меньше света падает на вашу книгу; по мере увеличения расстояния между вами и источником света интенсивность света падает. В физике взаимосвязи между явлениями, как правило, приводят к превосходной корреляции, но в других областях, начиная с бизнеса и заканчивая социологией или медициной, цифры редко когда снисходят до такой точности. Даже если образование в целом и повышает будущие доходы, оно может запросто обернуться для какого-нибудь малого полным разорением. Имейте в виду, что корреляция действительно может существовать и притом основываться на реальной причинно-следственной связи – и тем не менее не представлять почти никакой пользы, когда надо определиться с действиями в каком-нибудь конкретном случае.
Скопились кипы сплошь испещренных цифрами бумаг, призванных продемонстрировать, насколько ценно высшее образование с точки зрения будущих доходов. Отпечатаны не меньшие кипы проспектов, чтобы донести эти цифры – равно как и утверждения, в большей или меньшей степени основанные на этих цифрах, – до сведения потенциальных студентов. Нет, я не собираюсь придираться к этому намерению. Я и сам – горячий сторонник образования, особенно если оно включает курс элементарной статистики. Так вот, эти цифры вполне убедительно доказывают, что люди, в свое время обучавшиеся в университете, зарабатывают больше денег, чем те, кто не обучался. Разумеется, из этого правила есть многочисленные исключения, но тенденция сильна и ясна.
Единственная ошибка тут такова: на основе цифр и фактов делается совершенно беспочвенный вывод. Это заблуждение по поводу причин и следствий в самом классическом виде. Оно гласит, что, как явствует из этих цифр, если вы лично посещаете университет, то, вероятно, будете зарабатывать больше денег, чем если решите посвятить эти четыре года каким-нибудь другим занятиям. В основу этого абсолютно беспочвенного вывода положено столь же беспочвенное предположение, что коль университетские выпускники зарабатывают больше денег, то это обусловлено именно тем, что они получили высшее образование. Хотя мы не можем этого знать, но вообще-то все это люди, которые и так зарабатывали бы больше денег, даже если бы и не учились в университетах. Имеется парочка факторов, на это указывающих. В стенах университетов наблюдается непропорционально высокая численность двух категорий студентов: одаренных и богатых. Одаренные ребята благодаря своим способностям могут много зарабатывать и без университетских знаний. А что касается отпрысков богатых семейств… ну, деньги приходят к деньгам путями всем известными. Не так уж много сынков богачей попадают в категорию лиц с низкими доходами – и не важно, учились они в университете или нет.
Нижеследующий пассаж взят из статьи, написанной в форме вопросов-ответов и опубликованной в журнале This Week, воскресном приложении с колоссальными тиражами. Возможно, вас позабавит (как позабавил меня) тот факт, что автор этого материала в свое время написал статью под названием «Расхожие истины: правдивы или ложны?».
Вопрос: Как влияет учеба в университете на шансы остаться несемейным человеком?
Ответ: Если вы – особа женского пола, то из-за учебы ваши шансы остаться в старых девах резко возрастают. А если вы мужчина, эффект будет прямо противоположным – учеба сводит к минимуму ваши перспективы остаться холостяком.
Корнеллский университет опросил 1500 типичных выпускников среднего возраста. Среди мужской части 93 % состояли в браке (по сравнению с 83 % мужского населения в целом).
Но среди окончивших университет женщин среднего возраста замужними были только 65 %. По сравнению с женской частью населения в целом среди выпускниц университетов старых дев оказалось в три раза больше.
Прочтет какая-нибудь семнадцатилетняя Сьюзи Браун эту статью и уяснит, что, если поступить в университет, у нее будет меньше шансов найти себе мужа. Такое ведь написали в статье, вот и соответствующие статистические данные из авторитетного источника приводятся. Так-то оно так, но только эти данные совсем не доказывают того, что утверждает автор статьи. И потом, не забудьте обратить внимание, что, хотя статистика представлена Корнеллским университетом, выводы сделаны не им. Однако невнимательный читатель вполне может заключить, что этот вывод сделали именно специалисты известного университета.