Даниэль Канеман - Думай медленно... решай быстро
Для иллюстрации суждения по репрезентативности представим человека, которого бывший сосед описывает следующим образом: «Стив – застенчивый и замкнутый, всегда готов помочь, но его мало интересуют люди и реальный мир. Кроткий и аккуратный, Стив во всем ищет порядок и структуру; он очень внимателен к мелочам». Как оценить вероятность того, что Стив выберет то или иное занятие из предложенного списка (например, фермер, продавец, летчик, библиотекарь или врач)? Как выстроить эти профессии от наиболее вероятной к наименее вероятной? В эвристике репрезентативности вероятность того, например, что Стив – библиотекарь, оценивается по степени его репрезентативности, то есть по соответствию стереотипу библиотекаря. Исследования показывают, что профессии выбираются в равной мере по принципу вероятности и по принципу схожести [1]. Такой подход к оценке вероятности приводит к серьезным ошибкам, потому что сходство или репрезентативность не учитывают нескольких факторов, которые должны влиять на оценку вероятности.
Игнорирование априорной вероятности. Одним из факторов, которые не влияют на репрезентативность, но от которых сильно зависит вероятность, является априорная вероятность, или исходный частотный уровень событий. В случае со Стивом то, что фермеры составляют гораздо большую часть населения, чем библиотекари, должно влиять на любую разумную оценку вероятности того, что Стив – библиотекарь, а не фермер. Однако соображения априорной вероятности не влияют на схожесть Стива со стереотипами библиотекарей и фермеров. Если вероятность оценивают по репрезентативности, значит, априорные вероятности игнорируются. Эта гипотеза была проверена в эксперименте с подтасовкой априорных вероятностей [2]. Участникам предлагали краткие описания нескольких лиц, якобы отобранные наугад из выборки 100 профессионалов – инженеров и юристов. Для каждого описания участников просили оценить вероятность того, что данный человек – инженер, а не юрист. Половине испытуемых говорили, что в группе, из которой отобраны описания, 70 инженеров и 30 юристов; а оставши мся – что в группе 30 инженеров и 70 юристов. Вероятность того, что описанный человек – инженер, а не юрист, должна быть выше в первом случае, где инженеров – большинство, чем во втором, где большинство – юристы. Применение формулы Байеса показывает, что соотношение вероятностей должно быть (0,7/0,3)2, или 5,44 для каждого описания. Грубо нарушая формулу Байеса, участники в обоих случаях выдавали практически одинаковые суждения о вероятности. Очевидно, что участники оценивали вероятность принадлежности описанного человека к инженерам, а не к юристам по степени схожести описания с двумя стереотипами, почти или совсем не учитывая априорной вероятности категорий.
Данные об априорной вероятности использовались правильно, когда отсутствовала другая информация. Если персональные описания не предлагались, участники соответственно оценивали вероятность того, что человек – инженер, как 0,7 и 0,3 в двух сессиях. Однако априорные вероятности решительно игнорировались, когда предлагалось описание, даже если оно не несло в себе никакой информации. Следующие ответы иллюстрируют это явление.
«Дику 30 лет. Он женат, детей нет. Очень способный и упорный, он наверняка добьется успеха в своей области. Он пользуется признанием коллег».
Такое описание не несет в себе никакой информации относительно того, является ли Дик инженером или юристом. Соответственно, вероятность того, что Дик – инженер, должна равняться доле инженеров в общей выборке, как и в случае отсутствия описания. Однако участники оценивали вероятность того, что Дик – инженер, как 0,5, независимо от того, составляла ли доля инженеров в группе 0,7 или 0,3. Получается, что при отсутствии данных люди отвечают иначе, чем при предоставлении бесполезных данных. Когда конкретных данных нет, априорная вероятность используется правильно; когда есть бесполезные данные, априорная вероятность игнорируется [3].
Игнорирование размеров выборки. Для оценки вероятности получения конкретного результата в выборке из некой популяции обычно применяют эвристику репрезентативности, то есть оценивают вероятность результата в выборке (например, что средний рост в случайной выборке из десяти мужчин составит 6 футов) по схожести этого результата с соответствующим параметром (то есть со средним ростом для всех мужчин). Схожесть статистики в выборке и во всей популяции не зависит от размера выборки. Следовательно, если вероятность оценивается по репрезентативности, тогда оцениваемая вероятность для выборки совершенно не будет зависеть от размера выборки. Когда участники оценивали распределение среднего роста в выборках различного размера, распределение получалось одинаковым. Например, вероятность получения среднего роста выше 6 футов получала одинаковые значения для выборки в 1000, 100 и 10 мужчин [4]. Более того, участники не учитывали важность размера выборки, даже когда она особо подчеркивалась в формулировке задачи. Рассмотрим следующий пример.
В городе работают две больницы. В большой больнице каждый день рождается примерно 45 младенцев, в маленькой больнице каждый день рождается примерно 15 младенцев. Как известно, около 50% всех новорожденных – мальчики. Однако точное соотношение меняется изо дня в день.
Иногда мальчиков больше 50%, иногда меньше.
В течение года каждая больница отмечает дни, когда мальчиков рождается более 60% от всех новорожденных. В какой больнице, по-вашему, таких дней больше?
В большой (21)
В маленькой (21)
Примерно одинаково (то есть разница менее 5%) (53)
Цифры в скобках показывают число студентов, выбравших указанный ответ.
Большинство участников решили, что вероятность рождения более 60% мальчиков будет одинаковой для маленькой и большой больницы , видимо, потому что эти события описаны одной и той же статистикой и, таким образом, одинаково представляют общую популяцию. Однако теория выборок утверждает: дней, когда мальчиков рождается свыше 60%, ожидается значительно больше в маленькой больнице, чем в большой, поскольку распределение в больших выборках будет реже отклоняться от 50%. Очевидно, это фундаментальное понятие статистики не входит в набор интуитивных навыков.
Похожее игнорирование размера выборки обнаружено при оценке апостериорной вероятности, то есть вероятности того, что выборка взята из той или иной популяции, а не из другой. Рассмотрим следующий пример.
Представьте сосуд, наполненный шарами, из которых 2/3 одного цвета, а 1/3 – другого. Один человек, вытащив из сосуда 5 шаров, обнаружил 4 красных и один белый. Другой человек вытащил 20 шаров и насчитал 12 красных и 8 белых. Кто из двух участников будет более уверен, что в сосуде 2/3 красных шаров и 1/3 – белых, а не наоборот? Какие шансы назовет каждый из участников?
В этой задаче правильные апостериорные шансы составляют 8 к 1 для выборки 4:1 и 16 к 1 – для выборки 12:8, при условии равных априорных вероятностей. Однако большинству людей кажется, что первая выборка представляет более сильное доказательство гипотезы о преобладании красных шаров в сосуде, потому что доля красных шаров в первой выборке больше, чем во второй. Опять-таки, на интуитивный выбор влияет соотношение в выборке и совсем не влияет размер выборки, который играет важнейшую роль в определении реальных апостериорных вероятностей [5]. Кроме того, интуитивные оценки апостериорных шансов оказываются далеко не столь экстремальными, как реальные величины. Недооценка влияния доказательств постоянно наблюдается в задачах подобного типа [6]. Это явление получило название «консерватизм».
Неверные представления о шансах. Люди ожидают, что последовательность событий, генерируемых случайным процессом, является существенной характеристикой процесса, даже если последовательность коротка. Например, бросая монету (орел или решка), человек рассматривает итоговую последовательность О-Р-О-Р-Р-О как более вероятную, чем последовательность О-О-О-Р-Р-Р, которая выпадает редко, а также более вероятной, чем последовательность О-О-О-О-Р-О, которая не отражает равновероятность исходов при подбрасывании монеты [7]. Таким образом, люди ожидают, что существенные характеристики процесса будут представлены не только глобально в полной последовательности, но и локально в каждой ее части. На самом же деле локально репрезентативная последовательность систематически отклоняется от ожидаемых вероятностей: в ней слишком много чередований и слишком мало повторений. Еще одно следствие веры в локальную репрезентативность – хорошо известная ошибка игрока. К примеру, заметив длинную последовательность выпадения красного на рулетке, большинство людей считают, что настала очередь чер ного, поскольку выпадение черного даст более репрезентативную последовательность, чем еще одно появление красного. Шанс часто рассматривается как саморегулирующийся процесс, в котором отклонение в одну сторону вызывает отклонение в противоположную сторону – для поддержания равновесия. На самом деле отклонения не «корректируются» по мере развития процесса; они просто сглаживаются.