Приложение А

Суждения в условиях неопределенности: эвристические методы и ошибки

Амос Тверски и Даниэль Канеман

Многие решения опираются на представления о вероятности неопределенных событий, таких как победа на выборах, признание подсудимого виновным или будущий курс доллара. Эти представления обычно выражаются в таких заявлениях: «думаю, что…», «есть вероятность…», «маловероятно, что…» и так далее. Иногда представления о неопределенных событиях выражаются в численной форме – как шансы или субъективная вероятность. Чем определяются такие представления? Как оценивают вероятность неопределенных событий или значение неопределенной величины? Эта статья показывает, что люди полагаются на ограниченный набор эвристических принципов, сводящих сложную задачу оценки вероятности и прогноза значений к более простым операциям суждений. Часто эти эвристические методы приносят пользу, но иногда ведут к грубым и систематическим ошибкам.

Субъективная оценка вероятности напоминает субъективную оценку физических величин, таких как расстояние и размер. Подобные суждения основаны на данных ограниченной достоверности, которые обрабатываются по эвристическим правилам. Например, кажущееся расстояние до объекта частично определяется различимостью самого объекта. Чем отчетливее виден объект, тем ближе он кажется расположенным. Это правило обладает некоторой ценностью, потому что в конкретных обстоятельствах дальний объект выглядит менее четко, чем ближний. Однако вера в это правило приводит к систематическим ошибкам в оценке расстояния. В частности, расстояния переоцениваются в условиях плохой видимости, поскольку контуры объекта размыты. С другой стороны, расстояния недооцениваются в условиях прекрасной видимости, потому что объекты видны четко. Опора на четкость как на показатель расстояния приводит к частым ошибкам. Такие же искажения таятся и в интуитивных суждениях о вероятности. В этой статье описаны три эвристических метода, с помощью которых оцениваются вероятности и прогнозируются значения величин. Перечислены ошибки, вызванные этими эвристическими методами, и приведены практические и теоретические выводы из наблюдений.

Репрезентативность

Вопросы о вероятности, встающие перед людьми, как правило, относятся к одному из следующих типов: какова вероятность того, что объект А принадлежит классу Б? Какова вероятность того, что событие А – следствие процесса Б? Какова вероятность того, что процесс Б приведет к событию А? Отвечая на подобные вопросы, люди обычно опираются на эвристику репрезентативности (типичности): вероятности оцениваются по той степени, в которой А репрезентативно по отношению к Б, то есть по степени, в которой А напоминает Б. Например, если А очень репрезентативно по отношению к Б, вероятность того, что А – результат Б, оценивается как высокая. С другой стороны, если А не похоже на Б, вероятность того, что А – результат Б, оценивается как низкая.

Для иллюстрации суждения по репрезентативности представим человека, которого бывший сосед описывает следующим образом: «Стив – застенчивый и замкнутый, всегда готов помочь, но его мало интересуют люди и реальный мир. Кроткий и аккуратный, Стив во всем ищет порядок и структуру; он очень внимателен к мелочам». Как оценить вероятность того, что Стив выберет то или иное занятие из предложенного списка (например, фермер, продавец, летчик, библиотекарь или врач)? Как выстроить эти профессии от наиболее вероятной к наименее вероятной? В эвристике репрезентативности вероятность того, например, что Стив – библиотекарь, оценивается по степени его репрезентативности, то есть по соответствию стереотипу библиотекаря. Исследования показывают, что профессии выбираются в равной мере по принципу вероятности и по принципу схожести [1]. Такой подход к оценке вероятности приводит к серьезным ошибкам, потому что сходство или репрезентативность не учитывают нескольких факторов, которые должны влиять на оценку вероятности.

Игнорирование априорной вероятности. Одним из факторов, которые не влияют на репрезентативность, но от которых сильно зависит вероятность, является априорная вероятность, или исходный частотный уровень событий. В случае со Стивом то, что фермеры составляют гораздо бо́льшую часть населения, чем библиотекари, должно влиять на любую разумную оценку вероятности того, что Стив – библиотекарь, а не фермер. Однако соображения априорной вероятности не влияют на схожесть Стива со стереотипами библиотекарей и фермеров. Если вероятность оценивают по репрезентативности, значит, априорные вероятности игнорируются. Эта гипотеза была проверена в эксперименте с подтасовкой априорных вероятностей [2]. Участникам предлагали краткие описания нескольких лиц, якобы отобранные наугад из выборки 100 профессионалов – инженеров и юристов. Для каждого описания участников просили оценить вероятность того, что данный человек – инженер, а не юрист. Половине испытуемых говорили, что в группе, из которой отобраны описания, 70 инженеров и 30 юристов; а оставшимся – что в группе 30 инженеров и 70 юристов. Вероятность того, что описанный человек – инженер, а не юрист, должна быть выше в первом случае, где инженеров – большинство, чем во втором, где большинство – юристы. Применение формулы Байеса показывает, что соотношение вероятностей должно быть (0,7/0,3)2, или 5,44 для каждого описания. Грубо нарушая формулу Байеса, участники в обоих случаях выдавали практически одинаковые суждения о вероятности. Очевидно, что участники оценивали вероятность принадлежности описанного человека к инженерам, а не к юристам по степени схожести описания с двумя стереотипами, почти или совсем не учитывая априорной вероятности категорий.

Данные об априорной вероятности использовались правильно, когда отсутствовала другая информация. Если персональные описания не предлагались, участники соответственно оценивали вероятность того, что человек – инженер, как 0,7 и 0,3 в двух сессиях. Однако априорные вероятности решительно игнорировались, когда предлагалось описание, даже если оно не несло в себе никакой информации. Следующие ответы иллюстрируют это явление.

«Дику 30 лет. Он женат, детей нет. Очень способный и упорный, он наверняка добьется успеха в своей области. Он пользуется признанием коллег».

Такое описание не несет в себе никакой информации относительно того, является ли Дик инженером или юристом. Соответственно, вероятность того, что Дик – инженер, должна равняться доле инженеров в общей выборке, как и в случае отсутствия описания. Однако участники оценивали вероятность того, что Дик – инженер, как 0,5, независимо от того, составляла ли доля инженеров в группе 0,7 или 0,3. Получается, что при отсутствии данных люди отвечают иначе, чем при предоставлении бесполезных данных. Когда конкретных данных нет, априорная вероятность используется правильно; когда есть бесполезные данные, априорная вероятность игнорируется [3].

Игнорирование размеров выборки. Для оценки вероятности получения конкретного результата в выборке из некой популяции обычно применяют эвристику репрезентативности, то есть оценивают вероятность результата в выборке (например, что средний рост в случайной выборке из десяти мужчин составит 6 футов) по схожести этого результата с соответствующим параметром (то есть со средним ростом для всех мужчин). Схожесть статистики в выборке и во всей популяции не зависит от размера выборки. Следовательно, если вероятность оценивается по репрезентативности, тогда оцениваемая вероятность для выборки совершенно не будет зависеть от размера выборки. Когда участники оценивали распределение среднего роста в выборках различного размера, распределение получалось одинаковым. Например, вероятность получения среднего роста выше 6 футов получала одинаковые значения для выборки в 1000, 100 и 10 мужчин [4]. Более того, участники не учитывали важность размера выборки, даже когда она особо подчеркивалась в формулировке задачи. Рассмотрим следующий пример.

В городе работают две больницы. В большой больнице каждый день рождается примерно 45 младенцев, в маленькой больнице каждый день рождается примерно 15 младенцев. Как известно, около 50 % всех новорожденных – мальчики. Однако точное соотношение меняется изо дня в день.

Иногда мальчиков больше 50 %, иногда меньше.

В течение года каждая больница отмечает дни, когда мальчиков рождается более 60 % от всех новорожденных. В какой больнице, по-вашему, таких дней больше?

В большой (21)

В маленькой (21)

Примерно одинаково (то есть разница менее 5 %) (53)

Цифры в скобках показывают число студентов, выбравших указанный ответ.

Большинство участников решили, что вероятность рождения более 60 % мальчиков будет одинаковой для маленькой и большой больницы, видимо, потому что эти события описаны одной и той же статистикой и, таким образом, одинаково представляют общую популяцию. Однако теория выборок утверждает: дней, когда мальчиков рождается свыше 60 %, ожидается значительно больше в маленькой больнице, чем в большой, поскольку распределение в больших выборках будет реже отклоняться от 50 %. Очевидно, это фундаментальное понятие статистики не входит в набор интуитивных навыков.

Похожее игнорирование размера выборки обнаружено при оценке апостериорной вероятности, то есть вероятности того, что выборка взята из той или иной популяции, а не из другой. Рассмотрим следующий пример.

Представьте сосуд, наполненный шарами, из которых ⅔ одного цвета, а ⅓ – другого. Один человек, вытащив из сосуда 5 шаров, обнаружил 4 красных и один белый. Другой человек вытащил 20 шаров и насчитал 12 красных и 8 белых. Кто из двух участников будет более уверен, что в сосуде ⅔ красных шаров и ⅓ – белых, а не наоборот? Какие шансы назовет каждый из участников?

В этой задаче правильные апостериорные шансы составляют 8 к 1 для выборки 4:1 и 16 к 1 – для выборки 12:8, при условии равных априорных вероятностей. Однако большинству людей кажется, что первая выборка представляет более сильное доказательство гипотезы о преобладании красных шаров в сосуде, потому что доля красных шаров в первой выборке больше, чем во второй. Опять-таки, на интуитивный выбор влияет соотношение в выборке и совсем не влияет размер выборки, который играет важнейшую роль в определении реальных апостериорных вероятностей [5]. Кроме того, интуитивные оценки апостериорных шансов оказываются далеко не столь экстремальными, как реальные величины. Недооценка влияния доказательств постоянно наблюдается в задачах подобного типа [6]. Это явление получило название «консерватизм».

Неверные представления о шансах. Люди ожидают, что последовательность событий, генерируемых случайным процессом, является существенной характеристикой процесса, даже если последовательность коротка. Например, бросая монету (орел или решка), человек рассматривает итоговую последовательность О-Р-О-Р-Р-О как более вероятную, чем последовательность О-О-О-Р-Р-Р, которая выпадает редко, а также более вероятной, чем последовательность О-О-О-О-Р-О, которая не отражает равновероятность исходов при подбрасывании монеты [7]. Таким образом, люди ожидают, что существенные характеристики процесса будут представлены не только глобально в полной последовательности, но и локально в каждой ее части. На самом же деле локально репрезентативная последовательность систематически отклоняется от ожидаемых вероятностей: в ней слишком много чередований и слишком мало повторений. Еще одно следствие веры в локальную репрезентативность – хорошо известная ошибка игрока. К примеру, заметив длинную последовательность выпадения красного на рулетке, большинство людей считают, что настала очередь черного, поскольку выпадение черного даст более репрезентативную последовательность, чем еще одно появление красного. Шанс часто рассматривается как саморегулирующийся процесс, в котором отклонение в одну сторону вызывает отклонение в противоположную сторону – для поддержания равновесия. На самом деле отклонения не «корректируются» по мере развития процесса; они просто сглаживаются.

Неверные представления о шансах – удел не только неискушенных людей. Проведенные исследования статистической интуиции опытных исследователей-психологов [8] выявили упорное заблуждение, которое можно назвать «закон малых чисел», – согласно ему даже маленькие выборки высоко репрезентативны для своих популяций. Ответы исследователей отражают ожидание того, что валидная гипотеза о популяции даст статистически значимые результаты в выборке любого размера. Как выяснилось, исследователи слишком доверяли результатам по маленьким выборкам и сильно переоценивали воспроизводимость таких результатов. В условиях реального исследования подобные искажения ведут к выборкам неадекватного размера и чересчур смелой интерпретации результатов.

Игнорирование предсказуемости. Людям иногда приходится делать численные прогнозы – например, предсказывать будущий курс акций, спрос на товар или результат футбольного матча. Эти прогнозы часто делаются на основе репрезентативности. Например, представьте, что кому-то предлагают описание компании и просят дать прогноз будущей прибыли. Если описание компании очень благоприятное, высокие прибыли покажутся репрезентативными для этого описания; если описание среднее, наиболее репрезентативными сочтут средние показатели. На благоприятность описания не влияет степень его надежности или то, насколько оно позволяет делать точные прогнозы. Значит, если прогноз делают на основании только благоприятности описания, то предсказания игнорируют надежность доказательств и ожидаемую точность прогноза.

Такой способ выносить суждения идет вразрез со статистической теорией, в которой крайность и диапазон прогнозов сдерживаются соображениями предсказуемости. Когда предсказуемость равна нулю, во всех случаях должны быть даны одинаковые предсказания. Например, если в описании компаний нет информации, связанной с прибылями, тогда правильно будет дать одинаковый прогноз (например, среднюю прибыль) для всех компаний. Если предсказуемость идеальна, предсказанные величины, разумеется, совпадут с реальными, а диапазон прогнозов совпадет с диапазоном итогов. В общем, чем выше предсказуемость, тем шире диапазон предсказанных величин.

Некоторые исследования числовых прогнозов показали, что интуитивные предсказания нарушают это правило и что люди редко учитывают – или вовсе не учитывают – соображения предсказуемости [9]. В одном из исследований участникам предлагалось несколько абзацев, в каждом из которых описывались действия учителя-практиканта во время урока. Некоторых участников просили оценить (в процентилях) качество описанного в тексте урока относительно конкретной популяции. Других участников просили предсказать (тоже в процентильных баллах) успехи данного практиканта через пять лет после этого урока. Суждения, высказанные в данных условиях, оказались идентичны, то есть прогноз по отдаленному критерию (успешность учителя через пять лет) совпадал с оценкой информации, на которой основывался прогноз (качество описанного урока). Студенты, дававшие ответы, разумеется, знали, что предсказуемость преподавательской компетентности по одному-единственному уроку пятилетней давности ограничена; тем не менее их прогнозы были столь же радикальными, как и их оценки.

Иллюзия валидности. Как уже упоминалось, люди, давая прогноз, выбирают результат (например, профессию), максимально репрезентативный для входных данных (например, описания человека). Уверенность в правильности прогноза напрямую зависит от степени репрезентативности (то есть от степени совпадения между выбранным результатом и входными данными); при этом почти (или совсем) не рассматриваются факторы, ограничивающие точность прогноза. Так, люди с большой уверенностью называют профессию библиотекаря, если предложенное описание человека соответствует стереотипу библиотекаря, даже если описание скудное, ненадежное или устаревшее. Необоснованную уверенность, вызванную хорошим совпадением между предсказанным результатом и входными данными, можно назвать иллюзией валидности. Эта иллюзия остается, даже когда человек знает о факторах, ограничивающих точность прогноза. Широко известен факт, что психологи, проводящие отборочные собеседования при приеме на работу, часто весьма уверены в своих прогнозах, несмотря на знакомство с обширной литературой, где показана невысокая надежность собеседований. То, какую роль продолжают отводить отборочным собеседованиям, невзирая на многочисленные примеры их неадекватности, подтверждает силу указанного эффекта.

Внутренняя согласованность структуры входных данных – главный источник уверенности в прогнозе, основанном на этих входах. Например, люди с большей уверенностью предсказывают итоговые оценки студента, который в первый год обучения получал сплошные оценки «В», чем студента, получавшего в первый год много «А» и «С». Высоко согласованные структуры наблюдаются чаще всего в случаях, когда входные переменные избыточны или взаимосвязаны. Значит, люди с большей уверенностью строят предсказания на избыточных входных переменных. Однако элементарный вывод из статистики корреляции гласит, что при входных данных указанной валидности основанный на них прогноз будет более точным, если данные независимы друг от друга, чем если они взаимосвязаны или коррелируют. Так что взаимосвязь между входными данными снижает точность, хотя повышает уверенность; и люди часто уверены в прогнозах, которые бьют мимо цели [10].

Неверные представления о регрессии. Представьте, что большая группа детей выполняет две эквивалентные версии теста способностей. Если взять десять детей, получивших лучшие оценки по одной версии, скорее всего, окажется, что по второй версии теста результаты этой десятки разочаруют. И наоборот, если отобрать десять детей, получивших худшие результаты по одной версии, в среднем они покажут по второй версии результаты выше. Говоря обобщенно, рассмотрим две переменных X и Y, имеющих одинаковое распределение. Если взять индивидов, у которых X в среднем отклоняется от математического ожидания X на k единиц, то Y у них обычно будет отклоняться от математического ожидания Y меньше, чем на k. Это наблюдение иллюстрирует общий феномен, известный как регрессия к среднему, впервые описанный Гальтоном более ста лет назад.

В обычной жизни мы часто сталкиваемся с регрессией к среднему – при сравнении роста отцов и сыновей, ума мужей и жен или экзаменационных результатов. Тем не менее, даже зная об этом явлении, люди не начинают выдвигать правильные суждения. Во-первых, они не ожидают регрессии там, где она должна бы присутствовать. Во-вторых, обнаружив регрессию, они часто изобретают для нее фиктивные каузальные объяснения [11]. Мы полагаем, что феномен регрессии остается незамеченным, поскольку не согласуется с верой в то, что предсказанный результат должен максимально представлять входные данные и, следовательно, значения выходных переменных должны быть настолько же экстремальными, как и значения входных.

Неумение понять значимость регрессии имеет пагубные последствия, как показано в следующем наблюдении [12]. Обсуждая подготовку летчиков, опытные инструкторы отмечали, что похвала за особо мягкую посадку обычно приводит к тому, что следующая посадка получается хуже, а резкая критика за грубую посадку обычно приводит к улучшению в следующей попытке. Инструкторы пришли к выводу, что словесное поощрение губительно для обучения, а словесное наказание полезно, в отличие от общепринятой психологической доктрины. Такой вывод нельзя принять из-за наличия регрессии к среднему. Как и в других случаях с последовательными испытаниями, за улучшением обычно следует ухудшение, а после неудачной попытки обычно идет прекрасное исполнение, даже если инструктор не реагирует на первую попытку. Поскольку инструкторы хвалили обучаемого за хорошую посадку и ругали за плохую, они пришли к ложному и потенциально опасному выводу, что наказание эффективнее, чем поощрение.

Таким образом, непонимание эффекта регрессии ведет к переоценке эффективности наказания и недооценке эффективности поощрения. В социальном взаимодействии, как и в обучении, поощрение обычно применяется в случае хорошего исполнения, а наказание – в случае плохого. Однако благодаря регрессии поведение, вероятнее всего, улучшится после наказания и ухудшится после награды. Следовательно, жизнь так устроена, что, в силу чистой случайности, человека чаще всего награждают за наказание других и наказывают за их поощрение. Обычно такого положения не замечают. Итак, незаметная роль регрессии в определении явных последствий поощрений и наказаний, похоже, ускользнула от внимания исследователей.

Приложение А Суждения в условиях неопределенности: эвристические методы и ошибки

Репрезентативность

Приложение А

Суждения в условиях неопределенности: эвристические методы и ошибки