Книга: Думай медленно… Решай быстро
Назад: Разговоры о регрессии к среднему
Дальше: Взгляд на регрессию с точки зрения двух систем

Коррекция интуитивных предсказаний

Вернемся к Джули, нашей одаренной читательнице. Метод правильного предсказания ее среднего балла описан в предыдущей главе. Как и ранее – для гольфа несколько дней подряд или для веса и игры на пианино, – я приведу схематическую формулу для факторов, определяющих оценку навыков чтения и оценки в колледже:

оценка навыков чтения = общие факторы + факторы, важные для оценки навыков чтения = 100%

средний балл = общие факторы + факторы, важные для среднего балла = 100%

К общим факторам относятся генетические способности, то, насколько семья поддерживает интерес к учебе, и все то, из-за чего одни и те же люди в детстве рано начинают читать, а в юности успешно учатся. Конечно, есть множество факторов, которые повлияют только на одно из этих событий: возможно, слишком требовательные родители научили Джули читать в раннем возрасте, или ее оценки в колледже пострадали из-за несчастной любви, или подростком, катаясь на лыжах, она получила травму, вызвавшую задержку в развитии, и так далее.

Вспомните, что корреляция между двумя величинами – в данном случае между оценкой навыков чтения и средним баллом – равна доле совпадающих определяющих факторов в их общем числе. По-вашему, как велика эта доля? По моим самым оптимистичным оценкам – примерно 30 %. Если взять за основу эту цифру, то мы получим все исходные данные для того, чтобы сделать неискаженное предсказание, производя следующие четыре действия:



1. Начните с оценки типичного среднего балла.

2. Определите средний балл, соответствующий вашим впечатлениям от имеющихся сведений.

3. Оцените корреляцию между вашими данными и средним баллом.

4. Если корреляция составляет 0,30, переместитесь от типичного среднего балла на 30 % расстояния в сторону среднего балла, соответствующего впечатлениям.



Первый пункт дает вам точку отсчета, средний балл, который вы предсказали бы для Джули, если бы ничего о ней не знали. В отсутствие информации вы бы предсказали типичный средний балл. (Это похоже на то, как без других данных о Томе В. ему приписывают априорную вероятность студента по специальности «управление бизнесом».) Второй пункт – интуитивное предсказание, соответствующее вашей оценке данных. Третий пункт перемещает вас от точки отсчета в сторону интуиции на расстояние, зависящее от вашей оценки корреляции. В четвертом пункте вы получаете предсказание, учитывающее вашу интуицию, но гораздо более умеренное.

Это – общий подход, который можно применять при любой необходимости прогнозировать количественную переменную: например, средний балл, или доход от инвестиций, или рост компании. Он основывается на интуиции, но умеряет ее, сдвигает к среднему. Если существует веская причина доверять точности интуитивных предсказаний (то есть сильная корреляция между предсказанием и данными), такая поправка будет небольшой.

Интуитивные прогнозы необходимо корректировать, поскольку они нерегрессивны, а потому искажены. Предположим, я предскажу, что у каждого гольфиста на второй день турнира будет то же число очков, что и в первый. Эта оценка не учитывает регрессию к среднему: те, кто в первый день играл хорошо, в среднем на следующий день справятся хуже, а те, кто играл плохо, в основном станут играть лучше. Нерегрессивные предсказания всегда будут искаженными в сравнении с реальными результатами. В среднем они слишком оптимистичны для тех, кто хорошо играл вначале, и слишком мрачны для тех, кто плохо стартовал. Экстремальность прогноза соответствует экстремальности данных. Сходным образом, если использовать детские успехи для предсказания оценок в колледже без регрессии к среднему, то юношеские достижения ранних чтецов разочаровывают, а успехи тех, кто стал читать относительно поздно, приятно удивляют. Скорректированные интуитивные предсказания избавляются от этих искажений, так что и высокие, и низкие прогнозы примерно одинаково переоценивают и недооценивают истинное значение. Разумеется, даже неискаженные предсказания бывают ошибочны, но в таких случаях ошибки меньше и не склоняются в сторону завышенного или заниженного результата.

Защита экстремальных предсказаний?

Ранее мы познакомились с Томом В. для иллюстрации предсказаний дискретных результатов, например области специализации или успеха на экзамене, которые выражаются присвоением вероятности определенному событию (или, в случае с Томом, расположением результатов от наиболее до наименее вероятного). Я также описал процесс противодействия распространенным искажениям дискретных предсказаний: пренебрежению априорными вероятностями и нечувствительности к качеству информации.

Искажения в прогнозах, выражающихся в шкале, как, например, средний балл или доход фирмы, сходны с искажениями, наблюдающимися при оценке вероятностей исходов.

Процедуры коррекции также схожи:



• Обе содержат исходное предсказание, которое бы вы сделали при отсутствии информации. В случае с категориями это были априорные вероятности, в случае с цифрами – средний результат в соответствующей категории.

• Обе оценки содержат интуитивное предсказание, выражающее пришедшее в голову число, независимо от того, вероятность это или средний балл.

• В обоих случаях ваша цель – дать прогноз, находящийся посередине между исходным предсказанием и вашим интуитивным ответом.

• В случае, когда нет никаких данных, вы придерживаетесь исходного прогноза.

• В другом крайнем случае вы придерживаетесь своего интуитивного прогноза. Разумеется, это произойдет, если вы останетесь в нем уверены, критически пересмотрев данные в его пользу.

• Чаще всего вы найдете причины сомневаться в существовании идеальной корреляции между истиной и вашим интуитивным прогнозом и в итоге окажетесь где-то посередине.



Эта процедура – аппроксимация вероятных результатов надлежащего статистического анализа. В случае успеха она приведет вас к неискаженным прогнозам, разумным оценкам вероятности и умеренным предсказаниям численных результатов. Обе процедуры направлены на устранение одного и того же искажения: интуитивные прогнозы, как правило, отличаются чрезмерной уверенностью и экстремальностью.



Коррекция интуитивных предсказаний – задача для Системы 2. Для поиска соответствующей референтной категории, а также для оценки исходного прогноза и качества данных требуются значительные усилия. Они оправданы лишь в случае, когда ставки высоки, а вы усиленно стремитесь не допустить ошибки. Более того, необходимо помнить, что коррекция предсказаний может осложнить вам жизнь. Неискаженные прогнозы отличаются тем, что позволяют предсказывать редкие или экстремальные события лишь при наличии очень хорошей информации. Если вы ждете от своих предсказаний умеренной надежности, вы никогда не угадаете редкий или далекий от среднего результат. Если вы даете неискаженные прогнозы, вам никогда не испытать удовольствия правильно назвать редкий случай. Вы никогда не сможете сказать: «Я так и думал!», когда ваш студент-юрист станет верховным судьей или когда новая компания, казавшаяся вам очень перспективной, в итоге добьется огромного коммерческого успеха. С учетом ограничений данных вы никогда не предскажете, что способный старшеклассник будет учиться на «отлично» в Принстоне. По тем же причинам венчурному капиталисту никогда не скажут, что в начале развития у новой компании «очень высокая» вероятность успеха.

Возражения относительно принципа смягчения интуитивных прогнозов следует воспринимать всерьез, потому что отсутствие искажений – не всегда важнее всего. Неискаженные прогнозы предпочтительны, если все ошибки равнозначны, независимо от их направления. Однако встречаются ситуации, в которых один тип ошибок намного хуже другого. Когда венчурный капиталист ищет новый проект, риск упустить новый Google или Facebook намного важнее, чем риск вложить скромную сумму в заурядную новую компанию. Цель венчурных капиталистов – выявить особые случаи, даже если из-за этого они переоценят перспективы многих других предприятий. Для консервативного банкира, дающего большие займы, риск банкротства одного заемщика может перевесить риск отказа нескольким потенциальным клиентам, которые выполнили бы свои обязательства. В таких случаях использование категоричных выражений («отличные перспективы», «серьезный риск неплатежеспособности») может быть оправдано ради успокоения, даже если информация, на которой они основаны, всего лишь умеренно надежна.

Для разумного человека неискаженные умеренные предсказания не представляют проблемы. В конце концов, разумные венчурные капиталисты знают, что даже у самых многообещающих новых компаний шансы на успех весьма ограничены. Их работа – выбрать лучшие из имеющихся, и они не чувствуют потребности обманывать себя относительно перспектив проекта, в который собираются вложить деньги. Соответственно, рациональные индивиды, предсказывающие доход фирмы, не будут привязываться к одному числу, а рассмотрят диапазон неопределенности вокруг самого вероятного результата. Разумный человек, оценив предприятие, которое, скорее всего, потерпит неудачу, может вложить в него крупную сумму, если награда за успех будет достаточно велика, – но при этом не будет питать иллюзий насчет шансов на подобный исход. Однако не все мы рациональны, и многим необходимо ощущать себя защищенными от искаженных оценок, иначе способность принимать решения будет парализована. Если вы решите обманывать себя, принимая экстремальные прогнозы, не забывайте о том, что вы потакаете собственным желаниям.

Мои корректирующие процедуры ценны тем, что заставляют думать об объеме известной вам информации. Рассмотрим следующий, распространенный в научном мире пример, вызывающий прямые аналогии с другими сферами жизни: факультет собирается нанять молодого преподавателя и хочет выбрать кандидата с наилучшим потенциалом для научной работы. Выбор свелся к двоим.

Ким недавно закончила дипломный проект. У нее отличные рекомендации, она замечательно выступила и произвела на всех прекрасное впечатление во время собеседований. Серьезной истории научных исследований у нее нет.



Джейн последние три года занимала должность постдокторанта. Она очень эффективно работала, провела множество исследований, но доклад и собеседования были не такими яркими, как у Ким.

Интуитивно хочется выбрать Ким, потому что она произвела более сильное впечатление, а что ты видишь, то и есть. Однако информации о Ким гораздо меньше, чем о Джейн. Мы вернулись к закону малых чисел. По сути, выборка информации о Ким меньше, чем о Джейн, а в маленьких выборках намного чаще наблюдаются экстремальные результаты. В них бо́льшую роль играет удача, а значит, предсказания результатов Ким необходимо сильнее сместить к среднему. Допустив, что Ким регрессирует сильнее, чем Джейн, вполне можно выбрать Джейн, хотя она произвела на вас более слабое впечатление. Делая выбор в научной среде, я бы голосовал за Джейн, хотя и приложил бы некоторые усилия для преодоления интуитивного впечатления о большей перспективности Ким. Следовать предчувствиям естественнее и приятнее, чем действовать вопреки им.

Легко представить себе похожие проблемы в других ситуациях, например, когда венчурному капиталисту необходимо выбрать, в какую из двух новых компаний, работающих на разных рынках, вложить деньги. У одной компании есть продукт, спрос на который можно довольно точно оценить. Другая фирма привлекательна и – с точки зрения интуиции – кажется многообещающей, но ее перспективы менее надежны. Следует задуматься о том, сохранит ли прогноз возможностей второй компании свою бо́льшую привлекательность после учета неопределенности.

Назад: Разговоры о регрессии к среднему
Дальше: Взгляд на регрессию с точки зрения двух систем

Ирина
Пп
Алексей
Перезвоните мне пожалуйста 8(812) 747-16-80 Алексей.
Денис
Перезвоните мне пожалуйста 8(999) 529-09-18 Денис.