Базовые ставки: брать или рассчитывать?
В только что описанных экспериментах продемонстрировано смещение базовой ставки, для которого дана соответствующая информация. Мы располагали частотностью синих и зеленых такси. Нам сказали, что свидетельница давала правильные ответы в 80 % случаев. Мы информированы о соотношении между инженерами и юристами. Нам сообщили о распространенности болезни, а также частоте ложных и истинных ответов. Располагая необходимой информацией, мы делаем только одно – применяем формулу и правильно рассчитываем.
Однако в реальном мире нас редко информируют о базовых ставках, их требуется узнать. Нассим Николас Талеб пишет в «Черном лебеде»: «Казино, по-моему, единственное из основанных на риске предприятий, где вероятность постижима, статистически выводима и, можно сказать, вычисляема… В реальной жизни шансы вам неведомы; до них приходится докапываться, при том что источники неопределенности не очерчены».
Иногда узнать о базовых ставках просто. Если вы интересуетесь количеством синих и зеленых такси, проблему можно решить с помощью нескольких удачных телефонных звонков в таксомоторные компании или, может быть, запроса в отдел автотранспортных средств. Кроме того, вы можете убедиться, что это данные регистрации такси за текущий год, а не за прошлый.
С другой стороны, количество зарегистрированных в городе такси может быть не самой полезной базовой ставкой. Если мы хотим определить, права ли наша свидетельница, лучше узнать, сколько синих и зеленых такси работали именно тем вечером. Может быть, работали все синие и только три пятых зеленых, что сделает базовые ставки несколько другими. А еще лучше выяснить, сколько машин каждого цвета работали в этот вечер, а также находились в районе, где произошел несчастный случай. С технологией GPS это вполне возможно. Конечно, придется решить, какую территорию включать: несколько кварталов или больше? Чем точнее наша оценка времени, когда произошла авария, тем меньше площадь; чем больше промежуток времени, тем площадь больше.
Это кажется трудным? Так и есть. Признать необходимость учитывать базовые ставки – только начало. Расчет с помощью теоремы Байеса принесет не много пользы, если мы не знаем, какие базовые ставки должны использовать.
В эксперименте в Гарвардской медицинской школе тоже были представлены все необходимые факты: распространенность заболевания и частота неправильных ответов. С помощью этой информации мы могли рассчитать, что более 98 % положительных результатов будет наблюдаться у здоровых людей. Но кто говорит, что распространенность заболевания составляет один к тысяче? В реальном мире эту информацию нам никто не предоставляет. А найти ее часто очень сложно.
Например, болезнь Паркинсона – дегенеративное заболевание центральной нервной системы, которое обычно поражает людей старше 50 лет. Хотя болезнь известна почти 200 лет (впервые она описана английским врачом Джеймсом Паркинсоном в 1817 году, он назвал ее «дрожательный паралич»), у нас нет точных лабораторных тестов, так что врачам приходится ставить диагноз на основании несовершенного неврологического обследования. Сканирование мозга исключает другие нарушения, но не может окончательно подтвердить болезнь Паркинсона. На самом деле, иногда этот диагноз может быть подтвержден, только когда лекарства наподобие леводопа уменьшают моторные нарушения. Наличие заболевания подтверждается только после того, как лечение оказывается эффективным!
Тем не менее было подсчитано, что в Соединенных Штатах болезнь поражает 2,1 % людей в возрасте 65 лет и старше, 2,2 % в Нидерландах и примерно столько же во многих европейских странах. На фоне этих довольно стабильных цифр заметно выделяется Китай: на протяжении многих лет китайцы сообщают об очень низкой частоте болезни Паркинсона, от 0,1 до 1,0 %. Чем объясняется такой низкий уровень? Генетикой, питанием или образом жизни? Некоторые исследователи считали, что существует более простое объяснение: низкий уровень зарегистрированных случаев отражает неадекватную диагностику. Реальная проблема в том, что многие случаи не выявлены или о них не сообщалось. В течение нескольких месяцев группу врачей обучали проводить первоначальное тестирование в местных клиниках, после чего проводилось неврологическое обследование в трех региональных центрах. Этот подход позволил выявить множество неучтенных случаев, и в итоге распространенность болезни Паркинсона у китайцев в возрасте 65 лет и старше выросла до 1,7 %.
Сегодня считается, что распространенность болезни Паркинсона одинакова во всем мире. Но это требовалось установить.