Априорные предположения реального мира…
В широком смысле в мире есть две категории явлений: те, которые стремятся к (или группируются вокруг) некоему естественному значению, и те, которые к ней не стремятся.
Продолжительность жизни человека, очевидно, находится в первой категории. Она попадает под нормальное распределение, также известное как гауссово распределение, названное так в честь немецкого математика Карла Фридриха Гаусса, а в быту иногда называемое колоколообразной кривой благодаря характерной форме графика. График действительно адекватно характеризует отрезок жизни человека. В США средняя продолжительность жизни мужчин, например, составляет примерно 76 лет, и вероятности не слишком отклоняются от этого показателя. Нормальное распределение обычно имеет одну применимую шкалу: продолжительность жизни, выраженная одной цифрой, считается трагично короткой, а тремя – удивительно длинной. Многие другие вещи в природе тоже попадают под нормальное распределение – от роста, веса и давления человека до дневной температуры воздуха в городе и диаметра фруктов в саду. Однако есть в мире и ряд значений, которые не выглядят нормально распределенными. Средняя численность населения в небольшом городе в США, например, составляет 8226 человек. Но, если вы подготовите таблицу с указанием городов и численности их жителей и построите по ней график, вы даже близко не увидите никакого колокола. Вы обнаружите, что городов с численностью меньше 8226 человек гораздо больше, чем тех, где численность выше этой отметки. В то же время в более крупных городах численность населения будет гораздо выше средней. Такая модель определяется так называемым экспоненциальным распределением. Оно также известно как безмасштабное распределение, поскольку характеризует количественные показатели, которые, вполне возможно, могут иметь различные масштабы: например, население города может насчитывать десять, сто, тысяча, десятки тысяч, сотни тысяч или миллионы жителей, и таким образом мы не можем отметить единственный критерий для определения размера «нормального» города.
Экспоненциальное распределение характеризует множество явлений в нашей повседневной жизни, у которых есть такое же базовое качество, как и у городов с их населением: огромное количество элементов имеет показатели ниже среднего, и лишь несколько – выше среднего. Суммы кассовых сборов от продаж билетов, которые могут выражаться десятизначными числами, – это другой пример. Большинство фильмов не собирают много денег, но какой-нибудь редкий «Титаник» может принести поистине гигантские суммы.
По сути, деньги – область, где почти повсеместно действует экспоненциальное распределение. Оно характеризует и уровень материального благосостояния людей, и их доходы. Средний уровень дохода в США, например, составляет 55 688 долларов, но, поскольку доход можно распределить очень приблизительно, мы снова обнаружим, что большее количество человек будет иметь доход ниже среднего, зато у тех, кто окажется выше средней отметки, сумма дохода будет просто фантастической. Ситуация такова: две трети населения США имеют доход ниже среднего, но 1 % на самом верху зарабатывает в 10 раз больше среднего показателя. А самая высшая категория, составляющая 1 % от этого 1 %, получает еще в 10 раз больше. Мы часто сокрушаемся, что богатые становятся еще богаче, и в самом деле процесс предпочтительного присоединения – один из самых надежных способов создать экспоненциальное распределение. Крайне вероятно, что на самые популярные интернет-сайты будут заходить новые люди; у самых популярных онлайн-знаменитостей, с высокой степенью вероятности, будут появляться новые поклонники; наиболее престижные фирмы, скорее всего, будут привлекать новых клиентов; в крупнейшие города, крайне вероятно, будут прибывать новые жители. В каждом случае экспоненциальное распределение будет работать.
Правило Байеса подсказывает, что, когда нам приходится оценивать вероятность исходя из ограниченного количества фактов, только один фактор так же важен, как правильные априорные предположения. Это характер распределения, из которого мы получили эти факты. Хорошие предсказания начинаются с правильного понимания, с чем мы имеем дело – с нормальным распределением или экспоненциальным. Как оказалось, правило Байеса предлагает нам абсолютное иное, очень простое проверенное средство для обоих случаев.