Байес против Коперника
Предсказывая будущее, в частности продолжительность существования Берлинской стены, нам необходимо оценить все возможные периоды существования явления: простоит ли стена один день, месяц, год, 10 лет? Чтобы применить правило Байеса, как мы видели, в первую очередь мы должны определить априорную вероятность всех этих периодов. И оказывается, что принцип Коперника – это как раз результат применения правила Байеса с использованием неинформативного априорного распределения.
Сперва может показаться, что в условии есть противоречие. Если правило Байеса всегда требует от нас указания априорных ожиданий и убеждений, как мы можем их указать при отсутствии таковых? В случае с лотереей оправдаться незнанием можно было бы, допустив одинаковую априорную вероятность, которая подразумевает, что любое соотношение выигрышных билетов одинаково вероятно. В случае с Берлинской стеной неинформативное априорное распределение означает, что мы ничего не знаем о временнóм интервале, который пытаемся предугадать: то есть стена может с равной вероятностью окончить свое существование в ближайшие пять минут или остаться еще на пять веков.
Помимо этого неинформативного априорного распределения, единственная информация, которую мы используем для правила Байеса, – тот факт, что на момент нашей первой «встречи» с Берлинской стеной она стояла уже восемь лет. То есть любая гипотеза, предсказывающая стене менее восьми лет существования в общей сложности, может быть исключена сразу же. (Аналогичным образом наличие двух орлов на одной монете исключается при появлении решки.) Любой период длиннее восьми лет вполне возможен, но, если бы стена в итоге простояла миллион лет, было бы удивительным стечением обстоятельств, что мы наткнулись на нее почти в самом начале ее существования. Таким образом, хоть мы и не можем исключить слишком длинные временные интервалы, вероятность их все же не очень высока. Когда правило Байеса комбинирует все эти вероятности (наиболее вероятный короткий отрезок уменьшает средний прогнозируемый показатель, а наименее вероятный, но все же возможный интервал увеличивает показатель), начинает действовать принцип Коперника: если мы хотим предсказать, как долго просуществует какое-то явление, и другой информации о явлении у нас нет, то лучшим предположением с нашей стороны будет следующее: явление будет существовать еще столько же, сколько существует на данный момент.
По сути, Готт не был первым, предложившим правило вроде принципа Коперника. В середине ХХ века последователь Байеса математик Гарольд Джеффрис пытался определить количество трамваев в городе, имея в качестве вводной информации серийный номер только одного трамвая, и ответ его был таким же: надо просто умножить серийный номер на два. Еще одна похожая задача появилась раньше, во время Второй мировой войны, когда страны Антанты хотели подсчитать количество танков, производимых Германией. Чисто математические подсчеты на основании серийных номеров захваченных танков показали, что немцы производили 246 танков в месяц, в то время как, по оценкам обширной (и крайне опасной) воздушной разведки, количество ежемесячно производимых за этот период танков составляло примерно 1400 единиц. После окончания войны немецкие архивы раскрыли истинную цифру: 245 танков в месяц.
Понимание того факта, что принцип Коперника – всего лишь правило Байеса с неинформативным априорным распределением, дает ответ на многие вопросы о его пригодности. Принцип Коперника кажется разумным как раз в тех ситуациях, когда нам не известно абсолютно ничего (разглядывая Берлинскую стену в 1969 году, мы даже не были уверены в том, какая временнáя шкала подойдет). А в тех случаях, когда мы знаем что-то об объекте, этот принцип в корне неверен. Предсказывать 90-летнему человеку жизнь до 180 кажется неразумным именно потому, что нам многое известно о продолжительности жизни человека, поэтому здесь нам виднее. Чем больше априорной информации мы берем для правила Байеса, тем более полезными могут оказаться предсказания, сделанные на его основе.