Правило Байеса
Все эти предположения постижимы и последовательны. Почему мы должны отдавать предпочтение одному из них, который не является более постижимым и последовательным, нежели остальные?
Дэвид Юм
Лаплас также внес важное дополнение к правилу Байеса: что делать с гипотезами, вероятность которых выше, чем у других. Например, даже с учетом того, что в лотерею могут выиграть 99 % людей, купивших лотерейные билеты, все же более вероятно, как мы можем предположить, что приз достанется только 1 %. Это предположение должно быть отражено в наших оценочных данных.
Приведем пример. Допустим, ваш друг демонстрирует вам две монеты. Одна – обычная, «правильная» монета, у которой есть орел и решка, а у другой – два орла на обеих сторонах. Он бросает монеты в мешок и наугад достает одну из них. Подбрасывает – и выпадает орел. Как вы думаете, какую из монет достал ваш друг?
Схема Байеса о работе в обратном направлении даст легкий ответ на этот вопрос. Орел выпадет в 50 % случаев, если монета обычная, и в 100 %, если она двухсторонняя. Таким образом, мы можем с уверенностью утверждать, что ответ будет
или что вероятность того, что друг достал двухстороннюю монету, вдвое выше.
А теперь рассмотрим следующий вариант. На этот раз у друга девять обычных монет и одна монета с двумя орлами. Он бросает все десять монет в мешок, вытаскивает одну наугад и подбрасывает: орел! Что вы подумаете теперь? Была это обычная монета или с двумя орлами?
Закон Лапласа предусматривает и такой вариант, и ответ вновь впечатляюще прост. Как и в предыдущем случае, у обычной монеты шанс, что выпадет орел, в два раза ниже, чем у двухсторонней. Но теперь вероятность вытащить из мешка первой обычную монету в девять раз выше. Получается, мы можем просто взять эти два различных расчета и перемножить их между собой: вероятность, что ваш друг держит обычную монету, а не двухстороннюю, ровно в 4,5 раза выше.
Математическая формула, которая отражает это соотношение, связывая воедино наши прежние представления и доказательства, стала известна как правило Байеса – хотя, по иронии судьбы, именно Лаплас внес больший вклад в ее разработку. И она дает нам удивительно простое и четкое решение проблемы, как объединить ранее существовавшие убеждения с наблюдаемыми ныне доказательствами: просто перемножить их вероятности между собой.
Стоит отметить, что существование ранних предположений имеет решающее значение в работе этой формулы. Если ваш друг просто подойдет к вам со словами: «Я подбросил монетку, взятую из этого мешка, и выпал орел. Как думаешь, какова вероятность, что это обычная монета?» – вы не сможете ответить на этот вопрос, не имея никакой, хоть мало-мальской информации о том, какие монеты вообще были в этом мешке. (Вы не можете перемножить две вероятности, не имея значения одной из них.) Это предположение, что было в мешке до подбрасывания монетки (то есть шансы каждой гипотезы оказаться верной еще до получения каких-либо точных данных), получило название априорной вероятности. И согласно правилу Байеса вам всегда требуется некоторая априорная вероятность, даже если это просто догадки. Сколько всего существует двухсторонних монет? Насколько легко их достать? И в какой степени ваш друг – аферист, в конце концов?
Из-за того что правило Байеса всегда зависит от использования априорных вероятностей, на разных этапах истории оно считалось спорным, предвзятым и даже антинаучным. Но в действительности мы довольно редко попадаем в настолько незнакомую ситуацию, что наш разум становится подобен чистому листу (пункт, к которому мы сейчас вернемся).
Между тем, когда у вас есть некие значения априорных вероятностей, правило Байеса применимо к широкому кругу проблем прогнозирования, будь то большие объемы данных или более общий вид малых данных. Вычисление вероятности выигрыша в лотерею или выбрасывания орла – это только начало. Методы, разработанные Байесом и Лапласом, придут на помощь в любой ситуации, где есть некая неопределенность и какое-то количество данных для работы. И это как раз то, с чем мы имеем дело, пытаясь предсказать будущее.