Книга: Байесовская статистика: Star Wars, LEGO, резиновые уточки и многое другое
Назад: 16. Введение в коэффициент Байеса и апостериорные шансы: конкуренция идей
Дальше: 18. Когда данные не убеждают

17. Байесовские рассуждения в «Сумеречной зоне»

В главе 16 мы применили коэффициент Байеса и апостериорные шансы, чтобы выяснить, во сколько раз одна гипотеза лучше другой. Но эти инструменты байесовского рассуждения могут сделать даже больше, чем просто сравнить идеи. В этой главе мы будем использовать коэффициент Байеса и апостериорные шансы для количественной оценки того, сколько доказательств понадобится, чтобы убедить кого-то в гипотезе. Мы увидим, как оценить силу чьих-то убеждений в определенную гипотезу, и все это на примере эпизода «Сумеречной зоны».

Байесовские рассуждения в «Сумеречной зоне»

Один из моих любимых эпизодов «Сумеречной зоны» называется «Вовремя». В этом эпизоде молодожены Дон и Пэт сидят в закусочной маленького городка и ждут, пока отремонтируют их машину. На столике в кафе они видят машину-гадалку «Мистический предсказатель», которая принимает вопросы «да» или «нет» и за монетки выкладывает карточки с ответами на каждый вопрос.

Суеверный Дон задает Мистическому предсказателю ряд вопросов. Когда машина отвечает правильно, он начинает верить в ее сверхъестественные способности. Тем не менее Пэт скептически относится к возможностям машины, хотя Предсказатель продолжает давать правильные ответы.

Хотя Дон и Пэт наблюдают одни и те же данные, они приходят к разным выводам. Как объяснить, почему они по-разному рассуждают, когда видят одно и то же? Используем коэффициент Байеса, чтобы лучше понять, как оба персонажа думают о данных.

Коэффициента Байеса и Мистический предсказатель

В этом эпизоде мы столкнулись с двумя конкурирующими гипотезами. Давайте назовем их H и Eqn0134.tif (или «не H»), поскольку одна гипотеза является отрицанием другой:

H — Мистический предсказатель действительно может предсказать будущее.

Eqn0135.tif — Мистическому предсказателю просто повезло.

Наши данные, в этом случае D, — последовательность из n правильных ответов, которые дает Мистический предсказатель. Чем больше n, тем сильнее доказательства в пользу H. Основное предположение заключается в том, что Мистический предсказатель всегда прав, поэтому возникает вопрос: является ли этот результат сверхъестественным или это просто совпадение? Наши данные D всегда представляют последовательность из n правильных ответов. Оценим правдоподобность или вероятность получения наших данных с учетом каждой гипотезы.

P (D | H) — это вероятность получить n правильных ответов подряд, учитывая, что Мистический предсказатель может предсказать будущее. Эта вероятность всегда будет равна 1, независимо от количества задаваемых вопросов. Если Мистический предсказатель имеет сверхъестественные свойства, то всегда найдет правильный ответ, независимо от того, задан один вопрос или тысяча. Это также означает, что если Мистический предсказатель выдаст один неверный ответ, вероятность этой гипотезы упадет до 0, так как экстрасенсорная машина никогда не будет угадывать неправильно. В этом случае может потребоваться выдвинуть более слабую гипотезу, например, что Мистический предсказатель прав в 90 % случаев (аналогичную задачу рассмотрим в главе 19).

Eqn0136.tif — это вероятность получения n правильных ответов подряд, если Мистический предсказатель выдает ответы случайно. Здесь Eqn0137.tif составляет 0,5n. Другими словами, если машина просто угадывает, то каждый ответ с вероятностью 0,5 может быть правильным.

Чтобы сравнить эти гипотезы, посмотрим на отношение двух вероятностей:

Eqn0138.tif.

Напомню, что отношение измеряет, во сколько раз вероятнее данные с учетом H, в отличие от Eqn0139.tif, если предполагается, что обе гипотезы одинаково вероятны. Теперь посмотрим, как сравнить их.

Измерение коэффициента Байеса

Как и в предыдущей главе, временно проигнорируем соотношение априорных шансов и сконцентрируемся на сравнении отношения правдоподобия, или коэффициента Байеса. Мы предполагаем (на данный момент), что Мистический предсказатель может как обладать сверхъестественными способностями, так и просто угадывать ответы.

В этом примере числитель P (D | H) всегда равен 1, поэтому для любого значения n мы имеем:

Eqn0140.tif.

Представим, что Мистический предсказатель дал три правильных ответа: P (D3 | H) = 1 и P (D | H) = 0,53 = 0,125. Очевидно, что Н объясняет данные лучше, но никого, даже суеверного Дона, не убедить только тремя правильными догадками. Предполагая, что априорные шансы одинаковы, вычислим коэффициент Байеса для трех вопросов:

Eqn0141.tif.

Мы можем использовать те же принципы, которые использовали для оценки апостериорных шансов в табл. 16.1, чтобы оценить здесь коэффициенты Байеса (если мы предположим, что каждая гипотеза одинаково вероятна). Из табл. 17.1 видно, что коэффициент Байеса (КБ), равный 8, далеко не окончательный.

Таблица 17.1. Руководство по оценке коэффициентов Байеса

КБ

Сила доказательств

1 к 3

Интересно, но ничего неопровержимого

3 к 20

Похоже, мы к чему-то движемся

20 к 150

Сильные доказательства в пользу H1

> 150

Подавляющие доказательства в пользу H1

Итак, принимая во внимание три вопроса, на которые дан правильный ответ и КБ = 8, мы должны как минимум заинтересоваться силой Мистического предсказателя, хотя пока не должны быть полностью уверены.

К этому моменту Дон, похоже, уже уверен, что Мистический предсказатель — экстрасенс. Ему достаточно только четырех правильных ответов, чтобы убедиться в этом. С другой стороны, Пэт требуется 14 вопросов, чтобы только начать всерьез рассматривать эту возможность, в результате чего коэффициент Байеса составляет 16 384 — гораздо больше доказательств, чем ей нужно.

Однако вычисление коэффициента Байеса не объясняет, почему Дон и Пэт формируют разные убеждения относительно доказательств. Что же происходит?

Учитываем априорные убеждения

Отсутствующий элемент — это априорное убеждение каждого персонажа в гипотезах. Помните, что Дон чрезвычайно суеверен, а Пэт скептик. Очевидно, что Дон и Пэт используют дополнительную информацию в своих ментальных моделях, потому что каждый из них приходит к выводу о разной силе и в разное время. Такое довольно часто встречается в повседневных рассуждениях: два человека по-разному реагируют на одни и те же факты.

Смоделируем это явление, просто представив начальные шансы P (H) и Eqn0142.tif без дополнительной информации. Назовем его отношением априорных шансов, как было показано в главе 16:

Eqn0143.tif.

Концепция априорных убеждений в отношении коэффициента Байеса на самом деле интуитивна. Скажем, мы идем в закусочную из «Сумеречной зоны», и я спрашиваю вас: «Каковы шансы, что Мистический предсказатель — экстрасенс?» Вы можете ответить: «Ну, один на миллион! Не может быть, чтобы эта штука была сверхъестественной». Математически мы можем выразить это следующим образом:

Eqn0144.tif.

Теперь объединим это априорное убеждение с нашими данными. Для этого умножим априорные шансы на результаты отношения правдоподобия, чтобы получить апостериорные шансы для гипотезы, учитывая наблюдаемые данные:

Eqn0145.tif.

Предполагая, что у Мистического предсказателя есть только один шанс на миллион иметь экстрасенсорные способности без учета любых доказательств — довольно сильный скептицизм. Байесовский подход достаточно хорошо его отражает. Если вы думаете, что гипотеза о том, что Мистический предсказатель сверхъестествен, крайне маловероятна, то потребуется значительно больше данных, чтобы убедиться в обратном. Предположим, Мистический предсказатель выдает пять правильных ответов. Тогда коэффициент Байеса становится следующим:

Eqn0146.tif.

Коэффициент Байеса, равный 32, — это достаточно сильное убеждение, что Мистический предсказатель действительно сверхъестествен. Но если добавить весьма скептические априорные шансы для расчета апостериорных шансов, то мы получим следующие результаты:

Eqn0147.tif.

Теперь апостериорные шансы указывают, что экстрасенсорность машины крайне маловероятна. Этот результат вполне соответствует интуитивному представлению. Опять же, если вы действительно не верите в гипотезу с самого начала, потребуется много доказательств, чтобы убедить вас в обратном.

При работе в обратном направлении апостериорные шансы могут помочь выяснить, сколько доказательств понадобится, чтобы заставить вас поверить в H. При апостериорных шансах, равных 2, вы начинаете просто рассматривать сверхъестественную гипотезу. Таким образом, если провести расчет для шансов, превышающих 2, то можно определить, что потребуется, чтобы убедить вас.

Eqn0148.tif.

Если мы проведем расчет для n до ближайшего целого числа, получим:

n > 21.

При 21-м правильном ответе подряд даже сильный скептик должен задуматься о том, что Мистический предсказатель на самом деле может быть экстрасенсом.  

Таким образом, априорные шансы могут сделать гораздо больше, чем просто сказать, как сильно мы верим чему-то, учитывая наш опыт. Они также помогут точно определить, сколько доказательств нужно, чтобы убедиться в гипотезе. Верно и обратное: если после 21 правильного ответа подряд вы сильно верите в Н, то, возможно, захотите ослабить априорные шансы.

Развитие собственных экстрасенсорных способностей

Мы научились сравнивать гипотезы и рассчитывать, сколько положительных доказательств потребуется, чтобы убедить нас в Н, учитывая наше априорное убеждение в Н. Теперь рассмотрим еще один прием: количественную оценку априорных убеждений Дона и Пэт на основе их реакции на доказательства.

Мы не знаем точно, насколько сильно Дон и Пэт верят в возможность того, что Мистический предсказатель — экстрасенс, когда они впервые заходят в закусочную. Но мы знаем, что Дону нужно около семи правильных ответов, чтобы убедиться в сверхъестественных способностях Мистического предсказателя. По оценкам, на данный момент апостериорные шансы Дона составляют 150 — порог для очень сильных убеждений, согласно табл. 17.1. Теперь выпишем все, что знаем, за исключением O (H), который нужно будет вычислить:

Eqn0149.tif.

Решение уравнения для O (H) дает результат:

O (H)Дон= 1,17.

Теперь у нас есть количественная модель для верований Дона. Поскольку его начальное соотношение шансов больше 1, Дон входит в забегаловку с чуть большей готовностью полагать, что Мистический предсказатель сверхъестествен, еще до сбора каких-либо данных. Это имеет смысл, если принять во внимание его суеверный характер.

Теперь Пэт. При 14 правильных ответах Пэт нервничает, называя Мистический предсказатель глупым куском мусора. Хотя она начала подозревать, что Мистический предсказатель может быть экстрасенсом, она не так уверена, как Дон. Я бы оценил, что ее апостериорные шансы равны 5 — с этого момента она может начать думать: «Может быть, Мистический предсказатель мог бы обладать экстрасенсорными способностями…» Рассчитаем последующие шансы для убеждений Пэт таким же образом:

Eqn0150.tif.

При решении уравнения для O (H) смоделируем скептицизм Пэт как:

O (H)Пэт= 0,0003.

Другими словами, Пэт, входя в закусочную, сказала бы, что у Мистического предсказателя есть 1 шанс на 3000 быть сверхъестественным. Это тоже интуитивно; Пэт начинает с очень сильного убеждения, что машина-гадалка — не более чем забавная игрушка, которой они с Доном могут занять себя.

То, что мы сделали здесь, замечательно. Мы использовали наши правила вероятности, чтобы составить количественное утверждение о том, кто во что верит. По сути, мы стали телепатами!

Заключение

В этой главе мы изучили три способа использования коэффициентов Байе­са и апостериорных шансов для оценки вероятностных рассуждений. Мы узнали в предыдущей главе, что можно использовать апостериорные шансы для сравнения двух идей. Затем увидели, что если мы знаем нашу априорную веру в шансы одной гипотезы против другой, то можем точно рассчитать, сколько доказательств потребуется, чтобы убедить нас в том, что стоит изменить убеждения. Наконец, мы использовали апостериорные шансы, чтобы присвоить ценность предыдущим убеждениям каждого человека, посмотрев, сколько нужно доказательств, чтобы убедить его. В конце концов, апостериорные шансы — гораздо больше чем просто способ проверить идеи. Они служат основой в рассуждениях в условиях неопределенности.

Теперь вы можете использовать свои собственные «мистические» способности байесовских рассуждений, чтобы выполнить приведенные ниже упражнения.

Упражнения

Чтобы убедиться, что вы понимаете количественную оценку числа доказательств, которые необходимо предоставить, чтобы убедить кого-либо в гипотезе и оценить силу чужого априорного убеждения, попробуйте ответить на эти вопросы.

1. Каждый раз, когда вы и ваш друг встречаетесь, чтобы посмотреть фильм, вы подбрасываете монетку, чтобы определить, кто выберет фильм. Друг всегда выбирает орла, и каждую пятницу в течение 10 недель выпадает орел. Вы выдвигаете гипотезу, что у монетки два орла, а не орел и решка. Вычислите коэффициент Байеса для гипотезы о том, что монетка с подвохом, в отношении к гипотезе о том, что монетка честная. Что одно только это соотношение говорит о том, обманывает ли ваш друг или нет.

2. Теперь представьте три случая: ваш друг немного шутник, ваш друг большую часть времени честен, но иногда может схитрить, и ваш друг очень надежный. В каждом случае оцените некоторые априорные коэффициенты шансов для вашей гипотезы и вычислите апостериорные шансы.

3. Предположим, вы очень доверяете другу. Задайте априорные шансы обмана равными 1/10 000. Сколько раз должен выпасть орел, прежде чем вы начнете сомневаться в невиновности друга — скажем, с апостериорными шансами 1?

4. Другой ваш друг также общается с вышеописанным другом, и после лишь четырех недель выпадения орла он твердо решил, что вас обманывают. Такая уверенность подразумевает апостериорные шансы около 100. Какую ценность вы бы присвоили априорному убеждению этого друга, что первый друг — мошенник?

«Сумеречная зона» — американский телевизионный сериал-антология, просуществовал пять сезонов на канале CBS с 1959 по 1964 год. Каждый эпизод представляет собой отдельную историю, в которой персонажи сталкиваются часто с тревожными или необычными событиями, явлениями или переживаниями, которые являются опытом вхождения в «Сумеречную зону». — Примеч. ред.

Назад: 16. Введение в коэффициент Байеса и апостериорные шансы: конкуренция идей
Дальше: 18. Когда данные не убеждают