Книга: Байесовская статистика: Star Wars, LEGO, резиновые уточки и многое другое
Назад: 2. Измеряем неопределенность
Дальше: 4. Как получить биноминальное распределение

3. Логика неопределенности

В главе 2 мы обсудили, что вероятности — это расширение логических понятий истины и лжи и выражаются как числа между 1 и 0. Сила вероятностей — в их способности принимать бесконечное число значений между этими полюсами. В этой главе мы обсудим, как правила логики и ее операции применяются к вероятностям. В классической логике важнейшую роль играют три операции:

• И;

• ИЛИ;

• НЕ.

С помощью этих трех простых операций можно построить любое высказывание в классической логике. Рассмотрим, например, высказывание: «Если идет дождь И я собираюсь на улицу, мне нужен зонтик». В этом высказывании всего одна логическая операция: И. Благодаря ей мы знаем, что если истинно утверждение, что идет дождь, И так же истинно утверждение, что я собираюсь на улицу, то мне нужен зонтик.

Мы можем переформулировать это утверждение, используя другие операции: «Если НЕТ дождя или я НЕ собираюсь на улицу, мне НЕ нужен зонтик». Здесь используются простейшие логические операции и факты для решения о том, нужно ли брать зонт.

Но такой способ логических рассуждений работает лишь тогда, когда факты либо абсолютно истинны, либо абсолютно ложны. Он годится, чтобы понять, нужен ли зонт прямо сейчас — когда я точно знаю, идет ли в этот момент дождь и собираюсь ли я на улицу. Зададимся вопросом: «Понадобится ли мне зонт завтра?» Тогда факты теряют определенность, ведь прогноз погоды дает только вероятность завтрашнего дождя, да и я не могу точно знать, нужно ли мне завтра выходить на улицу.

В этой главе мы объясним, как применять логические операции при работе с вероятностями и в ситуациях неопределенности рассуждать по аналогии с классической логикой. Вы уже знаете, как определить операцию НЕ для вероятностных рассуждений:

¬P (X) = 1 – P (X).

Дальше я расскажу, как использовать две другие операции, И и ИЛИ, для сочетаний вероятностей и делать точные и полезные выводы.

Вероятность и операция И

В статистике И используется, когда речь идет о вероятности одновременных событий. Например, вероятности:

• бросив кубик и монету, выкинуть шестерку И орла;

• попасть под дождь И забыть зонт;

• выиграть в лотерею И получить удар молнии.

Чтобы понять, как определить операцию И для вероятностей, начнем с простого примера про монету и кубик.

Вычисление совместной вероятности

Допустим, нужно узнать вероятность выпадения орла и шестерки при бросании монеты и кубика. Нам известны вероятности обоих событий по отдельности:

Eqn0015.tif 

Требуется найти вероятность, что оба события произойдут, то есть:

P (орел, шестерка) = ?

Можно вычислить ее тем же способом, что в главе 2: посчитать интересные нам исходы и поделить на общее число исходов. Пусть сначала мы бросаем монету. Как показано на рис. 3.1, возможных исходов два.

471475.png 

Рис. 3.1. Два возможных исхода броска монеты как два пути

Далее после каждого результата броска монеты возможны шесть исходов броска кубика, как показано на рис. 3.2.

471498.png 

Рис. 3.2. Возможные исходы броска монеты и броска кубика

Посмотрев на рисунок, легко посчитать возможные исходы бросков монеты и кубика. Их 12, а нас интересует только один, поэтому

Eqn0016.tif 

Мы решили одну конкретную задачу. Но нужно иметь общее правило, позволяющее считать вероятность любой комбинации событий. Посмотрим, как обобщить это решение.

Применяем правило произведения вероятностей

Вернемся к той же задаче: какова вероятность выкинуть орла И шестерку?

Сначала найдем вероятность выпадения орла. Посмотрев на ветвящиеся пути на рисунке, вы поймете, сколько будет путей при данных вероятностях. Нам нужны только пути, включающие выпадение орла. Вероятность выпадения орла 1/2, поэтому половина возможностей отпадает. Посмотрим только на оставшуюся ветку возможностей. Шансы получить желаемый результат (выкинуть шестерку) — всего 1/6. Эти рассуждения наглядно показаны на рис. 3.3, очевидно, что нам интересен всего один исход.

471446.png 

Рис. 3.3. Вероятность одновременно выкинуть орла и шестерку

Перемножив эти вероятности, мы видим, что

Eqn0017.tif

Получается в точности такой же ответ, что и раньше, но вместо подсчета всех возможных событий мы считали только вероятности интересующих нас событий, двигаясь по веткам «дерева». С помощью рисунка легко решить эту простую задачу, но важнее другое — здесь заложено общее правило, как соединять вероятности операцией И:

P (A, B) =P (A) ×P (B).

Умножим результаты, посчитаем произведение и назовем эту формулу правилом произведения вероятностей. Можно обобщить ее и на большее число событий.

Рассмотрим комбинацию событий A и B как одно событие и посчитаем вероятность его комбинации с C:

P (P (A, B), C) =P (A, B) ×P (C) =P (A) ×P (B) ×P (C).

Можно пользоваться правилом произведения для любого количества событий.

Пример: вероятность опоздать

Рассмотрим пример применения правил произведения для чуть более сложной задачи, чем броски монет и кубиков. Допустим, вы условились встретиться с другом за чашечкой кофе в 16:30 на другом конце города, куда вы можете добраться на трамвае или автобусе. Сейчас 15:30. Ближайший автобус приедет в 15:45 и за 45 минут довезет вас до кофейни. Ближайший трамвай придет в 15:50, доедет за 30 минут, но затем придется идти еще 10 минут пешком. В обоих случаях вы окажетесь на месте ровно в 16:30, а при любой задержке уже опоздаете. К счастью, так как автобус приходит раньше, то в случае его задержки вы можете сесть на трамвай и успеть (если не задержится и трамвай!). Все хорошо и в случае, когда автобус приходит вовремя, а трамвай задерживается. Опоздаете вы, только если задержатся и автобус, и трамвай. Как же найти вероятность опоздания?

Найдем вероятность, что и трамвай, и автобус задержатся. Пусть транспортная компания пишет, что

P (задержкатрамвая) = 0,15;

P (задержкаавтобуса) = 0,2

(потом мы научимся оценивать такие вероятности на основе данных).

Эти данные говорят нам, что трамваи задерживаются в 15 % случаев, а автобусы — в 20 % случаев. Вы опоздаете, только если задержатся оба вида транспорта, так что применим к задаче правило произведения:

P (опоздание) =P (задержкатрамвая) ×P (задержкаавтобуса) = 0,15 × 0,2 = 0,03.

Даже если по отдельности шансы задержки трамвая и автобуса довольно велики, вероятность, что опоздают оба, значительно меньше — всего 0,03. Можно сказать, что шанс задержки обоих составит 3 %. Теперь вы можете сильно не переживать, что опоздаете.

Вероятность и операция ИЛИ

Другое важнейшее правило логики описывает, как вероятности сочетаются при помощи операции ИЛИ, например:

• заболеть гриппом ИЛИ простудой;

• выбросить орла на монете ИЛИ шесть на кубике;

• проколоть колесо ИЛИ столкнуться с нехваткой бензина.

Вероятность одного ИЛИ другого события чуть сложнее, так как события могут быть взаимоисключающими, а могут и не быть. Взаимоисключающими события называются, когда из наступления одного следует невозможность другого. Например, исходы броска кубика взаимоисключающие, так как за один бросок вы не в состоянии получить и единицу, и шестерку. С другой стороны, бейсбольный матч могут отменить, если будет дождь или заболеет тренер. И это не взаимоисключающие события — вполне возможно, что и тренер болен, и дождь идет.

ИЛИ для взаимоисключающих событий

Комбинировать два события, используя ИЛИ, кажется интуитивным действием. Спроси вас, какова вероятность, бросив монету, получить орла или решку, и вы ответите: 1. Мы знаем, что:

Eqn0018.tif 

Мы интуитивно складываем вероятности этих событий и знаем, что это сработает, поскольку других исходов, кроме орла и решки, не бывает, а вероятность всех возможных исходов равна 1. Если вероятность всех возможных исходов не равна 1, значит, мы не учли какой-то исход. Как это понять? Допустим, вероятность выпадения орла P (орел) = 1/2, но некто утверждает, что вероятность выпадения решки P (решка) = 1/3. Мы уже знаем, что вероятность невыпадения орла равна:

Eqn0021.tif 

Так как вероятность не выкинуть орла равна 1/2, а заявленная вероятность решки всего 1/3, то либо мы не учли какое-то событие, либо вероятность решки ошибочна. Пока события взаимоисключающие, можно просто сложить все вероятности, чтобы получить вероятность того, что произошло одно из них — ИЛИ то, ИЛИ другое. Еще одним примером будет бросок кубика. Мы знаем, что вероятность выпадения единицы равна 1/6, как и вероятность выпадения двойки:

Eqn0024.tif 

Можно проделать то же самое — сложить две вероятности и увидеть, что вероятность выкинуть 1 ИЛИ 2 равна 2/6, или 1/3:

Eqn0025.tif 

Все кажется интуитивно понятным.

Правило сложения верно только для взаимоисключающих событий. На языке вероятностей взаимоисключающие события такие, когда

P (A) И P (B) = 0.

То есть вероятность наступления одновременно A И B равна 0. Для наших примеров это так:

• невозможно бросить одну монету и одновременно выкинуть орла и решку;

• невозможно бросить кубик один раз и одновременно выкинуть 1 и 2.

Чтобы действительно понять, как объединять события операцией ИЛИ, рассмотрим не взаимоисключающие события.

Правило суммы для не взаимоисключающих событий

Вернемся к примеру с кубиком и монетой и найдем вероятность выбросить орла ИЛИ шестерку. Часто новички наивно полагают, что сложение вероятностей сработает и здесь. Мы знаем, что P (орел) = 1/2  и P (шестерка) = 1/6, и кажется правдоподобным, что вероятность одного из этих событий равна 4/6. Но если рассмотреть вероятность выпадения орла или числа меньше шести, станет ясно, что сложение не работает. Так как P (меньше шестерки) = 5/6 , сложение вероятностей даст 8/6, что больше 1! Нарушено правило, что вероятность находится в диапазоне между 0 и 1, а значит, где-то ошибка.

Беда в том, что выкинуть орла и выкинуть шестерку — события не взаимоисключающие. Мы знаем, что P (орел, шестерка) = 1/2. Так как вероятность наступления обоих событий одновременно не равна 0, они по определению не взаимоисключающие. Сложение вероятностей для не взаимоисключающих событий не работает, так как мы дважды считаем исходы, когда происходят оба события. В качестве примера рассмотрим все исходы бросков монеты и кубика, в которых выпадает орел:

Орел — 1;

Орел — 2;

Орел — 3;

Орел — 4;

Орел — 5;

Орел — 6.

Это 6 из 12 возможных исходов, что ожидаемо, так как P (орел) = 1/2. Посмотрим теперь на все исходы, в которых выпадает шестерка:

Орел — 6;

Решка — 6.

Это два из 12 возможных исходов, и снова ничего удивительного, потому что P (шестерка) = 1/6. Так как шесть исходов удовлетворяют условию выпадения орла и два — выпадения шестерки, очень хочется сказать, что орел или шестерка появляются в восьми исходах. Однако орел — шестерка есть в обоих списках, мы посчитали его дважды. Так что разных исходов только семь из 12. Наивно сложив P (орел) и P (шестерка), мы получим больше чем надо.

Чтобы исправить расчеты, сложим обе вероятности и вычтем вероятность возникновения обоих событий. Получаем правило, как объединять с помощью ИЛИ не взаимоисключающие события, — правило суммы вероятностей:

P (A ИЛИ B) =P (A) + P (B) – P (A, B).

Мы складываем вероятности обоих событий по отдельности и вычитаем вероятность обоих событий одновременно, чтобы не учитывать дважды вероятности некоторых исходов, включенные и в P (A), и в P (B). В примере с монетой и кубиком вероятность выкинуть орла или число, меньшее шести, равна

P (орел ИЛИ шестерка) =P (орел) + P (шестерка) – P (орел, шестерка) =

Eqn0030.tif 

Для закрепления материала рассмотрим последний пример с ИЛИ.

Пример: вероятность большого штрафа

Представьте, что вас тормознули за превышение скорости. Вас уже давно не останавливали, и вы понимаете, что, возможно, забыли взять новые права или новую страховку. Если у вас нет хотя бы одного из этих документов, штраф будет гораздо выше. Как, еще не проверив это, оценить вероятность большего штрафа? Вы почти уверены, что брали права, поэтому присваиваете их наличию вероятность 0,7. Но вы почти уверены, что забыли страховку дома на столе, и присваиваете ее наличию в машине вероятность 0,2. Итак,

P (права) = 0,7;

P (страховка) = 0,2.

Но это вероятности наличия документов, а вас беспокоят вероятности их отсутствия. Посчитать их просто, используя отрицание:

P (нетправ) = 1 – P (права) = 0,3;

P (нетстраховки) = 1 – P (страховка) = 0,8.

Если не использовать настоящее правило суммы, а просто сложить вероятности, мы получим вероятность больше 1:

P (нетправ) + P (нетстраховки) = 1,1.

События не взаимоисключающие: возможно, вы забыли оба документа, так что мы посчитали этот исход дважды. Надо найти вероятность отсутствия обоих документов, чтобы затем вычесть ее. Применим правило произведения:

P (нетправ, нетстраховки) = 0,24.

Теперь применим правило суммы, чтобы определить вероятность отсутствия одного из документов, подобно тому как считали вероятность выпадения орла или шестерки:

P (нетдокумента) =P (нетправ) + P (нетстраховки) — P (нетправ, нетстраховки) = 0,86.

Что ж, с вероятностью 0,86 одного из документов нет. Будьте повежливее с инспектором!

Заключение

В этой главе мы изучили логику неопределенности, добавив правила для комбинации вероятностей через операции И и ИЛИ. Вспомним изученные логические правила. В главе 2 вы узнали, что вероятности измеряются по шкале от 0 до 1, где 0 — ложь (невозможное событие), а 1 — истина (то, что точно случится). Следующее важное правило касается комбинации вероятностей с использованием И. Для этого используется правило произведения, гласящее, что для нахождения вероятности одновременного наступления двух событий, A и B, нужно умножить их вероятности:

P (A, B) =P (A) ×P (B).

Последнее правило касается комбинации вероятностей с использованием ИЛИ по правилу суммы. Тонким моментом правила суммы является то, что при сложении вероятностей не взаимоисключающих событий мы дважды учтем вероятность исходов, когда они происходят одновременно, и будем обязаны ее вычесть. Правило суммы при этом использует правило произведения (вспомним, что для взаимоисключающих событий P (A, B) = 0):

P (A ИЛИ B) =P (A) + P (B) P (A, B).

Эти правила вместе с изученными в главе 2 позволяют решать широкий спектр задач. На них будут основаны вероятностные рассуждения на протяжении всей книги.

Упражнения

Чтобы убедиться, что вы понимаете, как применять правила логики к вероятностям, попробуйте ответить на эти вопросы.

1. Какова вероятность выбросить двадцать на двадцатигранной игральной кости три раза подряд?

2. Прогноз погоды сообщает, что завтра с 10 %-ной вероятностью пойдет дождь. Вы забываете зонтик дома в половине случаев. Какова вероятность, что завтра вы окажетесь под дождем без зонта?

3. Сырые яйца с вероятностью 1/20 000 заражены сальмонеллой. Вы съели два сырых яйца, какова вероятность, что вы съели яйцо с сальмонеллой?

4. Какова вероятность выкинуть два орла за два броска монеты или три шестерки за три броска шестигранного кубика?

Назад: 2. Измеряем неопределенность
Дальше: 4. Как получить биноминальное распределение