Книга: Вероятности и неприятности. Математика повседневной жизни
Назад: Счастье — это найти друзей с тем же диагнозом, что и у тебя
Дальше: Сравниваем и ищем с помощью вероятности

Этот странный закольцованный мир

По мере повышения размерности распределение углов становится похожим на нормальное. Однако это не оно, несмотря на характерную колоколообразную форму. Нормальное распределение определено для всей вещественной числовой оси, в нашем же случае значение угла зациклено в пределах от 0 до 180°. Мы попали из поля вещественных чисел на кольцо вычетов — математическую структуру, подобную циферблату на часах, дням недели или остаткам от деления. Применяя привычные нам операции в этом кольцевом мире, нужно быть аккуратным, даже выполняя простые расчеты. Скажем, чему равно среднее значение для двух углов: 30 и 350°? Простое сложение даст ответ 190°, тогда как чертеж покажет, что правильным ответом будет 10°. А чему равно среднее значение равномерного распределения на всей окружности? Оно не определено, хотя площадь под кривой распределения конечна. Даже простое вычисление среднего для набора измеренных углов уже становится нетривиальной задачей, требующей перехода на плоскость (декартову или комплексную). Представьте себе, что вы исследуете зависимость числа обращений граждан в полицию от времени суток и получили гистограмму, показанную на рисунке слева (рис. 5.7).

 

Рис. 5.7. Гистограмма, показывающая распределение числа событий по времени суток, не отражает цикличности времени и не дает возможности правильно найти среднее значение

 

Попытка вычислить математическое ожидание для самого неспокойного времени с помощью среднего арифметического даст невнятный результат. Он показан на рисунке вертикальной линией. Правильно будет изобразить нашу гистограмму в полярных координатах и там уже найти математическое ожидание, вычислив угловую координату положения центра масс получившейся фигуры. Ее можно визуализировать, построив из центра координат луч, проходящий через центр масс.
Привычные распределения вероятностей с хорошо известными свойствами на кольцах вычетов «зацикливаются» и становятся своеобразными. На рисунке 5.8 показано, как можно построить аналоги некоторых распределений на окружности. Числовая ось как бы наматывается на окружность, при этом каждый слой спирали суммируется, и в результате мы получаем циклический аналог распределения, имеющий единичную площадь.

 

Рис. 5.8. Построение циклических экспоненциального (слева) и нормального (справа) распределений (показаны тонкой линией). Тут же приведены графики функций плотности для обыкновенных (линейных) распределений (показаны жирными линиями)

 

Например, циклическое экспоненциальное распределение (рис. 5.9) описывает случайное положительное отклонение от заданного угла с заданным средним значением. С его помощью можно описать время суток, в которое ожидается появление пуассоновского события. Циклическое нормальное распределение допустимо использовать для описания погрешностей в измерении углов. Хотя, если быть точным, они будут подчиняться другому распределению, но об этом чуть позже. Циклические распределения, хоть они и выглядят несколько однообразно, важны при анализе данных на земном шаре, если их дисперсии сравнимы с длиной экватора, а это характерно для широкого класса задач геофизики, климатологии и других наук о Земле.

 

Рис. 5.9. Циклический аналог распределения Коши

 

Любопытно, что при зацикливании свойства распределения могут поменяться радикально. Например, относительная погрешность при измерении нулевой величины описывается распределением Коши. Оно примечательно тем, что ее функция плотности вероятности имеет бесконечную площадь под кривой, так что для этого распределения невозможно вычислить значения среднего и дисперсии: они, в отличие от моды и медианы, для распределения Коши просто не определены. Однако круговой аналог этого распределения ведет себя хорошо, интегрируется и имеет вычислимые значения среднего и дисперсии. Это распределение встречается, например, в физике — при анализе явления дифракции.
Меняет свои свойства при зацикливании и нормальное (гауссовское) распределение. Его циклический аналог уже не будет устойчивым, а суммы случайных величин начнут сходиться не к нему. На окружности эту роль играет распределение фон Мизеса с такой функцией плотности вероятности:
Среднее значение для этого распределения равно μ, а величина 1/k влияет на дисперсию. В приведенном выражении I0 — модифицированная функция Бесселя, одна из целого семейства специальных функций. Функции Бесселя обычно появляются, если в задаче есть осевая симметрия. Например, с их помощью описывается профиль круговых волн, разбегающихся по воде от упавшей капли.
Впрочем, когда дисперсия данных мала и x незначительно отклоняется от среднего значения μ, косинус можно разложить в степенной ряд, в котором главную роль играет квадратичный член. Таким образом, когда влияние цикличности становится незначительным, то и распределение фон Мизеса оказывается похожим на «обычное» гауссовское. Никуда от него не денешься — в отличие от мифического «среднего пилота» или усредненной «идеальной женщины», случайные величины, подчиняющиеся нормальному распределению, встречаются повсеместно!
Назад: Счастье — это найти друзей с тем же диагнозом, что и у тебя
Дальше: Сравниваем и ищем с помощью вероятности