6. Проблемы с вероятностью
Как самоуверенные знатоки математики едва не разрушили глобальную финансовую систему
Статистика не может быть более совершенной, чем люди, которые ее используют. Но иногда она заставляет умных людей делать глупости. Одним из самых безответственных случаев применения статистики за последнее время стал механизм оценивания рисков на Уолл-стрит перед финансовым кризисом 2008 года. В то время компании, представляющие финансовый сектор, использовали общепринятый барометр риска – модель стоимости риска, или рисковой стоимости (Value-at-Risk – VaR). Теоретически VaR сочетала в себе элегантность индикатора (совмещая обширную информацию в едином числовом показателе) с мощью вероятности (присоединяя ожидаемую прибыль или убыток к каждому из активов или торговым позициям соответствующей фирмы). Такая модель исходила из того, что для каждой инвестиции компании существует определенный диапазон возможных исходов. Если, например, компания владеет акциями General Electric, то их стоимость может повышаться или понижаться. Когда VaR вычисляется для некоего короткого промежутка времени, например недели, то самым вероятным исходом станет то, что в конце данного периода у этих акций будет примерно такая же стоимость, как и в начале. Вероятность того, что их стоимость повысится или снизится на 10 %, относительно невелика. Еще меньше вероятность того, что она повысится или снизится на 25 %, и т. д.
На основе прошлых данных о движениях рынка «количественные» эксперты компании (в сфере финансов их часто называют «квантами» [от слова quantitative, то есть «количественный»], а во всех остальных отраслях – «богатенькими ботанами») могли определить максимальную сумму в денежном выражении (например, 13 миллионов долларов), которую фирма может с 99-процентной вероятностью потерять на данной позиции в течение рассматриваемого периода времени. Другими словами, в 99 случаях из 100 компания не потеряет более 13 миллионов долларов на конкретной торговой позиции; а в 1 случае из 100 потеряет.
Запомните последнее утверждение, поскольку вскоре оно станет важным.
До финансового кризиса 2008 года фирмы охотно использовали модель VaR для оценки своего суммарного риска. Если у какого-либо отдельно взятого трейдера было 923 различных открытых позиции (инвестиций, стоимость которых могла расти или падать), то каждую из таких инвестиций можно было оценить, как описано выше для акций General Electric, и на основе этого вычислить совокупный риск портфеля данного трейдера. Формула даже учитывала корреляции между разными позициями. Если, например, ожидаемые доходности двух инвестиций отрицательно коррелированы между собой, то убыток по одной из них, скорее всего, будет компенсирован прибылью по другой; таким образом, две инвестиции в совокупности менее рискованны, чем каждая в отдельности. В целом глава торгового отдела должен знать, что, скажем, у Боба Смита, торгующего облигациями, 24-часовая VaR (стоимость риска в течение ближайших 24 часов) 19 миллионов долларов – как указывалось выше, с 99-процентной вероятностью. Максимум, что может потерять Боб Смит в течение ближайших 24 часов, это 19 миллионов долларов – в 99 случаях из 100.
К тому же, что еще лучше, в любой момент можно вычислить совокупный риск для компании, дополнив тот же самый базовый процесс. Математические механизмы, положенные в его основу, по-видимому, невероятно сложны, поскольку каждая из фирм располагает огромным массивом инвестиций в разных валютах, с разными величинами рычагов (по-другому, леверидж, или кредитное плечо; сумма, которая заимствована для выполнения соответствующей инвестиции), торгующихся на рынках с разными степенями ликвидности, и т. д. Несмотря на все это, менеджеры фирмы якобы располагали точным показателем величины риска, принимаемого ею на себя в любой момент времени. Как поясняет бывший экономический обозреватель The New York Times Джо Носера: «Огромная привлекательность VaR в глазах людей, которые не принадлежат к числу “квантов”, заключается в том, что она представляет риск в виде единого числа, в денежном выражении – и никак не меньше!» В банке J. P. Morgan, где была разработана и неоднократно уточнялась модель VaR, ее ежесуточное вычисление носило название «отчет 4:15», так как результат этого расчета появлялся на рабочих столах высшего руководства каждый день в 16:15 – сразу же после закрытия в тот день американских финансовых рынков.
По-видимому, это был неплохой вариант, поскольку наличие дополнительной информации в любом случае лучше, особенно когда речь идет о риске. В конце концов, вероятность – довольно мощный инструмент. Разве эти вычисления принципиально отличаются от тех, которыми занималось руководство компании Joseph Schlitz Brewing Company, прежде чем потратить кучу денег на проведение слепой сравнительной дегустации пива в перерыве матча за Суперкубок?
Как сказать… Как только ни называли в свое время показатель VaR: и «потенциально катастрофический», и «надувательский», и… (да, были и другие эпитеты, которые вряд ли следует упоминать в такой солидной книге по статистике, как эта). В частности, именно эту модель обвиняли в наступлении финансового кризиса, разразившегося в 2008 году. Главной причиной критики в адрес VaR является то, что фундаментальные риски, связанные с финансовыми рынками, невозможно предсказать по аналогии с подбрасыванием монетки или слепой сравнительной дегустацией двух сортов пива. Ложное ощущение точности, встроенное в эти модели, породило ложное ощущение безопасности. Показатель VaR был похож на неисправный спидометр; пожалуй, это хуже, чем если бы его не было вообще. Понадеявшись на неисправный спидометр, вы перестанете обращать внимание на другие признаки того, что уже превысили допустимую скорость. В случае же отсутствия спидометра вам придется отслеживать признаки, указывающие на реальную скорость движения автомобиля.
Примерно в 2005 году, ориентируясь исключительно на показатели VaR, которые ежедневно появлялись на рабочих столах руководителей компаний ровно в 16:15, Уолл-стрит набрала скорость, существенно превышающую допустимую. К сожалению, с профилями риска, заложенными в моделях VaR, существовали две огромные проблемы. Во-первых, вероятности, на которых строились эти модели, исходили из прошлых движений рынка; однако на финансовых рынках (в отличие от дегустации пива) будущее вовсе не обязательно должно быть похожим на прошлое. Таким образом, не было никаких оснований полагать, что движения рынка в период с 1980 по 2005 год были наилучшим предиктором изменеий на рынке после 2005 года. В какой-то степени этот недостаток воображения напоминает периодические ошибочные предположения генералов о том, что следующая война будет похожа на предыдущую. В 1990-е годы, а также в начале нулевых коммерческие банки широко применяли модели кредитования для жилищных ипотек, согласно которым вероятность значительного снижения цен на жилье близилась к нулю. Цены на жилье никогда ранее не падали так сильно и так быстро, как это происходило с начала 2007 года. Однако случилось то, что случилось. Бывший глава Федеральной резервной системы Алан Гринспен, выступая впоследствии перед членами одного из комитетов Конгресса США, так объяснял этот факт: «Все это величественное интеллектуальное здание рухнуло летом 2007 года, поскольку данные, вводимые в модели управления риском, охватывали лишь два последних десятилетия, то есть период, когда всех нас захлестнула эйфория. Между тем, если бы мы использовали более подходящие модели, затрагивающие исторические периоды, характеризующиеся экономическим неблагополучием, то, как мне кажется, требования к капиталу оказались бы значительно выше, а финансовый мир чувствовал бы себя гораздо лучше».
Кроме того, даже если бы исходные данные могли точно прогнозировать будущий риск, 99-процентная гарантия, обещанная моделью VaR, была опасно бесполезной, поскольку остающийся 1 % действительно вводит в заблуждение. Менеджер хеджевого фонда Дэвид Айнхорн поясняет: «Это как подушка безопасности, которая дает сбой именно в момент автокатастрофы». Если стоимость риска (VaR) какой-либо компании составляет 500 миллионов долларов, то это можно рассматривать как 99-процентную вероятность того, что на протяжении указанного периода фирма потеряет не более этой суммы. Но это также означает, что данная компания может с 1-процентной вероятностью потерять свыше 500 миллионов долларов (а при определенных обстоятельствах даже значительно больше). По сути, опираясь на эти модели, невозможно предусмотреть, насколько плохим может оказаться 1-процентный сценарий. Очень мало внимания уделялось так называемому хвостовому, то есть малому риску (производное от хвоста кривой распределения) какого-то катастрофического исхода. (Если вы возвращаетесь домой из ресторана за рулем своего автомобиля и уровень алкоголя в вашей крови равен 0,15 промилле, то вероятность того, что вы попадете в ДТП со смертельным исходом, наверное, будет менее 1 %; тем не менее это не повод садиться за руль в нетрезвом виде.) Многие компании усугубили эту ошибку, сделав нереалистичное предположение о своей готовности к маловероятным событиям. Бывший глава Казначейства США Хэнк Поулсон пояснил, что большинство из них надеялись в крайнем случае привлечь денежные средства путем продажи активов. Но во время кризиса деньги нужны всем, поэтому все пытаются продать те или иные активы. С точки зрения управления рисками это равносильно тому, как если бы вы сказали: «Мне нет нужды запасаться водой и продуктами питания, поскольку в случае стихийного бедствия я смогу пойти в супермаркет и купить все необходимое». Разумеется, после того как астероид упадет на ваш город, его пятьдесят тысяч жителей ринутся в супермаркеты, чтобы запастись водой и продуктами питания, но к тому моменту, когда вы доберетесь до ближайшего супермаркета, окна в нем будут разбиты, а полки пусты.
То обстоятельство, что вы никогда всерьез не рассматривали возможность падения на ваш город крупного астероида, в точности описывает проблему с VaR. Вот еще одна выдержка из статьи колумниста The New York Times Джо Носера, который подытоживает мысли Николаса Талеба, автора книги The Black Swan: The Impact of the Highly Improbable и яростного критика VaR: «Самые опасные – отнюдь не риски, которые вы можете увидеть и измерить, а риски, которые вы не можете увидеть и, следовательно, измерить. Это риски, находящиеся настолько далеко за пределами нормальной вероятности, что невозможно даже себе представить, что они могут произойти в вашей жизни, – хотя, конечно же, они случаются, и даже чаще, чем вы могли бы предположить».
В каком-то смысле фиаско VaR является полной противоположностью примера с компанией Joseph Schlitz Brewing Company, приведенного в главе 5. Данные о вероятности выбора пива в ходе слепой сравнительной дегустации, которыми располагала эта компания, позволили ей примерно предугадать поведение дегустаторов в ходе сравнительной дегустации, транслируемой в прямом эфире во время перерыва матча за Суперкубок. Компании даже удалось обернуть себе на пользу то обстоятельство, что в акции участвовали только любители других сортов пива. Даже если бы пиво Schlitz предпочли не более 25 % любителей пива Michelob (практически нереальный исход), компания все равно могла бы сказать, что по крайней мере одному из каждых четырех любителей пива следовало бы переключиться на пиво Schlitz. И, возможно, самое важное: здесь речь шла лишь о пиве, а не о глобальной финансовой системе. «Кванты» с Уолл-стрит совершили три фундаментальные ошибки. Во-первых, они спутали точность с достоверностью. Модели VaR действовали подобно моему дальномеру, который был настроен на измерение расстояний в метрах, а не в ярдах, в результате чего расстояния измерялись точно, но неправильно. Эта ложная точность заставила обитателей Уолл-стрит поверить, будто они контролируют риск, хотя на самом деле это было не так. Во-вторых, оценки вероятностей, положенные в основу вычислений согласно модели VaR, оказались ошибочными. Как указывал Алан Гринспен, выступая на слушаниях в одном из комитетов Конгресса США (цитату из его выступления я приводил чуть выше), относительно безмятежные и благополучные десятилетия до 2005 года не следовало брать за основу при построении распределений вероятностей, которые использовались для прогнозирования поведения рынков в предстоящие десятилетия. Это как если бы вы отправились в казино с твердой уверенностью, что сегодня выиграете в рулетку в 62 случаях из ста только потому, что именно так получилось вчера, когда удача сопутствовала вам. Подобная уверенность обошлась бы вам очень дорого! В-третьих, компании пренебрегли «хвостовым риском». Модели VaR прогнозируют, что должно произойти в 99 случаях из ста. Именно таков механизм действия вероятностей (во второй половине книги это обстоятельство будет подчеркиваться неоднократно). Между тем маловероятные события время от времени случаются. Более того, в долгосрочном периоде они не так уж и маловероятны. Иногда в людей попадает молния. Моя мать убедилась в этом на собственном опыте.
«Статистическое высокомерие», продемонстрированное коммерческими банками и на Уолл-стрит, в конечном счете сыграло ключевую роль в самом жестоком глобальном финансовом кризисе со времен Великой депрессии. Этот кризис, разразившийся в 2008 году, серьезно подорвал финансовое благополучие Соединенных Штатов, повысил уровень безработицы до более чем 10 %, породил волну банкротств и отчуждений имущества и заставил многие государства, пытавшиеся минимизировать экономический ущерб, влезть в огромные долги. Подобный исход особенно печален потому, что столь изощренные инструменты, как VaR, обязаны были снизить угрозу риска.
Теория вероятностей предоставляет в наше распоряжение мощный и полезный набор инструментов, правильное использование которых поможет лучше уяснить ситуацию, складывающуюся в мире; а неправильное посеет в нем хаос. В русле метафоры «статистика как мощное оружие», которая неоднократно повторяется в этой книге, я хочу перефразировать любимое выражение сторонников свободной продажи огнестрельного оружия в нашей стране: ошибается не теория вероятностей, а люди, которые ею пользуются. Далее в этой главе я перечислю ряд самых распространенных ошибок, заблуждений и этических дилемм, связанных с применением концепции вероятности.
Предполагается, что события независимы, тогда как на самом деле они зависимы друг от друга. Вероятность выпадания решки при подбрасывании «правильной» монетки равняется ½. Вероятность двукратного (подряд) выпадания решки при подбрасывании такой же монетки составляет (½)2, или ¼, поскольку вероятность одновременного наступления двух независимых событий равняется произведению их индивидуальных вероятностей. Теперь, когда вы вооружены этим важным знанием, допустим, что вас назначили на должность начальника отдела управления рисками в крупной авиакомпании. Ваш заместитель сообщает вам, что вероятность выхода из строя по тем или иным причинам авиадвигателя во время трансатлантического перелета составляет 1 шанс из 100 000. Учитывая количество трансатлантических перелетов, этот риск нельзя считать приемлемым. К счастью, каждый современный самолет, совершающий такие перелеты, оснащен по меньшей мере двумя двигателями. Ваш заместитель подсчитал, что риск одновременного выхода из строя обоих во время трансатлантического перелета должен равняться (1/100 000)2, или 1 шансу из 10 миллиардов, что считается вполне приемлемым риском с точки зрения обеспечения безопасности полетов. Что же, сейчас самое время предложить вашему заместителю взять отпуск и подготовиться к увольнению. Поломка обоих авиадвигателей не относится к категории независимых событий. Если во время взлета самолет наталкивается на стаю гусей, то, вероятнее всего, оба двигателя выйдут из строя одинаковым образом. То же самое можно сказать о многих других факторах, влияющих на функционирование авиадвигателя, начиная с погодных условий и заканчивая небрежным выполнением своих обязанностей наземными службами техобслуживания. Если один двигатель выйдет из строя, то вероятность поломки второго будет значительно выше, чем 1 шанс из 100 000.
Это очевидно, не правда ли? Однако британским прокурорам это показалось не столь очевидным в 1990-е, когда они совершили серьезную судебную ошибку вследствие некорректного использования теории вероятностей. Как и в гипотетическом примере с авиадвигателями, ошибка заключалась в предположении о независимости нескольких событий (как с подбрасыванием монетки), хотя на самом деле они были зависимы (то есть когда какой-то определенный исход повышает вероятность аналогичного исхода в будущем). Тем не менее эта теоретическая ошибка стоила свободы абсолютно невинным людям, которые в результате оказались за решеткой.
Эта история произошла в контексте так называемого синдрома внезапной смерти младенцев во время сна (СВСМ) – явления, когда вполне здоровый малыш умирает в своей кроватке. (У британцев СВСМ принято называть «смертью в колыбели».) Долгое время СВСМ оставался медицинской загадкой, которая привлекала к себе все большее внимание по мере снижения детской смертности по другим причинам. Поскольку СВСМ настолько таинственен и малопонятен, его феномен породил всевозможные подозрения. Иногда они потдверждались. Время от времени ссылки на СВСМ использовались, чтобы скрыть факты небрежного выполнения родительских обязанностей или даже предумышленного убийства, так как вскрытие далеко не всегда позволяет отличить смерть в силу естественных причин от убийства. Британские прокуроры и суды были убеждены, что один из способов правильно определять причины СВСМ – повысить внимание к семьям с повторными случаями «смерти в колыбели». Сэр Рой Мидоу, известный британский педиатр, часто привлекался к рассмотрению подобных случаев в качестве эксперта. Как поясняется в британском журнале The Economist: «Мысль, которая пришла в голову Рою Мидоу и стала впоследствии известной как “закон Мидоу” (суть ее в том, что одна младенческая смерть – это трагедия, две смерти вызывают подозрение, а три – это убийство), основывается на том, что если какое-либо событие является достаточно редким, то два или большее число его наступлений в одной и той же семье настолько маловероятны, что нет никаких оснований считать это простой случайностью». Сэр Рой Мидоу объяснил присяжным, что вероятность внезапной смерти от естественных причин двух младенцев в одной семье чрезвычайно мала и равняется примерно одному шансу из 73 миллионов. Он толковал свои подсчеты так: поскольку случаи «смерти в колыбели» встречаются довольно редко (1 из 8500), вероятность наступления двух смертей в колыбели в одной и той же семье составляет (1/8500)2, что равняется примерно одному шансу из 73 миллионов. Так что здесь явно попахивает предумышленным убийством. Руководствуясь этими доводами, присяжные выносили свои вердикты. В результате, основываясь на статистике смертей в колыбели, присяжные отправили за решетку немалое число родителей (зачастую без учета каких-либо медицинских свидетельств, указывающих на их неумелое обращение с ребенком). В некоторых случаях у родителей, относительно которых возникали подозрения, вызванные необъяснимой смертью кого-либо из их детей в младенческом возрасте, последующих детей отбирали сразу же после рождения.
The Economist объясняет, каким образом неправильная трактовка статистической независимости могла привести к ошибочным выводам в докладе, с которым Мидоу выступал перед присяжными:
Как указывает Королевское статистическое общество (Royal Statistical Society), в рассуждениях Мидоу есть очевидный изъян. Выполненный им подсчет вероятности был бы правильным, если бы смерти в колыбели носили совершенно случайный характер и не были бы связаны с каким-то неизвестным фактором. Но когда речь идет о столь загадочном феномене, как смерть в колыбели, вполне возможно наличие какой-то связи, например некоего генетического фактора, вследствие действия которого угроза потерять по той же причине еще одного ребенка в семье, уже лишившейся одного малыша, гораздо выше, (а не ниже), чем в семьях, где таких случаев не зафиксировано. После того как в результате повторных смертей в колыбели многие родители оказались за решеткой, ученые поверили в реальность существования такой связи.
В 2004 году британское правительство объявило о предстоящем пересмотре 258 приговоров, согласно которым родители, обвинявшиеся в умышленном лишении жизни своих детей, отбывают тюремный срок.
Непонимание, когда события ДЕЙСТВИТЕЛЬНО независимы друг от друга. Еще одна разновидность ошибок возникает, когда события, действительно независимые друг от друга, рассматриваются как взаимосвязанные. Если вы когда-либо окажетесь в казино (место, в котором, с точки зрения статистики, вам лучше вообще не появляться), то обязательно увидите людей, вперившихся взглядом в игральные кости или карты и заявляющих, что они «ожидают должное». Если шарик рулетки пять раз подряд остановился на черном поле, то всякому здравомыслящему человеку понятно, что на следующий раз должно выпасть красное. Нет, нет и еще раз нет! Вероятность того, что шарик остановится на красном поле, каждый раз будет одной и той же: 16/38. Уверенность в том, что это вовсе не так, иногда называют «заблуждением игрока». В действительности, если «правильную» монетку подбросить 1 000 000 раз и каждый раз будет выпадать решка, то вероятность того, что на 1 000 001-й раз выпадет орел, по-прежнему останется ½. Само определение статистической независимости двух событий заключается в том, что исход одного события никак не сказывается на исходе другого. Даже если статистика не убеждает вас, обратитесь к физике соответствующего явления: каким образом выпадание решки несколько раз подряд может повлиять на вероятность выпадания орла в результате следующего подбрасывания монетки?
Даже в спорте представление о полосе удач и неудач может оказаться иллюзорным. В одной из самых знаменитых и интересных научных статей, посвященных вероятностям, опровергается общепринятое утверждение о том, что в течение одной игры у баскетболистов периодически возникает некая «полоса везения», когда один за другим следуют удачные броски по кольцу (в таких случаях говорят, что игрок «набил себе руку»). Несомненно, большинство спортивных болельщиков станут вас уверять, что игрок, попавший по кольцу, с большей вероятностью попадет по нему при выполнении следующего броска, чем игрок, «промазавший» перед этим. Однако исследование, проведенное Томасом Гиловичем, Робертом Валлоне и Амосом Тверски, которые протестировали феномен «набитой руки» тремя разными способами, говорит об обратном. Во-первых, они проанализировали данные о результатах бросков, сделанных в ходе домашних игр командой НБА «Филадельфия Севенти Сиксерс» (сезон 1980–1981 годов). (На момент его проведения аналогичные данные для других команд НБА отсутствовали.) И «не обнаружили каких-либо свидетельств положительной корреляции между результатами бросков, следующих друг за другом». Во-вторых, они проделали такое же исследование относительно результатов штрафных бросков в команде «Бостон Селтикс» и пришли к аналогичным выводам. Наконец, они провели управляемый эксперимент с членами мужской и женской баскетбольных команд Корнелльского университета, игроки которых в среднем попадали по кольцу с игры в 48 случаях из 100, когда предыдущий бросок игрока был удачным, и в 47 случаях из 100, когда предыдущий бросок был неудачным. Для четырнадцати игроков в возрасте 26 лет корреляция между результатом выполнения одного броска и результатом выполнения следующего броска оказалась отрицательной. Лишь у одного баскетболиста обнаружилась значительная положительная корреляция между результатом выполнения двух следующих друг за другом бросков.
Разумеется, такой результат полностью расходится с мнением любителей баскетбола. Например, 91 % любителей баскетбола, опрошенных исследователями в Стэнфордском и Корнелльском университетах, согласились с утверждением, что вероятность попадания игроком по кольцу после того, как он выполнил перед этим два или три удачных броска, будет выше, чем в случае, если перед этим он два или три раза промазал. Важный вывод относительно феномена «набитой руки» заключается в наличии разницы между восприятием и эмпирической реальностью. Исследователи замечают, что «интуитивные представления людей о случайности или закономерности тех или иных событий систематически расходятся с положениями теории вероятностей». Нам подчас свойственно усматривать закономерности там, где их и в помине нет.
Как, например, в случае с раковыми кластерами.
Кластеры действительно встречаются. Вы, наверное, читали в газетах (или видели репортаж по телевизору) о том, что в некоем регионе отмечена повышенная заболеваемость редкой формой рака. Возможно, причиной тому является вода, расположенная поблизости атомная электростанция или вышка сотовой связи. Разумеется, любой из перечисленных факторов может реально обусловить развитие столь опасной болезни. (В последующих главах я постараюсь показать, как с помощью статистики можно идентифицировать подобные причинно-следственные связи.) Однако этот кластер (совокупность) случаев заболеваний также может оказаться результатом чистой случайности, даже когда количество заболевших подозрительно велико. Да, вероятность того, что пять человек в одном и том же учебном заведении, или церковном приходе, или на одном предприятии заболеют одной и той же редкой формой лейкемии, может составлять один шанс из миллиона, однако не следует забывать, что существуют миллионы учебных заведений, церковных приходов и предприятий. Не так уж маловероятно, что пять человек могут заболеть одной и той же редкой формой лейкемии в одном из этих мест. Мы просто забываем о всех школах, церковных приходах и предприятиях, где этого не случилось. Возьмем другую разновидность того же исходного примера – вероятность выигрыша в мгновенной лотерее; хотя она может составлять 1 шанс из 20 миллионов, никто из нас не удивляется тому, что кому-то удается выиграть: действительно, что же здесь удивительного, если были проданы миллионы билетов! (Несмотря на мое недоверие к лотереям в целом, меня восхищает лозунг иллинойсской мгновенной лотереи: «Кто-то должен выиграть; возможно, этим человеком окажетесь вы!». И впрямь, почему бы и нет?)
Ниже описан эксперимент, который я провожу со своими студентами, чтобы подтвердить этот базовый постулат. Чем больше аудитория, тем лучше. Я предлагаю каждому из присутствующих вынуть монетку и встать. Затем все подбрасывают монетку, и те, у кого выпадает решка, садятся. Допустим, в аудитории находится 100 студентов; примерно 50 из них займут свое место после первого подбрасывания. Потом мы выполняем это упражнение еще раз, в результате чего останутся стоять примерно 25 студентов. И так далее. Чаще всего после пяти или шести подбрасываний остается всего один человек, у которого пять или шесть раз подряд выпал орел. Я спрашиваю этого уникума: «Как вам это удалось?», или «Вам, наверное, известна какая-то особая методика тренировок, позволяющая достигать определенного результата?», или «Вы, возможно, придерживаетесь какой-то особой диеты, помогающей добиться такого исхода?» Все присутствующие, конечно, воспринимают это как шутку, поскольку наблюдали процесс подбрасывания монетки собственными глазами, к тому же неплохо знают друг друга и понимают, что у человека, которому удалось пять раз подряд поймать монетку орлом вверх, нет никаких особых талантов в этом занятии, а результат, которого он добился, не более чем случайное совпадение. Однако каждый раз, когда мы видим какое-либо аномальное событие вне конкретного контекста, в котором оно произошло, у нас поневоле возникает подозрение, что здесь, помимо чистой случайности, замешано что-то еще.
Ошибка прокурора. Допустим, в суде вы услышали показания, которые сводятся к следующему: 1) образец ДНК, найденный на месте преступления, совпадает с результатами анализа ДНК обвиняемого и 2) существует лишь один шанс из миллиона, что образец ДНК, найденный на месте преступления, совпадет с образцом ДНК, взятым у кого-либо другого (не у обвиняемого). (Ради простоты будем полагать, что вероятности, на которые опирается обвинение, соответствуют действительности.) Готовы ли вы вынести вердикт «виновен» на основе таких доказательств?
Надеюсь, вы не станете торопиться.
Ошибки обвинения случаются, когда контекст статистических доказательств игнорируется. Ниже описаны два сценария, каждый из которых может объяснить доказательства виновности обвиняемого, базирующиеся на результатах анализа ДНК.
Обвиняемый 1. Этот обвиняемый – влюбленный, отвергнутый своей жертвой, – был схвачен полицией за три квартала от места преступления; при нем было найдено орудие убийства. После ареста у него был взят образец ДНК, который совпал с образцом ДНК, взятым с волоска, найденного на месте преступления.
Обвиняемый 2. Этот обвиняемый был осужден несколько лет назад за аналогичное преступление, совершенное в другом штате. Когда суд признал его виновным, у него взяли образец ДНК, который был включен в общенациональную базу данных ДНК (в ней хранятся образцы ДНК более миллиона опасных уголовных преступников). Образец ДНК, взятый с волоска, найденного на месте преступления, сравнили с образцами, хранящимися в базе данных, и обнаружили совпадение с ДНК обвиняемого 2. Однако следствию не удалось обнаружить какую-либо связь последнего с жертвой преступления.
Как указывалось выше, в обоих случаях прокурор может с полным основанием заявить, что образец ДНК, взятый с места преступления, совпадает с образцом ДНК обвиняемого, и подчеркнуть, что существует лишь один шанс из миллиона, что он может совпасть с образцом ДНК какого-либо другого человека. Однако когда речь идет об обвиняемом 2, вероятность того, что он может оказаться тем самым случайным «другим человеком», одним из миллиона, образец ДНК которого по чистой случайности похож на ДНК подлинного убийцы, весьма высока. Поскольку шансы найти случайно совпадающий образец ДНК среди миллиона других образцов относительно высоки, если вы ищете его в базе данных, насчитывающей более миллиона образцов.
Возврат к среднему. Возможно, вы слышали о так называемом проклятии Sports Illustrated, в результате которого спортсмены или команды, фотографии которых помещались на обложке журнала Sports Illustrated, впоследствии снижали свои спортивные достижения. Одно из объяснений этого феномена заключалось в том, что размещение фотографии спортсмена на обложке издания неблагоприятно сказывается на его последующих спортивных показателях. Более правдоподобным, с точки зрения статистики, будет объяснение, что команды и спортсмены обычно появляются на обложке Sports Illustrated после того, как добьются выдающихся успехов (например станут олимпийскими чемпионами), поэтому вполне естественно, что, пройдя пик физической формы, они демонстрируют результаты, близкие к средним. Это явление называется возвратом к среднему. Теория вероятностей говорит о том, что любой «отщепенец» – наблюдение, существенно отклоняющееся от среднего значения в том или ином направлении, – зачастую сопровождается исходами, более близкими к долгосрочному среднему значению.
Тенденция возврата к среднему позволяет объяснить, почему Chicago Cubs всегда платит огромные суммы за так называемых свободных агентов, которые впоследствии разочаровывают болельщиков вроде меня. Игроки могут выторговать у Chicago Cubs высокие зарплаты после одного-двух необычайно удачных для себя сезонов и, одевшись в форму Chicago Cubs, вовсе не обязательно начинают играть хуже (правда, я отнюдь не исключаю и такой вариант); скорее, Chicago Cubs платит за них огромные деньги по окончании какого-то особенно удачного для этих суперзвезд периода – года или двух, – после чего их спортивные результаты (уже в ходе выступлений за Chicago Cubs) возвращаются к неким средним показателям.
То же явление объясняет, почему когда некоторые учащиеся сдают какой-либо экзамен гораздо лучше, чем обычно, в ходе его повторной сдачи они демонстрируют худшие результаты, а у учащихся, которые сдают экзамен хуже обычного, при его повторной сдаче результаты оказываются лучше. Такая взаимосвязь наталкивает на мысль, что достижения – как интеллектуальные, так и физические – представляют собой сочетание труда (связанного со способностями данного человека) и некоторого элемента везения (или невезения). В любом случае можно допустить, что тем, кто длительное время демонстрировал высокие результаты, сопутствовала удача; а тем, у кого показатели были гораздо ниже среднего, наверное, в какой-то мере не везло. (Что касается экзаменов, то ученики иногда пытаются угадать правильный ответ – а здесь уже все полностью зависит от везения; когда речь идет о футболе, мяч, посланный нападающим в сторону ворот противника, может оказаться в воротах только потому, что по пути заденет ногу кого-либо из игроков команды противника.) Когда период сильного везения или невезения заканчивается – а рано или поздно это неизбежно происходит, – достигнутые результаты становятся ближе к среднему.
Представьте, что я пытаюсь сформировать команду подбрасывателей монет, основываясь на ошибочном предположении, что способности в этом деле играют большую роль. После того как я увидел студента, у которого шесть раз подряд выпал орел, я предлагаю ему десятилетний контракт на 50 миллионов долларов. Разумеется, я испытаю огромное разочарование, когда окажется, что на протяжении этих десяти лет выпадение орла придется лишь на 50 % подбрасываний монетки.
На первый взгляд возврат к среднему вступает в противоречие с «заблуждением игрока». После того как у моего студента шесть раз подряд выпал орел, можно ли утверждать, что на седьмой раз он «обязан» выбросить решку? Вероятность того, что на седьмой раз выпадет решка, такая же, как и всегда, – ½. То обстоятельство, что у студента несколько раз подряд выпал орел, вовсе не повышает шансы на выпадание решки. Каждое подбрасывание монетки является независимым событием. Однако мы вправе рассчитывать на то, что результаты последующих подбрасываний будут соответствовать не прошлой картине, а тому, что предсказывает нам теория вероятностей (то есть примерно одинаковые шансы на выпадание орлов и решек). Вполне возможно, что тот, у кого несколько раз подряд выпал орел, в ходе последующих 10, 20 или 100 подбрасываний начнет раз за разом выбрасывать решку. И чем больше подбрасываний он выполнит, тем ближе окончательный их результат будет к соотношению 50 на 50, то есть к среднему результату, который предсказывает нам закон больших чисел. В противном случае у нас будут все основания искать доказательства мошенничества.
Кстати, исследователи задокументировали так называемый феномен Businessweek. Когда главам компаний вручают престижные награды (в том числе еженедельник Businessweek присваивает звание «Лучший менеджер»), как правило, в течение трех последующих лет эти компании ухудшают показатели (в частности, такие как учетная прибыль и цена акций). Однако, в отличие от упоминавшегося выше эффекта Sports Illustrated, «феномен Businessweek» представляет собой нечто большее, чем возврат к среднему. По словам Ульрики Малмендьер и Джеффри Тейта, экономистов Калифорнийского университета в Беркли и UCLA соответственно, когда главы компаний обретают статус «суперзвезды», внезапно свалившаяся на них слава начинает отвлекать их от дел. Они пишут мемуары. Их приглашают в советы директоров других компаний. Они ищут для себя так называемых статусных (то есть молодых и эффектных) жен. (Упомянутые мною авторы предлагают лишь первые два объяснения, однако последнее мне также кажется вполне правдоподобным.) Малмендьер и Тейт пишут: «Полученные нами результаты свидетельствуют о том, что культура суперзвезд, искусственно формируемая средствами массовой информации, ведет к более глубоким изменениям поведения, чем обычный возврат к среднему». Иными словами, когда фотография главы компании появляется на обложке Businessweek, пиши пропало, то есть быстро продавай акции этой компании.
Статистическая дискриминация (установление различия в статистическом смысле). В каких случаях следует опираться на то, что подсказывает нам теория вероятностей, а в каких так поступать не стоит? В 2003 году Анна Диамантопуло, еврокомиссар по проблемам занятости и социальным вопросам, выступила с предложением запретить страховым компаниям применять разные ставки к мужчинам и женщинам, поскольку это нарушает принцип равноправия, исповедуемый Евросоюзом. Однако страховые компании вовсе не рассматривают такие надбавки как гендерную дискриминацию – для них это всего лишь статистика. Мужчины обычно платят больше за автостраховку, поскольку чаще, чем женщины, попадают в аварии. Женщины платят больше за аннуитеты (финансовый продукт, который выплачивает фиксированную ежемесячную или ежегодную сумму), потому что живут дольше, чем мужчины. Очевидно, что многие женщины попадают в аварии чаще, чем многие мужчины, а многие мужчины живут дольше, чем многие женщины. Но, как объяснялось в предыдущей главе, страховым компаниям нет до этого никакого дела. Их интересуют лишь среднестатистические показатели, поскольку именно это позволяет им получать прибыль. Что же касается политики Еврокомиссии, запрещающей ставить страховые надбавки в зависимость от пола человека (эта политика вступила в силу в 2012 году), то интересно отметить, что они вовсе не утверждают, будто страхуемые риски никоим образом не связаны с полом человека; они лишь заявляют о неприемлемости увязки с полом ставок страхования.
Поначалу это кажется всего лишь раздражающей данью политкорректности. Но после некоторого размышления я не стал бы торопиться с таким выводом. Помните впечатляющую информацию о предотвращении преступлений? В этом отношении теория вероятностей может завести нас в интересные, но весьма «проблемные» места. Как нам следует реагировать, когда вероятностные модели говорят о том, что мексиканские наркоторговцы чаще всего оказываются испаноязычными мужчинами в возрасте от восемнадцати до тридцати лет, перевозящими товар в красных грузовиках-пикапах где-то между девятью и двенадцатью часами ночи, если нам также известно, что подавляющее большинство испаноязычных мужчин, соответствующих такому профилю, не промышляют контрабандой метамфетамина? Да, я использовал слово «профиль», поскольку оно представляет собой менее эффектное описание предсказательной аналитики, о которой я так красочно рассказывал в предыдущей главе, или по крайней мере один ее потенциальный аспект.
Теория вероятностей указывает нам, какие события более вероятны, а какие – менее. Да, речь идет лишь о базовой статистике – инструментах, описанию которых я посвятил несколько последних глав. Но это также статистика с социальными последствиями. Если мы хотим поймать уголовных преступников, террористов и наркоторговцев, а также других лиц, представляющих угрозу для общества, то обязаны использовать для этого все имеющиеся в нашем распоряжении инструменты. Теория вероятностей может быть одним из таких инструментов. Было бы наивно полагать, будто пол, возраст, расовая принадлежность, национальность, вероисповедание и страна происхождения человека в своей совокупности не играют никакой роли в том, что касается правоприменения.
Однако вопрос, что мы можем или должны делать с информацией такого рода, предполагая, что она представляет собой какую-то прогностическую ценность, является философско-правовым (но отнюдь не статистическим). Буквально каждый день мы получаем все больше и больше информации о все более широком круге явлений. Разве мы не будем одобрять дискриминацию, если соответствующие данные говорят нам о том, что мы будем правы гораздо чаще, чем неправы? (Именно отсюда происходит термин «статистическая дискриминация», или «рациональная дискриминация».) Точно такой же анализ, как использовался для того, чтобы выяснить, что люди, покупающие корм для птиц, менее склонны увиливать от оплаты по кредитным карточкам (представьте, это действительно так!), может применяться ко всем остальным аспектам нашей жизни. Какая часть всего этого может быть приемлема для нас? Если нам удастся разработать модель, позволяющую выявлять наркоторговцев в 80 случаях из 100, что случится с беднягами, которые попадут в оставшиеся 20 %, – ведь для этих ни в чем не повинных людей наша модель несет вполне реальную угрозу!
Проблема состоит в том, что наша способность анализировать данные развилась значительно больше, чем понимание того, как нам следует поступать с результатами этого анализа. Вы можете соглашаться или нет с решением Еврокомиссии, запрещающим применение страховых надбавок, связанных с полом человека, но я абсолютно уверен, что это далеко не последнее спорное решение такого рода. Нам нравится думать о числах как о «холодных, неумолимых фактах». Если вычисления выполнены правильно, то у нас должен получиться правильный ответ. Однако более интересная и опасная реальность заключается в том, что подчас мы можем правильно все рассчитать – и двинуться в опасном направлении. Мы можем разрушить финансовую систему или упечь за решетку двадцатидвухлетнего белого парня, которому не повезло оказаться в определенное время в определенном месте, потому что, согласно нашей статистической модели, он явился сюда затем, чтобы купить наркотики. Какой бы соблазнительной ни была элегантность и точность вероятностных моделей, они не заменят нам здравого размышления о сути и цели выполняемых вычислений.