Потрясающе, не правда ли?
Мы обожаем наблюдать работу случая, наделяя глубоким смыслом те виды коррелирующих между собой событий, которые для статистики совершенно лишены какого-то особого значения. Похоже, это своего рода врожденный рефлекс. Вполне возможно, что человек всегда отыскивал значение в незначительном.
Йен Стюарт и Джек Коэн готовы порассуждать о психологической приманке – неожиданном совпадении.
Автодром Херес, последний заезд «Формулы-1» 1997 года. В этом Гран-при Михаэль Шумахер на одно очко опережает своего давнего соперника Жака Вильнёва – благодаря блистательной тактике вождения своего товарища по команде «Феррари» Эдди Ирвайна, отлично проявившего себя в предыдущей гонке. Товарищ Вильнёва по «Уильямсу» Хайнц-Харальд Френтцен может проделать сегодня такой же трюк, так что квалификация в поул-позишн еще важнее, чем обычно.
Что же происходит? Вильнёв, Шумахер и Френтцен финишируют с абсолютно одним и тем же результатом – 1 мин 21,972 с. Потрясенные комментаторы сочли это неслыханным, поразительным совпадением. Что ж, и вправду совпадение, ведь время прохода дистанции у всех троих совпало. Но поразительное ли?
Подобные вопросы возникают не только в спорте. Они появляются повсюду. Порой они тривиальны, а порой имеют очень важное значение. Удивительно ли, что вы встретили свою двоюродную бабушку Луизу, проживающую в Швеции, в этом конкретном стрип-баре Сан-Франциско? Три участницы рождественской вечеринки явились в одинаковых платьях – вправду ли это такая неожиданность? В науке тоже много таких вопросов, и куда более серьезных. Насколько значим «лейкемический кластер»? Действительно ли сильная корреляция между раком легких и наличием курильщика в семье доказывает, что пассивное курение опасно?
Один из авторов этого опуса, Джек Коэн, специализируется в области репродуктивной биологии. Как-то раз его попросили объяснить два очень любопытных статистических наблюдения. Во время визита в Израиль ему сообщили, что 84 % детей пилотов израильских истребителей – девочки. «Что в жизни пилота истребителя предопределяет такое преобладание дочерей над сыновьями?» – поинтересовались у него. Другую цифру упо мянули в связи с проблемой оплодотворения in vitro. В наши дни клиники, которые занимаются этой процедурой, следят за овуляцией при помощи ультразвука и поэтому могут определить, из какого яичника берется яйцеклетка (и получающийся младенец) – из левого или из правого. В одной клинике обнаружили, что большинство девочек происходят из левого яичника, а большинство мальчиков – из правого. Революция в области выбора пола будущего ребенка? Или просто статистический выброс?
Решить эту проблему не так-то просто. Интуиция здесь бесполезна: когда речь идет о случайных событиях, незачем пытаться что-то «почуять нутром». Многие уверены, что лотерейные номера, которые долго не выпадали, выпадут в будущем с большей вероятностью, чем иные. Такие люди ссылаются на некий «закон средних величин» – мол, в долгосрочной перспективе все должно уравняться. На самом деле все иначе, хотя эта истина и противоречит нашей интуиции. Да, в долгосрочной перспективе у всех лотерейных номеров одинаковые шансы. Но у лототрона нет памяти. Рано или поздно доли выпавших шаров сравняются, но вы не можете заранее предсказать, когда наступит это «рано или поздно». Более того, если вы решите выбрать какое-то конкретное число попыток, каким бы большим оно ни было, самым точным прогнозом окажется следующий: «Всякий первоначальный дисбаланс останется неизменным».
Наша интуиция подвергается еще более тяжким испытаниям, когда речь заходит о совпадениях. Вы приходите в ближайший бассейн, и парень за стойкой наугад берет ключ из коробки, где их полно. Пройдя в раздевалку, вы с облегчением обнаруживаете, что задействованы лишь очень немногие ящики… и тут выясняется, что у трех посетителей ящики рядом с вами, и вы хором извиняетесь, когда соседние дверцы с грохотом ударяются друг о друга. Или, скажем, вы единственный раз в жизни прилетели на Гавайи – и вдруг столкнулись там с венгром, с которым вместе работали в Гарварде. Или вы проводите медовый месяц в Ирландии… и вместе со своей молодой женой встречаете на безлюдном пляже вашего директора департамента вместе с его молодой женой. Такое как раз случилось с Джеком.
Подобные совпадения кажутся ошеломляющими, поскольку мы ожидаем, что случайные события будут распределены равномерно. Вот почему статистические сгустки событий удивляют нас. Мы думаем, что «типичный» набор выпавших номеров в Британской национальной лотерее – что-нибудь вроде «5, 14, 27, 36, 39, 45», а набор «1, 2, 3, 19, 20, 21» кажется нам куда менее вероятным. На самом деле вероятность выпадения у двух этих наборов совершенно одинакова – 1 к 13 983 816. Более того – последовательности из шести случайных чисел будут даже с большей вероятностью «слипаться», нежели «не слипаться».
Откуда мы это знаем? Специалисты по теории вероятностей решают такие проблемы при помощи так называемых выборочных пространств. Выборочное пространство (пространство выборок, пространство элементарных событий) содержит в себе не только событие, которое нас занимает, но и все возможные альтернативы. К примеру, для броска игральной кости выборочное пространство – это «1, 2, 3, 4, 5, 6». Для Британской лотереи выборочное пространство – это множество всех последовательностей 6 различных целых чисел от 1 до 49 включительно. Каждому событию в выборочном пространстве присваивается числовое значение, именуемое его вероятностью и соответствующее тому, насколько возможно данное событие. При честной игре в кости все такие значения равны, и вероятность выпадения каждой цифры составляет одну шестую. То же самое и для лотереи, но там вероятность выпадения каждого номера – 1/13 983 816.
Полезно представить себе размеры выборочного пространства, чтобы оценить, таким ли удивительным является кажущееся совпадение. Вспомним совпадающее время в «Формуле-1». Гонщики высшего класса обычно все мчатся по трассе примерно с одинаковой скоростью, так что логично предположить, что три лучших результата будут отличаться друг от друга не более чем на одну десятую секунды. Если точность измерения составляет одну тысячную секунды, на интервале в одну десятую у нас 100 возможных результатов для каждого спортсмена: этот список и определяет наше выборочное пространство. Предположим для простоты, что вероятность каждого результата здесь одна и та же. Тогда существует вероятность 1/100, что второй гонщик придет в такое же время, что и первый, и вероятность 1/100, что третий придет в то же время, что и двое остальных, а значит, общая оценка вероятности совпадения всех трех результатов (получаемая путем перемножения двух вероятностей) составит 1/10 000. Достаточно малая величина, чтобы удивиться, но все-таки недостаточно низкая, чтобы так уж поражаться. Здесь примерно те же шансы, что и на попадание мяча в лунку с ти-бокса в гольфе.
Подобные оценки помогают объяснять фантастические совпадения, о которых любят писать в газетах: скажем, когда в бридже образуется perfect hand (идеальный расклад), при котором каждый игрок собирает по 13 карт – от двойки до туза. В каждой отдельной партии шансы для такого события исчезающе малы. Но каждую неделю во всем мире играется несметное число партий в бридж. Это число столь огромно, что за каждые несколько недель в ходе всех сыгранных партий обходится все выборочное пространство. Иными словами, следует ожидать, что хоть где-нибудь да выпадет идеальный расклад, и будет он выпадать в полном соответствии со своей малой, но все же ненулевой вероятностью.
Впрочем, использование выборочных пространств не всегда совсем уж прямолинейно. Статистики предпочитают иметь дело с так называемым очевидным выборочным пространством. К примеру, для вопроса об израильских пилотах истребителей они, конечно, включили бы в выборочное пространство всех детей израильских пилотов истребителей. Но это был бы неверный выбор. Почему? Мы зачастую склонны недооценивать (занижать) размер выборочного пространства. Потому-то совпадения и кажутся нам столь удивительными, хотя на самом деле ничего удивительного в них нет. Здесь все сводится к ключевому фактору, который называется «избирательным сообщением результатов» и который традиционная статистика, в общем-то, как правило, склонна игнорировать.
К примеру, идеальный расклад в бридже имеет куда больше шансов попасть в местную или даже общенациональную прессу, чем неидеальный. Часто ли вам попадаются на глаза, скажем, такие заголовки: «Бриджисты из Ноттингема получили совершенно обычный расклад»? Человеческий мозг не в силах сопротивляться собственному неуемному стремлению повсюду отыскивать какой-то осмысленный узор. Вот он и цепляется за определенные события, которые кажутся значимыми, – и неважно, значимы ли они на самом деле. Поступая так, наш мозг игнорирует все «соседние» события, которые помогли бы ему рассудить, насколько вероятным (или маловероятным) является то, что он воспринимает как совпадение.
Избирательное сообщение результатов влияет на то значение, которое мы придаем этому хронометражу гонок 1997 года. Если бы эти цифры не совпали, мы бы, возможно, отыскали какой-то необычный рисунок в теннисном счете матчей «US Open», или в бильярдном турнире этой недели, или в гольфе… Обо всем этом тоже непременно сообщили бы. Но никакое из неслучившихся совпадений не попадает на первые полосы газет. Если внести всего-навсего десяток главных спортивных событий в список этих неслучившихся совпадений, тогда шансы 1/10 000 вырастут вдесятеро – до 1/1000. С чем сравнить эту величину? Такова же вероятность того, что при подбрасывании монетки у вас десять раз подряд выпадет орел.
Вернемся к летчикам израильской боевой авиации. Что здесь действует – только ли случай? Или вдобавок что-то еще? Для ответа на вопрос традиционная статистика выстроила бы очевидное выборочное пространство (дети пилотов истребителей), оценила бы вероятность рождения мальчика и девочки и затем рассчитала бы вероятность появления на свет 84 % девочек в совершенно случайной выборке. Но этот анализ не обращает внимания на избирательное сообщение результатов. Почему вообще кто-то заинтересовался полом отпрысков израильских пилотов истребителей? Вероятно, потому что такое статистическое сгущение уже привлекло чье-то внимание. Если бы такое же явление наблюдалось при анализе роста детей израильских авиаконструкторов или музыкальных способностей жен израильских авиадиспетчеров, мозг, повсюду ищущий необычные сгущения, тут же обратился бы к этим неожиданным сведениям. Традиционный статистический подход молчаливо исключает из рассмотрения многие факторы, которые не дают сгущения. Иными словами, при этом игнорируется часть выборочного пространства.
Человеческий мозг отфильтровывает колоссальные объемы данных, отыскивая вещи, которые кажутся необычными, и лишь тогда посылает осознанный сигнал: мол, поглядите-ка! Чем шире вы раскидываете сеть, ища осмысленный узор, тем больше вероятность, что вы поймаете статистическое сгущение. Ничего страшного в этом нет. Но если вы хотите узнать, насколько значимо такое сгущение, нужно не учитывать данные, которые первоначально привлекли ваше внимание к этому сгущению. В комнате, где присутствует 20 человек, обычно найдется один (самый высокий), чей рост позволяет ему попасть в несколько процентов самых высоких людей в стране. Но нельзя потом вывести этого дылду из комнаты, заново измерить его рост и сделать глубокомысленный вывод: мол, как удивительно, что вы нашли человека с таким необычным ростом. Опомнитесь, вы ведь изначально выбрали его именно по такому параметру.
Точно такую же ошибку совершали в первых опытах по изучению экстрасенсорного восприятия. Экспериментаторы просили тысячи добровольцев угадать карту в специальной колоде из пяти символов. После нескольких недель отбора каждый, чьи способности оказывались выше среднего уровня, приглашался на второй круг опытов. Поначалу казалось, что эти «хорошие угадчики» обладают сверхъестественными способностями. Но с течением времени доля успешных предсказаний для каждого такого «экстрасенса» медленно скатывалась обратно к среднему значению, словно мистическая сила постепенно покидала их. Дело в том, что их первоначальные высокие показатели (те сгущения, по которым их и отобрали) рассматривались на общем фоне и включались в общие расчеты. Если бы эти удачные результаты исключили из второго набора опытов, показатели тут же упали бы примерно до средних величин для первого круга.
Такая же история с пилотами истребителей и с левыми-правыми яичниками. Любопытные цифры, которые привлекли внимание ученых именно к этим конкретным данным, вполне могли стать следствием избирательного сообщения результатов – или, что почти одно и то же, избирательного восприятия. А если так, можно сделать простое предсказание: «В дальнейшем цифры вернутся к равному распределению – пятьдесят на пятьдесят». Если прогноз не сбудется и новые данные подтвердят дисбаланс, отраженный в статистическом сгущении, тогда эти новые данные можно будет счесть имеющими какое-то значение. Но я готов поручиться, что предсказание окажется верным.
Та же погрешность таится в традиционных экспериментальных исследованиях – скажем, направленных на то, чтобы выяснить, вызывают ли рак определенные продукты. Для экономии времени обычно рассматривают много пищевых компонентов сразу: клетчатку, жиры, красное мясо, овощи и т. п. – и определяют, как все они соотносятся с заболеваемостью раком. Пока вроде бы все выглядит нормально. Но потом вы решаете выбрать самую впечатляющую позицию – компонент, который необычно тесно коррелирует с заболеваемостью раком. Если вы проявите неосторожность, то мигом позабудете обо всех прочих факторах и опубликуете статью, утверждающую, что употребление в пищу красного мяса существенно увеличивает вероятность онкологических заболеваний. На самом деле вы просто выбрали среди сотен разных продуктов один, который показался вам наиболее значимым. Разумеется, какой-то один непременно должен был таким показаться. По чисто статистическим причинам следовало бы удивиться, если бы такого продукта не нашлось, даже если все продукты отбирались случайным методом.
Мнимое падение содержания сперматозоидов в семенной жидкости может служить еще одним примером избирательного сообщения результатов. Группа Нильса Скаккебака из Копенгагенского университета опубликовала первые (впоследствии многими признанные) данные в пользу такого падения в 1997 году. Но винить в избирательном сообщении результатов следует не этих исследователей. Повинны в этом ученые, у которых имелись данные в пользу противоположного вывода и которые не опубликовали их, считая, что они, должно быть, неверны. Повинны в этом и редакции журналов, чаще принимавшие статьи, где подтверждалось падение, нежели те работы, где это падение не подтверждалось. Повинна в этом и пресса, лихо свалившая в одну кучу разные связанные с половой сферой дефекты в разных частях царства животных и слепившая из этого одну единую историю, не отдавая себе отчета в том, что каждый отдельный случай имеет прекрасно обоснованное объяснение, не имеющее ничего общего с падением содержания сперматозоидов, а зачастую и с сексом. К примеру, половые аномалии у рыб, живущих близ предприятий по очистке сточных вод, по всей видимости, вызваны избытком нитритов (все рыбоводы знают, что эти вещества вызывают самые разные отклонения у рыб), а не эстрогеноподобными веществами в воде, которые придали бы больше пикантности истории с падением доли сперматозоидов.
Главное здесь вот в чем. При оценке статистической значимости нужно формировать выборочное пространство согласно тому, как вы действительно проводили эксперимент, а не опираться на его отредактированную версию, полученную с применением избирательного сообщения результатов. Надежнее всего не учитывать данные, которые привели к этому результату, привлекшему ваше внимание, и повторить эксперимент, чтобы получить новые данные. Но даже тогда вы не должны позволять совпадению (статистическому сгущению) определять выборочное пространство за вас. Поддавшись такому искушению, вы невольно проигнорируете окружающее пространство почти-совпадений.
Мы решили проверить эту теорию во время нашей недавней поездки в Швецию. Еще в самолете Джек предсказал, что в стокгольмском аэропорту, где нам предстоит приземлиться, нас ждет некое совпадение. Он выдал и причину: избирательное сообщение результатов. По его словам, вглядываясь достаточно пристально, мы наверняка что-нибудь такое найдем. Мы прилетели, добрались до автобусной остановки близ терминала, но никаких совпадений за это время не произошло. Но мы никак не могли отыскать нужный автобус, и Джек вернулся к справочной стойке. Пока он ждал своей очереди, за ним встал какой-то человек. Этим человеком оказался Стефано, математик, который работает по соседству с Джеком в британском Уорикском университете, буквально в соседней комнате.
Итак, предсказание подтвердилось. Однако на самом деле мы хотели заполучить почти-совпадение – такое, которое на самом деле не произошло, но о котором могли бы рассказать благодаря избирательному восприятию. К примеру, если бы еще кто-то из наших знакомых появился бы в то же самое время, но в другой день или в другом аэропорту, мы этого никогда бы не заметили. Швеция вообще могла бы кишеть нашими знакомыми, и для нас было бы практически невозможно избежать встречи с ними практически в любой конкретный момент. Почти-совпадения по определению трудно наблюдать. Но мы, так уж случилось, упомянули об этом в разговоре с Тедом, другом Йена, который приехал к нему в гости вскоре после того, как мы вернулись обратно в Англию. «Стокгольм? – переспросил Тед. – Когда?» Мы сказали. «Какой отель?» – «„Ярл Биргер“», – ответили мы. – «Вот так штука! Я останавливался в „Ярле Биргере“, только на день позже!» Значит, если бы мы прилетели на следующий день, мы не встретили бы Стефано, зато встретили бы Теда. Согласно законам селективного сообщения результатов, мы рассказали бы друзьям лишь о той встрече, которая произошла на самом деле.
Теория вероятностей позволяет оценить, какова возможность того, что некое событие произойдет, а другие (которые могли бы произойти) по тем или иным причинам не будут иметь места. Иными словами, вероятность одного события здесь сравнивается с вероятностью других. На уровне интуиции мы плохо воспринимаем вероятности, поскольку система детектирования свойств и явлений в нашем мозгу замечает лишь то, что происходит. В окружающем нас мире каждое событие уникально. Каждая встреча, каждая доля сперматозоидов, каждый расклад в бридже. «Как, у тебя часть телефонного номера похожа на номер твоей машины? Ну и ну!» Однако если вспомнить, что у обычного гражданина несколько десятков важных для него номеров и чисел (цифры в адресе, почтовый индекс, ПИН-коды, номер мобильного, номера кредитных карточек…), случайное сходство между двумя из них – вещь совершенно обыденная, и ничего примечательного в ней нет.
А следовательно, мы не должны, оглядываясь на былые события, отыскивать значение в тех немногих, которые неизбежно будут выглядеть какими-то странными. Это путь пирамидологов и гадателей по чайным листьям. Каждый узор дождевых капель на тротуаре уникален. Мы не говорим, что если в одном из таких узоров случайно проглянет ваше имя, то этому не стоит удивляться. Но если бы ваше имя дождь написал на пекинской улице во время правления династии Мин, в полночь, этого никто бы не заметил, уверяю вас. При оценке значимости незачем всматриваться в прошлое: для корректной оценки вам придется обязательно учесть все прочие события, которые могли бы случиться взамен выбранного вами.
Каждое случившееся событие уникально. Пока вы не отнесете его к какой-то категории, вы не сможете понять, на каком фоне его следует рассматривать. А пока вы не подберете фон, вы не сможете корректно оценить вероятность события. С другой стороны, если что-то кажется вам странным и пугающим, однако действительно, как выясняется, имеет малое выборочное пространство, этому и в самом деле следует удивиться по-настоящему.