Книга: Математика жизни и смерти. 7 математических принципов, формирующих нашу жизнь
Назад: Ошибка независимости
Дальше: Ошибка прокурора

Экологическая ошибка

Один из видов экологической ошибки – это поверхностное допущение, что обо всей разнообразной популяции можно судить по одному статистическому параметру. Так, в Великобритании в 2010 году средняя ожидаемая продолжительность жизни женщин составляла 83 года, а мужчин – всего 79 лет. Общая ожидаемая продолжительность жизни населения, таким образом, составила 81 год. Но утверждение, что любая случайно выбранная женщина будет жить дольше, чем любой случайно выбранный мужчина, сделанное на основании того, что средняя ожидаемая продолжительность жизни у женщин выше, чем у мужчин, и будет типичным примером экологической ошибки. Этот тип ошибки имеет собственное (очень подходящее) название – абстрактное обобщение. Другая распространенная экологическая ошибка – утверждение, что «мы все живем дольше», основанное на поверхностной интерпретации данных об увеличении общей продолжительности жизни. Им часто злоупотребляют ленивые журналисты. Говорить, что все будут жить дольше, чем ожидалось прежде, нельзя. Очевидно, что в лучшем случае это наивные предположения.
Однако экологические ошибки могут быть и менее очевидными. Как ни удивительно, при средней продолжительности жизни в 78,8 года большинство британских мужчин проживет дольше, чем при общей продолжительности жизни населения 81 год. На первый взгляд утверждение кажется противоречивым, но на самом деле это связано со спецификой использования статистических методов для обобщения данных. Небольшое, но значимое количество людей, умирающих молодыми, снижает средний возраст смерти (обычно за общую продолжительность жизни принимают сумму возрастов всех людей на момент смерти каждого, деленную на общее число людей). Как ни странно, эти ранние смерти опускают среднее значение продолжительности жизни намного ниже медианного (возраста, который не переживают столько же людей, сколько и переживают его). Медианный возраст смерти мужчин в Великобритании составляет 82 года, то есть до этих лет доживет как минимум половина из них. В данном случае представленная сводная статистика – средняя продолжительность жизни в 78,8 года – является исключительно недостоверной характеристикой мужской половины британцев.
Гауссова кривая, или кривая нормального распределения, с помощью которой можно описывать самые разные обыденные наборы данных – от роста до показателей IQ, – выглядит как гармоничная симметричная кривая, в которой половина данных лежит на одной стороне среднего значения, а половина – на другой. Это означает, что среднее и медианное – среднее значение распределения данных – значение характеристик, которые подчиняются этому распределению, склонны совпадать. Привыкнув к тому, что эту замечательную кривую можно использовать для описания реальных событий и явлений, многие из нас предполагают, что понятие «среднего» является хорошим маркером «середины» набора данных. Столкновение же с распределениями, где среднее значение не совпадает с медианным, может нас ошарашить. Распределение возраста смерти британских мужчин, показанное на рис. 11, явно далеко от симметрии. Поэтому подобные распределения обычно называют «смещенными» или «асимметричными».

 

Рис. 11. Возрастная зависимость числа смертей в год у мужчин в Великобритании следует искаженному распределению. Средний возраст смерти составляет чуть менее 79 лет, в то время как медианный возраст – 82 года

 

Как мы видели в предыдущей главе (где познакомились с медианой, обсуждая способы предотвратить ложные срабатывания сигнала тревоги), распределение доходов домохозяйств – это еще один статистический показатель, медианное значение которого сильно отличается от среднестатистического. Распределение доходов домохозяйств в Великобритании, показанное на рис. 4, также асимметрично; та кривая очень напоминает изломанную и зеркально отображенную версию кривой на рис. 11. Большинство домохозяйств Великобритании имеют низкий располагаемый доход, но есть небольшое, но статистически значимое число богатых, которое искажает симметрию распределения. В 2014 году недельные доходы двух третей британцев были ниже «среднего» уровня.
Поначалу еще более удивительным примером кажется старая загадка: «Каков шанс на то, что у следующего человека, которого вы встретите на улице, ног будет больше, чем в среднем у людей?» Ответ: «Почти наверняка». Соль в том, что одноногих или вовсе безногих калек очень немного, но они и обеспечивают некоторое снижение среднего количества ног в пересчете на все население. Так что каждый, у кого две ноги, имеет больше ног, чем все население в среднем. Этот пример показывает, насколько смехотворны попытки оценивать индивидуальные качества, исходя из усредненных показателей по всей популяции.
Очевидно, что использование некорректного усреднения для описания популяции может привести к экологическим ошибкам. Еще один тип экологической ошибки, известный как парадокс Симпсона, возникает, когда мы пытаемся взять среднее значение из двух и более разнородных групп данных. Парадокс Симпсона проявляется в самых разных областях – от оценки состояния экономики до интерпретации социально-демографических электоральных профилей и, что, возможно, наиболее важно, в разработке лекарств . Представьте себе, например, что мы отвечаем за контролируемое испытание нового препарата для снижения давления «Фантастикол». На исследование записалось 2000 добровольцев обоих полов, причем количество мужчин и женщин получилось равным. В целях контроля мы разделили их на две группы по 1000 человек. Пациенты в группе А получат «Фантастикол», а пациенты в группе Б – плацебо. В конце исследования выяснилось, что у 56 % (560 из 1000) человек, получавших препарат, артериальное давление снизилось, а в группе получавших плацебо этот эффект наблюдался только у 35 % (350 из 1000) добровольцев (см. таблицу 5). Похоже, что «Фантастикол» действительно работает.

 

Табл. 5. «Фантастикол», похоже, оказывает в целом более существенный благоприятный эффект, чем плацебо

 

Для правильной адресации препарата важно знать особенности его воздействия с учетом половой принадлежности пациента. Следовательно, нам нужно понять, как наш препарат действует на мужчин и женщин по отдельности, поэтому мы перераспределяем наши статистические данные соответственно. Эта более подробная разбивка приведена в табл. 6. Анализ результатов оказывается несколько неожиданным. У мужчин из группы Б, принимавших плацебо, артериальное давление понизилось у 25 % (200 из 800 в группе Б), а вот у мужчин из группы А, принимавших «Фантастикол», такой же благотворный эффект наблюдался лишь в 20 % случаев (40 из 200). Среди женщин очевидна та же тенденция: в группе Б давление понизилось в 75 % случаях (150 из 200), а в группе А – только в 65 % случаев (520 из 800). Для обоих полов доля тех, на ком плацебо сказался благотворнее, чем «Фантастикол», оказывается выше. В этом свете новый препарат уже кажется менее эффективным, чем плацебо. Как может быть, что при разбиении данных на группы и их стратификации исследование рассказывает одну историю, а при объединении групп – противоположную, и какая из этих историй правдива?

 

Табл. 6. При распределении испытуемых по половой принадлежности выясняется, что вне зависимости от пола эффект от приема плацебо выше, чем от приема «Фантастикола»

 

Отвечает за эту путаницу так называемая смешанная переменная, она же – искажающий фактор. В нашем случае такой переменной величиной является пол. Оказывается, что пол очень важен для результата. В ходе исследования давление у женщин улучшалось по естественным причинам чаще, чем у мужчин. Поскольку разделение по половому признаку в группах было разным (800 женщин и 200 мужчин в группе А и 200 женщин и 800 мужчин в группе Б), на общий результат группы А значительное положительное влияние оказало естественное улучшение давления у женщин, в результате чего «Фантастикол» показался более эффективным, чем плацебо. Несмотря на то что в исследовании принимало участие равное количество мужчин и женщин, неравномерность их распределения по группам привела к тому, что первоначальный высокий результат применения «Фантастикола» в 56 %, взятый по среднему значению в группе А и отраженный в таб. 5, при сопоставлении с результатом его применения с учетом пола (20 % улучшений для мужчин и 65 % для женщин) не подтвердился. Нельзя просто брать и выводить среднеарифметическое из разнородных средних значений.

 

Табл. 7. При равномерном распределении мужчин и женщин по группам пропорции благотворного воздействия различных препаратов на мужчин и женщин остаются теми же, что и в табл. 6

 

Выведение среднеарифметического из средних значений допустимо только в том случае, если мы уверены, что учли все возможное влияние смешанных переменных. Знай мы заранее, что пол является одной из таких переменных, то мы понимали бы, что результаты необходимо разделять по половой принадлежности, чтобы получить истинную картину эффективности «Фантастикола». Мы могли пойти и другим путем – собрав в группах равное количество мужчин и женщин, как показано в табл. 7. Показатели улучшения для мужчин и женщин, принимающих «Фантастикол» или плацебо, остаются такими же, как и в табл. 6. Однако, когда результаты объединены в табл. 8 и мы смотрим на показатели улучшения для «Фантастикола» (42,5 % улучшения), становится ясно, что препарат не лучше, а хуже, чем плацебо (50 % улучшения). Конечно, в нашем случае на результат могут влиять и другие смешанные переменные, которые мы не учли, – возраст, например, или иные социально-демографические факторы.

 

Табл. 8. Теперь, когда мы учли (и устранили) влияние смешанной переменной в виде пола, очевидно, что «Фантастикол» оказывается менее эффективен, чем плацебо

 

Экологические ошибки и проблема контроля смешанных переменных серьезно затрудняют задачу тех, кто разрабатывает и проводит клинические испытания (мы видели это во второй главе и еще увидим в четвертой – но по иной причине), но их негативное влияние проявляется и в других областях медицины. В 1960-х и 1970-х годах у детей, матери которых курили во время беременности, наблюдалось любопытное явление. Дети от курящих матерей, рожденные с низким весом, имели значительно меньше шансов умереть в первый год жизни, чем дети, рожденные некурящими матерями. Низкий вес при рождении долгое время ассоциировался с более высокой младенческой смертностью, но было похоже, что курение во время беременности обеспечивает некоторую защиту младенцам, рожденным с низким весом . На самом деле это было совсем не так . Парадокс возник из-за смешанной переменной.
Хотя более низкий вес при рождении и связан с повышенной младенческой смертностью, он не является ее причиной. Как правило, оба этих явления вызваны каким-то иным неблагоприятным состоянием, которое и является смешанной переменной. Как курение, так и другие нездоровые привычки, и неблагоприятные условия жизни могут повлиять на вес ребенка при рождении и привести к росту младенческой смертности, но они делают это в разной степени. Курение родителей приводит к тому, что многие дети, в остальном совершенно здоровые, рождаются с пониженным весом. Другие причины недовеса при рождении, как правило, несут более серьезную угрозу для здоровья ребенка, что приводит к более высоким показателям младенческой смертности в этих случаях. В итоге комбинация того, что у курящих матерей дети с недовесом рождаются гораздо чаще, и того, что смертность у таких детей лишь незначительно выше, приводит к тому, что в первый год жизни эти дети умирают реже, чем те, что родились с низким весом из-за некоторых более опасных для жизни заболеваний.
Экологическая ошибка Мидоу, своевольно зачислившего Кларков в категорию семей, где риск развития СВДС низок, сделала смерть их двух детей в глазах присяжных гораздо более подозрительной, чем она выглядела бы, если бы присяжные исходили из других, более высоких показателей этого риска. Даже отсылка к значению общего уровня СВДС в данном случае была бы экологической ошибкой. Конечно, общепопуляционный показатель менее предвзят, и поэтому использование его в ситуации, когда на карту была поставлена свобода женщины, можно допустить. Но положение усугубило ошибочное допущение, что серийные смерти от СВДС – статистически независимые события.
Назад: Ошибка независимости
Дальше: Ошибка прокурора