Я пишу эти строки в конце марта 2020 г., когда у нас на глазах пандемия COVID-19 в Европе и Северной Америке растет по экспоненте. И вместо очередных оценок или прогнозов (которые все равно мгновенно устаревают) я решил рассказать о неопределенностях, затрудняющих оценку и интерпретацию статистики в столь напряженной обстановке.
Страхи, вызванные пандемией вируса, связаны с относительно высокой смертностью. Но, пока инфекция распространяется, вычислить уровень смертности невозможно – это трудно сделать даже после окончания пандемии. Наиболее общепринятый эпидемиологический подход – определить показатель летальности, разделив количество подтвержденных смертей, связанных с вирусом, на общее количество случаев болезни. Числитель этой дроби (свидетельства о смерти с указанием причины) очевиден и в большинстве стран вполне надежен. Но на выбор знаменателя влияют многочисленные неопределенности. Что считать «случаями»? Только лабораторно подтвержденные болезни? Все случаи с характерными симптомами (включая людей, которых не тестировали, но у которых наблюдались эти симптомы)? Или общее количество заболевших, включая бессимптомных? Количество проведенных тестов известно с большой точностью, но для оценки общего числа заболевших нужно либо проводить серологические исследования среди населения, дождавшись окончания пандемии (выявляя антитела в крови), либо использовать различные уравнения роста для моделирования хода пандемии, либо предполагать наиболее вероятные коэффициенты (x инфицированных на y умерших).
Подробное исследование смертности во время недавней пандемии гриппа – она началась в США в январе 2009 г., в не- которых регионах продолжалась до августа 2010 г. и была вызвана новым штаммом H1N 1 с уникальной комбинацией генов вируса гриппа – иллюстрирует влияние этих неопределенностей. В числителе всегда бралось количество подтвержденных смертей, а в знаменателе – три разные категории, в зависимости от определения «случая»: число лабораторно подтвержденных случаев, оценка числа симптоматических случаев и оценка числа заболевших (на основе серологических тестов или предположений относительно распространенности бессимптомных случаев). В результате разница оказалась чрезвычайно велика: от менее одной смерти до более чем 10 000 смертей на 100 000 человек.
Как и предполагалось, учет лишь лабораторно подтвержденных случаев показывает самый высокий риск (обычно от 100 до 5000 смертей); при «симптоматическом» подходе этот показатель находится в диапазоне от 5 до 50 смертей, а если в качестве знаменателя использовать предполагаемую оценку числа инфицированных, то смертность снижается до 1–10 человек на 100 000. В первом случае смертность получается в 500 раз выше, чем в последнем!
В 2020 г. при пандемии COVID-19 (вызванной коронавирусом SARS-CoV-2) мы столкнулись с теми же неопределенностями. Например, к 30 марта 2020 г. официальная китайская статистика сообщала о 50 006 случаях заражения в Ухане, эпицентре пандемии, где пик, по всей видимости, уже миновал и умерло 2547 человек. Независимых подтверждений этих данных не было, а 17 апреля число смертей, согласно китайской статистике, увеличилось на 50 % – до 3869, а число заболевших – всего на 325. В первом случае летальность составляет 5 %, а во втором – 7,7 %, но реальных цифр мы, скорее всего, никогда не узнаем. Как бы то ни было, знаменатель дроби включал только лабораторно подтвержденные случаи (или лабораторно подтвержденные и «симптоматические»): население Уханя составляет 11,1 млн человек, и 50 000 заболевших означает, что заразилось меньше 0,5 % населения города – необычайно мало, если сравнивать с числом инфицированных при ежегодной эпидемии гриппа.
Если мы не знаем общего числа зараженных, то можем получить более точную оценку, применяя демографический показатель смертности, то есть число смертей по той или иной причине на 1000 человек, и взяв для сравнения смертность от ежегодной эпидемии гриппа. Предполагая, что пик заражения COVID-19 в 2020 г. в Ухане уже пройден (и что официальная статистика отражает реальность), смерть приблизительно 3900 человек указывает на смертность от пандемии на уровне 0,35/1000. По данным центров по контролю и профилактике заболеваний (Centers for Disease Control and Prevention, CDC), сезонная эпидемия гриппа 2019–2020 гг. в США затронет 38–54 млн человек (из общего населения порядка 330 млн и унесет жизни от 23 000 до 59 000 человек. Если взять средние цифры – 46 млн инфицированных и 41 000 смертей, – то получится, что гриппом переболеют около 14 % всех американцев, а умрут приблизительно 0,09 % зараженных (летальность); общая смертность от гриппа будет составлять 0,12/1000 (то есть умрет приблизительно 1 из 10 000) – по сравнению с 0,35/1000 для Уханя к середине апреля 2020 г. Таким образом, смертность от COVID-19 в Ухане примерно в три раза выше, чем смертность от сезонной эпидемии гриппа 2019–2020 гг. в США, – явно повод для беспокойства, но не для паники.
Как и с любой другой пандемией, мы должны подождать окончания пандемии COVID-19, чтобы получить ясную картину ее масштабов. Только тогда мы сможем сделать достоверные подсчеты – или, поскольку мы никогда не узнаем общее количество инфицированных в каждой стране и во всем мире, предложить наиболее точную оценку – и сравнить получившуюся смертность, причем разброс может получиться не меньший, чем для цифр пандемии гриппа в 2009 г.
Это один из главных уроков алгебры: даже если вы точно знаете числитель, но не можете со сравнимой точностью определить знаменатель, точное соотношение вычислить невозможно. Полностью избавиться от неопределенностей не получится, но к тому времени, когда вы прочтете эти строки, мы уже будем гораздо лучше понимать масштаб и интенсивность последней пандемии, чем в тот момент, когда я их писал. Не сомневаюсь, что вы их прочтете – и с вами все будет в порядке.