Книга: Математика жизни и смерти. 7 математических принципов, формирующих нашу жизнь
Назад: Глава 2 Чувствительность, специфичность[48] и альтернативные варианты: почему нужна математика в медицине
Дальше: Момент истины

Каковы шансы?

В 2007 году 23andMe, названная в честь 23 пар хромосом, составляющих типичную человеческую ДНК, стала первой компанией, предложившей персональный анализ ДНК с целью установления родословной клиента. В следующем году, благодаря инвестициям от Google в размере 4 миллионов долларов, 23andMe выпустила на рынок слюнный тест, с помощью которого можно было оценить предрасположенность к почти 100 различным заболеваниям – от непереносимости алкоголя до мерцательной аритмии. Их список генетических признаков был настолько исчерпывающим, а результаты анализов имели настолько мощный трансформационный потенциал, что журнал «Тайм» присвоил тесту статус «изобретения года».
Но музыка для 23andMe играла недолго. В 2010 году Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA) уведомило компанию, занимающуюся персональной геномикой, что их тесты считаются медицинскими приборами и поэтому требуют федеральной сертификации. В 2013 году FDA выпустила в адрес 23andMe, которая так и не получила нужного сертификата, предписание приостановить продажу индивидуальных тестов с указаниями предрасположенностей к заболеваниям до тех пор, пока точность этих тестов не будет подтверждена. Клиенты 23andMe подали коллективный иск на нее, утверждая, что были введены в заблуждение относительно того, какую информацию может предоставлять им компания-профайлер . В разгар этих неприятностей, в декабре 2014 года 23andMe запустили свой сервис в области здравоохранения в Великобритании. Учитывая эти противоречия, я задумался о том, какие результаты анализа своей ДНК я получил бы, отправь я им образец еще тогда.
Читая об опыте 33-летнего веб-разработчика Мэтта Фендера в «Нью-Йорк Таймс», я лишь утвердился в своих сомнениях. Искренний «ботаник» и последователь активно расширяющегося сообщества озабоченных собственным здоровьем . Фендер был идеальным клиентом 23andMe. Получив данные своего профиля, он отправил их для расшифровки в другую организацию. Расшифровка принесла Фендеру положительный результат на PSEN1-мутацию. Мутация белка PSEN1 (пресенилин-1) может служить признаком предрасположенности к ранней болезни Альцгеймера с «полной пенетрантностью», что означает, каждый носитель этой мутации заболеет без вариантов и никаких шансов избежать этой участи у него нет. Неудивительно, что Фендер был встревожен мыслью о потере способности абстрактно мыслить, решать задачи и хранить целостные воспоминания. Диагноз сокращал срок его осмысленной жизни по крайней мере на 30 лет.
Эта мысль не выходила у него из головы, и он решил перепроверить диагноз. В истории его семьи случаев болезни Альцгеймера не было, и Фендер не сумел убедить генетиков провести контрольный тест. Вместо этого он решил воспользоваться схожим сервисом проверки генотипа «на дому». Он отправил еще одну пробирку со своей слюной – на сей раз в компанию Ancestry.com – и стал ждать результатов. Через пять недель он получил отрицательный результат на PSEN1. Фендер слегка воспрял духом, но озадачился и растерялся даже сильнее, чем прежде. В конце концов он сумел убедить врача дать ему направление в клинику, где провели контрольный анализ и подтвердили отрицательный результат от Ancestry.com.
Технология секвенирования, используемая в 23andMe и Ancestry.com, допускает лишь 0,1 % ошибок и кажется невероятно надежной. Однако при проверке почти миллиона генетических вариантов стоит помнить, что даже при такой точности примерно 1000 результатов будут неверными. Неудивительно (хотя, конечно, и тревожно), что результаты, полученные двумя независимыми компаниями, могут отличаться. Большее, пожалуй, беспокойство вызывает очевидное отсутствие поддержки клиента после проведения анализа. Запросив услугу секвенирования на дому, человек оказывается лицом к лицу с результатами этого анализа в одиночку, практически в полной медицинской изоляции.
Со временем 23andMe получила одобрение FDA на проведение генетических тестов (в значительно сокращенном диапазоне) и в 2017 году возобновила свою деятельность в США. В том году их домашний набор для анализа ДНК стал одним из самых продаваемых товаров на Amazon в «черную пятницу». Несмотря на мои собственные опасения (или, возможно, как раз из-за них), я заказал набор и отправил образец своей слюны на тестирование.
Почти в каждой клетке человеческого тела находится ядро, содержащее копию нашей ДНК – так называемую «Книгу жизни». Мы наследуем эти длинные, извилистые цепочки аминокислот в 23 парах хромосом, по одной от каждого из наших родителей. Каждая хромосома в паре содержит копии тех же генов, что и ее партнер, последовательности которых похожи, но не обязательно точно совпадают. Например, есть два основных варианта связанного с болезнью Альцгеймера гена аполипопротеина (APOE), который может обнаружить тест 23andMe. Эти варианты называют Е3 и Е4. Вариант Е4 связан с повышенным риском позднего Альцгеймера. Поскольку хромосом две, вы можете иметь либо одну копию Е4 (и одну копию Е3), две копии Е4 (и ни одной копии Е3) или ни одной копии Е4 (и две копии Е3). Количество копий называют вашим генотипом. Две копии Е3 – наиболее распространенный вариант генотипа и базовый показатель, по отношению к которому оценивается вероятность болезни Альцгеймера. Чем больше у вас копий Е4, тем выше риск ее развития.
Но насколько он высок? Учитывая, что 23andMe обнаружили, что я обладаю определенным генотипом, каков мой прогнозируемый риск – вероятность развития болезни? Прежде чем делать какие-то выводы, я должен был убедиться, что их математический анализ проведен на надежной основе.
Лучший способ разобраться с прогнозируемым риском болезни Альцгеймера – продольное исследование, для которого отбирается огромное количество лиц, представляющих население в целом, устанавливается их генотип, а затем их регулярно проверяют, чтобы узнать, у кого развивается эта болезнь. С помощью этих репрезентативных данных можно сравнить риск получить болезнь Альцгеймера для данного генотипа с риском по популяции в целом – так называемым относительным риском. Обычно, однако, такое масштабное исследование обходится непомерно дорого из-за большого количества участников (особенно при редких заболеваниях), которых надо обследовать, и сроков, в течение которых их необходимо наблюдать.
Более распространенным, но менее надежным является метод анализа серии контролируемых случаев. Для такого анализа отбираются несколько человек, уже страдающих болезнью Альцгеймера, а также ряд «контрольных случаев» – людей со сходными жизненными обстоятельствами, но не больных. (В третьей главе мы увидим, почему тщательный контроль жизненных обстоятельств имеет большое значение). В отличие от продольного исследования, в котором участники отбираются независимо от статуса заболевания, в этом случае внимание исследователей сосредоточено на носителях заболевания, поэтому такой анализ не дает оценку заболеваемости среди населения в целом. В результате прогноз относительного риска получается искаженным. Тем не менее эти испытания позволяют точно рассчитать соотношения рисков, которые не требуют знать общую распространенность заболевания среди населения.
Те, кто бывал на собачьих бегах или скачках, могут вспомнить, что вероятность победы в забеге часто выражается в коэффициентах. Аутсайдер может иметь коэффициент 5 к 1. Это означает, что в пяти из шести идентичных забегов это животное, скорее всего, проиграет, а выиграет лишь в одном. Вероятность его победы составляет 1 к 6. Естественный способ описывать шансы против – задавать соотношение вероятности того, что событие не произойдет, и вероятности того, что оно произойдет (в данном случае 5/6 к 1/6, или, проще, 5 к 1). Фаворит гонки, напротив, может иметь коэффициент 2 к 1. В спортивном тотализаторе принято всегда ставить на первое место большее число, поэтому необходимо различать коэффициенты «на» и «против». Коэффициент «на», обратный коэффициенту «против», выражает отношение вероятности того, что событие произойдет, к вероятности того, что оно не произойдет. При коэффициенте 2 к 1 можно ожидать, что фаворит в трех забегах выиграет два раза и проиграет один. Таким образом, вероятность того, что фаворит выиграет, составляет 2 из 3 или 2/3, а вероятность того, что он проиграет, составляет 1/3, что и дает коэффициент 2/3 к 1/3 или, проще, 2 к 1.
Комментаторы и букмекеры порой говорят о «фаворите с высокой котировкой» – как правило, когда речь идет о забегах с небольшим количеством лошадей. Этот жаргонизм – тавтология. Любая лошадь с положительным коэффициентом (выше единицы) котировок является фаворитом по определению, поскольку в любом забеге математически может быть только одна лошадь, которая с большей вероятностью выиграет, чем проиграет. В забеге же с большим количеством лошадей вероятность выиграть ниже. Так, в самых известных скачках Великобритании Grand National участвуют 40 лошадей. Даже победитель 2018 года, Tiger Roll, считавшийся неоспоримым фаворитом в 2019 году (в конце концов он и выиграл), имел шансы 4 к 1 «против». Поскольку большинство лошадей вряд ли выиграют большинство забегов, коэффициенты на лошадей, начинающиеся с высокого числа, как правило, это коэффициенты «против» – если прямо не указано иное.
В медицинских сценариях все наоборот. Шансы обычно выражаются в виде коэффициента «за» – вероятности того, что событие произойдет, относительно вероятности того, что оно не произойдет, а поскольку мы обычно говорим о заболеваниях с уровнем распространения среди популяции ниже 50 %, первым обычно называется меньшее число.
Чтобы посмотреть, как вычислить медицинские шансы и желаемое соотношение шансов, рассмотрим гипотетическое исследование конкретного контролируемого случая о влиянии единственного варианта Е4 (как в моем профиле ДНК) на вероятность развития болезни Альцгеймера к 85 годам. Результаты представим в табл. 1. Шансы развития болезни Альцгеймера к 85 годам в случае с одной копией варианта Е4 в генотипе (как и у меня) представляют собой количество людей с болезнью (100), деленное на количество людей без болезни (335), то есть 100 к 335 или, в виде дроби, 100/335. По той же логике, с учетом данных из второй строки таблицы, шансы развития болезни к 85 годам у обладающих распространенным генотипом с двумя копиями варианта Е3 составляют 79 к 956, или 79/956. Таким образом, соотношение шансов – это сравнение шансов на развитие болезни у человека с заданным генотипом (например, одна копия варианта Е4 и одна копия варианта Е3) с шансами развития болезни у человека с наиболее распространенным генотипом (две копии варианта Е3). Для гипотетических показателей, приведенных в табл. 1, соотношение шансов составляет 100/335, деленное на 79/956, что дает 3,61. Крайне важно, что соотношение шансов не требует от нас знать уровень распространения болезни в популяции в целом, поэтому его можно легко вычислить на основе анализа конкретных случаев.

 

Табл. 1. Результаты гипотетического тематического исследования о влиянии варианта одной копии Е4 на развитие болезни Альцгеймера к 85 годам

 

Показатель соотношения шансов сам по себе не дает информации о значении относительного риска (вероятности получения заболевания для генотипа Е3/Е4 относительно вероятности получения заболевания для генотипа Е3/Е3), но, объединив его с общим популяционным риском заболевания и известными частотами генотипов , можно определить вероятность заболевания для данного генотипа. Этот расчет очень непрост. Более того, не существует даже однозначно определенного способа его сделать. Я попытался воспроизвести тот же показатель риска развития поздней болезни Альцгеймера, что обнаружил в присланном отчете, используя тот же метод, что и в 23andMe, и данные, взятые непосредственно из отчета или из документов, которые они цитировали . (Если вам интересно, при расчете мне предстояло найти вероятность развития заболевания, решив систему из трех взаимосвязанных уравнений для трех неизвестных условных вероятностей при помощи нелинейной программы поиска решений – как раз в таких задачках я люблю покопаться в процессе своей повседневной работы). Я обнаружил небольшие, но потенциально очень значимые расхождения между моими результатами и результатами 23andMe. Мои расчеты подсказывали, что к выкладкам 23andMe стоит отнестись с некоторым скептицизмом.
Наткнувшись на исследование 2014 года, в котором сравнивались методы расчета рисков, применявшиеся в трех ведущих персональных геномных компаниях, включая 23andMe , я укрепился в своих сомнениях относительно точности их результатов. Авторы обнаружили, что разные подходы к оценке общепопуляционного риска, частот генотипов и разные формулы, используемые при расчетах, вкупе способствовали значительному расхождению итоговых значений прогнозируемых рисков у различных компаний. Когда прогнозируемые риски использовались для распределения людей в группы повышенного, пониженного или стандартного риска, расхождения становились еще более очевидными. Исследование показало, что по крайней мере две из трех компаний относили 65 % всех лиц, протестированных на рак простаты, к противоположным категориям риска (повышенной или пониженной). Почти в двух третях случаев одна компания могла сообщить человеку, что он здоров, в то время как другая компания информировала бы его, что у него повышенный риск развития рака простаты.
Оставляя в стороне возможность ошибки самих генетических тестов, я получил ответ на свой третий вопрос: несовершенство математического подхода к оценке риска, представляемой в индивидуальных отчетах о личном геноме, заставляет воспринимать эти отчеты с некоторым скепсисом.
Назад: Глава 2 Чувствительность, специфичность[48] и альтернативные варианты: почему нужна математика в медицине
Дальше: Момент истины