3. Очень немногим пациентам лекарства идут на пользу
Я уверен, что это заявление удивит многих пациентов, которые пьют лекарства каждый день, и поэтому объясню более подробно на примере лечения депрессии.
Если мы лечим пациентов с депрессией антидепрессантом в течение 6 недель, то примерно у 60% из них будут заметные улучшения1. Кажется, что это хороший эффект. Однако если мы слепым образом лечим пациентов с помощью плацебо, которое выглядит точно так же, как таблетки, у 50% из них будут наблюдаться улучшения. Большинство врачей интерпретируют этот результат как эффект плацебо, но интерпретировать его таким образом невозможно. Если мы вовсе не будем лечить пациентов, а просто увидимся с ними через 6 недель, многим из них также станет лучше. Мы называем это спонтанной ремиссией заболевания, или его естественным течением.
Важно быть в курсе этих вопросов. В моем центре мы занимаемся исследованиями антидепрессантов, и я часто объясняю СМИ, что большинство пациентов не получают от них никакой пользы. Ведущие психиатры оспаривают это, заявляя, что хотя эффект скромный, пациенты получают пользу от того, что они ошибочно называют «эффектом плацебо», который, по их словам, составляет около 70% (как видим, результаты преувеличены).
Есть три основные причины, почему пациент может чувствовать себя лучше после лекарств: эффект от лекарства, эффект плацебо и естественное течение заболевания. Если мы хотим изучить влияние плацебо, нам нужно будет найти испытания, в которых некоторые из пациентов по случайной выборке получат плацебо, а другие – не получат вообще никакое лечение.
Один из моих коллег, Асбьерн Хробьяртссон, в 2001 году нашел 130 таких испытаний, большинство из которых включали третью группу пациентов, получавших некое лекарство, часто похожее по виду на плацебо. Вопреки распространенному убеждению, что плацебо оказывает большой эффект, мы обнаружили – к нашему удивлению, – что плацебо не имеет большого влияния на боль, но нельзя было также исключать, что результат был вызван смещением, а не плацебо2.
Смещение, о котором мы упоминали, происходит потому, что невозможно скрыть от пациентов, что они не получают никакого лечения (так называемое ослепление). Пациенты, разочарованные этим фактом, имеют склонность сообщать о меньшем улучшении, чем есть на самом деле, например в отношении их депрессии или боли. Наоборот, пациенты из группы плацебо могут преувеличивать улучшения, особенно в испытаниях, имеющих три группы сравнения, когда они не знают, что получают, но надеются, что это активное лечение, а не плацебо.
Мы обновили результаты, включив в них последние испытания, и теперь в Кокрейновском обзоре – 234 испытания, исследующих 60 различных клинических состояний3. Мы подтвердили первоначальные результаты, что плацебо-вмешательства в целом не оказывают важного клинического эффекта и что трудно отличить истинный эффект плацебо от предвзятого сообщения о нем.
Вы, наверное, удивлены, почему я так много говорю об эффектах плацебо, а не лекарств. Это потому, что эффекты лекарств определяют по сравнению с плацебо в плацебо-контролируемых исследованиях. И если ослепление не безупречно, мы ожидаем, что сообщенный эффект от лекарства преувеличен, особенно когда результаты субъективны, как в случае с общим настроением или болью.
Как часто ослепление не работает? Довольно часто, по двум причинам. Во-первых, в испытаниях, называемых двойными слепыми, возможно, не было проведено эффективного ослепления в самом начале. Например, исследователи, которые провели шесть двойных слепых исследований антидепрессантов или транквилизаторов, отметили, что во всех случаях плацебо отличалось от активного препарата по физическим характеристикам, таким как текстура, цвет и толщина4. Во-вторых, даже когда препарат и плацебо неотличимы по своим физическим характеристикам, обычно трудно поддерживать ослепление во время испытания, потому что лекарства имеют побочные эффекты, например, антидепрессанты вызывают сухость во рту.
Из-за всех этих проблем истинная разница в улучшении состояния в 60% и 50% при использовании, соответственно, антидепрессантов и плацебо, вероятно, значительно меньше, чем 10%. Но давайте сначала предположим, интереса ради, что эти показатели верны, и разработаем испытание со следующими показателями улучшения (смотрите таблицу 3.1, стр. 76). Мы случайно разделили 400 пациентов на две группы, при этом у 121 из 200 пациентов (60,5%) было улучшение на активном лекарстве, а у 100 из 200 пациентов (50,0%) – на плацебо. Следует ли считать, что лекарство лучше, чем плацебо, или могла ли разница, которую мы наблюдали, возникнуть случайно? Мы можем проанализировать это, задав следующий вопрос: насколько частой будет разница в 21 пациента или более, если повторить это испытание много раз? Правда состоит в том, что лекарство не имеет никакого эффекта.
Таблица 3.1. Результаты рандомизированного исследования, сравнивавшего антидепрессант с плацебо
Это тот случай, когда статистика очень полезна. Статистический тест вычисляет значение P, которое показывает вероятность того, что мы будем наблюдать разницу в 21 пациента или больше, если лекарство не работает. В этом случае Р = 0,04. Медицинская литература полна значениями P, и традиция такова, что если значение P меньше 0,05, то мы говорим, что разница статистически достоверна, и верим, что разница, которую мы нашли, реальна. Р=0,04 означает, что мы наблюдали бы разницу в 21 пациента и более четыре раза из ста, если лекарство не работает, и мы повторили наше испытание много раз.
Если бы на два пациента меньшего чувствовали себя лучше на активном лекарстве, то есть 119, а не 121, то разница все равно была бы почти такой же, но при этом она не была бы статистически достоверной (Р = 0,07).
Этот пример иллюстрирует то, что весьма часто «доказательство» эффективности лечения зависит всего от нескольких пациентов. Это верно даже для случая, когда, как в этом примере, в исследование были рандомизированы 400 пациентов, а это довольно крупное исследование депрессии.
Как правило, не требуется предпринимать больших усилий, чтобы превратить недостоверный результат в достоверный. Иногда исследователи или компании переосмысливают или повторно анализируют данные, после того как получают значение P выше 0,05, до тех пор, пока не придут к значению Р ниже 0,05. Это они делают путем, например, вранья о том, что еще у нескольких пациентов на активном лекарстве было улучшение или еще у нескольких пациентов на плацебо не было улучшения или за счет исключения некоторых рандомизированных пациентов из анализа5.
Это нечестный подход к науке, но, как мы увидим в главах 4 и 8, нарушения в научной практике очень широко распространены.
Помимо такого мошенничества, недостаточное «ослепление» в исследованиях может также подвести нас к представлению, что неэффективные препараты эффективны. «Ослепление» важно не только когда пациенты оценивают свое состояние, но и когда их оценивают врачи. Депрессия имеет сложную шкалу, включающую множество субъективных элементов, и совершенно очевидно, что знание того, какое лечение получает пациент, может положительно влиять на оценку врачом эффективности этого лечения.
Это было убедительно продемонстрировано Хробьяртссоном и коллегами в 2012 году с помощью серии клинических испытаний при различных заболеваниях, в которых участвовали как «ослепленные», так и «не ослепленные» подопытные. Обзор 21 такого испытания, в которых в основном использовались субъективные результаты, показал, что эффект вмешательства был преувеличен в среднем на 36% при оценке его «не ослепленными» исследователями по сравнению с «ослепленными»6. Это очень большое смещение, учитывая, что заявленный эффект большинства лечебных вмешательств гораздо ниже, чем 36%.
Таким образом, двойное слепое исследование, в котором «ослепление» недостаточно эффективно, может преувеличивать эффект весьма существенно. Можем проверить это на нашем примере с антидепрессантами, допуская для простоты, что «ослепление» нарушается у всех пациентов. Для расчета соотношения шансов мы переставим числа так, чтобы низкое значение символизировало полезный положительный эффект, что вполне соответствует принятой договоренности (смотрите таблицу 4.2). Соотношение шансов для достоверного эффекта составляет (79´100)/(121´100) = 0,65. Так как мы ожидаем, что этот эффект преувеличен на 36%, можно оценить, каков истинный эффект. Смещение в 36% означает, что отношение между смещенным и истинным результатом составляет 0,64. Таким образом, истинный результат рассчитываем так: 0,65/0,64, или 1,02. Так как соотношение шансов теперь около 1, это означает, что антидепрессант не сработал.
Таблица 3.2. Те же результаты, что в таблице 3.1, но переставленные
Этот пример был слишком упрощенным, поскольку «ослепление» редко нарушается для всех пациентов, но упражнение тем не менее отрезвляет. Даже если «ослепление» нарушается только по отношению к нескольким пациентам, этого может быть достаточно, чтобы сделать недостоверный результат достоверным. Хробьяртссон c коллегами отметили в своем обзоре, что 36-процентное преувеличение эффекта лечения, связанное с отсутствием «ослепления» оценщиков, было вызвано неправильным распределением результатов по медиане у 3% оцененных пациентов на каждое клиническое испытание (что соответствует 12 пациентам из общего числа, в данном случае – 400).
Требуется очень небольшое нарушение принципа «ослепления», чтобы превратить совершенно неэффективный препарат в якобы эффективный.
Невозможно переоценить важность этого открытия. Большинство лекарств имеют выраженные побочные эффекты, поэтому не может быть никаких сомнений, что «ослепление» нарушается у многих пациентов в большинстве плацебо-контролируемых исследований. Когда мы используем лекарства, чтобы спасти людей от смерти, нарушения «ослепления» не имеют значения, так как мы можем с уверенностью сказать, жив пациент или нет. Однако такие ситуации редки. В большинстве случаев лекарства используются для снижения симптомов или уменьшения риска осложнений при болезни, и результаты очень часто субъективны, например уровень депрессии или шизофрении, тревоги, слабоумия, боли, качества жизни, функциональных способностей (часто называемых повседневной активностью), тошноты, бессонницы, кашля и одышки. Даже решение о том, перенес ли пациент сердечный приступ, может быть довольно субъективным (смотрите главу 4, стр. 86).
Рандомизированное клиническое испытание – наиболее надежный метод оценки эффектов лечения. Но мы слишком легко верим результатам этих экспериментов, если клиническое испытание было «слепым» и основной результат сопровождается достоверной величиной значения P.
Тревожнее всего, что все лекарства приносят вред, при этом многие из них вообще неэффективны. Поэтому мы добросовестно вредим огромному числу пациентов, поскольку рандомизированные исследования не всегда дают понять, какие из лекарств не работают.
На этом фоне легко понять, почему компании, которые показали, что их лекарство действует на определенную болезнь, в дальнейшем могут тестировать его при совершенно не связанных с этим заболеваниях и находить, что оно также работает и при них. Нарушение «ослепления» является основной причиной, почему гораздо легче изобретать новые заболевания, чем новые лекарства7, 8. Легко показать определенный эффект на простой или чуть более сложной шкале, которая, в довершение всего, может иметь малое клиническое значение, а дальше пусть маркетинговая машина делает остальное.
Однажды один из членов моего гольф-клуба, старше меня по возрасту, признался, что не уверен в эффективности своих таблеток от деменции. Он хотел знать, прекратить ли их принимать, и просил моего совета. Я редко даю советы пациентам, не являясь их врачом и специалистом в конкретной области и не имея представления об их анамнезе. Однако он также сказал, что его беспокоят побочные эффекты лекарства и высокая цена. Учитывая, что эффект лекарств от деменции совсем не впечатляет, а клинические испытания, спонсированные фармой, имели весьма субъективные результаты, а также помня о многих других смещениях в подобных испытаниях, я сделал исключение из правила. Сказал, что не советую больше принимать это лекарство. Правда, он был довольно дементным и вряд ли последовал моему совету, скорее всего, он скоро забыл об этом разговоре.
Невозможность стопроцентного «ослепления» должна сделать врачей гораздо более осторожными; они должны внимательно наблюдать, думать дважды, прежде чем назначать лекарства, четко прописывать в дневниках, какой именно результат хотят получить и когда, и, конечно, не забывать отменить препарат, если эффект не достигнут.
Осознать, что совсем немногим лекарства приносят пользу, поможет ЧБНЛ (число больных, которых необходимо лечить, NNT – number needed to treat). Это величина, обратная разности рисков. Так, если мы считаем, что 60 процентам пациентов, получающих антидепрессант, и 50 процентам, получающим плацебо, станет лучше, – ЧБНЛ составит 1/(60% – 50%) = 10.
Это означает, что только одному из 10 пациентов, которых мы лечим антидепрессантом, он принесет пользу. Если принять, что любой возможный эффект плацебо настолько мал, что мы можем им пренебречь3, то более того, это означает, что для остальных девяти пациентов не имело никакого значения, получили они препарат или нет, кроме его побочных эффектов и стоимости. Даже если мы не примем результаты, которые показали, что плацебо в целом довольно неэффективны, все равно доказано, что очень немногие пациенты получают пользу от антидепрессанта. На самом деле все гораздо хуже, не только из-за отсутствия эффективного «ослепления», но и потому, что разница в 10% взята из клинических испытаний, проводимых промышленностью, которые были тщательно просчитаны и тестировали только тех пациентов, которые с наибольшей вероятностью реагировали на лекарства (смотрите главу 16, стр. 285)9. В реальной практике ЧБНЛ намного выше, чем 10.
Если же идет речь о профилактике, то ЧБНЛ становится значительно больше. Статины – очень популярный тип лекарств, так как они снижают уровень холестерина. Клиническое испытание 1994 года показало, что из 30 пациентов с очень высоким риском коронарного приступа, получавших симвастатин в течение 5 лет, помогал он только одному10. При этом в 1990-х, когда он был еще патентованным препаратом, симвастатин очень дорого стоил. Я проанализировал таблицу 1 в статье, которая описывала пациентов, включенных в исследование. Хотя 80% испытуемых уже перенесли сердечный приступ, только одна треть получала аспирин, хотя доказано, что аспирин буквально спасает жизни. Более того, четверть из них были курильщиками! Выходит, мы могли бы спасти много жизней очень дешево, напоминая врачам, что пациенты должны получать аспирин, а также что их нужно уговорить бросить курить. Доказано, что даже краткие беседы с врачом влияют на курильщиков11.
Статины до сих пор активно рекламируют здоровому населению, как промышленность, так и некоторые энтузиасты-врачи, но польза от них в качестве профилактики сердечно-сосудистых заболеваний крайне мала.
Когда данные восьми клинических испытаний были объединены в Кокрейновском обзоре, исследователи обнаружили, что статины уменьшали общую смертность на 16%12. Звучит эффектно, и это хороший пример того, как промышленность рекламирует хорошие результаты. Однако это ровным счетом ничего не говорит о пользе профилактики, так как мы не знаем уровень смертности среди тех, кто не принимал статины. Авторы сообщили, что 2,8% участников клинических испытаний умерли (обратите внимание, что я не называю здоровых людей пациентами, так как они ими не являются). Чего в этом обзоре не хватало, так это ЧБНЛ. Снижение на 16% от частоты 2,8% дает частоту 2,35%, и ЧБНЛ составляет 1/(2,8%–2,35%) = 222.
Чтобы понять, что означает этот результат, нужно тщательно прочитать весь обзор. Получается, что средний возраст участников составил 57 лет и, для начала, они были не совсем здоровы. Некоторые исследования включали только пациентов с диабетом, гипертонией или повышенным уровнем липидов, а некоторые в дополнение к этому – пациентов с сердечно-сосудистыми заболеваниями. Более того, доля курильщиков колебалась от 10% до 44% в клинических испытаниях, которые приводили такие данные. Также необходимо знать, как долго принимать статины, чтобы они принесли пользу, поэтому большинство исследований длились несколько лет. Наконец, то, на что я всегда обращаю внимание: финансировались ли испытания фармацевтической промышленностью или шли за счет государственных средств? Ведь многие испытания фармы так никогда и не публикуются, если результаты неутешительны. Только одно из испытаний, представивших данные о смертности от всех причин, финансировалось государством. Мне представляется, и авторы обзора подтвердили это в обсуждениях, что снижение общей смертности на 16% сильно преувеличено. Например, проводилось большое финансированное государством клиническое испытание ALLHAT-LLT, которое не было включено в обзор, потому что более 10% пациентов имели сердечно-сосудистые заболевания. Это исследование не обнаружило никакого снижения смертности, а отношение риска составляло 0,99 (95%, доверительный интервал от 0,89 до 1,11, что означает, что мы на 95% уверены, что истинный эффект лежит где-то между 11-процентным снижением общей смертности и ее 11-процентным увеличением).
Авторы призвали с осторожностью примененять статины для первичной профилактики, аргументируя это тем, что некоторые клинические испытания были остановлены слишком рано, когда показанная польза была большой, и что во многих случаях налицо было выборочное представление результатов. Они также отметили, что многие испытания не сообщили о каких-либо побочных эффектах, хотя их не могло не быть. К сожалению, резюме этого обзора, которое и читают большинство людей, дает другое впечатление. В нем отмечено, что произошло снижение общей смертности и при этом не было четких доказательств какого-либо вреда, причиненного статинами, воздействия на качество жизни или повышения мышечной боли.
Эта информация ненадежна. Статины вызвают боль в мышцах и слабость, и я вновь приведу пример из гольф-клуба. Один из моих коллег, ученый-физик, признался мне, что ему нужно принимать статин всю оставшуюся жизнь, потому что у него был сердечный приступ. Это его серьезно беспокоило, поскольку боль в мышцах затрудняла ходьбу на расстояние в 18 лунок. Он также отметил, что все его знакомые, принимавшие статины, также страдали от мышечной боли или слабости, или от того и другого. Он почитал медицинскую литературу и недоумевал, почему всего несколько испытуемых сообщили о боли в мышцах. Тогда я рассказал, что занимаюсь медицинскими исследованиями, и он спросил, в чем причина такого огромного несоответствия между тем, что пациенты испытывали, и тем, что говорила литература. Я рассказал, как масштабно фармацевтическая промышленность манипулирует испытаниями, когда речь идет о вреде препаратов. Он совсем не удивился.
На самом деле опыт моего знакомого был более показательным, чем рандомизированные испытания. В 2012 году я нашел статью о влиянии статинов на энергию и усталость от физической нагрузки13. В ней говорилось, что, хотя многие обсервационные исследования ссылались на слабость и усталость от физической нагрузки при статинах, ни одно рандомизированное исследование не подняло этот вопрос. В статье сообщалось о результатах испытания, которое выявило, что 20% мужчин и 40% женщин испытывали ухудшение состояния, выражавшееся либо в слабости, либо в усталости при физической нагрузке. Я никогда не слышал, чтобы кто-либо из моих коллег-энтузиастов, выступавших за то, что большинство из нас, независимо от уровня холестерина, должны принимать статины всю оставшуюся жизнь, упоминал об этом. Все их аргументы заключаются в том, что статины работают и не имеют побочных эффектов.
Относительно легко решить фундаментальную проблему с нарушением «ослепления», используя так называемые «активные плацебо». Термин в некотором роде вводит в заблуждение, так как идея не в том, чтобы плацебо применялось в качестве активной субстанции, помогая против болезни, а в том, что оно даст аналогичные с лекарством побочные эффекты. В случае антидепрессантов испытания были проведены c плацебо, содержащим атропин, который вызывает сухость во рту, как и препарат. Как и ожидалось, эти испытания показали значительно меньшее различие между препаратом и плацебо, чем испытания, в которых не использовали «активное плацебо»14.
Смещение, связанное с недостаточным «ослеплением», усугубляется тем, что врачи и пациенты не всегда делают то, что от них ожидается. Психиатрам обычно платят по количеству пациентов, и они ленятся проходить по всем пунктам шкалы депрессии Гамильтона с каждым из них, так как на это уходит много времени. Поэтому они иногда ориентируются на общее впечатление, даже не спрашивая пациентов, а то и постфактум – по памяти9.
Некоторые пациенты участвуют в клинических испытаниях по депрессии, не будучи в депрессии, просто ради денег, в чем один здоровый испытуемый признался врачу15: «Я не в депрессии… испытания рекламируют и платят за них до 100 фунтов стерлингов в день. За 20 дней исследования я могу получить 2000 фунтов стерлингов. И так делаю не только я».
Испытания с атропином проводили давно, и теперь «активные плацебо» больше не используют. Причина этого ясна. Подавляющее большинство плацебо-контролируемых испытаний проводятся фармацевтическими компаниями, а им невыгодно доказывать, что лекарства не действуют. Я считаю, мы должны требовать использования активных плацебо и просто отказывать в одобрении лекарствам на основе испытаний с обычными плацебо, по крайней мере в тех областях, в которых ожидаемый эффект скромен и субъективен.
Порой компании идут еще дальше. Они отказываются предоставлять неактивное плацебо независимым исследователям16. Когда компания Novo Nordisk отказалась предоставить плацебо исследователю, у него не было выбора, кроме как провести исследование без плацебо. Когда результаты были опубликованы, их раскритиковали именно из-за отсутствия плацебо. Была и другая ситуация, когда компания Novo Nordisk потребовала, чтобы авторы отказались от идеи изучить, насколько лираглутид (victoza, виктоза – лекарство для лечения диабета) помогает снизить избыточный вес. Также компания требовала подкорректировать ту часть исследования, которая касалась влияния препарата на псориаз. Это, возможно, сыграло свою роль, когда Novo Nordisk ждала одобрения виктозы в качестве средства против избыточного веса. Если бы независимые исследователи обнаружили, что лекарство приносит больший вред, чем заявляла компания, репутация Novo Nordisk серьезно бы пострадала.
Фармацевтические компании всегда делают вид, что готовы к сотрудничеству, однако запрашивают за плацебо огромные суммы, хотя стоимость его производства близка к нулю. Компании знают, что академические исследователи не имеют большой финансовой поддержки государства. В одном таком случае крупнейшая фармацевтическая компания в мире оценила плацебо в 40 000 евро, и этого было достаточно, чтобы заблокировать во всех отношениях важное испытание.
Пожалуйста, задумайтесь над этим: врачи и пациенты помогают компаниям проводить испытаниях, а компании врачам и пациентам только препятствуют. Эта асимметрия аморальна, так же как аморально было со стороны империй эксплуатировать колонии. Мы должны ввести закон, чтобы компании предоставляли плацебо для независимых исследований по низкой цене, то есть по производственной стоимости, в качестве условия для пребывания препарата на рынке.
Фармацевтические компании могут прерывать важные исследования, которые угрожают их доходам, и другими способами. Ципрофлоксацин – антибиотик, который стимулирует сопротивляемость микроорганизмов. В 2000 году, когда ученый-бактериолог попросил у компании Bayer субстанцию чистого ципрофлоксацина для своих исследований по устойчивости к антибиотикам, ему предложили подписать документ о том, что он не будет публиковать результаты без письменного разрешения компании. Он сообщил в Европейскую комиссию, но ему ответили, что единственное, что они могут сделать, – это напомнить компании о «потенциальном общественном интересе к такому типу исследований»17. Опять-таки с этим нельзя мириться, необходимо сделать обязательным для компаний предоставление чистой субстанции лекарств для независимых исследований по себестоимости. Я слышал много историй о беспочвенных отказах предоставить или продать чистый образец субстанции лекарства.