Слепой, ведущий двойного слепого

Самая простая разновидность клинических исследований – сравнение группы больных, получающих испытываемое лечение, с группой (контрольной) таких же больных, которых не лечат вовсе. В идеале больных в каждой группе должно быть много, а распределять их по группам следует случайным образом. Если затем выяснится, что в той группе, которую лечили, признаков выздоровления в целом больше, чем в контрольной, значит, новый метод лечения и правда действенный. Но так ли это?

Мы должны учитывать вероятность того, что метод лечения показал себя действенным, но лишь из-за эффекта плацебо. Другими словами, больные, которых активно лечили, могли выздороветь только потому, что их подвергали каким-то медицинским манипуляциям и тем самым стимулировали благоприятный эффект плацебо. Следовательно, простая постановка испытаний может приводить к ошибочным выводам, поскольку при таких условиях даже бесполезное лечение иногда дает положительные результаты. Возникает вопрос: как организовать клинические исследования, чтобы они учитывали всю эту путаницу, вносимую эффектом плацебо?

Решение отыскалось во Франции XVIII века, где Франц Месмер делал свои громкие заявления. Сегодня имя Месмера ассоциируется с гипнотизмом (или месмеризмом), однако при жизни он славился в основном пропагандированием целительных свойств магнетизма. Месмер утверждал, будто способен лечить многие болезни, манипулируя так называемым животным магнетизмом больных, для чего, например, давал им намагниченную воду. Сеансы лечения бывали очень зрелищными, поскольку иногда якобы намагниченная вода вызывала судороги или обмороки, считавшиеся признаком предполагаемого процесса выздоровления. Тем не менее критики Месмера сомневались, что воду можно намагнитить, и не верили, что магнетизм вообще влияет на здоровье человека. Они подозревали, что реакция пациентов Месмера основана исключительно на вере его заявлениям. Выражаясь современным языком, можно сказать, что критики предполагали, будто метод Месмера опирается на эффект плацебо.

В 1785 году Людовик XVI созвал королевскую комиссию для проверки месмеровских заявлений. Эта комиссия, в состав которой входил Бенджамин Франклин, провела серию экспериментов. Один бокал месмерической воды размещали посреди четырех бокалов обычной – выглядели все пять совершенно одинаково. Затем испытуемые-добровольцы, не зная, где что налито, наугад выбирали один бокал и выпивали его содержимое. Одна испытуемая пригубила питье и тут же упала в обморок, но затем оказалось, что в ее бокале была обычная вода. Очевидно, женщина, лишившаяся чувств, думала, что пьет намагниченную воду, знала, что при этом бывает, – и ее организм отреагировал соответствующе.

По завершении экспериментов члены королевской комиссии убедились, что добровольцы реагируют как на намагниченную, так и на обычную воду абсолютно одинаково. Поэтому они заключили, что разницы между намагниченной водой и обычной нет, а следовательно, сам термин “намагниченная вода” ничего не значит. Более того, комиссия постановила, что лечебное воздействие якобы намагниченной воды вызывалось исключительно ожиданиями больных (сегодня мы бы сказали, что все дело в эффекте плацебо). Одним словом, Месмера обвинили в шарлатанстве.

Однако комиссия не стала раздумывать о широкой распространенности эффекта плацебо, вот почему официальное открытие роли, которую играет этот эффект в медицинской практике, приписывают Хейгарту, исследовавшему вытягиватели четырнадцать лет спустя. Впрочем, королевская комиссия все же внесла важнейший вклад в историю медицины, поскольку провела клинические испытания нового типа. Главное новаторство заключалось в том, что в эксперименте испытуемые не знали, какое лечение получают – подлинное или мнимое, поскольку бокалы с намагниченной и простой водой на вид ничем не отличались. То есть испытуемые были словно слепые.

Понятие так называемого ослепления можно применить к исследованиям в целом, которые в таком случае будут называться слепыми клиническими испытаниями. Например, при проверке новых таблеток их дают всем больным в терапевтической группе (где проводится настоящее лечение), а в контрольной группе все получают точно такие же на вид таблетки, но без всякого действующего вещества. Важно, что сами испытуемые не знают, в какой они группе – терапевтической или контрольной, поэтому остаются слепыми в том смысле, что не подозревают, лечат их или нет. Весьма вероятно, что признаки улучшения появятся в обеих группах благодаря эффекту плацебо, ведь все участники могут думать, что получают реальное лекарство. Однако если испытываемые таблетки и в самом деле лечат, а не только оказывают эффект плацебо, в терапевтической группе улучшение состояния пациентов должно быть заметнее, чем в контрольной.

При слепом исследовании важно, чтобы испытуемых из контрольной группы и из терапевтической лечили внешне совершенно одинаково, поскольку любые различия могут повлиять на выздоровление больных и тем самым исказить результаты. Таким образом, пациенты в обеих группах должны не только получать идентичные на вид таблетки, но и проходить лечение в одном и том же месте, им должно оказываться одинаковое внимание и так далее. Все эти факторы вносят свой вклад в так называемые неспецифические эффекты. Этот собирательный термин охватывает реакции, которые объясняются контекстом процесса лечения, но не связаны напрямую с самим лечением, – в том числе и эффект плацебо.

Даже обследовать пациентов из обеих групп следует в точности одинаково, поскольку оказалось, что сам акт пристального наблюдения может привести к общему улучшению здоровья или повышению работоспособности человека. Это назвали хоторнским эффектом – термин вошел в употребление после того, как ученые посетили хоторнский завод в Иллинойсе, принадлежавший “Западной электрической компании”. Исследователи хотели выяснить, как обстановка на рабочих местах влияет на производительность завода, поэтому в период между 1927 и 1935 годами то усиливали, то убавляли искусственное освещение, то повышали, то понижали температуру в цехах и так далее. К своему удивлению, они обнаружили, что производительность труда повышается при любых изменениях. Это объяснялось тем, что, во-первых, рабочие ожидали, что перемены должны приводить к улучшениям, а во-вторых, знали, что за ними наблюдают специалисты с блокнотами. Избавиться от хоторнского эффекта в ходе любых медицинских исследований крайне трудно, но, по крайней мере, нужно добиваться того, чтобы он был одинаковым в контрольной и терапевтической группах, – тогда их можно будет честно сравнивать.

Создание тождественных условий для контрольной и терапевтической групп “ослепляет” пациентов: они не догадываются, подвергаются ли настоящему лечению или получают плацебо. Однако важно “ослепить” и всех тех, кто непосредственно выдает пилюли. Другими словами, даже врачи не должны знать, что дают пациентам – препарат-пустышку или таблетку с действующим веществом. Ведь манера поведения, энтузиазм и тон врача – все может измениться, если он будет знать, что дает просто плацебо, а значит, возможно, неосознанно подскажет это больному. Подобные утечки информации, разумеется, нарушают “слепоту” пациентов и снижают надежность клинических испытаний в целом. В результате больные в контрольной группе заподозрят, что не получают настоящего лечения, и у них не возникнет реакции на плацебо. У больных же из терапевтической группы подобных сомнений не будет, и у них, напротив, проявится эффект плацебо. Следовательно, испытания окажутся недобросовестными.

Если же ни врач, ни пациент не догадываются, с чем имеют дело – с плацебо или с потенциально действенным лекарством, то их ожидания не повлияют на результаты. Такие исследования, действительно честные и беспристрастные, называют двойными слепыми испытаниями. Теперь мы можем перечислить главные критерии, которым в идеале должны отвечать правильно организованные испытания, включая некоторые требования, сформулированные в первой главе:

1. Сравниваются контрольная группа и терапевтическая – получающая испытываемое лечение.

2. В каждой группе достаточно много больных.

3. Пациенты распределяются по группам бессистемно, случайным образом.

4. Контрольная группа получает плацебо.

5. Больные из обеих групп находятся в абсолютно одинаковых условиях.

6. Пациенты “слепы”, то есть не знают, в какую именно группу входят.

7. Врачи “слепы”, то есть не знают, действительно ли лечат того или иного пациента или дают ему плацебо.

Исследования, которые соответствуют всем этим требованиям, называются рандомизированными плацебо-контролируемыми двойными слепыми клиническими испытаниями. Они считаются наивысшим возможным стандартом медицинских исследований. Сегодня различные национальные институты, отвечающие за внедрение новых методов лечения, как правило, принимают решения на основании результатов подобных испытаний.

Иногда, однако, необходимо проводить исследования, очень близкие по формату к золотому стандарту, но без плацебо. Например, представьте, что ученые хотят испытать новое средство от какой-нибудь болезни, когда от нее уже существует до некоторой степени эффективное лекарство. Согласно третьему пункту приведенного выше списка, контрольная группа должна получать только плацебо, но это было бы неэтично, поскольку пациенты лишатся хоть сколько-то действенного лекарства. В такой ситуации контрольная группа должна получать существующее средство, а терапевтическая – новое. Испытания не будут плацебо-контролируемыми, но контроль все же будет присутствовать – его функцию выполняет уже имеющееся лекарство. В подобных исследованиях, как и в других, необходимо строго соблюдать все остальные требования, в том числе рандомизацию и двойную “слепоту”.

При проведении медицинских изысканий клинические испытания такого рода поистине бесценны. Результаты иных видов испытаний и данные из других источников могут рассматриваться, но, когда речь заходит о главном вопросе – эффективен ли тот или иной метод лечения при данном конкретном заболевании, их обычно считают гораздо менее убедительными.

Возвращаясь к акупунктуре, мы теперь можем пересмотреть условия проведения клинических испытаний 1970-х и 1980-х годов и понять, насколько правильно они были организованы, были ли в полной мере слепыми и возможно ли, что вся заявленная польза акупунктуры объясняется лишь эффектом плацебо.

Прекрасный пример типичного для тех лет испытания акупунктуры – исследование, которое в 1982 году провел доктор Ричард Коан со своими сотрудниками, желая выяснить, помогает ли в действительности акупунктура при болях в шее. Терапевтическая группа состояла из пятнадцати больных, которые проходили сеансы акупунктуры, а контрольная – еще из пятнадцати человек, остававшихся в листе ожидания. Поклонникам акупунктуры результаты показались бы крайне убедительными: в группе, которую лечили акупунктурой, 80 % больных заявили, что им стало лучше, а в контрольной группе таких оказалось лишь 13 %. Причем пациентам из терапевтической группы стало настолько легче, что они вдвое уменьшили дозу принимаемых болеутоляющих, тогда как пациенты из контрольной группы – всего на одну десятую часть.

Сравнение терапевтической группы с контрольной показывает, что улучшение, обусловленное акупунктурой, так сильно, что естественным выздоровлением его объяснить сложно. Но какие же факторы его вызвали – психологические, физиологические или, может быть, их сочетание? Удалось ли иглоукалыванию запустить подлинный механизм исцеления или же оно лишь вызвало эффект плацебо? Последний вариант следует рассмотреть очень серьезно, поскольку акупунктура обладает некоторыми чертами, делающими ее идеальным методом плацебо: иглы, слабая боль, небольшая инвазивность, экзотичность, фантастическая реклама в прессе и корни, уходящие в древнюю мудрость.

Так вот, клиническое исследование доктора Коана, как и многие другие испытания, проведенные в то время, отличались одной неприятной особенностью: не позволяли определить, приносит ли акупунктура реальную пользу или дело лишь в эффекте плацебо. Чтобы выяснить, действительно ли иглоукалывание полезно, следовало бы давать контрольной группе плацебо – нечто, воспринимаемое в точности как акупунктура, но не оказывающее ни малейшего воздействия. К сожалению, найти такое плацебо оказалось чрезвычайно трудно: как придумать метод, который походил бы на акупунктуру, но при этом не был бы ею? Как “ослепить” пациентов, чтобы они не знали, подвергаются ли иглоукалыванию?

Контрольные плацебо-группы легко организовать в контексте традиционных испытаний лекарств, поскольку терапевтическая группа может получать, скажем, таблетки с действующим веществом, а контрольная – точно такие же на вид таблетки, но без действующего вещества. Либо, например, в терапевтической группе делают инъекции лекарства, а в контрольной – вкалывают физиологический раствор. К сожалению, тривиального плацебо, которое заменило бы акупунктуру, не существует.

Тем не менее постепенно исследователи осознали, что существует два способа убедить пациентов, будто они лечатся акупунктурой, но на самом деле проводить фальшивые процедуры.

Во-первых, можно вводить иглы на минимальную глубину, а не на сантиметр и больше, как это обычно делают. Цель такого поверхностного иглоукалывания состоит в том, чтобы пациенты, которым никогда раньше не проводили сеансы акупунктуры, решили, что так и полагается. Однако, согласно китайской теории, такая процедура с медицинской точки зрения бесполезна, поскольку иглы не дойдут до нужного меридиана. Поэтому ученые предложили провести исследования, в которых в контрольной группе делали бы поверхностные уколы, а в терапевтической проводили бы сеансы настоящего иглоукалывания. Тогда у больных в обеих группах улучшение благодаря эффекту плацебо будет одинаковым, однако если настоящая акупунктура и в самом деле оказывает физиологическое воздействие на организм, то в терапевтической группе улучшение будет гораздо значительнее по сравнению с контрольной.

Во-вторых, можно имитировать сеанс иглоукалывания, вводя иглы не в акупунктурные точки, а в любые другие, которые, согласно традиции, не имеют отношения к здоровью пациента. Если ставить иглы в неправильные точки, то пациентам-новичкам это покажется настоящей акупунктурой, однако по китайской теории такие уколы не принесут никакой пользы, поскольку не попадут в нужные меридианы. Следовательно, некоторые испытания планировались так, чтобы в контрольной группе ставили иглы в абстрактные точки, а в терапевтической проводили сеансы настоящей акупунктуры. Тогда у больных из обеих групп возникнет улучшение благодаря эффекту плацебо, однако любая дополнительная польза, зарегистрированная в терапевтической группе, будет объясняться воздействием акупунктуры.

Эти две разновидности плацебо-акупунктуры – поверхностные уколы и воздействие на неактивные точки – часто называют ложным иглоукалыванием. В 1990-х годах скептики настаивали на масштабной переоценке акупунктуры, требуя, чтобы на сей раз провели плацебо-контролируемые клинические испытания с применением фальшивого иглоукалывания. Многие иглотерапевты считали, что подобные исследования просто излишни, ведь они собственными глазами видели отличные результаты у своих больных. Они утверждали, что в пользу эффективности их метода уже и так достаточно свидетельств. Критики продолжали требовать проведения плацебо-контролируемых испытаний, а иглотерапевты упрекали их в том, что те хватаются за соломинку и просто предубеждены против нетрадиционной медицины. Тем не менее ученые-медики, которые верили авторитету плацебо-контролируемых исследований, не отступали. Они говорили, что акупунктура так и останется сомнительным методом, пока не докажет, на что способна, в ходе высококачественных клинических испытаний.

В конце концов те, кто требовал подвергнуть акупунктуру надлежащим испытаниям, добились своего: в 1990-х годах благодаря крупным финансовым вливаниям стало возможно провести десятки плацебо-контролируемых клинических испытаний как в Европе, так и в Америке. Каждое из них следовало проводить строго – только тогда можно было надеяться, что результаты прольют новый свет на то, кто прав, а кто заблуждается. Так что же такое акупунктура – чудодейственное средство, которое лечит все от дальтонизма до коклюша, или не более чем плацебо?