Глава 18
“Какие ваши доказательства?”
Клинические рекомендации
На что опираются в своей работе современные врачи? Теоретически в их распоряжении весь инструментарий доказательной медицины. Идеальный образ предполагает, что каждое решение основано на данных высококачественных клинических испытаний и метаанализов. Но так ли это в реальности?
Представьте себя российским врачом. Небольшой заработок вынуждает многих работать больше чем на одну ставку, в нескольких местах, брать дежурства по ночам и в выходные. При этом дома вас ждут дети с невыученными уроками и домашние дела. Более 70% врачей в России – женщины, и это значит, что изрядная часть работы по хозяйству, скорее всего, тоже лежит на вас. Есть ли у вас время и силы знакомиться с последними публикациями в медицинских журналах? Есть ли у вас доступ к этим публикациям и достаточен ли ваш английский язык для того, чтобы их читать и критически анализировать?
В 2004 году в США посчитали, сколько времени должен ежедневно тратить врач общей практики, чтобы быть в курсе всех последних исследований. На беглое ознакомление с 7287 статьями, опубликованными в 341 журнале, требуется 627,5 часов в месяц. Или, если вычесть выходные дни, 29 часов в сутки. Нужно добавить, что с 2004 года количество публикуемых статей выросло как минимум в два раза.
Эта оценка сделана на основе скорости чтения статей эпидемиологами, у которых есть соответствующие навыки и опыт. Большинство врачей, какими бы хорошими специалистами они ни были, не умеют интерпретировать и критически оценивать научные публикации – их этому не учат. Кроме того, большинство врачей не владеют английским языком и не имеют доступа к полным текстам статей, а доступных бесплатно абстрактов недостаточно для критического анализа. Не удивительно, что идеальный образ опирающегося только на научные данные врача имеет мало отношения к реальности.
На чем же тогда основаны клинические решения? Потраченные на учебу долгие годы не гарантируют применимости полученного знания – оно обновляется с огромной скоростью, и часть того, что рассказывают студентам в аудиториях, устаревает уже к моменту получения диплома. Другая часть неактуальна еще при передаче студенту: программа, учебные материалы и знания преподавателей не поспевают за новой информацией. Столь быстрое устаревание знания может влиять на результаты лечения. Исследование 2017 года показало, что смертность пациентов тем выше, чем старше лечащий врач. Одно из возможных объяснений – устаревание профессиональных знаний.
Решение проблемы – в непрерывном образовании, о котором мы говорили выше. Другой инструмент – клинические рекомендации или, как их еще называют, протоколы лечения. Это регулярно обновляемые документы, которые описывают актуальные подходы к диагностике и лечению конкретных болезней. Их создают специально собранные группы экспертов, которые оценивают и суммируют существующие данные и ранжируют методы лечения на основе убедительности доказательств в их пользу. Например, если рекомендация подтверждена крупными РКИ надлежащего качества или систематическими обзорами, ее относят к классу А, а если только небольшими клиническими исследованиями – к классу B и так далее. Предполагается, что создаваемый таким образом документ абсолютно прозрачен: утверждения подтверждены ссылками на источники, а составители раскрывают возможный конфликт интересов.
В идеальной ситуации клинические рекомендации исполняют роль той самой “прокладки” между врачом и научными публикациями, своевременно и объективно систематизируя новейшие данные. Ожидаемо на практике не все так гладко. Проверка американских клинических рекомендаций 2007 года показала, что хотя в 70% случаев они подкреплены ссылками на РКИ и систематические обзоры, лишь в половине случаев источники выбраны правильно. Проблема заключалась в суррогатных исходах и в том, что РКИ провели на популяции, отличавшейся от той, для которой написаны рекомендации. В качестве примера приведена рекомендация использовать спироналоктон у пациентов с артериальной гипертензией, основанная на РКИ, не содержащем отдельного вывода касательно таких больных.
Причин неудовлетворительного качества клинических рекомендаций несколько. Тут и неготовность признать, что в некоторых областях просто нет хороших исследований и обоснованных методов лечения. И влияние собственных идей экспертов, их профессиональных привычек. И, к сожалению, конфликт интересов. В странах, где его наличие можно проверить, примерно половина авторов клинических рекомендаций отчиталась о финансовых связях с производителями упомянутых в них лекарств. Еще четверть “забывала” это сделать. В России установить конфликт интересов такого рода крайне сложно. Возможно, именно это объясняет отдельные необоснованные рекомендации, не выдерживающие никакой критики.
Хотя следование добросовестным клиническим рекомендациям может улучшить результаты лечения, приверженность им врачей невысока. Все попытки ее оценить дали скромный результат. Так, лишь половина пациентов с артериальной гипертензией получала препараты, рекомендованные к назначению в первую очередь. Только 60–70% соответствия выявили в родовспоможении, 50% – в лечении неотложных состояний.
Некоторые врачи недолюбливают клинические рекомендации, видя в них ущемление своей самостоятельности. Или считают, что опыт дает им основания принимать другие решения. Но никто не подразумевает под этим, что перепробовал все возможные способы лечения и поэтому знает, какое из них лучше. Как показывает глубинное интервьюирование, под опытом врачи понимают набор простых правил, эвристик, которые формируются за время работы. Они складываются из узнанного на обучении, конференциях, из рекламы. Очень большую роль играет информация, полученная от коллег, а на раннем этапе карьеры – от вышестоящих авторитетных коллег. Прочитанное в клинических рекомендациях тоже играет роль, но не определяющую. Хотя все специалисты знают об их существовании, не каждый хотя бы раз знакомился с их содержанием.
Иногда опора на это неформальное знание оправдана: клинические рекомендации не могут алгоритмизировать все ситуации, и личный опыт порой подсказывает решение или указывает на то, что рекомендации не годятся для конкретного пациента, например из-за повышенного в этом конкретном случае риска осложнений. Однако опыт одного врача не заменит результата работы тысяч специалистов. А с учетом того, как формируется личный опыт, за ним может скрываться многолетнее повторение одних и тех же ошибок.
Очень сложно оценить, какая доля получаемого пациентами лечения обоснована. В 2012 году два французских врача взяли на себя труд проанализировать исследования по 4 тысячам зарегистрированных во Франции лекарств и пришли к выводу, что только половина препаратов имеет приемлемые доказательства эффективности. Хотя критики отметили несистематический подход и использование устаревшей информации, этот вывод может быть близок к реальному положению дел. Интересны выводы обзора всех опубликованных в 2001–2010 годах в престижном The New England Journal of Medicine исследований, перепроверявших уже применяемые методы лечения. Предполагаемую эффективность подтвердили только в 38% случаев, в 40,2% случаев метод сочли бесполезным или вредным, в остальных результат был неопределенным.
Насморк левой ноздри
Ситуация в России как минимум не лучше. Общемировые проблемы усугубляются существованием целых классов препаратов, не признанных в большинстве стран мира. Есть основания считать, что их эффективность недостаточно доказана из-за относительно низких требований к доказательствам эффективности и безопасности, предъявляемых при регистрации лекарств в России. Хотя в последние годы процедура проверки новых лекарственных препаратов ужесточается, требования к дизайну регистрационных клинических испытаний у нас по-прежнему мягче, чем в Евросоюзе, США и других развитых странах.
Препарат “Кагоцел” российского производителя “Ниармедик” занимал в первой половине 2018 года пятую строчку в рейтинге самых популярных в России лекарственных брендов. За эти полгода его продажи составили 3,2 миллиарда рублей. Препарат включен в “Перечень жизненно необходимых и важнейших лекарственных препаратов”, что увеличивает объемы продаж за счет государственных закупок. “Кагоцел” используется для лечения гриппа и других простудных инфекций и входит в клинические рекомендации по лечению гриппа у взрослых. Предполагаемый механизм его действия – стимулирование выработки организмом участвующего в иммунном ответе интерферона, что должно обеспечивать более сильную защитную реакцию на вирусную инфекцию и более быстрое излечение. При этом в США и Евросоюзе такой механизм лечения простудных заболеваний не признан, подобные лекарства на рынке отсутствуют.
Некоторые эксперты высказывали сомнения в безопасности “Кагоцела”. Потенциальный риск заключается в том, что это производное госсипола – вещества, подавляющего репродуктивную функцию (одно время даже рассматривалась возможность использовать его как противозачаточное). Резонно предположить, что с учетом этого факта и не признанного во многих странах механизма действия регистрирующий орган подверг безопасность и эффективность “Кагоцела” самому пристальному анализу. Однако изучение опубликованных материалов вызывает удивление. В исследованиях, на основании которых могло быть выдано разрешение применять препарат для лечения детей, количество участников невелико, а дизайн далек от совершенства. В самом крупном РКИ, которое удается найти, участвовало лишь 120 детей, и оно не было двойным слепым, при этом информация о нем минимальна. Длительное наблюдение для исключения отдаленных нежелательных эффектов в ходе этих исследований не проводилось. И хотя впоследствии было сделано наблюдательное исследование, которое могло бы исключить или подтвердить риск бесплодия, в опубликованных результатах об этом нет ни слова: складывается впечатление, что вопрос просто не изучался.
Другая вызывающая недоумение у зарубежных специалистов, но широко распространенная в России группа препаратов – нейропротекторы. Производители объясняют их действие предохранением тканей мозга от повреждения, и они широко применяются при инсультах, эпилепсии и других неврологических заболеваниях. Процедура изготовления препаратов могла бы обеспечить нейропротекторам достойное место в античных и средневековых фармакопеях. Например, “Кортексин” представляет собой выжимку головного мозга крупного рогатого скота и свиней. Как, по мнению производителя, это должно помогать мозгу пациента – не совсем ясно.
Отсутствие этих препаратов на многих крупных рынках, вероятно, связано с качеством доказательств их эффективности и безопасности. Так, в клиническом испытании “Кортексина” участвовало 272 человека, что относительно много по российским, но мало по мировым стандартам. В этом эксперименте пациенты были разделены на три группы, двум из которых давали “Кортексин”, третья получала плацебо. В результате смертность в группах “Кортексина” оказалась выше, чем в группе плацебо, – 2,9% и 4,2% против 0%, количество осложнений тоже было выше в группах “Кортексина”. Хотя различия не удовлетворяли выбранному авторами критерию статистической значимости, это могло быть вызвано как их случайным характером, так и недостаточной статистической мощностью, обусловленной малым количеством участников. Но ни более крупных клинических испытаний, ни длительных наблюдательных исследований, которые могли бы подтвердить или исключить риск, обнаружить не удалось.
Чтобы в полной мере оценить качество российских медицинских исследований, вы можете не читать этот фрагмент и самостоятельно разобрать статью “Использование препарата “Коризалия” у детей с острым инфекционным и персистирующим аллергическим ринитом”, опубликованную в четвертом номере журнала “Доктор.ру” за 2017 год, ее несложно найти в интернете. Если вы добрались до этой страницы, ваших знаний для самостоятельного анализа уже достаточно.
Статья рассказывает об исследовании эффективности гомеопатического препарата “Коризалия”, произведенного компанией Boiron, и опубликована в конце 2017 года в журнале “Доктор.ру”, который позиционирует себя как рецензируемый. Исследование проводилось на кафедре детских болезней Первого МГМУ им. И. М. Сеченова под руководством заведующей кафедрой Н. А. Геппе. Фактически под видом одного исследования проведено два: в первом участвовало 39 детей с острым ринитом, в во втором – 38 с аллергическим. Цель исследования – изучение эффективности препарата. Авторы приходят к выводу, что он эффективен. Однако при этом:
• Количество участников очень мало.
• Это наблюдательное исследование, а не рандомизированный клинический эксперимент, а значит, оно в принципе не подходит для ответа на вопрос об эффективности лекарства.
• Авторы оценивают время, прошедшее с начала наблюдения до момента исчезновения симптомов. При этом нет никакого способа понять, сколько времени прошло с начала заболевания. Очевидно, что, если наблюдение в одной группе начато не сразу, а через пару дней после начала простуды, с момента начала наблюдения до исчезновения симптомов пройдет меньше времени.
• Симптомы оценивают неослепленные врачи.
• При этом оценивается огромное количество показателей, в том числе экзотические – “скорость воздушных потоков”, “двигательная активность целлиарного эпителия”, все замеры сделаны отдельно для правой и левой ноздри. Поправки на множественные сравнения нет. В главе 14 мы обсуждали, что такое p-хакинг и как он помогает преодолеть порог статистической значимости даже в отсутствие реальных отличий в сравниваемых группах. И авторам это удалось: был обнаружен статистически значимый эффект (p < 0,05) препарата. Впрочем, только для левой, но не для правой ноздри.
• Самое интересное – что и с чем сравнивалось. Пациенты во всех группах принимали “Коризалию”, а все статистически значимые результаты касаются сравнения симптомов в первый и последний день наблюдения. Таким образом, авторам удалось продемонстрировать, что насморк статистически значимо проходит через пару недель болезни. Что, конечно, не является достаточным основанием для выводов об эффективности “Коризалии”.
• Конечно, возникают сомнения в том, что статья проходила рецензирование. Хотя в ней нет никакого упоминания о конфликте интересов, главный редактор журнала Н. А. Геппе и руководитель исследовательской группы Н. А. Геппе – одно и то же лицо. По всем признакам, это маркетинговое исследование, цель которого – лишний раз напомнить читателям о существовании препарата. В этом же номере журнала размещены рекламные модули “Коризалии”.
Исследования, которые преследуют исключительно коммерческие цели, особенно на детях, противоречат и букве, и духу Хельсинкской декларации и абсолютно неэтичны.
Хирургия и психотерапия
Несколько слов нужно сказать о двух областях медицины, где доказательная практика внедряется особенно медленно, – это хирургия и психотерапия.
Значительная часть хирургических методов не проверена в рандомизированных клинических испытаниях. Причина в мало регулируемом характере хирургии: в отличие от лекарственных препаратов новая операция не проходит формальной процедуры одобрения, в которой нужно доказать ее эффективность и безопасность. Достаточно того, что ожидаемый эффект кажется хирургу биологически правдоподобным. Даже давно существующие операции разные хирурги выполняют по-разному – по сути, под одним названием могут скрываться очень отличающиеся манипуляции. При этом каждый хирург может считать оптимальным именно свой метод и найдет для этого достаточно теоретических аргументов.
Еще одна причина немногочисленности хирургических РКИ – сложности с финансированием таких исследований. Поскольку хирургическая операция не может стать чьей-то собственностью, бизнес не заинтересован в спонсировании исследований, а денег государственных и некоммерческих организаций не хватает. Ранее мы говорили о том, что финансирование РКИ производителями лекарств снижает их объективность. Но ситуация, когда медицинская индустрия не заинтересована оплачивать исследования, немногим лучше.
Существует и этическая проблема. Во время плацебо-операции пациента вводят в наркоз и делают хирургический разрез, который зашивают, не производя больше никаких манипуляций. Пациент не получит от такого участия в эксперименте никакой пользы, но ему будет причинен заведомый вред: как минимум боль и шрам от разреза, побочные эффекты наркоза. Этот аргумент часто звучит из уст противников проведения хирургических РКИ. Но это вызывает другой, не менее серьезный вопрос: насколько этично продолжать оперировать миллионы людей, не будучи уверенными, что операция приносит пользу?
Иногда кажется, что хирургия не может не быть эффективной. Идея физического устранения источника проблемы выглядит простой, наглядной и убедительной. В этом тоже есть немного магического мышления: мы охотно верим в то, что легко вообразить. Тем временем на практике популярные хирургические методы не всегда проходят проверку контролируемым экспериментом. Сделанный в 2014 году систематический обзор РКИ показал, что в половине случаев разница между группой с настоящей операцией и группой плацебо отсутствовала. В остальных случаях разница была в пользу операции, однако размер эффекта часто был невелик. Серьезные побочные эффекты ожидаемо чаще наблюдались в экспериментальных группах.
Первое хирургическое исследование с плацебо-контролем было проведено в 1959 году. Процедура перевязки внутренней маммарной артерии для лечения стенокардии считалась проверенной на многих пациентах и животных. Описание механизма ее эффекта было биологически правдоподобным. Но слепое испытание не выявило различий между группами. Другой широко известный пример – лечение болезни Паркинсона путем трансплантации эмбриональных дофамин-продуцирующих клеток в мозг пациента. Неослепленные исследования были положительными, пациенты сообщали об улучшении, но слепое плацебо-контролируемое исследование не показало статистически значимой разницы. Еще один классический пример – артроскопия коленного сустава. Эта процедура долгое время считалась эффективным методом лечения остеорартрита или разрыва коленного мениска. Когда эта современная эндоскопическая операция пришла на смену открытой хирургии колена, никто даже не задался вопросом, есть ли от операции польза. Позже несколько плацебо-контролируемых испытаний показали, что бесполезны оба варианта операции. Тем не менее в мире до сих пор делают до двух миллионов артроскопий коленного сустава ежегодно.
Список хирургических методов, не выдержавших проверки контролируемым экспериментом, можно продолжать долго. Увы, еще длиннее будет перечень операций, которые никогда не проверялись в высококачественных РКИ. К сожалению, многие хирурги считают собственный опыт достаточным основанием для выбора того или иного вмешательства.
Опыт хирурга, безусловно, важен: противоположно результатам исследования, показавшего, что результаты молодых терапевтов лучше, исследование выживаемости хирургических пациентов показало, что она выше у более опытных хирургов. Одно из возможных объяснений: навыки хирурга со временем совершенствуются. Но это не отменяет того, что выбор метода лечения лучше делать на основе результатов РКИ надлежащего качества, а не суждений одного, пусть даже блестящего специалиста.
Психотерапией называют лечение с помощью беседы и других психологических техник. Существует более 400 типов психотерапии, каждый из которых основан на своей теории, и часто эти теории противоречат друг другу. Интересно, что при этом все виды психотерапии эффективны примерно в одинаковой степени. Сделанный в 1975 году обзор сорока исследований, показал, что все методы привели к улучшению даже в тех случаях, когда терапевтическое вмешательство было минимальным. К такому же выводу пришли авторы сделанного в 1977 году обзора 375 исследований и обзора 435 исследований, сделанного пятью годами позже. Результат повторялся и в последующих обзорах. Из чего, вероятно, следует, что все методы психотерапевтического воздействия не имеют собственного эффекта, а приносимая ими польза – результат общения с врачом, внушаемых им позитивных ожиданий и происходящего со временем естественного улучшения самочувствия.
Интересен проведенный в 1979 году эксперимент, в котором испытавших стресс студентов колледжа распределяли между психотерапевтами с 20-летним стажем и профессорами английского, истории, философии и математики без психотерапевтического опыта, но умеющими расположить к себе и известными душевной теплотой. Профессора справились не хуже психотерапевтов. Это подкрепляет предположение, что эффект психотерапии обусловлен самим контактом с врачом, его вниманием и поддержкой, а не специфическими приемами того или иного метода. Иначе говоря, психотерапия сводится к эффекту плацебо.
Экспериментальная проверка этой гипотезы – задача нетривиальная. Для этого нужно провести контролируемый эксперимент, в котором мы сравним психотерапию и имитирующее ее плацебо. Но здесь возникают две проблемы: техническая и концептуальная. Техническая заключается в сложности выбора плацебо для контрольной группы. Если в случае с лекарством отделить фармакологический эффект от психологического можно, убрав из таблетки действующее вещество, то в случае психотерапии весь эффект – психологический. Были опробованы разные варианты психотерапевтического плацебо: прослушивание аудиозаписей и просмотр видеозаписей врача; молчаливая встреча с психотерапевтом, в ходе которой он и пациент сидят рядом, не произнося не звука; нейтральная беседа на отвлеченные темы, не касающаяся психологических проблем пациента. Но все эти приемы не выполняют главную функцию плацебо: и пациент, и врач всегда знают, что происходит – лечение или имитация, а значит, ожидания в контрольной и экспериментальной группах будут разными.
Концептуальная проблема в том, что граница между истинным специфическим воздействием психотерапии и эффектом плацебо условна. Ответ на наш вопрос зависит только от того, какие определения мы для них выберем. Поэтому важны не те исследования, которые пытаются выделить из психотерапии ее “истинный” эффект, а те, что сравнивают разные виды психотерапии между собой. Даже если мы назовем все влияние психотерапии эффектом плацебо, понимание, какой его вариант сильнее, имеет клиническое значение.
По мере распространения доказательной медицины некоторые виды психотерапии начали позиционировать себя как более доказательные, чем остальные. Здесь выделяется когнитивно-поведенческая терапия (КБТ) – комплекс методов, основанных на когнитивных и поведенческих подходах. Когнитивные исходят из того, что психологические проблемы вызваны нелогичными и нерациональными мыслями пациента, и направлены на их изменение. Поведенческие пытаются изменить поведение человека путем оперантного обучения – подкрепляя желательное поведение. Вопреки имиджу “доказательной психотерапии” данные скорее не подтверждают преимущество КБТ над остальными методами. Хотя метаанализ 2010 года показал, что она эффективнее психодинамической терапии, преимуществ перед другими методами выявить не удалось. Метаанализ 2013 года оценил эффективность разных психотерапевтических подходов к лечению депрессии и не нашел различий. Два метаанализа 2014 года обнаружили небольшое преимущество КБТ, однако сделанный в 2017 году критический разбор показал, что исправление некоторых недостатков исследований сводит обнаруженную разницу на нет или делает ее незначительной.
Важно помнить, что рядом с эффектом плацебо существует эффект ноцебо. Ожидания пациента могут меняться в обе стороны, поэтому психотерапия способна вызвать не только улучшение, но и ухудшение состояния больного. Так, кокрейновский обзор эффективности дебрифинга стресса критических инцидентов дал довольно неожиданный результат. Эта методика была разработана для оказания помощи группам людей, переживших стрессовые или трагические события, например сотрудникам служб спасения или жертвам насильственных преступлений. Ее цель – предотвратить развитие посттравматических расстройств. Систематический обзор 2009 года показал, что вопреки ожиданиям эта популярная методика не только не приносит пользы, но и в ряде случаев ухудшает состояние. Негативные результаты были получены и для некоторых других методов, например психотерапии диссоциативного расстройства идентичности и групповой терапии для подростков с расстройствами поведения.