Общий обзор

Шуму в медицине посвящено огромное количество книг. В основном эти труды описывают эмпирические исследования шумовых помех, однако есть немало литературы, содержащей рекомендации. Люди, работающие в системе здравоохранения, находятся в постоянном поиске стратегий снижения шума, которые принимают разнообразные формы и являются настоящим кладезем идей, достойных применения в иных отраслях.

Что такое шум в медицине? Бывает, что один врач явно прав, другой же наверняка ошибается (возможно, проявляется когнитивное искажение). Вполне предсказуемо, что огромную роль играет мастерство. Почитайте, как описывают картину пневмонии разные рентгенологи²⁹⁶, и вы обнаружите значительный шумовой фон. Частично он вызван разницей в компетентности. Более конкретно «разницей в профессионализме объясняется 44 % расхождений в диагностических решениях». Из этого следует, что «политика повышения уровня знаний может дать лучшие результаты, нежели методические рекомендации». В медицине, как, впрочем, и везде, обучение²⁹⁷ и отбор являются решающими факторами, которые снижают вероятность ошибок, устраняя как смещение, так и шумовые помехи.

Специалисты, занятые в ряде областей медицины (например, рентгенологи и патологоанатомы), прекрасно знают о наличии шума в профессии. Рентгенологи, например, называют²⁹⁸ разброс мнений при диагностике «ахиллесовой пятой». Да, в патологической анатомии и рентгенологии шум привлекает повышенное внимание. В чем причина? Либо уровень шума в данных областях и вправду настолько высок, либо его просто-напросто легче зарегистрировать. Ответа нет, но мы подозреваем, что причина кроется именно в легкости выявления. Рентгенология предоставляет все возможности для проведения простых и понятных тестов. Например, всегда можно вернуться к рентгеновским снимкам и пересмотреть ранее вынесенное суждение.

Уровень межэкспертной надежности обычно измеряют методами каппа-статистики²⁹⁹. Чем выше число каппа, тем меньше шума. Значение каппы на уровне единицы говорит о единодушном совпадении мнений; значение «0», пожалуй, может возникнуть лишь в обезьяньей стае при попытке поставить диагноз метанием дротиков в соответствующую мишень. В некоторых областях медицинской диагностики надежность, измеряемая данным коэффициентом, определяется как «слабая» или «ничтожная», что свидетельствует о высоком содержании шума. Нередко степень надежности классифицируется как «удовлетворительная». Подобная оценка, безусловно, выше и все же говорит о значительном шумовом фоне. При ответе на важнейший вопрос о наиболее значимых примерах взаимодействия лекарственных препаратов³⁰⁰ врачи общей практики, рассматривая комбинации сотни произвольно выбранных лекарств, показали «ничтожную» степень согласованности. Для нас, сторонних наблюдателей, а также для многих врачей диагностика заболеваний почек представляется относительно несложной. И все же нефрологи, оценивая результаты обычных анализов, сдаваемых при почечной недостаточности, демонстрируют в своих суждениях³⁰¹ колебания согласованности от «слабой» до «умеренной».

В одном из исследований проводился эксперимент по определению злокачественности поражения молочной железы³⁰². Результаты свидетельствуют об «удовлетворительной» степени согласия между специалистами. При диагностике пролиферирующего поражения молочной железы³⁰³ степень согласия осталась без изменения. Точно такой же итог мы видим при оценке врачебным персоналом картины МРТ-исследования по поводу определения стадии спинального стеноза³⁰⁴. Данные результаты заслуживают внимания. Как мы уже упоминали, в некоторых сферах медицины уровень шума чрезвычайно низок, однако в технически сложных областях это далеко не так. Если пациента обследуют по подозрению на серьезное заболевание (например на предмет рака), процесс постановки диагноза превращается в своеобразную лотерею. Все зависит от того, к какому врачу вы попадете на прием.

Рассмотрим выводы некоторых исследований, описанных в литературе. Возьмем те из них, что проводились в областях, где уровень шума особенно высок. Мы оцениваем данные результаты отнюдь не с целью сделать авторитетное заявление о текущем состоянии сложившейся врачебной практики (кстати, эволюция и рост эффективности налицо и в этих отраслях медицины). Наша задача – получить общее представление о степени распространения шумовых помех как в недавнем прошлом, так и в настоящем.

1. Заболевания сердца – основная причина³⁰⁵ как мужской, так и женской смертности в Соединенных Штатах. Коронарография – главный способ исследования в кардиологии – применяется, чтобы оценить степень закупорки сердечных артерий и при острой, и при хронической форме болезни. В хронических случаях, когда пациент периодически испытывает боли в грудной клетке, при закупорке 70 и более процентов одной или нескольких артерий часто прибегают к шунтированию. Однако при изучении коронарограмм зарегистрирован существенный разброс мнений специалистов; значит, имеется риск назначения ненужной пациенту процедуры. Исследования, проводившиеся много лет назад, выявили, что в тридцати одном случае из ста³⁰⁶ врачи не могут прийти к единодушному мнению относительно степени закупорки крупного кровеносного сосуда. Кардиологи отдают себе отчет, что вариативность в интерпретации коронарограмм существует, принимают разнообразные корректирующие меры, и все же на сегодняшний день радикального решения проблемы не найдено.

2. Под эндометриозом мы понимаем нарушения, при которых ткань, выстилающая внутреннюю сторону матки, прорастает наружу. Заболевание достаточно болезненно и порой приводит к бесплодию. Для диагностики эндометриоза часто используют лапароскопию, когда маленькая камера вводится хирургическим путем в тело пациентки. Цифровую картинку, полученную при обследовании трех больных, показали 108 хирургам-гинекологам. У двух пациенток диагностировали эндометриоз различной степени тяжести, у третьей женщины заболевания не выявили. Хирургов попросили выразить мнение по поводу количества и расположения очагов эндометриоза. Разброс суждений оказался значительным³⁰⁷; точки зрения относительно масштаба и места поражения коррелировали очень слабо.

3. Туберкулез – одна из самых распространенных и смертельно опасных болезней: только в 2016 году им заразилось более 10 миллионов человек, из которых 2 миллиона умерли. Признанным способом выявления туберкулеза остается флюорография – обследование легких на предмет каверн, связанных с деятельностью палочки Коха. Вариативность диагностики туберкулеза отмечается уже на протяжении 75 лет. За последние десятилетия методы диагностики совершенствуются, и все же последние исследования выявляют значительный разброс мнений³⁰⁸; степень межэкспертного согласия варьирует от «умеренной» до «удовлетворительной». Точки зрения рентгенологов разных стран³⁰⁹ на диагностику туберкулеза также имеют отличия.

4. Межэкспертное согласие специалистов при исследовании поражений кожи с целью исключения меланомы – одной из самых опасных разновидностей рака кожи – дотянуло лишь до оценки «умеренно». Восемь специалистов лабораторной диагностики, рассматривавшие³¹⁰ результаты анализов, лишь в 62 % случаев приходили к единогласному выводу (либо имели разночтения не более чем по одному из параметров оценки). Еще один эксперимент, проведенный в онкологическом центре³¹¹, показал, что точность определения меланомы составляет лишь 64 %; следовательно, врачи ставили неверный диагноз в одном из трех случаев. В ходе другого исследования выяснилось, что в тридцати шести случаях из ста дерматологи Нью-Йоркского университета не сумели определить меланому по результатам биопсии. Авторы исследования пришли к выводу³¹², что «неспособность клинических специалистов четко диагностировать меланому имеет печальные последствия для жизни пациентов, страдающих смертельно опасным заболеванием».

5. Подвержены вариативности и суждения рентгенологов относительно рака молочной железы. Обширное исследование показало, что количество ложноотрицательных диагнозов по результатам изучения маммограмм у разных специалистов колеблется от 0 % (то есть рентгенолог неизменно правильно ставит диагноз) до величины, превышающей 50 % (рентгенолог дает неверную оценку более чем в половине случаев). Сходным образом варьируют и ложноположительные диагнозы³¹³: от величины менее 1 % до 64 % (то есть два раза из трех рентгенолог говорит, что маммограмма свидетельствует о раке, когда злокачественного образования и в помине нет). Наличие ложных положительных и отрицательных диагнозов, поставленных различными специалистами, свидетельствует о наличии шумового фона.

Упомянутые нами случаи межэкспертного шума доминируют в результатах исследований, однако встречаются случаи и шума ситуативного. Рентгенологи порой меняют³¹⁴ свою точку зрения при повторном просмотре снимка (хотя подобное явление отмечается реже, чем несогласие с оценкой коллеги). Оценивая степень закупорки сосуда на коронарограмме³¹⁵, двадцать два кардиолога не могут прийти к внутреннему согласию минимум в 63 и максимум в 92 случаях из 100. В тех областях, где критерии диагностики определены расплывчато³¹⁶ и диагноз требует сложного суждения, межэкспертная надежность показывает весьма скромные результаты.

Исследование, упомянутое в предыдущем абзаце, не предлагает однозначного объяснения подобного уровня ситуативного шума. Однако другой эксперимент (в котором, правда, проблемы диагностики не фигурируют)³¹⁷ выявил вполне банальный источник ситуативного шума в медицине. Этот вывод следует держать в уме как пациентам, так и врачам. Итак, медики в подавляющем большинстве проявляют склонность к назначению исследований на онкологию по утрам и гораздо реже делают это после обеда. В ходе наблюдения за большим количеством специалистов выяснилось, что направления на исследования по поводу рака молочной железы и кишечника чаще всего выдают в 8:00 (в 63,7 % случаев). К 11:00 доля таких назначений снижается до 48,7 %, вновь повышаясь до 56,2 % к полудню, а затем вновь падает до 47,8 % к 17:00. Таким образом, пациенты, попадающие на прием в районе обеда и позже, получат подобное направление (между прочим, упомянутое в методических рекомендациях) с меньшей вероятностью, чем с утра.

Как объяснить подобный результат? Один из возможных ответов: врач неизбежно начинает выбиваться из графика после работы с несколькими пациентами со сложной симптоматикой, которые отнимают у него более двадцати минут стандартного приема. Мы уже говорили в главе 7 о немаловажной роли таких механизмов возникновения ситуативного шума, как стресс и усталость; похоже, что они срабатывают и здесь. Пытаясь войти в график, доктор сокращает время беседы с очередным пациентом, пропуская рассказ о профилактических мерах. Любопытный пример ситуативного шума: в конце смены клинический специалист реже и менее тщательно моет руки – вот и еще одно доказательство той роли³¹⁸, которую играет усталость. Даже в такой несложной процедуре мы наблюдаем воздействие шума.