Успех проекта по выявлению суперпредсказателей подчеркивает значение двух стратегий гигиены принятия решений: стратегии отбора (суперпредсказатели действительно по праву носят приставку «супер») и стратегии обобщения (работая в команде, прогнозисты действуют более эффективно). Обе стратегии широко применяются для вынесения суждений самого разного характера. Если ситуация позволяет, стратегии следует сочетать, создавая команды судей (в сферах прогнозирования, инвестиций или работы с персоналом), отобранных не только по принципу профессионализма, но и с учетом взаимодополняемости.
До сих пор мы обсуждали способы повышения точности, достигаемой усреднением множества независимых суждений, как, например, в случае экспериментов с концепцией «мудрости толпы». Агрегирование оценок экспертов высокой квалификации еще более способствует улучшению точности суждения. Дополнительного эффекта можно также добиться, сочетая оценку экспертов, которые будут работать автономно и в то же время смогут дополнять друг друга288. Представьте себе ситуацию, когда четыре человека стали свидетелями преступления. Важно, конечно, не допустить взаимного влияния их показаний. При этом качество информации, которую они вам дадут, будет гораздо лучше, если они наблюдали за происшествием с четырех разных сторон.
Задача создания команды профессионалов, которой предстоит вынести суждение, подобна отбору комбинации тестов, способных спрогнозировать результаты деятельности ваших кандидатов (что в учебном процессе, что в профессиональной сфере). Стандартным инструментом решения такой задачи считается метод множественной регрессии, введенный нами в главе 9. Метод работает путем последовательного отбора переменных. Первым выбирается тест, показавший наилучший прогнозный результат. Однако второе место в вашем арсенале необязательно займет тест со вторым по порядку итоговым баллом. Нет, второй тест должен дополнять прогностическую способность первого инструмента; его прогнозный потенциал должен соответствовать критериям достоверности и не быть избыточным по отношению к первому тесту. Приведем пример. Допустим, у вас имеется два сопоставимых теста измерения сообразительности, которые дают корреляцию 0,50 и 0,45 относительно будущих успехов кандидата. Третий тест (на выявление личностных характеристик) коррелирует лишь на 0,30 относительно потенциального успеха и совершенно не коррелирует с двумя другими тестами. Оптимальным решением станет комбинация первого теста с более высоким коэффициентом корреляции и третьего теста, который способен добавить к вашему заключению новую информацию.
Таким же образом, создавая команду судей, разумеется, в первую очередь необходимо пригласить лучшего кандидата. Однако вторым выбором вполне может стать отнюдь не человек с аналогичными способностями, а кандидат с более умеренным уровнем, который, тем не менее, привнесет в команду новый импульс. Команда, созданная на основе подобного критерия, покажет лучший результат, поскольку степень достоверности коллективного суждения растет быстрее, когда индивидуальные суждения не коррелируют, и медленнее в ситуациях, когда их комбинация избыточна. Внутриэкспертный шум в такой команде будет достаточно высок, поскольку индивидуальные суждения по каждому вопросу варьируют. Парадоксально, но факт: «шумная» группа даст более точную среднюю оценку, чем та, что родилась в условиях полного единогласия.
Следует принять во внимание важную оговорку. Вне зависимости от степени разнородности оценок, агрегирование снизит шум лишь в том случае, если суждения действительно выносятся автономно. Как показали наши рассуждения о шуме в коллективах, групповые обсуждения скорее добавят ошибку за счет смещения, нежели снизят шум. Если организация по-настоящему стремится достигнуть разнообразия мнений, ей следует приветствовать дискуссию, зарождающуюся после независимого формирования суждений каждым из членов команды. Процесс идентификации и обобщения независимых, хотя и разнородных суждений часто оказывается наиболее простой, экономичной и популярной стратегией гигиены принятия решений.
«Найдем среднее значение четырех суждений – так мы точно снизим шум в два раза».
«Следует стремиться к тому, чтобы стать вечной бета-версией, подобно суперпредсказателям».
«Давайте начнем с поиска априорной вероятности, прежде чем приступить к обсуждению».
«У нас хорошая команда, и все же: как добиться большего разнообразия мнений?»
Несколько лет назад одному из наших близких друзей (назовем его Пол) поставили диагноз: гипертония. Семейный врач (назовем его доктор Джонс) посоветовал Полу начать медикаментозное лечение и выписал мочегонное, однако улучшения не наступило; давление по-прежнему оставалось высоким. Через месяц Джонс назначил нашему другу еще один препарат – блокатор кальциевых каналов, и почти с тем же успехом.
Отсутствие результатов сбивало врача с толку. Через три месяца регулярных визитов к врачу показатели давления снизились очень незначительно и оставались выше нормы. Никто не понимал, что делать дальше. Пол был встревожен, доктор Джонс также не находил себе места от беспокойства, в том числе и потому, что Пол – человек отменного здоровья, сравнительно молодой. Врач уже начал задумываться о назначении третьего препарата.
Так совпало, что Полу в это время пришлось переехать в другой город, где он обратился к местному врачу общей практики (назовем его доктор Смит). Пол рассказал ему историю продолжительной борьбы с гипертонией, на что доктор Смит сразу ответил: «Купите себе тонометр, посмотрим, какие показания у вас будут дома. У меня нет уверенности, что вы и в самом деле страдаете от высокого давления. Возможно, у вас просто синдром боязни врачей: давление повышается, как только вы переступаете порог клиники».
Пол так и поступил, и, разумеется, дома его показатели находились в пределах нормы. С тех пор никаких проблем не наблюдалось. Через месяц, после того как доктор Смит рассказал о «синдроме белого халата», давление у Пола перестало подниматься и при визитах к врачам.
Одна из основных задач медика – поставить диагноз, определить, действительно ли пациент болен, и если это так, то чем именно. Для того чтобы поставить диагноз, врачу, как правило, требуется вынести суждение. Чаще всего это процедура рутинная и даже механическая: существующие правила и процедуры помогают снизить шум. Обычно доктору не составляет труда диагностировать вывих плеча или перелом пальца. Примерно то же самое можно сказать и о технически более сложных случаях. Шум почти не повлияет на врача при определении дистрофии связочного аппарата289. При поражении молочной железы врач оценит образец ткани290, взятый при биопсии, и сформулирует относительно четкое, практически «незашумленное» мнение.
Важно отметить, что некоторые диагнозы вообще не требуют вынесения суждений. Здравоохранение развивается, пытаясь исключить из диагностики элементы индивидуального мнения и заменяя его расчетами. Допустим, у вас болит горло. Вы обратитесь в клинику, где доктор сразу возьмет у вас мазок из горла и сделает экспресс-тест на антитела. Уже через несколько часов анализ покажет наличие стрептококка. Если подобный тест не сделать291, при диагностике возникнет шумовой фон (что, впрочем, возможно даже при наличии результатов анализа). Допустим, уровень сахара в вашей крови составляет 126 миллиграммов на децилитр или даже выше, либо ваш показатель гликогемоглобина держится на отметке 6,5 и больше. Вам наверняка диагностируют диабет292. В самом начале пандемии вируса COVID‑19 некоторые врачи, изучив симптомы, ставили диагноз на основании индивидуального суждения. По мере развития пандемии обычной практикой стала экспресс-диагностика, и необходимость в профессиональном суждении отпала.
Многие из нас в курсе, что врачи в процессе вынесения профессионального суждения не застрахованы от шума; значит, не исключены ошибки. Поэтому пациентам обычно советуют получить второе мнение293 – это общепринятый подход. В некоторых больницах второе мнение даже является обязательной практикой. Если второе мнение отличается от первого – значит, мы столкнулись с шумом. Правда, в подобных случаях не всегда понятно, который из врачей в итоге прав. Некоторые пациенты (в том числе и наш Пол) поражаются, понимая, насколько мнение второго врача отличается от диагноза первого. Впрочем, само наличие шума в медицине нас удивлять не должно; проблема в его количестве.
Цель данной главы – разобраться в этом заявлении и описать некоторые подходы к снижению шумовых помех в медицине. Сосредоточимся на одной из стратегий гигиены принятия решений, а именно на развитии методических рекомендаций по диагностике. Мы прекрасно знаем, что о шуме в профессии медработника запросто можно написать целую книгу, включив в нее несколько глав о том, какие меры принимают врачи, медсестры и целые больницы для исправления ситуации. Отметим, что шум в медицине не ограничивается лишь процессом диагностики заболеваний, на котором мы сейчас остановимся. Шум проявляется и в процессе лечения; по этому поводу также существует обширная литература. Если пациент испытывает дискомфорт в области сердца, заключения врачей, назначающих лечение, пугающе варьируют относительно препаратов и методов хирургического вмешательства. Порой доктора расходятся во мнениях, требуется ли операция в принципе. Уже более двадцати лет существует проект «Дартмутский атлас»294, фиксирующий вопиющие расхождения в распределении и использовании медицинских ресурсов в Соединенных Штатах. Подобные недочеты отмечены295 почти во всех странах мира. Наша цель, однако, состоит в кратком исследовании шума, присутствующего именно в медицинской диагностике. Полагаем, что данный пример вполне показателен.