Книга: Думай «почему?». Причина и следствие как ключ к мышлению
Назад: Потенциальные результаты, структурные уравнения и алгоритмизация контрфактивных утверждений
Дальше: Контрфактивные суждения и закон

О том, как важно видеть собственные допущения

Метод SCM, который я показал для вычисления контрфактивов, — не тот метод, который использовал бы Рубин. Основное различие между нами — применение диаграмм причинности. Они позволяют исследователям представить причинные допущения в терминах, которые они могут понять, а затем рассмотреть все контрфактивные утверждения как производные свойства от их модели мира. Причинная модель Рубина рассматривает контрфактивы как абстрактные математические объекты, которыми управляет алгебраический аппарат, а не производные от модели.
В отсутствие графического представления пользователь причинной модели Рубина обычно должен принять допущения. Первое из них, допущение о стабильном эффекте воздействия на единицу, достаточно прозрачно. В нем говорится, что каждый индивид (или единица — предпочтительный термин среди разработчиков причинных моделей) получит одинаковый эффект от лечения независимо от того, какое лечение получают другие индивиды (или единицы). Во многих случаях, если не считать эпидемии и другие коллективные взаимодействия, это имеет смысл. Например, если предположить, что головная боль не заразна, моя реакция на аспирин не будет зависеть от того, получит ли аспирин Джо.
Второе допущение в модели Рубина, тоже безобидное, называется постоянством. Оно подразумевает, что человек, который принял аспирин и выздоровел, также выздоровеет, если получит аспирин в экспериментальном порядке. Это разумное предположение, которое рассматривается как теорема в рамках SCM, фактически утверждает, что эксперимент лишен эффекта плацебо и других недостатков.
Но главное допущение, которое неизменно должны делать все, кто использует потенциальные результаты, называется игнорируемостью. Это более технический аспект, но он является критически важной частью всей операции, поскольку аналогичен условию обмениваемости у Джейми Робинса и Сандера Гренланда, которое обсуждается в главе 4. «Игнорируемость» выражает то же требование в терминах переменной потенциального результата YX Она требует, чтобы YX не зависел от фактически полученного лечения, т. е. X, с учетом значений определенного набора конфаундеров (или конфаундеров Z. Прежде чем исследовать ее интерпретацию, мы должны признать, что любое допущение, выраженное как условная независимость, наследует широкий набор знакомых математических механизмов, разработанных статистиками для обычных (не контрфактивных) переменных. Например, статистики обычно используют правила для определения, когда одна условная независимость следует из другой. К чести Рубина, он признал, что перевод причинного понятия неосложненности в синтаксис теории вероятностей имеет смысл, пусть и на контрфактивных переменных. Допущение игнорируемости делает причинную модель Рубина действительной моделью. Табл. 12 сама по себе не является моделью, поскольку не содержит допущений о мире.
К сожалению, я еще не нашел ни одного человека, который мог бы объяснить, что такое игнорируемость на языке, на котором говорят те, кому необходимо сделать это допущение или оценить его правдоподобие для конкретной задачи. Вот до чего удалось додуматься мне. Определение пациентов в экспериментальную или контрольную группы игнорируется, если в любой страте осложнителя Z пациенты, у которых может быть один потенциальный результат — YX = y, могут оказаться в экспериментальной или контрольной группе с той же вероятностью, что и пациенты, у которых может быть другой потенциальный результат — YX = Y¢. Это определение вполне оправданно, если у вас есть функция вероятности. Но как биолог или экономист, обладающий только научными знаниями, должен оценить, правда это или нет? И как ученый оценит, сохраняется ли игнорируемость для любого из примеров, обсуждаемых в этой книге?
Чтобы понять, в чем здесь сложность, попробуем применить это объяснение к нашему примеру. Чтобы определить, является ли ED игнорируемым (при условии EX), мы должны оценить, будут ли сотрудники с одной потенциальной зарплатой, скажем S1 = s, иметь одинаковый уровень образования с той же вероятностью, что и сотрудники с другой потенциальной зарплатой, предположим S1 = s¢. Если вы думаете, что это похоже на замкнутый круг, я могу только согласиться! Мы хотим определить потенциальную зарплату Элис, но, еще не начав — еще не получив намека на ответ, — должны размышлять о том, зависит ли результат от ED или нет в каждой страте EX. Это настоящий когнитивный кошмар!
Как оказалось, ED в нашем примере нельзя игнорировать по отношению к S, обусловленной EX, и поэтому метод сопоставления (приравнивание Берта к Кэролайн) даст неправильный ответ. Фактически оценки для них должны отличаться на сумму S1 (Берт) — S1 (Кэролайн) = $5 000 (читатель теперь выведет это из чисел в табл. 12 и трехэтапной процедуры). Теперь я покажу, что благодаря диаграмме причинности студент мог сразу увидеть, что ED нельзя игнорировать и пытаться искать здесь соответствие. При отсутствии диаграммы у студента возникнет соблазн предположить, что игнорируемость сохраняется по умолчанию, и он попадет в эту ловушку. (Это не безосновательные подозрения. Я позаимствовал идею для примера из статьи в «Юридическом журнале Гарвардского университета», где история была, по сути, такой же, как на рис. 53 и автор действительно использовал сопоставление.)
Вот как целесообразно использовать причинно-следственную диаграмму для проверки (условной) игнорируемости. Чтобы определить, является ли X игнорируемым относительно результата Y, обусловленного набором совпадающих переменных Z, нам надо лишь убедиться, что Z блокирует все обходные пути между X и Y и ни один член Z не является потомком X. Это так просто! В нашем примере предлагаемая совпадающая переменная (стаж) блокирует все лазейки (потому что их нет), но не проходит тест, так как является потомком образования. Следовательно, ED нельзя игнорировать, а EX нельзя использовать для сопоставления. Никакой сложной умственной гимнастики не требуется, достаточно взглянуть на схему. От исследователя вообще не требуется мысленно оценивать, насколько вероятен потенциальный результат того или иного лечения.
К сожалению, Рубин не рассматривает диаграммы причинности как средство, которое помогает сделать причинно-следственные выводы. Следовательно, те, кто последует его советам, не смогут проверить игнорируемость вот так. Им придется либо заняться сложной умственной гимнастикой, чтобы убедиться в верности допущения, либо просто принять его как «черный ящик». И действительно, видный исследователь потенциальных результатов Маршалл Джоффе писал в 2010 году, что допущения об игнорируемости обычно делают потому, что они оправдывают использование доступных статистических методов, а не потому, что искренне в них верят.
С прозрачностью тесно связано понятие проверяемости, которое неоднократно упоминалось в этой книге. Модель, представленная как диаграмма причинности, легко тестируется на совместимость с данными, тогда как модель, представленная на языке потенциальных результатов, лишена этой возможности. Проверка проходит так: всякий раз, когда все пути между X и Y на диаграмме блокируются набором узлов Z, в данных X и Y должны быть независимыми при условии Z. Это свойство d-сепарации, упомянутой в главе 7, которое позволяет нам отклонять модель всякий раз, когда независимость не проявляется в данных. Напротив, если одна и та же модель выражается на языке потенциальных результатов (т. е. в виде набора утверждений об игнорируемости), нам не хватает математического аппарата, чтобы выявить независимость, которую влечет за собой эта модель, и исследователям не удастся подвергнуть ее проверке. Трудно понять, как исследователям потенциальных результатов удавалось мириться с этим недостатком, не сопротивляясь. У меня есть единственное объяснение: их так долго держали в стороне от графических инструментов, что они забыли, что каузальные модели могут и должны быть проверены.
Теперь я должен применить те же стандарты прозрачности к себе и расказать немного больше о допущениях, воплощенных в структурной модели причинности.
Помните историю Авраама, которую я упоминал выше? Первой реакцией библейского героя на известие о неминуемом разрушении Содома были поиски зависимости «доза — реакция», или функции-ответа, связывающей порочность города с его наказанием. Это был здравый научный инстинкт, но, подозреваю, мало кто из нас был бы достаточно спокоен, чтобы отреагировать таким образом.
Функция-ответ — ключевая составляющая, которая позволяет СМП обрабатывать контрфактивы. Она подразумевается в парадигме потенциальных результатов у Рубина, но является основным отличием СМП от байесовских сетей, включая каузальные байесовские сети. В вероятностной байесовской сети стрелки к Y означают, что вероятность Y определяется таблицами условной вероятности для Y с учетом наблюдений за его родительскими переменными. То же верно и для каузальных байесовских сетей, только в таблицах условной вероятности указывается вероятность Y с учетом интервенций по родительским переменным. Обе модели определяют вероятности для Y, а не конкретное значение Y. В структурной модели причинности нет дополнительных таблиц вероятностей. Стрелки просто означают, что Y является функцией от своих родителей, так же как и экзогенная переменная UY:
Y = fY (X, A, B, C, …, UY) (8.4)
Таким образом, инстинкт Авраама был здравым. Чтобы превратить некаузальную байесовскую сеть в причинную модель, или, точнее, сделать ее способной отвечать на контрфактивные запросы, нам нужна взаимосвязь «доза — реакция» в каждом узле.
Я осознал это далеко не сразу. Еще не обратившись к контрфактивам, я очень долго пытался сформулировать модели причинности, используя таблицы условной вероятности. Одним из препятствий, с которым я столкнулся, были циклические модели, полностью устойчивые к формулировкам условной вероятности. Еще одним препятствием была необходимость придумать запись, позволяющую отличать вероятностные байесовские сети от причинных. В 1991 году меня внезапно осенило, что все трудности исчезнут, если сделать Y функцией от его родительских переменных и обозначить с помощью UY все неопределенности, касающиеся Y. В то время это казалось ересью по отношению к моему же учению. Посвятив несколько лет изучению причин вероятностей в искусственном интеллекте, я предлагал теперь сделать шаг назад и использовать невероятностную квазидетерминированную модель. Я до сих пор помню, как мой тогдашний студент Дэнни Гейгер недоверчиво спрашивал: «Детерминированные уравнения? Действительно детерминированные?» Как будто Стив Джобс только что велел ему купить PC вместо Mac. (Это был 1990 год!)
На первый взгляд, в этих уравнениях не было ничего революционного. Экономисты и социологи использовали такие модели с 1950–60-х годов и называли это моделированием структурных уравнений. Но это название сигнализирует о противоречиях и путанице, связанной с каузальной интерпретацией уравнений. Со временем экономисты упустили из виду тот факт, что первые разработчики этих моделей, Трюгве Ховельмо в экономике и Отис Дадли Дункан в социологии, хотели, чтобы они отображали причинно-следственные связи. Они начали путать структурные уравнения с линиями регрессии, тем самым отрывая суть от формы. Например, в 1988 году, когда Дэвид Фридман попросил 11 исследователей SEM объяснить, как применять интервенцию к модели структурного уравнения, ни один из них не смог этого сделать. Они рассказали, как оценить коэффициенты на основе данных, но не сумели растолковать, зачем это делать. Если интерпретация функции-ответа, которую я представил в период с 1990 по 1994 год, и внесла нечто новое, то это было всего лишь возвращением и оформлением изначальных намерений Ховельмо и Дункана. Я хотел представить их ученикам смелые выводы, которые вытекают из этих намерений, если относиться к ним серьезно.
Некоторые из этих выводов поразили бы даже Ховельмо и Дункана. Возьмем, к примеру, идею о том, что из каждого SEM, сколько угодно простого, можно вывести все контрфактивы, какие только получается вообразить среди переменных в модели. Наша способность вычислить потенциальную зарплату Элис, если бы она имела высшее образование, вытекала из этой идеи. Но даже сегодня современные экономисты все еще не усвоили эту идею.
Еще одно важное различие между SEM и SCM, помимо средней буквы, заключается в том, что взаимосвязь между причинами и следствиями в SCM не обязательно линейна. Методы, вытекающие из анализа SCM, действительны как для нелинейных, так и для линейных функций и как для дискретных, так и для непрерывных переменных.
У линейных SEM есть много преимуществ и много недостатков. С точки зрения методологии, они соблазнительно просты. Их легко оценить на основе наблюдений с помощью линейной регрессии, на что способны десятки статистических программ, которые сделают это за вас.
Однако линейные модели не способны представлять кривые «доза — эффект», которые не являются прямыми линиями. Они не в состоянии отражать пороговые эффекты, например, для лекарства, действие которого усиливается до определенной дозы, а потом прекращается. Они также не представляют взаимодействия между переменными. Так, линейная модель не опишет ситуацию, в которой одна переменная усиливает или подавляет эффект другой (предположим, образование может усилить эффект стажа, поскольку позволит получить работу с более быстрым карьерным продвижением и более высокими ежегодными прибавками).
Несмотря на то что споры о верных допущениях неизбежны, наша основная идея довольно проста: радуйтесь! Благодаря полностью определенной SCM, включающей диаграмму причинности и все стоящие за ней функции, мы способны ответить на любой контрфактивный вопрос. Даже с частичной SCM, где некоторые переменные скрыты или отношения «доза — эффект» неизвестны, мы все же можем во многих случаях ответить на поставленный вопрос. В следующих двух разделах приведены некоторые примеры.
Назад: Потенциальные результаты, структурные уравнения и алгоритмизация контрфактивных утверждений
Дальше: Контрфактивные суждения и закон