211 - Естественные эксперименты в истории - Коллектив авторов -- История - RutLib.com

Вот небольшой ликбез по этим широко распространенным статистическим методам. Если кратко, двумерная корреляция предполагает, что некие две переменные в своих показателях проявляют заметную связь друг с другом, однако рассматривает только две эти конкретные переменные. Кроме того, она не проверяет, действительно ли их взаимодействие представляет собой прямую причинно-следственную связь между двумя рассматриваемыми переменными, или, возможно, на самом деле оно опосредовано некоей третьей переменной. Например, владение автомобилем марки «роллс-ройс» ассоциируется с долгожительством, но не потому, что владение этой машиной непосредственно способствует долголетию, а из-за посреднического эффекта богатства: покупка «роллс-ройса» требует обеспеченности, которая предполагает качественное медицинское обслуживание и питание, а вот они-то на самом деле непосредственно способствуют долголетию. Многомерная регрессия стремится смягчить эти недостатки двумерной корреляции путем одновременной проверки на связь одной зависимой переменной (переменной, изменение которой требуется объяснить) с двумя или более независимыми переменными (переменными, которые могли бы объяснить это изменение), классификации этих связей по силе и отсева двумерных связей, которые оказываются слабыми или фактически опосредованными другой переменной. Многомерные модели-деревья помогают найти одну или несколько групп, состоящих из нескольких независимых переменных, действующих вместе на зависимую переменную, и классифицировать эти группы по силе. Анализ остатков рассматривает оставшиеся вариации (так называемые «остаточные») зависимой переменной, которые остаются необъясненными после некоего статистического анализа (например, после множественного регрессионного анализа). Затем исследователь пытается объяснить эти остаточные вариации и таким образом извлечь еще больше выводов, чем на первой стадии своего статистического анализа. В сущности, анализ остатков смотрит на «периферийные точки данных», иными словами, точки, значения которых по-прежнему выше или ниже, чем сумела объяснить первая стадия статистического анализа.