Что же такое корреляции, отражающие согласованность поведения?
Предположим, что Мишел и его коллеги правы в своей характеристике экспериментальных данных, т.е. что индивидуальные реакции отдельных людей на фиксированный набор ситуаций, выявляющих те или иные черты личности, коррелируют друг с другом на уровне, приблизительно равном заявленному Мишелем. Предположим также, что мы принимаем совет Эпштейна полагаться при предсказании поведения на агрегированные показатели в большей степени, чем на отдельные. Насколько тогда отличаются предсказания о людях, сделанные на основании знания об их поведении во множестве аналогичных ситуаций в прошлом, от предсказаний, которые мы сделали бы, не зная о них ничего? И насколько точны в среднем окажутся подобные предсказания, если проверять их на протяжении длительного периода?
Ответы на подобные вопросы могут быть связаны с рядом еще более фундаментальных проблем, которым ни психологи личности, ни их критики не уделяли до сих пор существенного внимания. Как будет выглядеть распределение реакций индивида, имевших место во множестве ситуаций, складывавшихся в мире, где люди демонстрируют уровень согласованности поведения, который готовы, кажется, признать и Мишел, и Эпштейн? К примеру, насколько часто «экстремальный» индивид будет проявлять экстремальное поведение, а насколько часто будет он производить впечатление вполне «среднего» человека? И наоборот, насколько часто «средний» человек будет производить впечатление «экстремального»?
Чтобы ответить на этот вопрос, позволим себе немного пофантазировать и предположим, что нам удалось полностью выполнить все многочисленные, чрезвычайно строгие требования и в нашем распоряжении имеются идеальные данные. Иными словами, предположим, что некто произвел оценку реакций очень большого числа людей в очень большом количестве ситуаций, каждая из которых была создана для выявления нужной нам черты личности (к примеру, дружелюбия, сознательности или честности). Предположим далее, что собранные в каждой ситуации простые (неагрегированные) данные о реакциях оказались коррелирующими с данными о реакциях в каждой из остальных ситуаций на уровне, дающем коэффициенты Пирсона (R), в точности равные 0,16, что, как показал наш предшествующий обзор литературы, представляет собой весьма щедрую оценку для большинства стандартных черт личности. Предположим, наконец, что все методологические требования, необходимые для того, чтобы извлечь полную выгоду из агрегирования показателей (в первую очередь независимость показателей, полученных в результате разных наблюдений), оказались каким-то образом удовлетворены и что, коль скоро мы предаемся фантазиям, все соответствующие показатели реакций распределяются в полном соответствии с законом нормального распределения, т.е. таким образом все необходимые расчетные формулы могут быть применены без дополнительных обоснований их применимости.
Теперь мы можем приступить, наконец, к исследованию того, что подразумевают собой отмеченные Мишелем низкие корреляции, а также более высокие корреляции, которые можно получить, если прислушаться к совету Эпштейна и извлечь все выгоды из агрегирования показателей. Прибегнув к некоторым стандартным формулам регрессии и агрегирования, и при некотором руководстве со стороны более искушенных, чем мы сами, статистиков мы выполнили необходимые вычисления (Ross, Griffin & Thomas, 1989). Результаты этих вычислений позволили нам лучше оценить как потенциальную ценность, так и ограничения — а в некотором отношении и сам смысл — уровней корреляции, характеризующих степень кросс-ситуативной согласованности поведения, соответствующего определенным личностным чертам. Начнем с изложения основных выводов, к которым мы, таким образом, пришли.
1. Оценивая великое множество реакций, соответствующих какой-либо черте личности каждого человека, мы можем получить надежную и точную оценку его усредненного поведения или, иными словами, так называемую «истинную оценку» («true score»). Соответственно мы можем предсказать с большой точностью усредненную реакцию, которую будет проявлять индивид на протяжении большого числа наблюдений в будущем. На самом же деле мы можем с точностью предсказывать также и полное распределение реакций данного индивида. Однако неопределенность, сопряженная с предсказанием данной конкретной реакции данного конкретного индивида, не может быть уменьшена сколько-нибудь существенно. Главное препятствие к этому — крайняя изменчивость индивидуального поведения, относящегося вроде бы к одной и той же черте личности (об этой изменчивости как раз и свидетельствует тот факт, что все корреляции, выявляющие степень согласованности соответствующих поведенческих реакций, находятся на уровне 0,16).
2. В нашей воображаемой выборке окажется, что хотя индивидуальные распределения реакций несколько отличаются друг от друга по своим центральным тенденциям, однако реакции каждого индивида будут колебаться в достаточно широких пределах. Причем все индивиды гораздо чаще будут проявлять реакции, близкие к среднему значению для совокупности в целом, чем реакции, которые можно было бы назвать экстремальными. (Если бы это было не так, то значения соответствующих корреляций — индикаторов поведенческой согласованности — были бы выше, чем 0,16.) В результате никакая степень агрегирования никогда не позволит нам предсказать, что даже самые общительные, импульсивные или сознательные субъекты, поведение которых мы наблюдали в ходе исследования, будут вести себя в любой конкретной ситуации так, чтобы это хоть сколько-нибудь напоминало крайнюю степень общительности, импульсивности или сознательности. И напротив, если кто-либо проявляет экстремальное поведение по какому-нибудь отдельному поводу, мы никогда не сможем сказать, что перед нами человек, чьи усредненные, или истинные, показатели поведения являются скорее экстремальными, чем средними.
3. Тем не менее знакомство с распределениями реакций и с усредненными показателями людей может сослужить нам хорошую службу в достижении определенного рода прогностической цели. Даже основываясь на столь низком значении корреляции отдельных реакций, как 0,16, мы будем в состоянии сделать некоторые предсказания об относительной вероятности проявления различными конкретными индивидами определенного рода экстремальных реакций. В самом деле, зная, что данный человек продемонстрировал экстремально «сильную» реакцию даже по одному единственному поводу, можно спокойно заключить, что его реакция по какому-либо другому поводу с гораздо большей вероятностью будет экстремально сильной, чем экстремально слабой. А знание о том, что усредненная реакция индивида в ходе множества наблюдений оказалась экстремальной, позволяет различиям относительной вероятности появления в будущем особо низких и особо высоких показателей достигать поистине впечатляющего уровня.
Предсказания, основанные на единичных наблюдениях
Приступим к более детальному рассмотрению нашего гипотетического исследования согласованности поведения, обратившись к типичному корреляционному полю (см. рис. 4.1,0), иллюстрирующему корреляцию между реакциями в двух различных ситуациях, относящихся к одной и той же черте личности, такой, как, например, экстраверсия. Эта корреляция равняется в нашем случае 0,16.
Рис. 4.1. Корреляционные поля, показывающие корреляцию, равную 0,16 (а), и корреляцию, равную 0,00 (б).
Данное корреляционное поле может изображать, например, взаимосвязь между показателями общительности учеников шестого класса некоей начальной школы, зафиксированными в один из дней во время обеда, и показателями общительности, зафиксированными несколькими днями позже на игровой площадке. Мы видим большую вариативность уровней экстравертированности, проявленной различными детьми в каждой из ситуаций, и слабую взаимосвязь между реакциями этих детей в первой и во второй ситуациях, с трудом отличимую, по крайней мере, при беглом просмотре от полного ее отсутствия (см. рис. 4.1,6).
Столь незначительная взаимосвязь, очевидно, означает, что знание о реакции, проявленной индивидом в одной из ситуаций, мало чем может нам помочь в предсказании реакции в другой подобной ситуации. Чтобы быть более точными, основываясь на традиционной формуле регрессии, можно сказать, что наилучшее при данных обстоятельствах предсказание сократило бы нашу среднюю, или «стандартную» ошибку прогнозирования на очень незначительную величину (всего около 1%).
Причина лежит на поверхности. Когда предсказываемые результаты, как в случае с показателями экстраверсии наших шестиклассников, чрезвычайно вариабельны, наилучший прогноз, который мы могли бы дать, основываясь на нашем знании об одной из предыдущих реакций, будет фактически во всех случаях соответствовать среднему для наших шестиклассников уровню экстравертированности. Иными словами, сделанные нами предсказания будут в целом похожи на те, что мы сделали бы, не зная ничего об экстравертированных проявлениях того или иного индивида в прошлом.
Рис. 4.2. Наиболее удачные предсказания последующей реакции (верхний график распределения), основанные на знании предшествующей реакции (нижний график распределения) для индивидов, показатели которых равны пяти различным процентным рангам (C).
Графически эта мысль отображена на рис. 4.2. Нижнее из двух распределений отражает наблюдения за поведением в отдельно взятом случае, к примеру уровень агрессивности, которую проявили 100 шестиклассников на детской площадке во вторник. Распределение представляет собой знакомую кривую в форме колокола, на которой частота вероятности отдельной реакции уменьшается, по мере того как рассматриваемая реакция становится все более экстремальной.
Выберем для рассмотрения пятерых детей: ребенка, проявляющего уровень агрессивности на два стандартных отклонения ниже средней величины (процентный ранг «2» означает, что меньшую агрессивность проявил только один ребенок из совокупности); ребенка, уровень агрессивности которого ниже средней на величину одного стандартного отклонения (процентный ранг «15» означает, что данный ребенок попадает приблизительно в нижнюю шестую или седьмую части распределения уровней агрессивности); ребенка, проявившего средний уровень агрессивности (процентный ранг «50»), и двух детей с уровнем агрессивности выше среднего на величину соответственно одного (процентный ранг «85») и двух (процентный ранг «98») стандартных отклонений. Верхний график распределения иллюстрирует наше самое удачное предсказание степени агрессивности, которую в соответствии с нашими ожиданиями те же самые шестиклассники, включая пятерых отобранных для особого рассмотрения, должны были проявить во время экскурсии в музее естественной истории.
Легко увидеть, что наиболее точный прогноз, который мы могли бы дать по каждому из детей, соответствует уровню агрессивности, близкому к среднему. Их действительные реакции будут, конечно же, весьма вариативны, но, принимая во внимание то, что коэффициент корреляции равняется всего 0,16, мы не сможем предсказать, кто из этих детей проявит экстремальную реакцию, а кто нет. Так что даже в случае с одним из двух детей, проявивших наибольшую агрессивность на детской площадке (предположим, это был Билли, который повалил Эллен и Джеймса наземь и крикнул: «Отвали!» — застенчивому Чарли), лучший прогноз будет заключаться в том, что Билли будет лишь немного агрессивнее «среднего» ребенка, возможно, он будет чуть более активно толкаться локтями, стоя в строю и достаточно громко ворчать по поводу скучной экспозиции, привлекая внимание кого-либо из учителей. И действительно, находясь в музее, он с гораздо меньшей вероятностью совершит что-либо в самом деле агрессивное (например, затеет драку), чем будет вести себя более спокойно по сравнению со средним одноклассником. Наоборот, и это не менее существенно, Джейн, которая сорвала с вешалки пальто другой девочки, чтобы повесить на нее свое, а затем понеслась по музею, производя достаточно много шума, чтобы быть призванной к порядку одним из учителей (попав, таким образом, в число двух детей, проявивших наибольшую агрессивность во время экскурсии), вряд ли оказалась бы среди детей, которые вели себя наиболее агрессивно на детской площадке. Уровень агрессивности, который она проявила в последнем случае, скорее всего, был бы немногим выше среднего.
Предсказания, основанные на множественных наблюдениях
Итак, в чем же состоят преимущества агрегирования? Предположим, что мы классифицировали детей на основании не одного, а 50, 100 или даже бесконечно большого числа наблюдений. Можно с уверенностью сказать, что мы были бы в состоянии очень точно предсказать средний уровень застенчивости, агрессивности и подобных им личностных характеристик, которые каждый ребенок обнаруживал бы в ходе множества дальнейших наблюдений. В самом деле, нам удалось бы точно спрогнозировать распределение реакций каждого ребенка в целом, т.е. мы смогли бы с уверенностью предсказать, что распределение реакций каждого ребенка в будущем будет близко напоминать распределение его же реакций в прошлом. Однако при этом нам не удалось бы существенно снизить нашу неопределенность в отношении поведения конкретного ребенка в конкретной единичной ситуации.
В частности, если бы нам был известен усредненный, или «истинный», показатель агрессивности того или иного ребенка, вычисленный на основании данных, полученных за продолжительный период, исходя из которого мы бы строили свои прогнозы в отношении данного индивида, то это позволило бы нам сократить среднюю разницу между нашими предсказаниями и данными реальных последующих наблюдений приблизительно лишь на 8%, т.е. наша средняя ошибка будет в этом случае на 8% меньше, чем если бы мы просто предположили, что поведение каждого ребенка в каждой ситуации будет соответствовать среднему показателю для всего класса.
Чтобы понять, почему ошибка уменьшится на столь скромную величину, необходимо вспомнить, что поведение детей на протяжении достаточно длительного периода будет очень изменчивым и индивидуальные средние показатели детей будут фактически близки к средним показателям для выборки в целом. (Чтобы этого не произошло, имеющаяся у нас кросс-ситуативная корреляция должна быть выше 0,16.) Соответственно этому наилучшие догадки, которые мы можем построить относительно реакций отдельных детей, все равно будут близки к среднему для выборки значению. Но поскольку действительное распределение реакций каждого ребенка в различных ситуациях весьма вариативно, даже эти наши лучшие из возможных предположений будут часто далекими от реальности.
Рис. 4.3. Распределение индивидуальных реакций для 21 испытуемого, каждый из которых имеет отличный от других процентный ранг в пределах выборки. Индивидуальные средние показатели отмечены полыми кружочками. Показатели, отстоящие от средних показателей для каждого испытуемого на величину в одно или два стандартных отклонения (как вверх, так и вниз), отмечены закрашенными кружочками. Особо выделены распределения для индивидов, имеющих соответственно процентные ранги «2», «15», «50», «85» и «98», причем каждый пятый процентный ранг в этих распределениях отмечен поперечной черточкой.
На рис. 4.3 показаны распределения реакций отдельных детей, имеющих в данной выборке различные процентные ранги. Здесь мы опять уделяем особое внимание пятерым детям из нашего гипотетического исследования, чьи средние оценки имеют в пределах выборки соответственно следующие процентные ранги: «2», «15», «50», «85» и «98». Уже после беглого взгляда на рисунок становится ясно, что даже самые «экстремальные» дети демонстрируют явно среднее поведение гораздо чаще, чем экстремальное, и даже наиболее «средние» дети проявляют иногда поведение, близкое к экстремальному. Короче говоря, когда соответствующие корреляции, измеряющие кросс-ситуативную согласованность поведения, составляют 0,16, подавляющее большинство детей демонстрируют весьма сходные и заурядные распределения реакций — распределения, после ознакомления с которыми к этим детям уже нельзя без колебаний применять такие эпитеты, как «застенчивый», «агрессивный» или даже «средний», не делая при этом оговорок относительно вариативности поведения.
Можно с уверенностью сказать, что порядок ранжирования средних показателей детей, которые они имели в прошлом, сохранится и в дальнейшем при условии, что число наблюдений за их поведением, сделанных в прошлом, равно как и число наблюдений, планируемых в будущем, будет достаточно велико, и, конечно, при условии, что личностные диспозиции детей за это время не изменятся. Таким образом, как и утверждал Эпштейн, корреляция между высоко агрегированными данными будет высокой. Но проблема состоит в том, что разница между средними показателями поведения детей в новых ситуациях, равно как и разница между их средними показателями в предшествующих ситуациях, будет сравнительно невелика, а наблюдаемая внутрииндивидуальная вариация вокруг этих средних показателей будет продолжать оставаться сравнительно большой. Закон больших чисел — мощнейший принцип, однако и он не в состоянии выжать воду из камня, т.е. в нашем случае — внести определенность в агрегированную совокупность, поведением каждого элемента которой руководит изменчивость.
Относительная вероятность случаев экстремального поведения
Независимо от уровня агрегирования вариативность поведения людей, кросс-ситуативная согласованность которого характеризуется корреляцией, равной 0,16, ограничивает пределы возможного снижения степени неопределенности предсказания поведения. Тем не менее корреляция даже такого уровня может оказаться весьма полезной для решения одного из типов прогностических задач, который часто возникает в повседневном социальном взаимодействии. Эта задача подразумевает выявление людей, которые с относительно большей или меньшей вероятностью, чем их товарищи, демонстрируют экстремальное поведение.
Очевидно, что подобного рода предсказания очень важны для решения множества проблем, связанных с «отбором» или «отсевом», когда нашей главной заботой является максимизация вероятности некоего крайне желательного, либо минимизация вероятности какого-либо крайне нежелательного результата или реакции.
Здесь мы вновь прибегнем к помощи кое-каких расчетов. Представьте себе Тома, Дика и Гарри — трех участников гипотетического исследования, наподобие только что разобранного, но посвященного на сей раз изучению экстравертированности взрослых людей. Предположим, что в одном произвольно выбранном случае показатель Тома оказался ниже среднего значения на величину двух стандартных отклонений, что соответствует приблизительно процентному рангу «2» (например, в то время как другие веселились на устроенной прямо в офисе вечеринке, он удалился в библиотеку и стал изучать там компьютерные журналы). Предположим также, что показатель Гарри оказался на два стандартных отклонения выше среднего значения, что соответствует процентному рангу «98» (к примеру, на той же вечеринке его видели надевающим на голову абажур от лампы и декламирующим непристойные стихи).
Имея в распоряжении только эти две «порции» информации, мы можем сформировать два резко отличных друг от друга суждения о дальнейшем поведении двух упомянутых людей. В частности, основываясь на этой информации, мы уже можем сказать, что при следующей нашей встрече Гарри может совершить что-либо действительно «экстравертированное» (будучи в верхних 2%) с вероятностью, примерно в пять раз более высокой, чем Том (вероятность подобного поведения составляет для них соответственно 4,5 и 0,9%). Вероятность того, что Гарри продемонстрирует экстравертированную реакцию скорее, чем любой произвольно выбранный нами человек или чем Дик, уровень экстравертированности которого является (согласно предыдущим наблюдениям) вполне средним, будет выше в два раза. Наоборот, при следующем наблюдении их поведения Том может совершить что-либо по-настоящему интровертированное (соответствующее нижним 2%) с вероятностью приблизительно в пять раз большей, чем Гарри, и более чем в два раза большей, чем Дик.
Рискуя охладить возродившийся при наших словах энтузиазм закоренелых диспозиционистов, мы должны сразу же отметить, что в абсолютных числах экстремально экстравертированные формы поведения остаются невероятными для всех троих (т.е. их вероятность составляет 4% для Гарри, 2% для Дика и менее 1% для Тома). Более того, вероятность, что экстраверт Гарри и интроверт Том будут проявлять реакции, ранг которых в точности соответствует среднему для данной выборки, будет в четыре раза выше, чем вероятность того, что они проявят себя в поведении, заслуживающем процентного ранга «98» (в случае Гарри) или процентного ранга «2» (в случае Тома).
Однако факт остается фактом: если наша задача состоит в том, чтобы, например, при отборе персонала минимизировать или максимизировать вероятность того, что отобранные индивиды будут проявлять определенного рода экстремальные реакции либо стремиться достичь определенного рода экстремального результата, то данные о наблюдавшемся с их стороны экстремальном поведении (даже единичном) могут обладать для нас практической ценностью.
Конечно, все эти различия в относительной вероятности становятся заметнее, когда для оценки нам удается воспользоваться агрегированными данными. Если предшествующие десять наблюдений дают основание присвоить Гарри, Дику и Тому соответственно процентные ранги «98», «50» и «2», то мы можем предположить, что для Гарри вероятность того, что в ходе следующего наблюдения он попадет по показателям экстраверсии в верхние 2% выборки, примерно в 35 раз превышает соответствующую вероятность для Тома и приблизительно в пять раз — для Дика.
Более того, если мы агрегируем достаточное число предшествующих наблюдений, чтобы устранить всю неопределенность в отношении внутрииндивидуальных распределений реакций всех троих, и обнаружим в результате те же самые процентные ранги, то вышеупомянутые соотношения будут еще более впечатляющими. Гарри сможет предстать перед нами исполнителем непристойных стишков с абажуром на голове с вероятностью в 100 раз более высокой, чем Том. И наоборот, вероятность того, что Том удалится для чтения компьютерных журналов будет в 100 раз выше, чем вероятность того, что Гарри сделает то же самое. Вероятность соответствующей поведенческой крайности будет в шесть раз выше для каждого из них, чем для «среднего» Дика.
Произведя еще некоторые вычисления, мы сможем определить, насколько велика вероятность того, что мы станем свидетелями нескольких проявлений экстремального поведения, исходящего от соответствующих людей, в зависимости от числа предшествующих наблюдений (см. рис. 4.4) Мы обнаружим, например, что если экстраверт Гарри и интроверт Том приобрели свою репутацию (вместе со своими процентными рангами соответственно «98» и «2») на основании единичного наблюдения, вероятность того, что в ходе следующих десяти наблюдений они будут вести себя так, что это позволит им хотя бы один раз быть отнесенными к верхним 2% выборки, составит 34% для Гарри и только 8% для Тома. Если же их репутация была заработана в результате десяти предыдущих наблюдений, то вероятность подобного события для Гарри возрастет до 52% и упадет до 2% для Тома. Если же они приобрели свои репутации (соответственно экстраверта и интроверта) в ходе очень большого или даже бесконечно большого числа предшествующих наблюдений, то вероятности, о которых идет речь, достигнут соответственно 60% и менее чем 1%.
Рис. 4.4. Вероятность того, что испытуемый получит в пределах выборки процентный ранг не ниже «98» (согласно свойствам по крайней мере одной из десяти последующих реакций и, исходя из его предшествующего ранга, основанного на различном числе наблюдений).
Короче говоря, при небольшом числе наблюдений за будущими поведенческими реакциями мы вполне можем увидеть Гарри (но практически наверняка не увидим Тома), совершающего какой-либо по-настоящему экстравертированный поступок.
Рассмотренные нами уровни экстремальности и вероятности выглядят таким образом, что почти наверняка обычный человек в состоянии их уловить. И может статься, что обыденная терминология личностных черт часто в меньшей мере основывается на представлении о «средних показателях» за длительный период, чем на идее об относительных вероятностях определенных экстремальных поведенческих проявлений, имеющих или не имеющих место на протяжении разумного периода или в ходе разумного числа наблюдений.
Природа обыденных представлений об индивидуальных различиях и пределах предсказуемости поведения будет более подробно исследована нами в следующей главе. В ней мы также рассмотрим обыденные мнения по поводу центральной темы данной книги — об относительном влиянии личностных и ситуационных факторов на человеческое поведение.