Научные открытия и дискуссии
Учитывая «очевидность» личностных различий между людьми, искушенность исследователей и огромное количество томов, содержащих описания выполненных экспериментов, обычный человек может резонно ожидать или даже опасаться того, что технология оценки личностных качеств и предсказания поведения доведена до высокой степени совершенства. Это означает, что существуют инструменты и формулы, позволяющие с высокой точностью предсказывать поведение конкретных людей в конкретных ситуациях.
Однако множество имеющихся фактов демонстрирует ложность любого из подобных ожиданий. Говоря конкретнее, исследователям удалось показать существование статистически значимых корреляций между поведением, измеренным в одной ситуации, и поведением, измеренным в другой ситуации. Им удалось также показать, что любого рода шкалы оценки личностных качеств дают статистически значимые корреляции как с другими оценочными инструментами, так и с объективно фиксируемыми показателями поведения.
Проблемой, а впоследствии и вызовом для психологов личности стал лишь вопрос о масштабности эффекта, или — более конкретно — вопрос о расхождении между наблюдаемыми уровнями кросс-ситуативной согласованности поведения и тем ее уровнем, которого можно было бы ожидать, исходя из широко распространенных диспозиционистских теорий. В самом деле, хотя соответствующие уровни корреляций и были значительно выше нуля, подтверждая тем самым, что личностные переменные действительно отвечают за некоторую долю изменчивости наблюдаемого поведения, они оказывались все же достаточно низкими, чтобы согласованность и предсказуемость поведения выглядели менее впечатляющими и информативными, чем несогласованность и непредсказуемость.
Полувековая история исследований так и не дала нам «классических» диспозиционистских образцов, которые можно было бы «на равных» противопоставить результатам экспериментов Эша на конформность, экспериментов Милгрэма на послушание, экспериментов Фридмена и Фрейзера, основанных на феномене «нога в двери», или даже «полевого» Беннингтонского исследования социального влияния, предпринятого Ньюкомбом. Иными словами, на сегодняшний день не существует сколь-нибудь известных исследований, в которых устойчивые личностные свойства — оцененные экспериментатором либо выявленные на основе данных о предшествующем поведении — проявили бы себя в качестве инструментов предсказания лучше, чем ожидали бы от них сами ученые или даже обычные люди. Не существует также и исследований, демонстрирующих, что кажущиеся малыми и незаметными индивидуальные различия (оцененные личностными вопросниками или любыми другими способами) порождают большие и надежные различия в наблюдаемом социальном поведении. Напротив, как мы покажем далее, существующая литература по предсказуемости и согласованности поведения дает больше доводов в руки критиков традиционной теории личности, чем ее сторонников.
Вызов 1968 года
Мощным потоком исследований в области психологии личности ознаменовался 1968 г. Именно в этом году Уолтер Мишел (W. Mischel) и Дональд Питерсон (D. Peterson) в двух независимых друг от друга обзорах литературы отметили, что предсказуемость индивидуальных реакций в конкретных ситуациях крайне низка, т.е. в действительности настолько низка, что этого было бы достаточно, чтобы подвергнуть сомнению наиболее основополагающие предположения о согласованности поведения, разделяемые как обычными людьми, так и психологами личности.
Работа Мишела (Mischel, 1968), посвященная личностной психодиагностике, до самого основания потрясла здание психологии личности. Несмотря на то, что первоначальной целью автора было простое обобщение некоторых, хорошо известных большинству исследователей фактов, потрясения, вызванные его работой, продолжают сказываться и по сей день.
Возможно, наиболее важным из этих фактов было то, что средний уровень корреляции между различными поведенческими показателями, которые были специально созданы для выявления одной и той же личностной черты (такой, как импульсивность, честность, зависимость и т.п.), находился обычно в пределах между 0,10 и 0,20, а зачастую оказывался даже ниже. В терминах процентных сравнений, использованных нами для оценки масштабности эффектов, это означает, что знание о том, каким образом вел себя некто в ситуации № 1, почти не увеличивает точность нашего предсказания того, как он поведет себя в ситуации № 2. То, что корреляция между значениями дружелюбия, проявленного в любых двух ситуациях, составляет, скажем, 0,16, означает, что знание о том, что в ситуации № 1 Джейн была более дружелюбной, чем Эллен, повышает вероятность проявления ею большего дружелюбия и в ситуации № 2 лишь до 55% (тогда как ожидаемая вероятность ее большего дружелюбия в ситуации № 2 в случае нашего полного неведения о ситуации № 1 равнялась бы, разумеется, 50%). Более того, корреляция между показателями различных оценочных шкал, созданных для измерения определенных черт личности, и поведением в отдельных ситуациях, в которых эти черты предположительно должны проявляться, редко выходит за пределы интервала 0,20-0,30. По сути, ни один из коэффициентов корреляции как между отдельными поведенческими реакциями, так и между индексом какой-либо черты личности по оценочной шкале и отдельным поведенческим проявлениям этой черты не преодолевает «барьера» в 0,30.
Реакция Мишела на обескураживающе низкие корреляции между объективными поведенческими показателями была совершенно новаторской. В отличие от предыдущих комментаторов он не стал пытаться объяснять факт низких корреляций методологическими погрешностями, а предложил рассмотреть возможность того, что подобные низкие корреляции могут отражать некую важную истину о человеческом поведении (т.е. то, что кросс-ситуативная согласованность поведения может являться исключением, а специфичность поведения — правилом). Он заставил нас считаться с тем фактом, что объективные данные о поведении не могут служить оправданием ни нашей склонности навешивать готовые ярлычки личностных черт, ни нашим исходным посылкам о согласованности поведения, на которые мы при этом опираемся.
При этом Мишел четко поставил две задачи. Первая состояла в том, чтобы определить, какие перцептивные, когнитивные и мотивационные факторы могут заставлять нас «усматривать» высокую согласованность и предсказуемость поведения там, где она почти или полностью отсутствует. Вторая задача заключалась в том, чтобы по-новому понять детерминанты реакции людей на свое социальное окружение. Мишел настаивал на необходимости объяснения как повторяющихся, так и специфических реакций не в терминах личностных черт, а в терминах когнитивный компетентности, стратегий обработки информации, личных целей, субъективных ожиданий и других факторов «социального научения» (Mischel, 1973; см. также Cantor & Kihistrom, 1987).
Далее мы перейдем к описанию резонанса, вызванного работой Мишела, и попытаемся ответить на различные поставленные им вопросы. Однако для начала было бы полезно остановиться на исследованиях, приводимых Мишелем в качестве свидетельства наличия низкой кросс-ситуативной согласованности поведения. После этого читатель сам сможет в полной мере оценить проблему, которую эти исследования поставили перед современными психологами личности. Она существует и по сей день. Причем с нею сталкиваются не только теоретики личности, но и обычные люди, настаивающие на том, что их собственные повседневные впечатления о согласованности и предсказуемости поведения представляют собой нечто большее, чем когнитивные или перцептивные иллюзии.
Эмпирические исследования кросс-ситуативной согласованности поведения
Ньюкомб и согласованность экстраверсии. В 1929 г. Теодор Ньюкомб (Newcomb, 1929) опубликовал результаты обследования «проблемных» мальчиков-подростков в летнем лагере. Целью Ньюкомба было изучение данных о личностных чертах или диспозициях, подпадающих под общее понятие экстраверсии. Перечень этих характеристик включал в себя разговорчивость, желание быть в центре внимания, энергичность, стремление к превосходству, интерес к социальному окружению, импульсивность, уверенное поведение в группе, отвлекаемость и выражение предпочтения групповым, а не индивидуальным занятиям.
В целях исследования вопроса о согласованности поведения Ньюкомб определил широкий круг поведенческих проявлений, обычно имеющих место в летнем лагере, которые могли бы свидетельствовать в пользу той или иной из вышеупомянутых черт. Эти проявления выбирались им так же, как это и сегодня стал бы делать любой нормальный человек или психолог личности. Разговорчивость, например, он определил в терминах следующих поведенческих проявлений: «любит поговорить о прошлом или о совершенных им ранее подвигах», «громко и спонтанно изъявляет восторг или неодобрение», «сводит беседу с консультантами к вопросам и ответам», «проводит тихий час в одиночестве или в обществе других», «много ли говорит за едой».
Эти проявления ежедневно заносились консультантами, закрепленными за каждым из мальчиков, в детально разработанные отчеты. Консультант должен был, например, указать, игнорировал ли мальчик общество товарищей во время тихого часа, разговаривал ли вполголоса, не жестикулируя, или же громко болтал и смеялся. В отношении каждого приема пищи консультант должен был указать, какую процентную долю отведенного на еду времени провел его подопечный за разговорами.
Ньюкомб вывел средние значения на основании записей, фиксирующих то или иное поведение по нечетным дням и вычислил их корреляцию со средними значениями по четным дням. Так, например, связь между разговорчивостью во время тихого часа с разговорчивостью во время еды определялась не на основании корреляции между показателями в единичных случаях, а на основании корреляции между средним показателем за 24 тихих часа и средним показателем за 72 приема пищи (т.е. 24 × 3). Как мы более подробно разъясним в дальнейшем, от подобного «агрегирования» реакций можно ожидать более высокой корреляции, чем в случае с единичными наблюдениями, так как среднее значение показателей 24 наблюдений является более устойчивым и надежным, чем значение, полученное в ходе одного наблюдения, и потому соответствующая корреляция не снижается за счет ошибок измерения.
Однако несмотря на это, обнаруженное Ньюкомбом среднее значение корреляции между любыми двумя показателями поведения, служившими для выявления соответствующих характеристик личности, составило лишь 0,14 — значение, которое обычный человек, использующий типичную схему выявления ковариации, с большим трудом мог бы отличить от полного отсутствия всякой взаимосвязи (Jennings, Amabile & Ross, 1982).
Исследование Ньюкомба имеет одну особенность, за которую мог бы ухватиться любой критик в попытке опровергнуть его основную находку. Испытуемые Ньюкомба были детьми, чьи личные проблемы были выражены достаточно ярко, для того чтобы существовала необходимость отправить их в летний лагерь, созданный специально для тех, кто имеет проблемы в сфере межличностного общения. Их едва ли можно было считать типичной выборкой. В сущности, Ньюкомб и сам отмечал, что нетипичность испытуемых влекла за собой по большей части экстремальные поведенческие проявления экстраверсии и интроверсии (а именно агрессию и крайнюю застенчивость).
Тем не менее его ответ потенциальным критикам был очень прост. Поскольку между его испытуемыми различие в реакциях должно было быть более значительным, чем у мальчиков их возраста вообще, то логичным результатом являлись бы корреляции, более высокие, а не более низкие в сравнении с теми, которые можно было бы обнаружить, обследуя специально не отобранных, «нормальных» мальчиков.
Однако нам нет никакой необходимости настаивать на защите результатов Ньюкомба, поскольку и другие исследования кросс-ситуативной согласованности поведения, проводившиеся на более репрезентативных выборках испытуемых, дали в целом те же результаты. Реакции испытуемых в ситуациях, специально подобранных для выявления определенных личностных черт, неизменно давали весьма мало оснований для предсказания реакций тех же испытуемых в других ситуациях, созданных для выявления таких же самых черт.
Хартшорн, Мэй и согласованность проявлений честности. Результаты первого в истории и вместе с тем наиболее амбициозного исследования согласованности поведения были опубликованы фактически за год до эксперимента Ньюкомба. В 1928 г. Хартшорн и Мэй (Hartshorne & May, 1928) исследовали честность учеников начальной и средней школ в ряде разнообразных учебных и внеклассных ситуаций. Использованные ими поведенческие показатели включали склонность учеников к краже мелочи, оставленной на столе в классной комнате, склонность ко лжи с целью выгородить товарища и склонность к жульничеству — исправлению оценок за контрольную работу, когда уличить их было невозможно. Кроме того, многие из исследованных учеными поведенческих проявлений изучались ими не по одному разу. К примеру, они исследовали склонность детей к жульничеству в ходе нескольких аналогичных контрольных работ.
Таким образом, как и в исследовании Ньюкомба, когда ученые оценивали корреляцию между разного рода поведенческими проявлениями, многие из включенных ими в расчет показателей представляли собой средние значения данных о нескольких случаях проявления того или иного поведения. И хотя подобное агрегирование показателей должно было бы обеспечить уровень корреляции более высокий, чем тот, которого можно было бы ожидать при рассмотрении отдельных поведенческих проявлений, полученная исследователями средняя величина корреляции между любыми двумя видами честного поведения не превысила 0,23.
Исследования согласованности поведения: 1929-1968 гг. Исследования, проведенные Ньюкомбом, Хартшорном и Мэем, были очень дорогостоящими и требовали много времени, поэтому в течение трех десятилетий не предпринималось серьезных попыток повторить или развить их. Однако лишь немногие психологи личности были готовы допустить, что предсказуемость поведения в одной конкретной ситуации и в другой может быть такой низкой, как это предвидели упомянутые классики эмпирических исследований. Вместо этого они предпочитали игнорировать более ранние исследования и обращаться к другой, весьма необычной исследовательской стратегии, не предпринимая даже попыток показать, что при условии устранения предполагаемых методологических несовершенств могли быть получены иные результаты. Оставив в стороне объективные показатели поведения, они сосредоточились на методах субъективной самооценки и взаимной оценки, производимых с помощью «бумаги и карандаша». Например, людей спрашивали, насколько дружелюбно настроенными они были при разного рода обстоятельствах («на вечеринке» или «в кругу товарищей по работе»), насколько они ощущали себя уверенными или чувствовали ответственность в разных ситуациях.
Когда вопросники, включавшие в себя множество разного рода самооценочных пунктов, становились предметом статистического анализа, низкая корреляция начинала представляться чем-то нереальным, возникшим из туманного прошлого. Корреляция между четными и нечетными пунктами тестов, между альтернативными вариантами одних и тех же тестов и даже между разными тестами, призванными выявить одну и ту же личностную характеристику, была высока. Корреляция, отражающая «устойчивость» самоописаний на протяжении продолжительных периодов (Block, 1971; Conley, 1984) также была высокой. Корреляция в диапазоне от 0,60 до 0,80 стала обычным делом, а показатели надежности методик возросли даже до 0,90. Корреляции между разными личностными чертами (по крайней мере зафиксированными при помощи вопросников) также могли быть достаточно высокими. Появились даже предположения, что подобные корреляции, проанализированные при помощи изощренных методов факторного анализа, начинают наконец-то служить отражением структуры личности.
Определенные успехи были достигнуты и при использовании анкетных методик, участники которых оценивали личностные качества друг друга. Оценки, даваемые одним и тем же «судьей» конкретному человеку, действовавшему в разных ситуациях, обнаруживали согласованность, а повторные измерения, производившиеся через сравнительно продолжительное время, демонстрировали устойчивость этих оценок.
Однако некоторые проблемы оставались все же нерешенными. Корреляция, отражающая уровень согласия между различными судьями, оценивающими одного и того же человека, была не слишком высокой. Несмотря на то что коэффициенты корреляции иногда достигали 0,50, более типичными были гораздо меньшие значения корреляции (см. Кеппу, 1991). В классическом исследовании Норма-на и Гольдберга (Norman & Goldberg, 1966) корреляция между оценками, которые члены студенческого братства, знавшие друг друга на протяжении нескольких лет, давали своему товарищу, составила по большинству исследуемых личностных черт около 0,20. Более того, корреляция между оценками любых двух людей, характеризовавших какого-либо человека, которого они никогда не встречали ранее, показанного им лишь однажды в целях эксперимента, была ненамного ниже, составляя в среднем 0,13. Наконец, корреляция между оценками, даваемыми человеку близкими знакомыми, и его самооценками редко превышала 0,50, а чаще находилась в районе 0,30 (Bem & Alien, 1974; Chaplin & Goldberg, 1985; Kenrick & Funder, 1988; Mischel & Peake, 1982a).
Короче говоря, субъективные оценки, основанные на анкетировании, давали более высокую корреляцию, чем объективные поведенческие исследования. Однако неизменно высокие корреляции были обнаружены лишь в исследованиях, которые рассматривали согласованность или устойчивость самовосприятий, или устойчивость при восприятии данной личности каким-либо оценивающим ее человеком.
Вместе с тем сторонники вербальных методов оказались перед лицом проблемы, гораздо более серьезной, чем скромное согласие между разными оценщиками, — проблемы достоверности. Достаточно сказать, что сколь бы ни была высока надежность оценок, даваемых одним и тем же «судьей» (ни даже сколь бы высоко ни было согласие между разными «судьями»), это вовсе не доказывает, что причина согласованности заключается именно в поведении оцениваемого. Оценивающий субъект может упорно придерживаться убеждений или стереотипов, не подкрепляемых объективной информацией о реакциях наблюдаемого объекта, а подкрепляемых лишь интерпретацией этой информации в свете его собственных предубеждений. Вы можете решить о себе, что вы застенчивы, чувствительны и добросовестны, но кто сможет подтвердить, что вы правы? Аналогичным образом два разных оценивающих субъекта (либо оценивающий субъект и сам оцениваемый) могут прийти к согласию относительно объективно необоснованных оценок при условии, что они будут руководствоваться одинаковыми имплицитными (подразумеваемыми) теориями личности, стереотипами или местными предрассудками (например: «люди, носящие очки, умны», или «коротышки агрессивны», или «все Ван Орманды заносчивы»).
Тем не менее простота вербальных методик и часто выявляемые с их помощью высокие корреляции не пробуждали у ученых особой склонности заново возвращаться к стоящему больших усилий и неблагодарному поиску объективной согласованности поведения.
Роберт Сирз и согласованность зависимости. Следующее достаточно амбициозное исследование объективной согласованности поведения было предпринято лишь в 1963 г. Это было исследование Роберта Сирза (Robert Sears, 1963), посвященное зависимости, проявляющейся у детей, посещающих детский сад. Зависимость у детей младшего возраста представляет собой очень привлекательный объект для исследования. Причина состоит в том, что дети делают много таких вещей, которые каждый посчитал бы проявлением зависимости, и эти действия детей можно очень легко зарегистрировать объективно.
Сирз исследовал такие поведенческие показатели, как прикосновение к воспитателю или удерживание его или других детей, частота требований поддержки и частота поиска внимания. Он измерял зависимость детей от своих товарищей, воспитателей и матерей как в детском саду, так и в лабораторных условиях. Как и в более ранних исследованиях, показатели Сирза представляли собой не результаты единичных наблюдений в единичных ситуациях, а средние показатели, рассчитанные на основании многих наблюдений.
Вопреки этому статистически благоприятному обстоятельству, средняя корреляция между отдельными видами зависимого поведения составила лишь 0,11 — показатель, несомненно, слишком низкий, чтобы служить оправданием интуитивной уверенности обычных людей или соответствовать требованиям традиционной теории личности.
Последствия эмпирического вызова
Спустя всего пять лет после исследования Сирза Мишел и Питерсон предприняли атаку на общепринятые положения о согласованности личностных проявлений. В сущности, то, что сделали эти два теоретика, представляло собой «расчистку бурелома», образовавшегося в результате шквала исследований, в которых ученые полагались исключительно на согласованность субъективных оценок. Они также переключили внимание на те немногие эксперименты, в которых были использованы объективные поведенческие показатели.
Отдавая предпочтение этим объективным показателям, Мишел и Питерсон привели ряд очевидных возражений против использования фактов надежности субъективных оценок в качестве средства для демонстрации существования согласованных индивидуальных различий между людьми и, тем более, для определения масштабов этой согласованности. Они настаивали на том, что несмотря на то что согласие между разными измерениями и их устойчивость во времени представляют собой интересные, достойные изучения феномены, однако эти феномены не доказывают достоверность соответствующих понятий о личностных чертах.
Они также обобщили существовавшую в то время литературу о тенденциозностях человека при обработке информации и о других недостатках умозаключений, которые могут заставить усомниться в достоверности социального восприятия и даже самовосприятия. Речь шла прежде всего о склонности полагаться на стереотипы, основанные на внешнем виде, социальной роли или репутации человека.
Более того, в последующие два десятилетия обрушилась буквально лавина исследований, посвященных разным видам тенденциозности социального восприятия и социального познания, которые обеспечили еще более солидное основание для критики (Dawes, 1988; Fiske & Taylor, 1990; Kahneman, Slovic & Tversky, 1982; Nisbett & Ross, 1980; Taylor & Fiske, 1978). Многие из продемонстрированных в ходе этих исследований тенденциозностей были именно таковы, что вполне могли бы служить причиной возникновения иллюзии согласованности. Например, проблема значительных искажений памяти на «факты» под влиянием разного рода предрассудков пользовалась в 70-е и 80-е годы огромной популярностью среди авторов многочисленных исследовательских работ.
Важно отметить, что Мишел вовсе не утверждал, что отсутствие согласованности поведения в различных ситуациях служит доказательством отсутствия измеримых или предсказуемых индивидуальных различий. Напротив, он подчеркивал, что отдельный субъект в одних и тех же ситуациях может демонстрировать очень согласованные реакции, другими словами, что конкретная реакция на конкретную ситуацию может быть очень устойчива во времени.
В сущности, это вполне ясно и из результатов некоторых классических исследований. Коэффициенты устойчивости — корреляция между двумя значениями одного и того же показателя поведения, зафиксированными в двух разных случаях, зачастую превышают 0,40, достигая иногда и гораздо более высоких уровней. Хартшорн и Мэй (Hartshorne & May, 1928) обнаружили, например, что уровень корреляции между склонностью списывать с готовых ответов при заполнении теста на общую эрудицию в одном из случаев и аналогичной склонностью при заполнении теста полгода спустя составил 0,79. Ньюкомб (Newcomb, 1929) обнаружил, что склонность поболтать за обедом также является очень устойчивым личностным атрибутом, но его корреляция с показателем разговорчивости по другим поводам не была настолько высокой (Buss & Craik, 1984). Мишел настаивал на том, что значительные различия между людьми, видимо, ограничены их отдельными реакциями на отдельные ситуации — такими, например, как дружелюбное поведение в столовой или готовность идти на конфронтацию со своим работодателем, что никак не свидетельствует о всеобъемлющей, кросс-ситуативной экстравертированности или напористости.
Атаки Мишела на устои психологии личности не ограничились утверждением, что кросс-ситуативная согласованность поведения отсутствует. Он добавил психологам личности еще больше беспокойства, заявив, что корреляция между оценками черт личности по стандартным вербальным шкалам и объективными поведенческими проявлениями также очень низка. Отдельные виды поведения редко давали с этими шкалами корреляцию, уровень которой превышал бы 0,30, в типичных же случаях эти корреляции были ниже. Затем он пошел еще дальше, указывая на то, что в предсказании действительных поведенческих реакций оценки черт личности, полученные с помощью косвенных и тонких проективных методов психодиагностики, редко позволяют добиться более значительного успеха, чем простые самоотчеты (в целом же их применение бывает гораздо менее успешным, чем использование самоотчетов).
Наконец, возможно, наиболее стимулирующим к размышлению фактом является демонстрация Мишелем того, что готовность или способность человека «откладывать вознаграждение» (черта, милая сердцу психоаналитически ориентированных психологов личности) может зависеть не столько от диспозиций человека, сколько от особенностей конкретной ситуации.
Так, например, вопрос о том, способен ли ребенок отложить вознаграждение в какой-либо отдельной ситуации (т.е. отказаться от небольшой немедленной награды ради получения впоследствии более существенной), может быть с очень скромной степенью вероятности (при корреляции в целом ниже 0,30) решен на основании показателей личностных черт или знания об успешных действиях того же ребенка в какой-либо другой ситуации. В то же время способность детей откладывать вознаграждение может быть резко изменена путем манипулирования некоторыми, очень тонкими нюансами ситуации, в которой эта способность испытывается. Например, в ходе одного из исследований (Mischel & Ebbesen, 1970) было обнаружено, что дети быстро использовали возможность получить небольшое, но немедленное вознаграждение в случае, когда оба приза были на виду (средняя отсрочка в этой ситуации равнялась одной минуте), но оказывались способными откладывать вознаграждение (в среднем на 11,3 мин), если оба приза были спрятаны.
Отталкиваясь от этих результатов, Мишел и его коллеги по исследованию (Mischel, 1974) показали, что любая из нескольких простых когнитивных стратегий, позволяющих детям отвлечь свое внимание от перспективы немедленного вознаграждения, может существенно усилить способность откладывать вознаграждение, в сущности, у любого ребенка. Иными словами, подобные манипуляции с ситуативным контекстом (а возможно, и со смыслом, который этот контекст имеет для детей) могут поглотить влияние любых обширных и устойчивых индивидуальных различий между детьми в уровне импульсивности, терпения или каких-либо других различий, которые как родители, так и профессиональные психологи принимают во внимание, пытаясь объяснить наблюдаемую изменчивость в реакциях детей на возможности и соблазны реального мира.