От морских слизней до сибирских хаски
Самые ранние описания петель привычек, формируемых по принципу «триггер — поведение — вознаграждение», опубликовал в конце XIX века джентльмен по имени Эдвард Торндайк. Его интерес вызывали потерявшиеся собаки, которые вопреки всему снова и снова находили дорогу домой. Торндайк, считавший, что привычным объяснениям недостает научной строгости, решил разобраться в механизме обучения у животных. В статье «Интеллект животных» он поставил под сомнение выводы своих коллег: «В большинстве этих книг мы можем найти не описание психологии животных, а их восхваление» (курсив автора). Он утверждал, что его современники «ищут интеллекта и чего-то необычного, игнорируя при этом глупость и нормальное поведение». Под нормальным поведением он понимал возникновение в процессе обучения определенных ассоциаций, наблюдаемое в повседневной жизни, и не только у собак, но и у человека. Так, например, запах корицы и мандаринов ассоциируется у нас с новогодними праздниками.
Стремясь восполнить научный пробел, Торндайк наблюдал за собаками, кошками и (похоже, менее успешно) цыплятами, которых помещал в клетки различных конструкций. Клетки оснащались несложными механизмами, позволяющими открыть их изнутри, например потянув за петлю на шнуре, нажав на рычаг или встав на платформу. Если животное находило способ выйти наружу, его немедленно поощряли едой. Ученый повторял эксперимент несколько раз, фиксируя количество попыток и способ открывания дверцы, чтобы связать определенное поведение с побегом из клетки и последующим кормлением (вознаграждением). Торндайк отмечал: «После установления четкой ассоциации время, необходимое животному для побега, становилось практически неизменным и очень коротким».
Торндайк обнаружил, что животные могут усвоить простые шаблоны поведения (потянуть за шнур), чтобы получить вознаграждение (еду). Он описал механизм обучения, основанного на поощрении. Важно отметить, что своими методами ученый снизил вероятность возникновения ошибок (таких, например, как эффект наблюдателя), способных исказить результаты экспериментов. Он пришел к выводу: «Таким образом, работа, выполненная одним исследователем, может быть повторена, проверена или усовершенствована другим». Исследования Торндайка позволили перейти от публикации необъяснимых историй об удивительных собаках, которые совершили некое действие х, к констатации возможности обучать любых собак (а также кошек, птиц и слонов) выполнению действий x, y и z.
В середине XX века Б. Ф. Скиннер подтвердил наблюдения Торндайка в ходе серии экспериментов на голубях и крысах. Он исследовал реакцию на изменение одного из условий, в которых находились животные (например, цвета камеры, которая позже получила название «ящик Скиннера»). Он быстро научил животное выбирать вместо черной камеры белую лишь посредством кормления его во второй и/или слабых ударов током в первой. Скиннер и другие ученые экстраполировали эти выводы, чтобы показать, что животные могут выполнять определенные действия не только ради вознаграждения, но и во избежание наказания. Поведение, характеризующееся приближением к приятному и удалением от неприятного, вскоре получило известность как положительное и отрицательное подкрепление и стало частью более широкой концепции «оперантного обусловливания».
На основе этих выводов Скиннер разработал простую модель, которую можно легко запомнить и применить в любой ситуации для объяснения каких-либо поступков: мы тянемся к стимулам, которые ассоциируются у нас с чем-то приятным (вознаграждение), и избегаем тех, с которыми возникли неприятные ассоциации (наказание). Благодаря Скиннеру теория обучения, основанного на вознаграждении, не имевшая до этого популярности в научных кругах, получила признание. Сегодня она включена в курс общей психологии, который преподается в вузах всего мира. Это настоящий научный прорыв.
Обучение, основанное на вознаграждении © Жадсон Брюер, 2014
Скиннер, которого часто провозглашают отцом этой концепции, был убежден, что она объясняет многое в поведении человека, а не только простые механизмы выживания.
В 1948 году после прочтения книги Генри Дэвида Торо «Уолден, или Жизнь в лесу» Скиннер написал роман под названием «Второй Уолден». В нем изображено утопическое общество, которое практикует обучение, основанное на вознаграждении, с целью научить людей жить в гармонии. Это философское произведение. Главный герой по имени Фрайзер (очевидный прототип которого сам Скиннер), используя сократические приемы, рассказывает небольшой группе гостей с различными взглядами про Второй Уолден. Он стремится убедить их, что с естественной способностью человека к обучению на основе поощрения можно победить глупость.
Члены этой выдуманной общины используют «поведенческую инженерию» (то есть обучение, основанное на вознаграждении), чтобы формировать у человека нужный тип поведения начиная с его рождения. Например, маленьким детям показывают преимущества сотрудничества по сравнению с соперничеством, чтобы к моменту ситуации выбора у них уже выработалась правильная реакция. Таким образом, все члены общины предпочитают наиболее эффективное и гармоничное поведение на благо как индивида, так и общины в целом. Условия социальной гармонии в романе «Второй Уолден» были заимствованы из научного исследования социальных норм и субъективных установок (индивидуальных реакций, выработанных посредством обучения, основанного на вознаграждении).
Давайте подробнее рассмотрим одно из важнейших понятий этой книги. Если говорить коротко, то чем чаще мы повторяем те или иные действия, тем больше привыкаем видеть мир определенным образом — сквозь субъективную призму наших ментальных установок, которые основаны на вознаграждениях и наказаниях, полученных в результате предыдущих действий. Простой пример: если мы едим шоколад и нам нравится его вкус, то и в дальнейшем в ситуации выбора между этой сладостью и какой-либо другой, которая нравится нам меньше, мы, скорее всего, предпочтем шоколад. Мы считаем, что «шоколад — это хорошо». У нас сформировалась установка в пользу шоколада, и она субъективна, поскольку отражает наши личные вкусы — кто-то другой может предпочитать шоколаду мороженое. Чем больше мы привыкаем к определенным взглядам, в совокупности образующим наше мировоззрение, тем скорее забываем, что они субъективны. Наши взгляды становятся чем-то большим — привычкой или даже истиной. Поскольку источником субъективных установок является основополагающий для нас процесс обучения, основанного на вознаграждении, они простираются далеко за пределы гастрономических пристрастий.
Так, например, многие американцы, выросшие в 1930-е годы, привыкли считать, что место женщины — дома. Как правило, их воспитывали матери-домохозяйки. Возможно, дети получали отрицательное подкрепление, когда их бранили за вопросы, почему мама дома, а папа на работе («Милый мой, твоему отцу нужно зарабатывать деньги, чтобы нас прокормить»). Со временем подобная точка зрения становится настолько привычной, что мы даже не ставим под сомнение свои непроизвольные автоматические реакции: разумеется, место женщины — дома! Это сродни коленному рефлексу: врач слегка ударяет неврологическим молотком по сухожилию, соединяющему колено и голень, чтобы проверить нервно-мышечные веретена, которые передают сигналы не далее позвоночного столба — до мозга они никогда не доходят. В этом круговом движении задействованы лишь три клетки (одна ощущает удар неврологического молотка и отправляет сигнал в позвоночник, вторая передает его по позвоночнику, а третья посылает импульс в мышцу, заставляя ее сжаться). Аналогичным образом и мы большую часть жизни реагируем бездумно и неосознанно. Мы не замечаем, что изменения, которые происходят в нас самих и окружающем нас мире, требуют отказа от автоматических действий, — и непонимание этого часто приводит к проблемам. Поняв, каким образом формируются и действуют субъективные установки, мы научимся извлекать из них пользу и минимизировать потенциальный вред.
Так, например, члены общины, описанной в романе «Второй Уолден», задались вопросом, могут ли женщины выполнять работу, выходящую за пределы привычной роли домохозяйки или учительницы младших классов (не забывайте, что книга написана в 1948 году). Мужчины и женщины сумели абстрагироваться от своих субъективных установок о том, что «женщины играют в обществе роли х и у». Оказалось, что женщины могут выполнять традиционно «мужские» функции, и это позволило включить их в состав рабочей силы (при этом мужчин стали больше вовлекать в воспитание детей).
Скиннер также утверждал, что «поведенческая инженерия» может сыграть свою роль и в обществе. Укрепившиеся в сознании людей субъективные установки формируют косную социальную структуру или догматичную негибкую политику. Подобные проблемы в обществе возникают естественным образом, когда процессы обучения, основанного на вознаграждении, не контролируются, и горстка людей, находящихся на ключевых позициях, использует их для манипулирования массами. Далее в книге мы рассмотрим, надуманны ли идеи Скиннера и в какой степени они находят подтверждение в человеческом поведении.
Во «Втором Уолдене» поднимаются философские вопросы. Есть ли способ устранить или, по крайней мере, уменьшить влияние субъективных установок, обусловливающих поведение людей? Может ли понимание их механизмов улучшить нашу личную и социальную жизнь и помочь преодолеть зависимости? И какие возможности откроются перед нами, если мы выйдем за пределы привычных моделей поведения, роднящих нас с морскими слизнями?
Целью моего первого клинического исследования после основания клиники было определить, может ли практика внимательности помочь людям бросить курить. Признаюсь, меня волновали результаты эксперимента. Не то чтобы я считал метод неэффективным — скорее, я беспокоился, насколько сам заслуживаю доверия в этом вопросе. Проблема заключалась в том, что сам я никогда не курил.
Мы набрали участников исследования, раздавая по всему городу Нью-Хейвен спичечные коробки с надписью «Бросьте курить без лекарств». Во время первого группового занятия курильщики беспокойно ерзали в своих креслах, не слишком понимая, во что они ввязались, — это было рандомизированное слепое исследование: им было известно лишь, что они получат какое-то лечение. Затем я начал рассказывать, как собираюсь помочь им бросить курить с помощью концентрации внимания. Это заявление вызвало массу вопросительных взглядов, и люди снова начали ерзать в креслах. И в этот момент один из участников прервал меня и спросил: «Доктор Брюер, а вы, м-м-м, когда-нибудь курили?» Они уже все перепробовали и теперь должны были слушать какого-то пафосного умника, который явно не сталкивался с их проблемой.
Я отвечал: «Нет, я никогда не курил, но у меня есть множество других зависимостей». Они заерзали в поисках выхода. Я пытался их разубедить: «Если вы не поверите мне к концу занятия, то можете громко крикнуть мне об этом». Затем я подошел к доске (блокируя таким образом выход, чтобы они не сбежали) и начал рассказывать, как формируется и укрепляется тяга к курению. Благодаря опыту работы с собственными привычками и идеям Скиннера я мог рассказать о составных элементах всех зависимостей, включая курение.
Мне потребовалось лишь пять минут выкладок на доске, после чего все слушатели согласно кивали. Беспокойство сменилось вздохами облегчения. Они наконец поняли, что я действительно знаю, с чем им приходится бороться. На протяжении дальнейших нескольких лет вопрос, курил ли я когда-нибудь, всплывал регулярно, но участники семинара никогда не сомневались в том, что я разделяю их опыт. Потому что с этим может справиться каждый, необходимо лишь понимать стандартные схемы.
Оказывается, курильщики ничем не отличаются от других людей. За исключением того, что курят. Я имею в виду, что при формировании привычек в нашем мозге происходят одни и те же базовые процессы: мы учимся одеваться по утрам, проверять ленту в твиттере и курить. Это одновременно хорошо и плохо. Плохо, потому что каждый из нас может пристраститься к слишком частой проверке электронной почты или страницы в соцсети, что снизит производительность труда и отрицательно скажется на качестве жизни. Ну а хорошо, потому что, поняв суть этих процессов, мы сможем избавиться от плохих привычек и приобрести хорошие.
Понимание психологических и нейробиологических механизмов, лежащих в основе процесса переобучения, сделает этот процесс проще (хотя и необязательно легче). Некоторые рекомендации были разработаны благодаря открытиям, демонстрирующим, как внимательность (концентрация внимания на происходящем в каждый момент времени) помогает работать над нашими привычками. Другие рекомендации были получены благодаря опыту работы с более чем 20 тысячами людей, которые прошли наш восьминедельный курс «Снижение стресса на основе внимательности» (ССОВ).