Игровое кресло Джуди разомкнулось, автоматически удаляя нейрокомпьютерный интерфейс из ее черепа. Она села. В комнате было темно, но Джуди все еще могла разглядеть часы на стене. Было 31 декабря 2151 года.
Прошло девять лет с тех пор, как она начала играть. За это время Джуди завоевала империи, вырастила семьи и построила башни до небес. И все в вымышленной компьютерной вселенной. Она бы осталась в системе, но что-то пошло не так. Мультиплеер вышел из строя. Некому было похвастаться, не с кем создавать что-либо. Она искала глобальную игровую сеть и не смогла соединиться ни с одним другим игроком. Она терпеть не могла выходить из компьютерного мира, но пришлось это сделать, чтобы исправить неполадку.
В комнате было темно и пыльно. Оглядевшись вокруг, она увидела игровое кафе с рядами стульев, простирающихся в правую и левую стороны. Внимательно присмотревшись к ним, она смогла увидеть их «обитателей». Все они были старыми, седыми, в старческих пигментных пятнах. Все были мертвы.
Джуди на секунду задумалась и откинулась на спинку стула. Он заключил ее в стальные объятия, нежно погружая в бессознательное состояние.
Дофаминовое удовольствие
Большинство из нас считает, что мы хотим чего-то потому, что это приносит нам удовольствие. На первый взгляд это мнение даже не похоже на убеждение. Конечно, мы хотим удовольствий. А как иначе?
Когда ученые впервые начали изучать удовольствие, казалось, результаты исследований подтвердили такое мнение. Еще в 1950-х годах Джеймс Олдс, на тот момент исследователь в Университете Макгилла в Монреале, хотел посмотреть, как воздействие электричества на мозг влияет на поведение. Чтобы выяснить это, он вживил электроды в мозг крысы и соединил ее с рычажком внутри клетки. Когда крыса нажимала на рычажок, через провод поступал импульс электричества прямо в головной мозг.
Сначала крыса просто бродила по клетке. Но как только она впервые случайно нажала на рычажок, ее поведение изменилось. Она стала нажимать на него все чаще и чаще. Со временем она превратилась в наркомана, бесконечно жаждущего новой дозы самостимуляции.
Эксперименты Олдса подтвердили гипотезу наличия в мозге центров удовольствия. При его активации центр удовольствия вырабатывает химическое вещество – дофамин. Обычно центр удовольствия генерирует дофамин в ответ на стандартные стимулы, такие как вкусная еда, выигрыш в лотерею или взгляд на привлекательного партнера. Электроды Олдса усиливали эту естественную реакцию.
В 1960-х годах этот эффект начали исследовать у людей. Первым был Роберт Хит, заведующий кафедрой психиатрии и неврологии Университета Тулейн в Новом Орлеане. В своем самом скандально известном исследовании Хит пытался «вылечить» гомосексуала при помощи стимуляции зон удовольствия. Молодой человек, известный под кодовым названием B-19, вырос в неблагоприятной домашней обстановке, имел мало друзей и находился на грани самоубийства. Хит подключил к нему провод и передал ему выключатель. По словам Хита: «В-19 стимулировал себя до такой степени, что как в поведенческом, так и в интроспективном плане он испытывал почти всепоглощающую эйфорию и восторг, а сессию нужно было прервать, несмотря на его энергичные протесты».
Эксперименты Олдса и Хита закрепили дофаминовую теорию мотивации: мотивация определяется стремлением к удовольствию, а предвестником удовольствия является дофамин. Их разумные рассуждения продержались много лет.
Но затем начали появляться проблемы.
Дофаминовая мотивация
Во-первых, поток дофамина. Исследователи обнаружили, что дофамин не появляется одновременно с получением награды, он также не появляется позднее. Скорее дофамин предшествует награде.
Если дофамин – это удовольствие, это не логично. Идя в магазин за стейком, вы испытываете чувство, отличное от тех ощущений, когда едите его. Но ваш мозг все еще напитан дофамином, даже если вы просто смотрите на мясные ряды в супермаркете.
Этот странный результат стал стимулом для последующих исследований, в которых ученые пытались понять реальную роль дофамина.
В 2009 году 61 участник эксперимента оценил свое желание провести отпуск в разных странах мира. Некоторым из них дали L-Dopa, препарат, который усиливает действие дофамина, а другим дали плацебо. Если бы дофамин и был удовольствием, испытуемые, которым дали L-Dopa, чувствовали бы себя так же, как и при стимуляции мозга через электропровод. Но этого не произошло. Вместо этого получившие усиленный дофамин люди хотели отправиться в большее количество стран и хотели действовать более интенсивно. Они не чувствовали радости. Они чувствовали себя мотивированными.
В 1989 году Кент Берридж, профессор нейробиологии в Мичиганском университете, дал крысам нейротоксин, который уничтожил все их клетки, принимающие дофамин. Крысы перестали совершать действия, даже питаться. Они потеряли всякую мотивацию и без посторонней помощи умерли бы от голода. Но когда Берридж впрыснул сладкую жидкость им в пасть, по выражению их мордочки можно было понять, что они испытывают удовольствие. Даже без дофамина крысы могли наслаждаться едой. Они только что потеряли мотивацию, чтобы снова ее получить.
Как оказалось, старая теория, которая еще вчера считалась здравой, была неверна. Дофамин не является маркером удовольствия, это маркер мотивации. И эти два понятия не всегда взаимосвязаны.
Звучит странно, но если присмотреться – нас повсеместно окружают подобные примеры. Наркоманы все больше хотят получить дозу, но наркотики нравятся им все меньше и меньше. Мы благодарны другу за то, что он вытащил нас на вечеринку, на которую мы не хотели идти. А многие игроки оказались не в состоянии отказаться играть даже после того, как игра стала для них скучной.
Мы можем хотеть чего-то, но не любить это или любить что-то и не хотеть этого.
Большая часть этой книги посвящена тому, как вызывать эмоциональные переживания, которые удовлетворяют игроков. В этой главе мы рассмотрим механизмы, которые создают только мотивацию. Мы рассмотрим, как их использовать, как сочетать их с удовлетворением, а также этические последствия отказа от них.
Предвкушение награды
Каждая игра должна использовать дофаминовую мотивацию, потому что каждая игра создает моменты недовольства. Часто эти моменты важны для дизайна. Без дофамина игроки сдались бы после первой же неудачи или потери ресурса. Дофамин мотивирует игроков преодолевать препятствия, чтобы они могли восторжествовать, получить социальную связь или насладиться графикой.
Основным способом, которым мы генерируем дофаминовую мотивацию, является создание предвкушения награды.
Множество видов наград может вызвать дофаминовую мотивацию. Еда, вода, секс, безопасность, деньги, имущество, власть и социальный статус – все это награды, за которые отвечает дофамин. Если мы находимся в предвкушении получить эти вещи, мозг вырабатывает много дофамина, а наша мотивация достижения цели растет.
Но секундочку. Игры почти по определению нематериальны. Как правило, мы не можем дать игрокам еду или секс (хотя несколько игр действительно используют порнографию в качестве награды). Обычно мы не можем предложить реальную физическую безопасность (за исключением тех случаев, когда игра может навредить игроку, как в PainStation). Обычно мы не можем дать реальные деньги или реальный социальный статус (если только игроки не делают ставки или играют на аудиторию). Большинство игр должны работать так, чтобы создать мотивацию, ничего не предлагая и ничем не угрожая. Но как это сделать, если мы не можем предложить никаких реальных наград?
Мы можем сделать это, потому что человеческий мозг развивался в среде, в которой не было современных игр, поэтому у него нет системы, позволяющей отличить реальные награды от виртуальных. Виртуальные награды обычно не обладают той же мотивационной интенсивностью, что и реальные, но в них сохраняется часть эмоций реальной награды. Хотя в реальной жизни мы хотим разбогатеть больше, чем в игре, мы все же хотим разбогатеть и в игре.
Некоторые виртуальные награды, такие как очки опыта, игровые деньги, оборудование и способности, связаны с прокачкой персонажа игрока. Другие, такие как кат-сцены или аудиозаписи, используют контент истории в качестве награды. Некоторые, такие как баллы в аркадах 1980-х годов, являются не более чем статистикой достижений, цифровым эквивалентом того, как ребенок царапает свое имя на самой высокой ветви самого высокого дерева в своем районе. И неважно, что эти награды бессмысленны вне игры. Они все равно щекочут центр удовольствия.
План подкрепления
При создании мотивации сама награда часто не самая важная часть уравнения. Реальный ключ к мотивации заключается в том, когда именно игроки ожидают и получают награды. Это определяется режимами подкрепления.
Режим подкрепления – это система правил, которая определяет, когда выдается награда.
Психолог Б. Ф. Скиннер разработал режимы подкрепления в 1930–1940-х годах, исследуя идею оперантного обусловливания. В то время как классическое обусловливание заключается в манипулировании непроизвольными реакциями (как в знаменитом эксперименте с собакой Павлова), оперантное обусловливание заключается в манипулировании явно добровольным поведением через награды и наказания. Давая собаке лакомство после того, как она выполняет трюк, вы используете оперантное обусловливание, чтобы заставить ее снова выполнить этот трюк.
Чтобы изучать оперантное обусловливание, Скиннер изобрел так называемый «ящик Скиннера». Это небольшой прибор, в который можно поместить крыс или голубей. В зависимости от эксперимента в ящике могут быть рычажки, колеса для хомяков, датчики, лампочки, громкоговорители, диспенсеры для пищи или электрошокеры. Эти устройства взаимосвязаны друг с другом невидимым механизмом.
Например, в одной конфигурации диспенсер будет выдавать пищу при каждом нажатии на рычаг. В другом он будет выдавать еду при каждом десятом нажатии. Или же он будет случайным образом выдавать еду в 10 % случаев нажатия. Каждая из этих конфигураций предоставляет разный режим подкрепления.
Скиннер хотел посмотреть, как различные режимы подкрепления будут влиять на поведение крысы. Как отреагирует крыса, если она будет получать еду, каждый раз нажимая на рычаг? Что, если она получил порцию случайно, или по таймеру, или после того, как пробежит определенное количество кругов в колесе? Скиннер обнаружил, что поведение животного меняется в зависимости от того, когда появляется награда, но не всегда очевидным способом. Даже незначительные изменения в режимах подкрепления могут приводить к резким различиям в поведении.
Такие режимы подкрепления предназначены не только для ящиков Скиннера. Их полно в играх. Побеждая орка, чтобы получить золотой слиток, вы играете в режимы подкрепления, созданном геймдизайнером. Как и у крыс, за которыми наблюдал Скиннер, детали этого режима подкрепления будут влиять на мотивацию продолжать играть. Для геймдизайнеров эти режимы подкрепления являются инструментами, которые можно использовать, чтобы мотивировать игроков.
Существует бесконечное множество возможных режимов подкрепления, но два наиболее важных из них – фиксированное соотношение и переменное соотношение.
Фиксированное соотношение
В случае с режимом подкрепления с постоянным соотношением награда дается в фиксированном соотношении с предпринятыми действиями. Например, в ящике Скиннера крыса может получать порцию еды каждый раз, когда она нажимает на рычаг. Игрок может получить золотую монету каждый раз, когда он побеждает орка. Оба режима подкрепления являются фиксированным соотношением, потому что соотношение между действием и поощрением всегда одинаково.
Соотношение не обязательно должно быть один к одному. Например, игрок может получить 10 золотых монет за каждого десятого орка, которого он победит. В этом случае большинство действий не вознаграждаются вообще. Десятый орк приносит награду за предыдущие девять орков.
Сами по себе режимы с фиксированным соотношением являются плохими мотиваторами. Они поощряют длительные периоды низкой активности с последующими всплесками активности, когда игрок решает, какую награду он хочет. Эти длительные периоды низкой активности позволяют игроку легко встать и уйти.
Переменное соотношение
Режим подкрепления с переменным соотношением подобен режиму подкрепления с постоянным соотношением, за исключением того, что соотношение изменяется каждый раз, когда выдается награда. Обычно при режиме с переменным соотношением награда дается после некоторого случайного набора действий. Например, у игрока может быть 10 % шанса получать 10 золотых монет каждый раз, когда он побеждает орка. В зависимости от того, как ляжет карта, он сможет либо получить награду три раза подряд, либо зарубить 50 орков и ничего не получить.
Режим подкрепления с переменным соотношением является наиболее эффективным простым режимом. Даже если он дает такую же среднюю отдачу, что и режим подкрепления с постоянным соотношением, он мотивирует совершенно иначе. У игрока, столкнувшегося с режимом с переменным соотношением, всегда остается шанс получить большую награду при следующем действии, поэтому активность остается высокой и последовательной. Вы всегда надеетесь, что следующий орк принесет большой платеж.
В играх режимы подкрепления с переменным соотношением встречаются повсеместно. В некоторой степени они существуют в любой игре со значимыми случайными элементами, и они лежат в основе всех азартных игр. Они являются главным предметом игры в некоторых ролевых играх, так как за каждого монстра и за каждый квест предлагается разный набор случайных наград с разной степенью вероятности.
В жизни они тоже появляются. Возможно, вы встречались с кем-то по такой схеме: в некоторые дни эти люди милы и приветливы, в другие – холодны и ведут себя отстраненно. Они не перезванивают и забывают о назначенной встрече. Словом, они разыгрывают неприступность. Люди, которые ведут себя по тому же принципу, что и игровые автоматы, привязывают к себе. Это просто еще один режим подкрепления с переменным соотношением.
Другие режимы подкрепления
При режиме подкрепления с постоянным интервалом награда становится доступной через определенный период времени после того, как ее заработали. В ящике Скиннера крыса может получить еду, только если нажмет на рычажок минимум через 15 секунд с момента получения последней порции. В классических играх со смертельным боем здоровье может появиться не раньше, чем через 60 секунд после того, как игрок взял его.
При режимах подкрепления с постоянным интервалом у игроков высокая мотивация, в случае если награда доступна, и низкая, если награда недоступна. Например, они будут игнорировать аптечку до тех пор, пока она практически не будет готова появиться снова, затем начнут проверять чаще, пока она не появится, после чего они хватают ее и снова некоторое время игнорируют. Такие пробелы в мотивации делают режимы подкрепления с постоянным интервалом плохими мотиваторами.
Режим подкрепления с вариативным интервалом делает награду доступной случайное количество времени после получения. Этот режим создает непрерывную мотивацию, но с меньшей интенсивностью, чем график с переменным соотношением. В обоих случаях за каждую попытку получить награду игрок теоретически что-то получает. Но в режиме подкрепления с вариативным интервалом шансы тем ниже, чем чаще игрок проверяет награду, поэтому у него меньше причин повторять действие.
Режим дифференциального подкрепления низкой частоты реакции подобен режиму подкрепления с постоянным интервалом, однако если игрок пытается забрать награду слишком рано, интервал перезапускается. Это усиливает низкую, равномерную активность.
В режиме с дифференциальным подкреплением высокой частоты реакций, чтобы получить награду, игрок должен выполнить определенный набор действий в течение заданного интервала времени. Например, вы должны победить пять врагов за одну минуту.
Существует множество других режимов подкрепления, при этом у каждого свой характерный паттерн мотивации.
Совмещенные режимы подкрепления
Большинство режимов подкрепления в определенные моменты приводят к спаду мотивации. Это является проблемой, потому что они создают окно, когда игрок может решить прекратить игру. Чтобы устранить эти пробелы в мотивации, игра может запустить несколько режимов подкрепления одновременно.
Сила режимов подкрепления не в каком-либо одном режиме, а в их совмещении таким образом, чтобы всегда был хотя бы один, который вызывает высокую мотивацию.
Например, режим подкрепления с постоянным соотношением создает провал в мотивации сразу после того, как игрок получает награду. Если он может получить 10 золотых монет за каждого десятого побежденного орка, его мотивация упадет сразу после уничтожения десятого орка, потому что игрок знает, что ему нечего ждать от следующих девяти орков. Именно в этот момент игрок убирает игру обратно на полку – на жаргоне дизайнеров это называется «момент полки».
Мы можем избежать такого «момента полки», совместив несколько режимов подкрепления с постоянными соотношением. Подумайте, что происходит, когда игрок может получить доллар за каждый десятый сундук, алмаз – за каждый десятый добытый камень и стрелу – за каждого десятого убитого гоблина. К тому времени, когда игрок открывает десятый сундук, он уже добывает девятый камень и хочет покончить с этим, чтобы получить следующий алмаз. К тому времени, когда он получает алмаз, он уже убивает девятого гоблина. К тому времени, когда он убивает десятого гоблина, чтобы получить стрелу, он уже открывает семнадцатый сундук и так далее. Всякий раз, когда один режим приводит к провалу в мотивации, другие режимы находятся на пике мотивации. Игрок переключает фокус между действиями, никогда не пропуская удары, вызванные дофамином.
Так называемые RPG с гриндом известны этой техникой. Игроку всегда остается всего лишь несколько шагов до получения следующего трофея, повышения уровня героя или мастерства. Каждый раз, когда он получает одну награду, он обнаруживает другую, которая находится всего в нескольких минутах ходьбы. Конечным результатом является то, что игрок не может остановиться.
Этот же механизм работает в пошаговых стратегиях, таких как Civilization V, и делает их захватывающими и качественными. В этих играх появляется синдром «еще одного хода», поскольку в них так много совмещенных режимов наград, что игроку никогда не остается более одного или двух ходов до получения своего приза. На следующем этапе наконец будет закончено исследование этой технологии. Один ход после этого – это новая военная единица. Затем новая структура, расширение границы и так далее. Одновременно могут выполняться 30 и более таких режимов подкрепления; по крайней мере один из них всегда поддерживает высокую мотивацию.
Ключом к совмещению режимов подкрепления является то, что игроку нельзя позволять концентрировать свои усилия только на одном режиме. Если игрок может эффективно игнорировать все режимы, кроме одного, он может по очереди отказаться от них и оказаться в ситуации, когда каждый режим находится на максимальном расстоянии от следующей награды. Это неизбежный «момент полки». RPG избегают этого, создавая свой мир так, чтобы у игрока постоянно была неиссякаемая возможность убивать гоблинов, открывать сундуки и добывать камни, даже если игрок занимается чем-то другим. В стратегиях игроки не могут объективно сосредоточиться только на одной исследовательской или производственной задаче, исключив все остальное. Это сохраняет постоянную мотивацию, а режимы остаются десинхронизированными.
Эмергентные режимы подкрепления
До сих пор мы рассматривали режим подкрепления с явной схемой разработки. Дизайнеры создают эти режимы так же, как Скиннер создал свои ящики, с математической точностью решая, что именно получит игрок после каждого действия. Но этот вид эксплицитно определенного режима подкрепления является исключением, а не правилом.
Большинство режимов подкрепления имеют неявную схему разработки. Скорее они появляются из игровых систем более низкого уровня.
Например, в шахматах игрок будет бить фигуру каждые X минут. Не потому, что дизайнер задал переменную X. Скорее интервал X возникает естественным образом из взаимодействия механики игры более низкого уровня. В шахматах темп захвата фигур очень острый – игроки долго выстраивают перекрестные защитные позиции, а затем уничтожают их в серии захватов. Поскольку размен фигур может произойти в любом ходе, шахматы представляют эмергентный режим подкрепления с переменным соотношением. И если бы правила изменились, изменился бы и этот режим.
Игроки реагируют на эмергентные режимы подкрепления точно так же, как и на режимы с явной схемой разработки. Часто они представляют собой разницу между игрой, которая захватывает вас, и игрой, которая заставляет вас уйти.
Например, во многих шутерах существует режим многопользовательской «мясорубки». Цель смертельного боя – убить как можно больше других игроков. В конце матча игрокам показывается количество убитых ими персонажей. Это количество является наградой, потому что так приятно видеть высокий счет убийств и неприятно – низкий. На языке наград каждый матч похож на побежденного орка, за исключением того, что он «выплевывает» убийства вместо денег. Но в то время как золото, которое игрок получает за уничтожение орка, определяется алгоритмом, количество убитых врагов вытекает из боевого дизайна игры. Различные карты, тюнинг оружия и системы устройства матчей дают разные паттерны количества убийств.
В некоторых играх со смертельным боем количество убийств весьма предсказуемо. Хороший игрок всегда совершает много убийств в отличие от плохого. Это создает эмергентный режим подкрепления, который напоминает фиксированное соотношение.
Как и все режимы подкрепления с постоянным соотношением, он создает пробел в мотивации сразу после получения награды (сразу по окончании матча). После окончания матча игроки не обязаны начинать новый матч, потому что точно знают, что они получат, а также знают, что им нужно закончить весь матч, чтобы это получить. Подобные режимы «мясорубки» не очень популярны из-за своего однообразия. Здесь нет великих побед или сокрушительных потерь. Просто матч за матчем, который каждый раз предлагает одинаковую предсказуемую награду.
Другие игры с режимами «мясорубки» гораздо более непредсказуемы. Игрок может прийти последним в одном матче и первым в следующем. Навык влияет на результат, но один удачный тактический прорыв или несколько удачных выстрелов могут превратить поражение в блистательную победу или наоборот. Это напоминает режим подкрепления с переменным соотношением и дает аналогичные мотивационные результаты. Игроки знают, что любой матч может стать тем самым, в котором им выпадает удачная серия из 30 убийств, поэтому они всегда мотивированы играть.
Если внимательно посмотреть, то вы увидите эмергентные режимы подкрепления повсюду. Многие игроки однопользовательской игры завершают игру в начале уровня, сразу после того, как они закончили предыдущий (разрыв в мотивации с фиксированным соотношением). Хорошие игры-головоломки позволяют игрокам запускать несколько головоломок одновременно, потому что они могут решить одну из них в любой момент (совмещенная переменная соотношения). И игроки будут пробовать пройти один и тот же уровень Super Meat Boy 300 раз подряд, потому что каждая попытка может привести к победе (переменное соотношение).
Внешняя и внутренняя мотивация
Режимы подкрепления выглядят так просто. Кажется, все, что нам нужно сделать, – это создать пару совмещенных режимов подкрепления, раздать золотые звезды, очки или какую-то другую дешевую награду, и все получилось! Мгновенная мотивация делать все, чего только пожелает дизайнер.
В этом есть доля правды. Вот почему школы боевых искусств выдают цветные пояса, бойскауты и девочки-скауты раздают значки, а армии – медали. Эти системы вознаграждения работают, но у них также скрытая цена.
Внешнее поощрение может вытеснить и даже разрушить внутреннее наполнение игры.
Внешнее поощрение – это те награды, которые находятся вне самой деятельности. Например, золото, которое дается за победу над орком, является внешним источником мотивации, потому что золото отделено от непосредственной борьбы с орком. Внутренние награды неотделимы от деятельности. Если победа над орком хороша сама по себе, у игроков будет внутренняя мотивация побеждать их даже без какого-либо вознаграждения.
На первый взгляд кажется, что нужно просто соединить эти два вида мотивации. Если игроку нравится побеждать орков, то добавление небольшого количества золота, кажется, только сделает лучше. Но этого не происходит. Исследования показали, что внешняя мотивация может искажать, смещать и даже разрушать внутреннюю мотивацию. Создание орка, разбрасывающего золото, уменьшает естественное желание игроков сражаться с ним.
В одном исследовании психолог Эдвард Дечи разделил участников на две группы. В первый день обе группы решали сложную задачу, такую как головоломка или игра. На второй день одна группа получила поощрение за задание, например деньги или бесплатное питание, а другой группе разрешили продолжать играть без вознаграждения. На третий день Дечи отменил поощрение. Группа, которой никогда не платили, продолжала радостно работать над этой задачей. Но группа, которой платили, потеряла интерес, когда награды не стало. Казалось, что после получения вознаграждения за задание эта группа решила, что задание не стоит того, чтобы выполнять его бесплатно. Внешние платежи вытеснили внутренний интерес.
Многие другие исследования изучали вариации на эту тему. Дети создают менее интересные рисунки, если им предлагают награду. Шахматисты решают меньше шахматных задач, когда им за это платят. Поэты пишут менее интересные стихи, когда им напоминают, что писатели могут зарабатывать деньги.
Когда мне было 11 лет, мои родители наняли учителя фортепиано. В течение пяти лет я покорно занимался полчаса ежедневно и изучал этюды, которые задавал преподаватель. Затем, когда мне исполнилось 16 лет, учитель перестал приходить. Но, вопреки собственным ожиданиям, я не переставал заниматься. Я много практиковался, намного больше, чем раньше. Иногда я играл сразу по три часа. И я стал играть по-другому. Вместо того чтобы просто дойти до той цели, которая была поставлена для меня, я свободно изучил инструмент. Я играл песни, которые были слишком сложными или слишком легкими или странных жанров. Я сочинял и импровизировал. Я играл, потому что хотел, и этот внутренний огонь был намного сильнее, чем любой внешний толчок, который мои родители или учитель могли бы дать мне.
Последствия искажения мотивации в результате получения награды зависят от того, насколько интересна задача. Внешний источник мотивации хорошо работает применительно к скучным задачам, потому что внутренняя мотивация, которую можно сместить, отсутствует. Если вам заплатят за то, чтобы вы рыли ямы, это вовсе не означает, что вам нравится копать, потому что вам это никогда не нравилось. Только когда задача интересна, возникает эффект.
Вы не любите копать не потому, что вам платят за то, чтобы вы копали ямы, а потому, что вам это никогда не нравилось. Этот эффект появляется только в том случае, если задача интересна. Чем интереснее задача, тем лучше результат.
Больше всего страдают исследовательские или творческие задачи. Если за них предлагается вознаграждение, люди перестают изучать систему с интересом. Они переключаются на выполнение минимума, чтобы получить поощрение в виде сладостей. Для игры, основанной на свободе или творчестве, это подобно смерти.
Для объяснения внешних эффектов демотивации были предложены многие психологические механизмы. Возможно, люди используют ментальную эвристику, которая говорит, что поощрение должно быть работой, и поэтому не стоит делать ее самостоятельно. Возможно, люди отталкиваются от того, что они чувствуют, когда другие пытаются их контролировать. Или, возможно, поощрение заставляет нас мысленно классифицировать взаимоотношения как торговые переговоры, а не как свободные и добровольные.
Каким бы ни был механизм, эти выводы представляют важность для геймдизайнеров. Они означают, что мы не должны волей-неволей разбрасываться вознаграждением в каждом игровом опыте, надеясь на повышение мотивации легким способом. Бессистемное использование обесценивает вознаграждение, искажая и разрушая основной игровой опыт. Игрок может быть мотивирован, но мотивация – это оболочка экшена без ядра чувства.
Корректировка вознаграждения
Теперь мы знаем, насколько важна дофаминовая мотивация в играх, чтобы игроки преодолевали препятствия в игровом опыте. Но теперь мы также знаем, что внешняя мотивация разрушает внутренний опыт игры. Получается замкнутый круг: вы должны мотивировать, но если вы это делаете, игра становится пустой. Что делать в данном случае?
Ключом к созданию наград, которые не разрушают игровой опыт, является корректировка вознаграждения.
КОРРЕКТИРОВКА ВОЗНАГРАЖДЕНИЯ – это степень того, насколько действия, поощряемые системой вознаграждений, схожи с действиями, без которых игрок оставался бы вовлеченным в игру.
Принцип корректировки вознаграждения в основном говорит о том, что вам следует выдавать вознаграждение только за то, что игрок уже хочет сделать. Чем ближе мы можем расположить структуру вознаграждения с внутренними желаниями игрока, тем менее разрушительным она будет для основного опыта. В лучших случаях система вознаграждений в точности соответствует внутренним желаниям игрока и два вида мотивации действительно соединяются.
Некоторые игры естественным образом предрасположены к системе вознаграждений, потому что легко определить, когда игрок достиг своих целей. Например, гонки должны поощрять игроков за самое быстрое время, потому что в этом и заключается весь их смысл. В гонках это возможно, потому что в них можно с легкостью точно определить время заезда, кроме того, в гоночной игре не так много других мотиваций, которые могут быть разрушены таймером.
В других играх сделать корректировку вознаграждения сложно или невозможно. Как в игре SimCity мы вознаграждаем игроков за создание города, похожего на их родной? Как мы награждаем игроков в коллективной игре за то, что они нашли нового друга? Какие очки, значки или призы мы даем игрокам за изобретение уникальной топильной камеры в Dwarf Fortress? Проблема этих мотиваций заключается в том, что игра не может определить, когда цели были достигнуты. А если мы не можем это определить, значит, мы не можем и вознаградить игроков. Вот почему невозможно скорректировать систему вознаграждений с творческими, исследовательскими, социальными игровыми системами, подобными этой. В таких играх единственное решение – не использовать систему вознаграждений, потому что любая такая система скорее уничтожит мотивацию, чем создаст ее.
Но большинство игр находятся между этими двумя крайностями. В них остается место для вознаграждений, но сложно разработать систему вознаграждений, которая бы точно отражала внутренние желания игрока. В этих случаях дизайн наград становится вопросом мастерства.
Цель дизайна наград состоит в том, чтобы создать систему, которая может обнаруживать и соответствующим образом вознаграждать игрока за все, что он уже хочет сделать. Поскольку каждая игра уникальна, то нуждается в собственной, продуманной системе вознаграждений.
Например, игра про катание на скейтборде Skate 3 использует систему баллов, чтобы вознаграждать игроков за выполнение трюков. Не так-то просто присвоить каждому трюку счет. Skate 3 позволяет игрокам объединять трюки в чрезвычайно сложные комбинации прыжков, флипов и гриндов. Этот элегантный дизайн позволяет производить бесчисленное множество различных комбинаций. Задача состоит в том, чтобы получить баллы за эти движения, которые соответствуют тому, насколько впечатляюще они выглядят.
Дизайнеры Skate 3 подошли к этой проблеме основательно. Они создали систему подсчета очков, которая отмечает каждый поворот, флип, грайнд и прыжок и считает каждую миллисекунду и каждый сантиметр. Используя ряд коэффициентов для учета длины трюковой комбинации, она точно оценивает эффект любой комбинации трюков.
Так как она настолько хорошо сбалансирована и детализирована, действия, которые вознаграждаются, практически идентичны действиям, которые игрок хотел бы выполнить, если бы система вознаграждений отсутствовала. И эта система прекрасно работает. Играть в Skate 3 – весело, гнаться за высокими баллами – всегда хочется и вызывает восторг.
Если бы корректировка вознаграждения в игре была хуже, скажем, если бы система поощряла игроков только за прыжки через колеблющиеся плавающие кольца, система вознаграждений вступала бы в противоречие с творческой игрой. Игроки игнорировали бы все игровые системы, кроме тех, которые помогали бы им пройти через кольца. Элегантная система трюков могла бы остаться, но она была бы безжизненной из-за плохо скорректированной системы внешних наград.
Но подождите, трюки – это не единственное, что игроки хотят делать в Skate 3. Что будет, если они захотят поучаствовать в гонках? Или увидеть, насколько сильно они могут травмировать своего персонажа или усовершенствовать одну конкретную комбинацию трюков? Игрок, который просто изучает игру, может решить, что он хочет сделать что-либо из перечисленного, но система подсчета очков сама по себе не может определить эти действия.
Чтобы справиться с такими нестандартными целями, Skate 3 включает ряд специальных режимов, которые задают нестандартные условия победы. Некоторые из них – гонки. В других вы должны точно скопировать комбинацию трюков другого игрока. А в соревнованиях Hall of Meat вы пытаетесь сломать как можно больше своих костей в одной ужасной аварии. Эти режимы достигают корректировки вознаграждения на основании этих нестандартных целей.
Угрызения совести игрока
Угрызения совести появляются у игрока после того, как он потратил время на игру, которая мотивирует его, но не наполняет.
Существуют игры, в которых геймдизайнеры даже не пытаются добиться корректировки вознаграждения. Весь дизайн таких игр основан на создании мощной, непрерывной мотивации независимо от стоимости основного опыта. Несмотря на то что игрок может продолжить играть, это также может привести к угрызениям совести игрока.
Когда я впервые начал делать игры, я никогда не думал, что мне придется столкнуться с этическими вопросами в своей работе. Но тогда я не знал силы режимов подкрепления.
Мозг древнего человека не имел развитой защиты от тщательно настроенных режимов подкрепления. Наши дофаминовые триггеры развивались, чтобы справляться с охотой и поиском пищи, а не с игровыми автоматами. Таким образом, игры, которые приводят к выработке дофамина, могут подтолкнуть людей к тому, что кажется иррациональным и саморазрушительным.
Веками азартные игры завлекали людей, используя наши доисторические дофаминовые триггеры. Теперь и неазартные игры могут делать то же. Хотя мы не берем деньги у игроков так же, как при игре в казино, мы тратим их время. И остается вещественный аргумент в пользу того, что если мы отнимаем какое-то время, то мы должны что-то вернуть взамен.
Угрызения совести игрока могут выйти за рамки нескольких потраченных часов. Люди потеряли работу и своих супругов, потому что они просто не могли перестать играть. Является ли этически приемлемым создание игры, которая это поощряет? Если нет, то где находится эта грань? Должны ли мы возложить всю ответственность за саморегуляцию на игрока или дизайнер тоже должен ее разделить? А что, если некоторые игроки – дети?
Ответ на этот вопрос можно представить в виде спектра. Я думаю, что против четко выстроенной структуры вознаграждений, связанной со значимым основным опытом, найдется мало аргументов. Это просто хороший геймдизайн. Игрок хочет играть, и он любит играть.
В середине спектра находятся игры, которые чередуют навязчивость и полноценность. Люди теряют друзей, потому что они часами проводят в игре, но они и заводят друзей в той же игре. Они часами страдают над мучительно скучным гриндом, а затем выигрывают захватывающую битву с боссом. Такие смешанные впечатления часто бывают вызваны прямыми ошибками искусства геймдизайна. Если бы награды в игре были лучше скорректированы, основной опыт мог бы проявиться лучше.
В конце спектра находятся игры, которые даже не пытаются серьезно удовлетворить игроков. Эти игры сосредоточивают каждое дизайнерское решение на максимальном увеличении мотивации. Такие игры не являются машинами опыта; это просто надоедливые механизмы. Игрок играет и платит и, в конце концов, ничего не чувствует из-за сожаления о потраченных времени и деньгах.
Подобные игры лучше всего иллюстрируют пародии на них. Например, Cow Clicker Яна Богоста – это игра в Facebook, в которой фигурирует корова. Вы можете кликать на корову, но только каждые шесть часов, если только вы не платите в игре «муни» (внутриигровые деньги), чтобы иметь возможность кликать раньше, или не шлете спам своим друзьям, приглашая их присоединиться к вам и вашим коровам. В игре только «голый» режим подкрепления с постоянным интервалом. Богост создал игру так, чтобы подчеркнуть то, что, по его мнению, являлось злоупотреблением шаблонами дизайна в реальных играх.
Но люди все равно играли в Cow Clicker тысячами. Богосту до такой степени надоела его собственная игра, что он заставил всех коров исчезнуть, оставив только пустой клочок земли. Но даже это не остановило людей. Они просто продолжали кликать по земле. Дофамин – адское химическое вещество в мозге.
Б. Ф. Скиннер полагал, что все организмы, включая людей, являются не более чем «системой поведения», управляемой исключительно внешними силами. И он довел эту идею до логического завершения, сказав, что наполненной позитивным содержанием концепции «Я» вообще не существует. В своих мемуарах он писал:
Меня иногда спрашивают: «Вы и себя воспринимаете так же, как те организмы, которые изучаете?» Да, так и воспринимаю. Насколько я понимаю, мое поведение в каждый конкретный момент представляет собой не что иное, как результат моего генетического наследия, личного опыта и существующих внешних обстоятельств… И если мои утверждения в отношении человеческого поведения верны, выходит, что я написал автобиографию не человека.
Последователи Скиннера были менее радикальными в этом вопросе, чем он сам. Но его наследие живет в некоторых теориях современного геймдизайна. Этот взгляд на дизайн рассматривает его как задачу создания не эмоций или удовлетворения, а поступков-триггеров. Он полностью игнорирует феноменологический опыт игры и рассматривает геймдизайн как конструкцию виртуального ящика Скиннера, извлекающего максимальную интенсивность желаемого поведения у игрока. И обычно такое поведение приносит издателю средства.
Эта книга о мастерстве, а не об этике. И эти вопросы гораздо обширнее, чем этот краткий обзор. Я не описывал ответственность игрока, не сравнивал игры с другими медиа и не рассматривал смешанные положительные и отрицательные результаты почти всех игр. Поэтому я не буду пытаться дать окончательный ответ на этот вопрос.
Но я могу предложить точку зрения одного дизайнера. Я думаю, что любой дизайнер, желающий освоить искусство геймдизайна, хочет большего, чем просто построить ящик Скиннера. В конечном счете, это может быть единственным перспективным путем. Гоночные игры, в основе которых лежит получение наград, быстро распространяются среди наивных игроков, потому что на такие игры легко подсесть. Но со временем эти игроки учатся избегать угрызений совести. И после того, как их жажда бессмысленной добычи исчерпана и они изучили все наши трюки, игроки все равно будут хотеть то, что они всегда хотят от игр: новых идей, новых друзей и новых впечатлений.