Назад: ГЛАВА 21. Три класса моделей теории игр

Дальше: ГЛАВА 23. Проблемы коллективных действий

ГЛАВА 22

МОДЕЛИ КООПЕРАЦИИ

Никто еще не стал бедным, отдавая.

Анна Франк

Когда экспертов просят перечислить самые важные научные вопросы, они обычно предлагают ограниченный набор вариантов: как возникла Вселенная? Как появилось сознание? Будет ли найдено лекарство от рака? Один из вопросов, который они упоминают, касается социальных и биологических наук: как возникает кооперация? Кооперация подразумевает совершение действия, не отвечающего личным интересам, а значит, вряд ли стоит ожидать широкую кооперацию. Тем не менее мы наблюдаем кооперацию во множестве областей и в самых разных масштабах. Клетки кооперируют посредством адгезии, когда одна клетка вырабатывает внеклеточное вещество, к которому могут прикрепляться другие клетки. Кооперацию можно увидеть между муравьями, пчелами, людьми, организациями и даже странами, которые поддерживают ее в рамках создания соглашений и международных законов.

В этой главе мы используем модели для поиска ответов на вопросы о том, как возникает кооперация, как она поддерживается и как ее расширить. Эти модели не дают исчерпывающего объяснения всего существующего в мире многообразия кооперации: почему вороны делятся найденной ими падалью; почему голые землекопы (heterocephalus glaber) совместно защищаются от хищников; почему вьющиеся растения пускают меньше корней, если их высадить рядом с родственными им растениями; почему термиты и пчелы строят сложные гнезда и почему муравьи сплетают конечности и делают перемычки для переноски пищи. Тем не менее эти модели позволяют глубже понять суть происходящего .

Несмотря на массу примеров внутри- и межвидовой кооперации, есть и примеры неудач. Степень кооперации зависит от обстоятельств. Федерации получают, а затем теряют новых членов; Великобритания участвовала в создании Евросоюза, а теперь выходит из него. Те же люди, которые собирают средства для школ в качестве волонтеров, могут проталкиваться без очереди к кассе в супермаркете или мошенничать с налогами. Лев, который охотится на азиатского буйвола в стае, может спрятать пойманного бородавочника. Кроме того, кооперация имеет место не у всех видов. Корни черного ореха выделяют в почву гербицид юглон для подавления роста расположенных рядом растений.

Разнообразие моделей поведения взаимодействующих субъектов (таких как клетки, корни, вороны, люди, компании и страны) требует применения многомодельного подхода. Клетки и растения лучше всего моделировать на основе установленных правил; вороны, муравьи и львы используют больше правил, которые диктует среда обитания или результаты, полученные в прошлом; люди, компании и страны делают прогнозы на будущее и вычисляют соотношение затрат и результатов.

Один из самых важных выводов этой главы состоит в том, что кооперация возникает и поддерживается с помощью различных механизмов. Мы остановимся на четырех: повторение, репутация, локальная кластеризация и групповой отбор. Все они делают кооперацию возможной без внешнего вмешательства или управления и применимы к взаимодействующим голым землекопам, пчелам и людям. У людей, кроме того, есть более формальные способы стимулировать и поддерживать кооперацию. В конце главы описываются такие институциональные решения, как, например, платить людям за сотрудничество, наказывать их, если они отказываются сотрудничать, и сделать кооперативное поведение обязательным согласно закону.

Второй вывод состоит в том, что эффективность любого из механизмов зависит от поведенческого репертуара объектов кооперации. Некоторые механизмы (особенно повторение) работают практически для любого поведения. Репутация и нормы требуют дальновидного поведения и обмена информацией. Эти механизмы наиболее эффективны для более развитых акторов.

С другой стороны, эффект кластеризации зависит от модели. Кооперация между субъектами, отобранными или отброшенными факторами эволюции, чаще всего возникает в разреженных сетях. Кооперация посредством норм требует плотных сетей. Эффективность группового отбора зависит (в более развернутом смысле) от степени дальновидности акторов и их способности придерживаться своих темпов адаптации. Обеспечение их дальновидности усиливает потенциал группового отбора. Предоставление им возможности адаптироваться быстрее может создавать помехи. Чтобы проанализировать все эти вопросы и объяснить взаимосвязь между поведенческими предположениями и кооперацией, мы используем известную игру «Дилемма заключенного», а также модель совместных действий. Вторая модель позволит нам охарактеризовать действия, которые приносят пользу многим игрокам, и смоделировать кооперацию в сетях.

Оставшаяся часть главы выглядит так: сначала мы опишем дилемму заключенного и покажем, как рациональные агенты могут поддерживать кооперацию. Затем продемонстрируем, как повторение может стимулировать кооперацию между субъектами, действующими на основе правил, а также почему сформировать кооперацию труднее, чем поддерживать. Далее мы рассмотрим менее развитые биологические объекты и покажем, каким образом могут способствовать кооперации родственный отбор и локальная кластеризация. В последних двух разделах мы обсудим групповой отбор и вопрос о том, как использовать эти модели для расширения сотрудничества.

ДИЛЕММА ЗАКЛЮЧЕННОГО

Происхождение этого названия связывают с историей о двух людях, обвиняемых в совместном совершении преступления. У полиции есть косвенные улики, поэтому каждому подозреваемому предлагают сознаться. Обвиняемые сталкиваются с дилеммой. Если ни один из них не признает своей вины, каждый получит мягкий обвинительный приговор на основании имеющихся доказательств. Если сознается кто-то один, он вообще не будет наказан, а другой получит строгое наказание. Если оба сознаются, оба получат достаточно суровое наказание, но не настолько, как в случае признания вины только кем-то одним. На рис. 22.1 эта история представлена в виде игры с участием двух игроков. Каждый игрок может либо сотрудничать (С), либо отказаться от сотрудничества (D). Выделенные полужирным шрифтом числа — это выигрыши игрока строки, а обычным шрифтом показаны выигрыши игрока столбца. У каждого игрока есть доминирующая стратегия отказа от сотрудничества: какое бы действие не предпринял другой игрок, отказ от сотрудничества обеспечивает более высокий выигрыш. Однако если оба игрока откажутся от сотрудничества, каждый получит более низкий выигрыш, чем если бы оба предпочли сотрудничество. Таким образом, преследование личных интересов приводит к получению обоими игроками более низких результатов.

Рис. 22.1. Пример игры «Дилемма заключенного»

Дилемма заключенного отражает основные стимулы, присутствующие во многих реальных ситуациях. Она позволяет смоделировать гонку вооружений между США и СССР, где отказ от сотрудничества соответствует расходам на вооружение, а сотрудничество — экономическому развитию. Кроме того, эта игра может моделировать проведение политической кампании и выбрать один из вариантов агитации — распространять порочащую информацию (отказ от сотрудничества) или размещать позитивную политическую рекламу (сотрудничество). Дилемма заключенного может даже объяснить, почему у самцов павлина такой длинный хвост: у каждого павлина есть причины казаться сильнее и выносливее других самцов.

Некоторые примеры дилеммы заключенного можно понять только постфактум. Первые пользователи многих технологий (например банки, которые первыми внедрили банкоматы) увидели рост прибыли. Однако когда за ними последовали другие, прибыль упала в связи с усилением конкуренции. Оказалось, что установка банкоматов аналогична отказу от сотрудничества .

Общий вид игры «Дилемма заключенного», представленный на рис. 22.2, подразумевает нулевой базовый выигрыш, если оба игрока откажутся от сотрудничества. Таким образом, игру можно описать с помощью трех переменных: вознаграждение (R) в случае сотрудничества, искушение (T) отказаться от сотрудничества и выигрыш простака (S), которым воспользовались в своих интересах (см. ). Приведенные на рисунке неравенства гарантируют, что выбор отказа от сотрудничества — это доминирующая стратегия, а сотрудничество обеспечивает эффективный исход.

Рис. 22.2. Дилемма заключенного

КООПЕРАЦИЯ ПОСРЕДСТВОМ ПОВТОРЕНИЯ И РЕПУТАЦИИ

Сначала мы продемонстрируем, как повторение игры и создание репутации может поддерживать кооперацию между рациональными агентами. Тот факт, что кооперацию можно поддерживать, не гарантирует, что она будет достигнута, а лишь указывает на то, что, если она действительно возникнет, рациональные игроки могут не дать ей угаснуть. Для того чтобы доказать, что повторение поддерживает кооперацию, построим модель повторяющейся игры, в которой после каждой итерации игры с вероятностью P игра будет проведена снова. Теоретически процесс игры может продолжаться бесконечно.

Когда игроки применяют стратегии повторяющейся игры, их действия основываются на истории предыдущих итераций. Здесь мы рассмотрим стратегию повторяющейся игры, известную как «триггер вечной кары», в соответствии с которой игрок сотрудничает в первой и последующих итерациях до тех пор, пока другой игрок не отказывается от сотрудничества. Если другой игрок отказывается сотрудничать, игрок, который следует стратегии «триггер вечной кары», отказывается от сотрудничества навсегда.

Для того чтобы доказать, что триггер вечной кары поддерживает сотрудничество в повторяющейся игре, необходимо продемонстрировать, что если один игрок выберет стратегию вечной кары, то другой игрок максимизирует свой выигрыш, тоже выбрав эту стратегию. Учитывая, что отклонение второго игрока приводит к бесконечному отказу первого игрока от сотрудничества, второму игроку необходимо просто сопоставить ожидаемый выигрыш от постоянного сотрудничества с ожидаемым выигрышем от однократной выгоды отказа от сотрудничества, а также с выигрышем в том случае, если после этого оба игрока предпочтут отказ . Обеспечит ли триггер вечной кары более высокий выигрыш, зависит от степени искушения, вознаграждения от сотрудничества и вероятности повторения игры.

Повторение поддерживает кооперацию

В повторяющейся игре «Дилемма заключенного» триггер вечной кары поддерживает кооперацию, если вероятность продолжения игры P превышает отношение разности между выигрышем от искушения T и выигрышем от вознаграждения R к выигрышу от искушения :

Этот результат говорит о том, что, если выигрыш от искушения превышает тройной выигрыш от вознаграждения (T > 3R), игра должна повториться с вероятностью, превышающей . Неравенство также говорит о том, что поддерживать сотрудничество становится легче, если вознаграждение и вероятность продолжения игры повышаются или соблазн отказаться от сотрудничества уменьшается. Каждое из этих следствий указывает интуитивный путь к расширению кооперации: увеличьте вознаграждение, повысьте вероятность продолжения взаимодействия и уменьшите искушение отказаться от сотрудничества. Хотя это довольно простые выводы, возможно, до построения модели они не были столь очевидны.

В поисках необходимого условия кооперации мы можем сделать и не столь простые выводы. Представленное выше выражение подразумевает, что если бы игроки исходили из того, что вероятность продолжения игры окажется ниже порогового значения в будущем, то рациональные игроки прекратили бы сотрудничество до, а не после изменения вероятности .

Логика, согласно которой повторение поддерживает кооперацию между рациональными игроками, основана на таком частном свойстве модели, как вероятность продолжения игры. Если бы вместо этого мы исходили из фиксированного количества повторений (скажем, игра должны повторяться три раза), рациональные игроки не сотрудничали бы, что можно доказать с помощью метода обратной индукции. Предположим, игра проводится только три раза и первый игрок заявляет о применении триггера вечной кары. Допустим, T = 3, R = 2 и S = 1. С учетом этих выигрышей, если второй игрок сотрудничает в ходе всех трех раундов, он получает общий выигрыш 6. Нам необходимо убедиться, что больше ни одна стратегия не обеспечивает более высокий выигрыш. Отказ от сотрудничества в первом раунде дает выигрыш всего лишь 2, поскольку после этого первый игрок прибегнет к отказу и в последних двух раундах. Отказ от сотрудничества во втором раунде дает выигрыш 5. Ни одно из этих действий не является рациональным. Тем не менее отказ от сотрудничества в третьем раунде дает выигрыш 7: выигрыш 2 в каждом из двух первых периодов и выигрыш 3 в последнем периоде. Следовательно, рациональный игрок откажется от сотрудничества в последнем раунде.

Первый игрок, применивший триггер вечной кары, должен понимать, что отказ от сотрудничества произойдет в третьем раунде, и тоже отказаться от сотрудничества. Тогда второй игрок поймет, что они оба намерены отказаться от сотрудничества в третьем раунде, поэтому сделает это во втором раунде. Согласно той же логике первый игрок также откажется от сотрудничества. Процесс будет продолжаться до первого раунда. Аналогичные рассуждения применимы при повторении игры любое конечное количество раз. В последнем сыгранном раунде рациональные игроки отказываются от сотрудничества. Следовательно, у обоих игроков есть стимул выбрать отказ от сотрудничества в предпоследнем раунде — и так далее. Единственная рациональная стратегия — всегда отказываться от сотрудничества.

До сих пор мы анализировали действия двух обособленных игроков, а это не учитывало того, как отказ человека от сотрудничества может повлиять на отношение к нему окружающих и как они будут обращаться с ним во время будущих взаимодействий. По сути, мы оградили двух играющих в эту игру человек. Однако модель можно расширить, включив в нее сообщество людей, которые следят за поведением друг друга и наказывают тех, кто не хочет сотрудничать.

Для того чтобы сделать это в формальном виде, предположим, что люди каждый день в произвольном порядке образуют пары и играют в игру «Дилемма заключенного». Члены сообщества убеждены, что эти игры будут продолжаться бесконечно, поэтому вероятность будущей игры равна 1. При таких предположениях человек, скорее всего, не станет играть с тем же человеком на следующий день, а значит, у него будет более высокий стимул отказаться от сотрудничества. Однако мы допускаем вероятность того, что сообщество это заметит, и тогда человек заработает плохую репутацию и, согласно договоренности, ни один член сообщества не будет с ним сотрудничать в будущем. Если мы обозначим символом P_D вероятность того, что человека уличат в отказе от сотрудничества и он будет наказан во всех будущих играх, то условие, что сотрудничество будет поддерживаться посредством репутации, (), тождественно условию его поддержания при помощи повторения, за исключением того, что вероятность повторения игры P заменит P_D — вероятность того, что человека уличат в отказе от сотрудничества.

В модели репутации сообщество усиливает кооперацию. Тот, кто отказался от сотрудничества и был в этом уличен, столкнется с осуждением со стороны всех будущих игроков. В этой ситуации люди снова вычисляют выгоды и потери от отказа от сотрудничества. Кроме того, они должны быть убеждены, что остальные присоединятся к наказанию, что в данном случае подразумевает отказ от сотрудничества всеми членами сообщества. Но для этого люди должны либо знать друг друга, либо располагать каким-то методом идентификации или маркировки тех, кто отказывался сотрудничать в прошлом. Из этого следует, что при прочих равных условиях у людей в небольших сообществах больше возможностей для усиления кооперации посредством повторения. В маленьких северных городках люди оставляют зимой автомобили на парковках у магазинов с включенным двигателем. Они не боятся, что автомобиль украдут (отказ от сотрудничества), поскольку знают всех жителей города. Любой, кто угонит автомобиль (даже в качестве шалости), понесет репутационный ущерб.

Физические метки могут сделать информацию о репутации общедоступной, что способствует поддержанию кооперации. В романе Натаниэля Готорна The Scarlet Letter Эстер Прин вынуждена носить на одежде вышитую алыми нитками букву «А» (от англ. «adultery» — «прелюбодеяние») за нарушение супружеской верности. В некоторых культурах осужденным ворам принято отрубать руки — надо сказать, довольно дорогая метка для осужденного. Маркировка отступников присутствует даже в некоторых видах. Рыба-чистильщик Labroides dimidiatus может очищать других рыб от паразитов (сотрудничество) или поедать более вкусную альтернативную пищу (отказ от сотрудничества). Если рыба поддерживает кооперацию, ее соседи будут избавлены от паразитов. Отсутствие паразитов видят другие рыбы. Чистота соседних рыб становится меткой, визуальной репутацией .

Связанность и репутация

Поддержание кооперации посредством механизма формирования репутации требует, чтобы соседи человека знали о допущенном им отклонении от норм поведения. Для того чтобы оценить вероятность распространения о нем такой информации, можно применить три вывода, которые мы сделали при включении сетей в модель заражения. Во-первых, чем выше степень сети, тем больше вероятность распространения слухов об отклонении. Во-вторых, вероятность усиливает вариация распределения степеней (особенно наличие чрезвычайно активных распространителей информации). В-третьих, если член совокупности отказывается от сотрудничества с тем, кто не связан с другими его соседями, то соседи вряд ли узнают об отклонении. Следовательно, для распространения информации о репутации сеть должна иметь высокий коэффициент кластеризации. Коэффициент кластеризации — это косвенный показатель социального капитала.

КООПЕРАЦИЯ МЕЖДУ МОДЕЛЯМИ ПОВЕДЕНИЯ, ПОДРАЗУМЕВАЮЩИМИ ИГРУ ПО ПРАВИЛАМ

Теперь смягчим предположение о рациональности и допустим, что игроки применяют стратегии, основанные на правилах, такие как триггер вечной кары. Мы используем эту модель, чтобы понять, может ли (и как) возникнуть сотрудничество. Наша модель включает совокупность отдельных игроков, которые проводят многократные раунды игры «Дилемма заключенного», играя друг против друга. Мы будем исходить из того, что каждое взаимодействие продолжится с определенной вероятностью. Такая структура игры побуждает рациональных игроков к сотрудничеству, если вероятность продолжения игры достаточно высокая.

В отличие от предыдущего случая, здесь мы предполагаем, что игроки применяют правила поведения. Одни могут использовать триггер вечной кары, другие — всегда сотрудничать, а третьи постоянно отказываться от сотрудничества. Различные варианты этих стратегий могут использовать другие виды. Самцы древесницы применяют стратегию «доброго врага», в соответствии с которой не участвуют в громком пении и не вступают в схватки для расширения владений за счет соседей. Мы можем рассматривать это как совместное действие .

Для удобства изложения будем исходить из того, что каждый член совокупности играет со всеми остальными ее членами. После того как каждый игрок сыграет все свои игры, все объявляют о полученном результате, равном среднему выигрышу за одну итерацию игры. Мы будем использовать средний выигрыш за игру, а не общий выигрыш, поскольку одни игроки могут по воле случая сыграть гораздо больше игр, чем другие, при условии вероятностного продолжения игры. Согласно данной структуре модели, результативность стратегии зависит от распределения стратегий. Отсюда следует, что выигрышная стратегия может также зависеть от исходного распределения. Если кооперативные стратегии обеспечивают более высокий результат на начальном этапе, то сотрудничество в данной совокупности с большой вероятностью будет усиливаться.

В целях нашего анализа присвоим в случайном порядке каждому игроку одну из пяти поведенческих стратегий: всегда сотрудничать (All C), всегда отказываться от сотрудничества (All D), триггер вечной кары (GRIM), око за око (TFT) и троллинг (TROLL). Стратегия GRIM сотрудничает на начальном этапе и продолжает сотрудничество до тех пор, пока соперник не выберет отказ от сотрудничества, после чего отказывается от сотрудничества навсегда. Стратегии All C и All D поступают в соответствии со своими названиями: слепо сотрудничают или отказываются от сотрудничества независимо от действий другого игрока. Стратегия TFT сотрудничает в первом периоде, а во всех последующих периодах копирует действие другого игрока за предыдущий период. Два игрока, выбирающих стратегию TFT, всегда будут сотрудничать. Стратегия TROLL стремится использовать игроков, которые всегда выбирают сотрудничество. Она отказывается от сотрудничества во время первых двух периодов, и если другой игрок не отказывается от сотрудничества в любом из этих периодов, TROLL отказывается от сотрудничества навсегда. Если другой игрок все же откажется от сотрудничества, TROLL переключается на сотрудничество в течение двух периодов, а затем выбирает GRIM.

Сначала вычислим выигрыши для каждой поведенческой стратегии, играющей против всех остальных стратегий, воспользовавшись выигрышами из дилеммы заключенного, представленной на . Начнем со стратегии All D. Если она играет против стратегии All C, то получает выигрыш 4 в каждой игре. All C, со своей стороны, в ходе таких взаимодействий получает средний выигрыш всего лишь 1. Если All D играет против TFT или GRIM, она получает выигрыш 4 во время первого раунда игры и выигрыш 2 во всех последующих раундах. Если мы предположим, что игра повторяется многократно, средний выигрыш составит немногим более 2, что мы запишем как 2⁺. Когда All D играет против TROLL, обе стратегии отказываются от сотрудничества в первые два периода; при этом TROLL сотрудничает в третьем и четвертом периоде, а затем отказывается от сотрудничества. Стратегия All D снова получает средний выигрыш 2⁺. TROLL получает средний выигрыш немногим менее 2, что мы запишем как 2⁻.

Мы можем выполнить аналогичные операции и вычислить ожидаемые выигрыши по каждой паре стратегий . В табл. 22.1 показан выигрыш каждой стратегии, играющей против всех остальных стратегий.

Таблица 22.1. Средние выигрыши стратегий строки, играющих против стратегий столбца

В таблице представлено сочетание взаимного сотрудничества, взаимного отказа от сотрудничества, а также стратегий, извлекающих пользу из ошибок в других стратегиях. Внимательный анализ таблицы показывает, что четыре из пяти стратегий сотрудничают сами с собой. Мы будем называть их потенциально кооперативными стратегиями. Только TFT сотрудничает с ними всеми. Следовательно, если любая комбинация этих четырех стратегий составляет большую часть данной совокупности, стратегия TFT обеспечит хорошие, если не лучшие результаты .

Тысячи экспериментов по дилемме заключенного с участием людей обнаруживают огромную неоднородность выбираемых ими стратегий. Поэтому мы используем приведенные в таблице выигрыши, чтобы проанализировать исходы в случае разных распределений. Учитывая многообразие выигрышей для различных комбинаций стратегий, лучшая стратегия будет зависеть от состава совокупности. В совокупности, состоящей в основном из стратегий All C, стратегия All D работает эффективнее всего. Если отдельные члены совокупности решают воспользоваться лучшей стратегией или если отбор работает быстро, тогда, возможно, члены данной совокупности никогда не смогут сотрудничать. Если процесс обучения или отбора идет умеренными темпами, игрокам следует воздерживаться от использования стратегии All C. Если совокупность содержит небольшое количество стратегий All C, стратегия All D будет обеспечивать менее высокие результаты, чем GRIM, TROLL и TFT. Одна из этих стратегий должна возобладать. Такую закономерность, когда на начальном этапе отказ от сотрудничества обеспечивает хорошие результаты, а затем берет верх сотрудничество, можно обнаружить во многих экспериментах с участием людей, а также в имитационных экспериментах с участием компьютерных интеллектуальных агентов. То, что происходит в этих случаях, можно описать как возникновение или эволюцию сотрудничества.

Можно представить любое распределение по этим пяти стратегиям или по любому другому ансамблю стратегий, вычислить средние выигрыши, а затем проанализировать, что произойдет в результате обучения или отбора. В следующей главе мы построим формальные модели обучения и отбора, а пока будем использовать неформальные аргументы, поскольку просто хотим подчеркнуть, что возникновение кооперации зависит от исходных стратегий, входящих в состав совокупности, и от того, как люди осваивают или развивают новые стратегии.

Необходимое условие возникновения или эволюции кооперации заключается в том, что выигрыш от сотрудничества должен превышать выигрыш в случае отказа от него в заданной совокупности. Иначе и отбор, и обучение приведут всю совокупность к отказу от сотрудничества. Для упрощения анализа представим, что совокупность состоит из кооперативных стратегий, таких как GRIM, All C и TFT, а также стратегий отказа от сотрудничества, таких как All D. А затем вычислим, при каких условиях кооперативные стратегии гарантируют более высокий средний результат. Результаты вычислений показывают, что развивать кооперацию труднее, чем поддерживать, и что она не способна самообеспечиваться — небольшая совокупность кооператоров не может стать источником возникновения кооперации .

Такое различие между поддержанием кооперации, ее возникновением или эволюцией и бутстрэппингом заслуживает повторного возвращения к этому вопросу. Поддержание кооперации возможно в случае, если при условии сотрудничества всех игроков она обеспечивает самые высокие результаты. Она имеет место тогда, когда стратегия GRIM является равновесием Нэша в повторяющейся игре. Кооперация может возникнуть или развиваться в случае, если стратегии, сотрудничающие между собой в рамках совокупности, в среднем демонстрируют более высокие результаты по сравнению со стратегиями, отказывающимися от сотрудничества. Как уже отмечалось, труднее удовлетворить условия для возникновения кооперации, чем условия для ее поддержания. На самом деле математические расчеты показывают, что бутстрэппинг — почти невыполнимая задача. Если доля кооператоров близка к нулю, они получают более низкие выигрыши, чем те, кто отказывается от сотрудничества. Вывод заключается не в том, что бутстрэппинг кооперации вообще невозможен, а в том, что он невозможен именно в этой модели. Для того чтобы добиться кооперации, изначально необходима определенная доля людей, готовых к сотрудничеству. Это может произойти с людьми, которые анализируют игру, но маловероятно в отношении пчел и корней деревьев. Для того чтобы понять, как может произойти бутстрэппинг, нужны более сложные модели, учитывающие локальное обучение, эволюцию и групповой отбор. Давайте теперь их рассмотрим.

МОДЕЛЬ СОВМЕСТНЫХ ДЕЙСТВИЙ

Для того чтобы проанализировать, как возникает сотрудничество, введем модель совместных действий, в которой люди могут либо совершать совместное действие, либо воздерживаться от него . Совместное действие сопряжено с издержками для выполняющего его члена совокупности и приносит выгоду всем остальным. Отказ от совместных действий не влечет за собой никаких издержек и не приносит никакой выгоды.

Существует ряд различий между моделью совместных действий и повторяющейся дилеммой заключенного. Во-первых, в модели совместных действий члены совокупности не играют в повторяющуюся парную игру, в которой они применяют стратегии и получают выигрыши. Вместо этого они являются либо кооператорами, либо некооператорами. Во-вторых, модель не рассчитана на рациональных акторов или членов совокупности, использующих более сложные правила. В-третьих, члены совокупности принадлежат к сети взаимодействия. Их совместные действия влияют только на тех, с кем они связаны, то есть на их соседей. И последнее: поскольку члены совокупности принадлежат к определенному типу, они совершают одни и те же действия в отношении всех своих соседей. Кооператор с пятью соседями несет в пять раз большие издержки в связи с кооперацией и приносит пользу пяти другим членам совокупности.

Модель совместных действий

Совокупность из N членов состоит из кооператоров и отступников, связанных между собой в рамках сети. Кооперация сопряжена с издержками C и приносит выгоду B другому игроку в ходе каждого взаимодействия. Отказ от сотрудничества не влечет за собой никаких издержек и не приносит никакой выгоды. Коэффициент кооперативного преимущества отражает потенциальную выгоду от сотрудничества.

Сеть играет ключевую роль в создании условий для возникновения кооперации и даже для ее бутстрэппинга. Небольшой кластер или группа кооператоров, в основном взаимодействующих друг с другом, получает хорошие результаты, а затем распространяется по всей совокупности. В экосистеме потомство часто обитает рядом с родителями. Если потомки кооператоров с большей вероятностью становятся кооператорами, то бутстрэппинг кооперации становится более легкой задачей.

Чтобы продемонстрировать, что кластеризация может обеспечить бутстрэппинг кооперации, начнем с частично заполненной сети. Каждый ее узел выступает в качестве потенциального местоположения одного из членов совокупности. В биологическом контексте такими местами является подходящая среда обитания. Затем наполним часть сети членами совокупности — либо кооператорами, либо отступниками. Например, мы могли бы сначала нарисовать произвольную сеть со средней степенью 10, а затем бросить игральную кость в каждом узле. Если выпадет шестерка, мы разместим члена совокупности в этом узле. Если нет, оставим его пустым. При размещении члена совокупности в узле мы снова бросаем кость. Если выпадет пятерка, мы поместим в этот узел кооператора, в остальных случаях отступника. Эта процедура позволит заполнить шестую часть узлов в нашей сети, причем в шестой части занятых узлов будут размещены кооператоры.

В сети с такой структурой отдельные члены совокупности будут отличаться по количеству соседей: у некоторых их вообще не будет, тогда как у других будет по четыре или пять. Для того чтобы обеспечить рост или распад кооперации, заполним оставшуюся часть сети, в итеративном режиме заполняя узлы, расположенные рядом с занятыми узлами. Будем исходить из того, что пустой узел принимает тот же тип (то есть становится либо кооператором, либо отступником), что и тип наиболее результативного узла среди его соседей. На рис. 22.3 показаны два сегмента линейных сетей. Кооператоры представлены темными линиями, отступники — серыми, а пустые узлы — пунктирными линиями. Каждый сегмент содержит пустой узел в центре с двумя соседями — одним отступником и одним кооператором. На этом рисунке сотрудничество обеспечивает выгоду 2 и влечет за собой издержки 1.

Рис. 22.3. Выигрыши соседей пустого узла в двух линейных моделях

В верхнем сегменте рисунка 22.3 у отступника справа от свободного узла есть сосед-кооператор, поэтому он получает выигрыш 1. У соседа-кооператора слева от свободного узла есть сосед-отступник, поэтому он получает выигрыш −1. Согласно нашим правилам заполнения узлов, поскольку сосед-отступник получает более высокий выигрыш, пустой узел станет отступником. В нижнем сегменте у соседа-отступника пустого узла есть сосед-отступник, тогда как сосед-кооператор пустой клетки связан с другим кооператором. Следовательно, в нижнем сегменте мы получаем противоположный результат. Здесь сосед-кооператор получает более высокий выигрыш, поэтому пустой узел станет кооператором.

В этом примере одиночный кооператор не может создать еще одного кооператора, а два соседних кооператора могут. Отсюда следует, что небольшой кластер кооперативных узлов, окруженных пустыми клетками, может расшириться на свободные узлы. Таким образом, небольшое количество кооператоров может обусловить формирование областей кооперации.

Мы можем сформулировать более общие условия того, станет ли пустая клетка кооператором или отступником, на основании доли соседних кооператоров и отступников, а также коэффициента кооперативного преимущества. Из этого следует, что обеспечить бутстрэппинг кооперации проще в сетях с более низкой степенью. Этот вывод противоположен полученному в ходе анализа того, как репутация поддерживает кооперацию, когда более связанная сеть способствует ее поддержанию. Это еще один пример того, что многомодельное мышление способствует получению условных знаний. На вопрос о том, обеспечивают ли связанные сети более высокий или более низкий уровень кооперации, нет однозначного ответа. Если кооперацию поддерживают сложно организованные агенты с помощью репутации, в более связанных сетях имеет место более широкая кооперация. Если кооперация зародилась или эволюционировала среди агентов с простой организацией, таких как деревья или муравьи, менее связанные сети должны способствовать расширению кооперации.

Кластеризация обеспечивает бутстрэппинг кооперации

Если соседи свободного узла — это кооператор со степенью D и K соседями-кооператорами, а все некооператоры пустого узла не имеют соседей-кооператоров, то свободный узел становится кооператором, тогда и только тогда, когда коэффициент кооперативного преимущества превышает отношение степени к количеству кооператоров :

p354

ГРУППОВОЙ ОТБОР

Наш последний механизм бутстрэппинга, эволюции и поддержки кооперации, групповой отбор, основан на конкуренции или отборе среди групп . Для построения модели группового отбора разделим совокупность на подгруппы. В рамках каждой подгруппы отдельные члены совокупности входят в состав одной из версий модели совместных действий, в которой либо сотрудничают, либо отказываются от сотрудничества. Как и прежде, мы можем определить результат каждого члена совокупности. В каждой группе мы также можем вычислить результат, равный среднему результату членов группы. Модель описывает отбор среди групп, в ходе которого копии групп с высокими результатами занимают место групп с низкими результатами. Это создает преимущество для групп кооператоров, которые получают более высокие результаты.

В интуитивном выводе относительно того, что при наличии группового отбора кооперативные группы должны взять верх, есть один подвох: в рамках любой группы отступники превосходят кооператоров. Рассмотрим две группы численностью десять человек. В первую входят два кооператора и восемь отступников. Во вторую — два отступника и восемь кооператоров. Предположим, выгода равна 2, а издержки 1, как и в предыдущем случае. В первой группе результат каждого отступника равен 4, поскольку он получает выгоду 2 от каждого кооператора. Каждый кооператор несет издержки 9 и получает выгоду всего 2, а значит, его результат равен −7. Средний результат члена группы 1,8. Во второй группе каждый отступник получает выгоду 2 от каждого из восьми кооператоров, а значит, его результат равен 16. Результат каждого кооператора равен 5: он получает выгоду 14 от остальных семи кооператоров, но несет издержки 9. Во второй группе средний результат составляет 7,2.

Эти вычисления приводят к парадоксальному выводу: в каждой группе отступники получают более высокий результат, чем кооператоры, но в более результативной группе больше кооператоров. Противоречие должно быть очевидным — индивидуальный отбор поддерживает отказ от сотрудничества, тогда как групповой способствует кооперации — и проявляется в различных экологических, социальных, политических и экономических контекстах. Деревья, чьи корни сотрудничают с другими деревьями, находятся в худшем положении по отдельности, но вносят свой вклад в создание более сильных экосистем, способных захватывать свободные пространства. Кооператоры в сообществах могут получать меньше выгод, чем отступники, однако кооперативные сообщества растут быстрее. У политиков, поддерживающих свою партию, вероятность быть переизбранными ниже, чем у политиков, сфокусированных исключительно на себе, но у сплоченных партий больше шансов к развитию. Человек, работающий на компанию, может оказаться в худшем положении, развивая способности, полезные только для нынешнего работодателя, но если он это делает, его компания может превзойти конкурентов.

Модель совместных действий помогла нам выявить это противоречие и выразить его в количественной форме. Для того чтобы понять, может ли групповой отбор обеспечить бутстрэппинг, эволюцию и поддержку кооперации, нам нужно добавить в модель больше деталей. Траулсен и Новак предлагают изящную модель, в которой совокупности растут, а новые члены напоминают тех, кто получает высокие результаты. В основе такой модели лежит как индивидуальный, так и групповой отбор. Отбор осуществляется на уровне отдельных членов совокупности, но ее более результативные члены, скорее всего, происходят из групп с высоким уровнем кооперации. Когда группа становится достаточно большой, она делится на две части, создавая новую группу. Для предотвращения чрезмерного разрастания совокупности формирование новой группы приводит к удалению случайно выбранной существующей группы. Такая особенность свойственна слабой форме группового отбора .

Эти модели показывают, что групповой отбор усиливает кооперацию при условии, что выгода от совместных действий сравнительно велика, а максимальный размер группы небольшой относительно количества групп. Вывод о том, что эффективность группового отбора отчасти зависит от отношения максимального размера группы к количеству групп, объясняет необходимость конкуренции. Наличие большего количества групп подразумевает более высокую вероятность формирования группы только из кооператоров, а также косвенно указывает на более высокую конкуренцию. Более неожиданный результат состоит в том, что меньший максимальный размер группы обеспечивает более широкую кооперацию. Меньший максимальный размер группы предотвращает доминирование отступников над группами кооператоров, ограничивая воздействие индивидуального отбора. Вспомните о группе из восьми кооператоров и двух отступников, где отступники получают более высокий результат. Если бы ее численность увеличилась до восьмидесяти членов, группа содержала бы гораздо большую долю отступников до того, как произойдет раздел. Если группа делится на две части, как только ее размер достигнет двенадцати членов, в худшем случае после раздела в ней будет две трети кооператоров.

Способность группового отбора усиливать кооперацию можно использовать в организациях. Как правило, большинство организаций назначают оплату в зависимости от результатов работы отдельных сотрудников. Разделение сотрудников на конкурирующие друг с другом команды и распределение бонусов и возможностей на основании результатов работы команд позволяет стимулировать кооперативное поведение. Когда ресурсы предоставляются командам, у сотрудников появляется стимул хорошо в них работать, то есть поддерживать кооперацию . Такие стимулы должны способствовать расширению сотрудничества в командах, если выгода от него достаточно высокая, а размер команд относительно небольшой.

Оценивая потенциал группового отбора, необходимо тщательно взвешивать уровень организации отдельных членов совокупности. Деревья адаптируются медленно, поэтому процесс группового отбора не будет протекать быстро. Люди адаптируются быстро, поэтому, если индивидуальные стимулы отказа от сотрудничества достаточно высокие, групповой отбор должен происходить соответствующими быстрыми темпами. Однако люди могут осознавать последствия группового отбора. Они могут учесть конкуренцию между группами и увидеть, что формирование сильной группы отвечает их интересам. Это повышает вероятность кооперации. Все это говорит о том, что мы не должны слишком доверять тому или иному ограничивающему условию, согласно которому в определенной модели кооперация будет усиливаться, а проанализировать вместо этого множество моделей и выяснить, сохраняют ли актуальность качественные выводы.

РЕЗЮМЕ

Загадку формирования, расширения и поддержания кооперации пытались разгадать тысячи ученых из разных областей науки. Эти исследования проводились с помощью моделей, среди которых самой известной была дилемма заключенного. Если исходить из участия рациональных акторов в повторяющейся игре, загадка исчезает. Сотрудничество можно поддерживать посредством угрозы наказания. Наказание может осуществляться напрямую в ходе повторяющейся игры или косвенным образом, в силу репутации. Эти механизмы позволяют объяснить, как кооперация возникает в условиях высоких ставок и с высокоразвитыми людьми, но они не могут объяснить, почему склонность к сотрудничеству демонстрируют муравьи, пчелы, деревья и голые землекопы. Изучив кооперацию между игроками, придерживающимися правил, мы обнаружили, что ее развитие — непростая задача. Рациональные акторы способны поддерживать кооперацию в такой среде, где играющие по правилам субъекты не могут ее развивать.

Кроме того, мы обнаружили, что, хотя примитивные стратегии (такие как «Око за око») и не оптимальны, они все же способны поддерживать сотрудничество и не становиться объектом эксплуатации. Последующие исследования показали, что стратегия «Око за око» не столь эффективна при наличии случайных ошибок в игре. Если возникает ошибка и игрок отказывается от сотрудничества, два игрока, использующих стратегию «Око за око», образуют цикл действий, включающих отказ от сотрудничества и сотрудничество. Если по стечению обстоятельств оба игрока откажутся от сотрудничества, стратегия «Око за око» приведет к взаимному отказу от сотрудничества вплоть до возникновения очередной ошибки.

В реальных играх с дилеммой заключенного ошибки действительно случаются. Самолет авиакомпании Korean Airlines, выполнявший рейс 007 из Нью-Йорка с дозаправкой в Анкоридже (Аляска) в Сеул, 1 сентября 1983 года вошел в воздушное пространство Советского Союза. Советский истребитель СУ-15 сбил самолет, в результате чего погибло 269 человек, находившихся на борту. США сочли это отказом Советского Союза от сотрудничества. СССР, полагая, что самолет выполнял секретную операцию, воспринял это как отказ США от сотрудничества.

Во избежание бесконечной серии наказаний за ошибку используются другие, более гуманные стратегии, такие как стратегия «выигрываешь — остаешься, проигрываешь — переходишь» (win — stay, lose — shift strategy), то есть повторение действия в случае победы и его замена в случае поражения. В такой стратегии выигрыш от взаимного сотрудничества (R) и выигрыш от искушения (T) условно обозначаются как победа, а два оставшихся выигрыша как поражение. Стратегия «выигрываешь — остаешься, проигрываешь — переходишь» начинается с сотрудничества, после чего в случае победы выполняется то же действие, что и в предыдущем периоде, а в случае поражения происходит переход к другому действию. Проанализировав ряд примеров, можно увидеть, как такая стратегия обеспечивает возврат к кооперативному поведению .

В этой главе мы также описали два других механизма. Кластеризация создает условия для бутстрэппинга кооперации. Этот механизм основывается на кооператорах, которые играют друг с другом и расширяют кооперацию посредством отбора. Групповой отбор действует в соответствии с аналогичной логикой. Группы кооператоров получают высокие результаты и вытесняют группы отступников. В процессе построения моделей мы обнаружили, что кооперация, возникающая в результате кластеризации и группового отбора, требует более строгих условий, чем кооперация через повторения или репутацию. Мы также узнали, что успех различных механизмов зависит от того, как мы моделируем отдельных членов совокупности. Не следует рассчитывать на то, что эти механизмы будут одинаково работать для людей, муравьев и деревьев. Агенты с более высоким уровнем организации в большей степени способны поддерживать кооперацию, поскольку им свойственна дальновидность, но они могут и с большей вероятностью распознавать выгоды отказа от сотрудничества, будучи в окружении кооператоров.

В большинстве случаев мы говорили о кооперации как о том, что приносит выгоду. Однако объекты могут сотрудничать и ради эксплуатации других объектов. Компании образуют картели, чтобы искусственно поддерживать высокие цены, а страны создают коалиции, чтобы ограничить поставку ресурса (такого как нефть), ради собственной выгоды, а не для блага человечества. Опухолевые клетки кооперируются, чтобы противостоять воздействию иммунной системы . Следовательно, при изучении кооперации следует помнить о том, что она не всегда нацелена принести благо. Азиатский буйвол не получает никакой выгоды от совместных действий львов.

Назад: ГЛАВА 21. Три класса моделей теории игр

Дальше: ГЛАВА 23. Проблемы коллективных действий