Глава 3 Решение дилеммы заключенных - Теория игр. Искусство стратегического мышления в бизнесе и жизни - Барри Дж Нейлбафф - RutLib.com

Книга: Теория игр. Искусство стратегического мышления в бизнесе и жизни

Назад: Глава 2 Решение игр методом обратных рассуждений

Глава 3
Решение дилеммы заключенных

Много контекстов – одна концепция

Что общего между следующими ситуациями?

• Две заправочные станции или два супермаркета, расположенных в непосредственной близости друг от друга, время от времени начинают жесткие ценовые войны между собой.

• Во время предвыборной кампании как Демократическая, так и Республиканская партия США часто придерживаются центристской политики, пытаясь привлечь на свою сторону избирателей, не определившихся со своими предпочтениями; при этом они игнорируют основных сторонников, придерживающихся крайних левых и крайних правых взглядов.

• «Разнообразие и продуктивность рыбного промысла в Новой Англии достигли беспрецедентного уровня. Однако сформировавшаяся за прошедшее столетие тенденция чрезмерного промысла привела к вымиранию одного вида рыбы за другим. Атлантический палтус, морской окунь, треска, желтохвостая камбала… пополнили ряды тех видов, которые считаются сейчас вымершими с точки зрения коммерческого промысла».

• В конце известного романа Джозефа Хеллера Catch-22 Вторая мировая война уже почти завершилась. Йоссариан не хочет быть среди тех, кто погибнет последним: это уже никак не повлияет на исход войны. Он объясняет это майору Денби, старшему по званию офицеру. Денби спрашивает его: «Но, Йоссариан, представь себе, что получится, если каждый американец станет рассуждать подобным образом?» Йоссариан отвечает ему: «Только круглый дурак рассуждает иначе. Разве я не прав?».

Ответ: все это примеры дилеммы заключенных. Как и во время допроса Дика Хикока и Перри Смита (героев романа «Хладнокровное убийство», о которых шла речь в ), у каждого участника игры есть свои причины сделать то, что повлечет за собой неблагоприятные последствия для обоих, поскольку каждый из них отслеживает только собственные интересы. Если один признается в совершении преступления, другому тоже лучше признаться, чтобы избежать сурового приговора; если один решит воздержаться от признания, другой сможет значительно облегчить свою участь, если признается. В действительности заключенные испытывают в подобной ситуации настолько сильное давление, что у них появляется желание признать свою вину независимо от того, виновны они (как в романе «Хладнокровный убийца») или невиновны, но полиция сфабриковала против них дело (как в фильме «Секреты Лос-Анджелеса»).

То же самое происходит и с ценовыми войнами. Если автозаправочная станция Nexon назначит низкую цену, Lunaco тоже лучше снизить цены, чтобы не потерять клиентов; если Nexon берет высокую цену за свой бензин, Lunaco может привлечь многих покупателей на свою сторону, снизив цену. Но если обе заправочные станции будут продавать бензин по низкой цене, ни одна из них ничего не заработает (хотя клиентам такая цена только на руку).

Если демократы примут предвыборную платформу, ориентированную на сторонников центристской политики, республиканцы рискуют потерять всех этих избирателей, а значит, и проиграть выборы, если будут работать только со своими основными сторонниками из числа борцов за экономические и социальные права; если демократы станут опекать только своих основных сторонников из числа представителей национальных меньшинств и профсоюзов, тогда республиканцы смогут привлечь на свою сторону умеренных избирателей, а значит, победить в выборах со значительным перевесом голосов, придерживаясь более центристской позиции.

Если все рыболовы будут ловить рыбу в умеренных количествах, большой улов одного рыболова не истощит рыбные ресурсы; если же все остальные начнут активно увеличивать промысел, тогда любой отдельный рыболов поступил бы глупо, пытаясь в одиночку охранять рыбные ресурсы. В итоге происходит чрезмерный вылов рыбы и некоторые виды вымирают.

В романе «Уловка-22» именно логика Йоссариана делает таким трудным дальнейшее участие в уже проигранной войне.

Немного истории

Как специалисты по теории игр изобрели и назвали эту игру, которая охватывает так много аспектов экономического, политического и социального взаимодействия? Это произошло еще на начальном этапе истории развития дисциплины. Гарольд Кун, который и сам был одним из пионеров теории игр, рассказал об этом на симпозиуме, который проводился в рамках церемоний вручения Нобелевской премии за 1994 год.

Весной 1950 года Альберт Такер, будучи в отпуске, приехал в Стэнфорд, а поскольку там не хватало кабинетов, его разместили в кабинете кафедры психологии. Однажды кто-то из психологов постучал к нему в дверь и спросил, чем он занимается. Такер ответил: «Я работаю над теорией игр». Психолог спросил, не согласится ли он провести семинар по этой теме. Для этого семинара Такер и придумал дилемму заключенного в качестве примера, иллюстрирующего теорию игр, равновесие Нэша, а также парадоксы, сопутствующие равновесиям, нежелательным с точки зрения общества. Поскольку это был поистине фундаментальный пример, он стал темой десятков научных работ и ряда серьезных книг.

Другие ученые рассказывают несколько иную историю. По их мнению, математическая структура игры была описана еще до Такера двумя математиками – Меррилом Фладом и Мелвином Дрешером из Rand Corporation (исследовательский центр, который был в свое время оплотом холодной войны). Гениальность Такера заключалась в том, что он придумал историю, иллюстрирующую математические выкладки. И это действительно было гениально, поскольку подача идеи может решить ее судьбу: запоминающаяся презентация способствует быстрому распространению идеи среди мыслящих людей, тогда как скучная и сухая – может привести к тому, что идея не получит должного внимания или вообще будет забыта.

Визуальное представление

Мы проиллюстрируем метод решения этой игры примером из бизнеса. Две конкурирующие компании посылочной торговли – Rainbow’s End и B. B. Lean – специализируются на торговле одеждой. Каждую осень они печатают и рассылают зимние каталоги. Обе компании должны придерживаться тех цен, которые указаны в их каталогах, на протяжении всего зимнего сезона. Период подготовки каталогов гораздо более продолжителен, чем окно для их рассылки, поэтому обе компании должны принимать решения о ценах одновременно, не имея никакой информации о решениях конкурента. В обеих компаниях знают, что их каталоги рассчитаны на общую аудиторию потенциальных покупателей, которые умеют делать покупки с умом и ищут низкие цены.

Как правило, в обоих каталогах публикуется практически идентичный ассортимент товаров. Предположим, один из таких товаров – рубашка из высококачественной ткани шамбре. Такая рубашка обходится каждой компании в 20 долларов. По оценкам обеих компаний, если каждая из них назначит за этот товар цену 80 долларов и продаст 1200 единиц, это обеспечит прибыль в размере (80–20) × 1200 = 72 000 долларов. Кроме того, оказалось, что это наилучшая цена для обеих компаний: если они смогут договориться о том, чтобы назначить одинаковую цену, 80 долларов – это та цена, которая обеспечит обеим максимальную прибыль.

В каждой из компаний подсчитали, что если одна из них снизит цену на 1 доллар, а другая оставит ее неизменной, то компания, снизившая цену, привлечет 100 покупателей: 80 покупателей, перешедших от другой компании, и 20 новых (например, тех, кто решил приобрести рубашку, которую не стали бы покупать по более высокой цене, или покупателей, пожелавших заказать товар по каталогу, вместо того чтобы покупать его в местном торговом центре). Таким образом, у каждой компании есть соблазн назначить более низкую цену, чтобы привлечь больше покупателей. Цель всей этой истории – разобраться в том, чем может обернуться такое решение.

Начнем с предположения о том, что обеим компаниям предстоит выбрать одну из двух цен: 80 и 70 долларов. Если одна компания снизит цену до 70 долларов, а другая оставит цену 80, первая компания привлечет на свою сторону 1000 покупателей, тогда как вторая потеряет 800. Следовательно, компания, снизившая цену, продаст 2200 рубашек, а у другой компании объем продаж сократится до 400 единиц; прибыль составит (70–20) × 2200 = 110 000 долларов у компании, снизившей цену, и (80–20) × 400 = 24 000 – у другой компании.

Что произойдет, если обе компании одновременно снизят цену до 70 долларов? При снижении цены на 1 доллар у компаний останутся имеющиеся покупатели и появятся по 20 новых. Следовательно, если обе компании снизят цену на 10 долларов, каждая из них продаст на 10 × 20 = 200 единиц товара больше предыдущих 1200 единиц. Таким образом, каждая компания продаст по 1400 единиц товара и получит прибыль в размере (70–10) × 1400 = 70 000 долларов.

Представим возможную прибыль обеих конкурирующих компаний в наглядном виде. Мы не можем использовать для этого дерево игры наподобие тех деревьев, которые приведены в . В данном примере два игрока действуют одновременно. Ни один из них не может сделать очередной ход, опираясь на информацию о том, что сделал другой игрок или какой ответный ход он может предпринять. Вместо этого каждый игрок должен анализировать, о чем в это же время думает другой игрок. Отправная точка для таких «рассуждений о рассуждениях» состоит в том, чтобы отобразить в наглядном виде все последствия каждой комбинации возможных вариантов выбора, который могут одновременно сделать обе компании. Поскольку у каждой из них только одна альтернатива: 80 или 70 долларов, это значит, что существует четыре возможные комбинации. Проще всего отобразить их в виде таблицы, состоящей из столбцов и строк, которую мы будем называть таблицей игры, или таблицей выигрышей. Выбор Rainbow’s End (сокращенно RE) будет отображен в строках этой таблицы, а выбор B. B. Lean (BB) – в столбцах. В каждой из четырех ячеек таблицы, соответствующих каждому выбору RE в строке и BB в столбце, содержатся две цифры, обозначающие прибыль каждой компании от продажи рубашки (в тысячах долларов). Цифра, расположенная в левом нижнем углу ячейки, соответствует тому игроку, для которого выделены строки; цифра в правом верхнем углу ячейки – игроку, для которого выделены столбцы. На языке теории игр эти цифры называются выигрышем. Для того чтобы внести полную ясность в то, какие выигрыши соответствуют каждому из игроков, в представленной таблице соответствующие фрагменты ячеек выделены разными оттенками серого цвета.

Прежде чем приступить к поиску решения этой игры, мы хотели бы обратить ваше внимание на один ее аспект. Сравните пары выигрышей в четырех ячейках. Лучший результат для RE не всегда означает худший результат для ВВ, и наоборот. В частности, для обеих компаний ситуация в левой верхней ячейке лучше, чем в правой нижней. В конце этой игры не обязательно должен быть победитель и проигравший: это не игра с нулевой суммой. В мы уже говорили о том, что инвестиционная игра Чарли Брауна тоже не относится к категории игр с нулевой суммой, как и большинство игр, с которыми мы сталкиваемся в реальной жизни. Во многих играх, таких как дилемма заключенных, главный вопрос заключается в том, как избежать проигрыша или добиться выигрыша обеих сторон.

Дилемма

Проанализируем ход рассуждений менеджера компании RE. «Если ВВ выберет 80 долларов, я могу получить 110 тысяч долларов вместо 72 тысяч, снизив цену до 70 долларов. Если ВВ выберет 70 долларов, мой выигрыш составит 70 тысяч, если я тоже назначу эту цену, и только 24 тысячи долларов, если я оставлю цену 80. Для меня более выгодный вариант (в действительности самый выгодный, поскольку у меня только одна альтернатива) остается неизменным, что бы ни решили в ВВ. Следовательно, мне вообще не нужно думать о том, что думают они; мне просто нужно первым назначить цену 70 долларов».

Если в игре с параллельными ходами есть такое свойство (а именно оптимальный выбор игрока не зависит от выбора других игроков), это существенно упрощает рассуждения игроков, а также анализ, который делают специалисты по теории игр в подобных случаях. Следовательно, наличие такого свойства существенно упрощает решение игры. Специалисты по теории игр обозначают его термином «доминирующая стратегия». Говорят, что у игрока есть доминирующая стратегия, если эта стратегия лучше всех остальных стратегий независимо от того, какую стратегию или сочетание стратегий выберет другой игрок или игроки. Существует простое правило участия в играх с параллельными ходами:

ПРАВИЛО № 2: если у вас есть доминирующая стратегия, примените ее.

Дилемма заключенных – еще более специфичная игра: в ней доминирующая стратегия есть не у одного, а у обоих игроков (или у всех игроков). Менеджер компании ВВ рассуждает точно так же, как менеджер RE; для того чтобы хорошо усвоить эту идею, вы должны самостоятельно проанализировать ход рассуждений менеджера ВВ. Сделав это, вы увидите, что цена 70 долларов – это доминирующая стратегия и для компании ВВ.

Результат применения такой стратегии отображен в правой нижней ячейке таблицы игры: обе компании назначают цену 70 долларов и получают прибыль по 70 тысяч долларов каждая. Необходимо обратить внимание на следующий аспект дилеммы заключенных, который делает ее настолько важной игрой. Когда каждый из игроков применяет свою доминирующую стратегию, оба получают худший результат по сравнению с тем, что они получили бы, если бы доверились друг другу и договорились о том, что каждый выберет другую, доминируемую стратегию. В нашем примере это означало бы, что каждая компания назначит на свой товар цену 80 долларов, для того чтобы получить результат, отображенный в верхней левой ячейке матрицы игры, а именно прибыль в размере 72 тысячи долларов.

Для этого было бы недостаточно, чтобы только одна компания назначила на свой товар цену 80 долларов: это повлекло бы за собой очень плохие последствия для этой компании. Так или иначе, обе компании должны назначить высокую цену, чего очень трудно добиться на практике, учитывая существующий у каждой из них соблазн назначить более низкую цену, чем у конкурента. Если обе компании будут преследовать свои эгоистические интересы, они не смогут получить наилучший результат для них обеих. Такой вывод противоречит тому, чему учат нас классические экономические теории, начиная с теории Адама Смита.

Это вызывает ряд вопросов, часть которых связана с более общими аспектами теории игр. Что произойдет, если доминирующая стратегия будет только у одного участника игры? Что если ни у одного игрока не окажется доминирующей стратегии? Если оптимальный выбор каждого игрока зависит от того, что в это же время выбирает другой игрок, могут ли они разгадать выбор друг друга и найти решение этой игры? Мы проанализируем ответы на эти вопросы в следующей главе, в которой рассматривается более общий подход к решению игр с параллельными ходами, а именно равновесие Нэша. В данной главе сосредоточимся на решении дилеммы заключенных.

В обобщенном описании дилеммы заключенных две стратегии, имеющиеся в распоряжении каждого игрока, обозначаются так: «сотрудничать» и «предать» (или в некоторых случаях – «обмануть»); мы будем придерживаться именно этих терминов. Предательство – это доминирующая стратегия для каждого игрока; если оба игрока выберут эту стратегию, их выигрыш будет меньше, чем в случае выбора стратегии сотрудничества.

Предварительные соображения по поводу решения дилеммы заключенных

У игроков, столкнувшихся с дилеммой заключенных, есть веские основания для достижения договоренности о совместных действиях, которые позволили бы уйти от ее решения. Например, в Новой Англии рыболовы могут согласиться на ограничение улова ради сохранения рыбных ресурсов на будущее. Проблема состоит только в том, как обеспечить выполнение таких договоренностей в условиях, когда каждая сторона испытывает соблазн обмануть другую (например, выловить рыбы больше, чем позволяет квота). Что говорит теория игр по этому поводу? И что происходит в таких случаях в реальной жизни?

С тех пор как дилемму заключенных сформулировали впервые, прошло более пятидесяти лет. За это время были усовершенствованы теоретические основы этой дилеммы, а также накоплен большой объем данных, полученных как в процессе наблюдений за тем, что происходит в реальной жизни, так и в ходе лабораторных экспериментов. Давайте проанализируем этот материал и посмотрим, какие уроки мы можем из него извлечь.

У стратегии сотрудничества есть обратная сторона: стремление избежать предательства. Игрока можно заинтересовать в том, чтобы он выбрал стратегию сотрудничества вместо доминирующей стратегии предательства, пообещав ему достаточное вознаграждение. Кроме того, его можно удержать от применения стратегии предательства с помощью адекватного наказания.

Метод вознаграждения проблематичен по нескольким причинам. Вознаграждение может носить внутренний характер: один игрок платит другому за выбор стратегии сотрудничества. В иных случаях вознаграждение может быть внешним: третья сторона, заинтересованная в сотрудничестве между двумя игроками, платит им за выбор этой стратегии. Как бы там ни было, вознаграждение нельзя предоставлять игроку, пока он не сделает свой выбор, в противном случае он просто положит его себе в карман, после чего откажется выполнять договоренность. С другой стороны, если вознаграждение просто обещают, игрок может не поверить этому обещанию: когда он выберет стратегию сотрудничества, не исключено, что тот, кто дал это обещание, нарушит его.

Однако, несмотря на все эти трудности, вознаграждение бывает действенным и полезным. Проявив максимум креативности и воображения, игроки могли бы одновременно дать друг другу обещания и сделать их заслуживающими доверия, поместив обещанное вознаграждение на счете условного депонирования, который контролирует третья сторона. В реальной жизни чаще складывается иная ситуация: поскольку игроки взаимодействуют по нескольким направлениям, сотрудничество в одном из них вознаграждается ответной услугой в чем-то другом. Так, самки шимпанзе делятся едой или присматривают за чужими детенышами в обмен на помощь в уходе за шерстью. В некоторых случаях третья сторона может быть заинтересована в обеспечении сотрудничества в игре. Например, ради того чтобы положить конец конфликтам в разных странах мира, Соединенные Штаты Америки и Европейский союз иногда обещают участникам противостояния экономическую помощь в качестве вознаграждения за мирное решение конфликта. Именно таким способом Соединенные Штаты вознаградили Израиль и Египет за сотрудничество в рамках подписания Кэмп-Дэвидских мирных соглашений в 1978 году.

Более распространенный метод решения дилеммы заключенных – наказание. Он имеет прямое действие. В фильме «Секреты Лос-Анджелеса» сержант Эд Эксли обещает Лерою Фонтейну, одному из подозреваемых, что если он согласится стать государственным свидетелем, то получит более мягкий приговор, чем два других подозреваемых, Рэй Коутс и Тайрон Джонс. Но Лерой знает, что, когда он выйдет из тюрьмы, его могут ждать на свободе друзья этих двоих!

Наказание, которое в данном контексте выглядит более естественным, оказывается возможным в связи с тем, что большинство подобных игр представляют собой часть непрерывного взаимодействия. Обман может обеспечить одному игроку краткосрочное преимущество, но навредит его взаимоотношениям с другим игроком и в долгосрочной перспективе обойдется гораздо дороже. Если цена достаточно велика, именно это может удержать игрока от обмана.

Наглядный пример такой ситуации предоставляет бейсбол. В Американской бейсбольной лиге питчеры попадают мячом в бэттеров на 11–17 процентов чаще, чем в Национальной бейсбольной лиге. По мнению профессоров Университета Юга в Суони Дага Драйнена и Джона-Чарльза Брэдбери, это обусловлено правилом о назначенном хиттере. В Американской бейсбольной лиге питчеры не бьющие игроки. Следовательно, питчер Американской лиги, который попадает мячом в бэттера, может не бояться ответных действий со стороны питчера команды-соперника. Вероятность того, что мяч попадет в питчера, совсем небольшая, но она повышается в четыре раза, если он попал в кого-то в предыдущей половине иннинга. В таком случае страх получить ответный удар очевиден. Первоклассный питчер Курт Шиллинг объяснил это так: «Вы на самом деле готовы бросить в кого-то мяч, если играете против Рэнди Джонсона?».

В ситуации, когда один игрок наказывает другого за обман, действует стратегия «око за око, зуб за зуб». Эта стратегия оказалась настоящим открытием, сделанным в ходе самого известного эксперимента с дилеммой заключенных. В следующем разделе вы узнаете об этом эксперименте и его уроках.

Стратегия равноценных ответных действий

В начале 1980-х годов политолог Мичиганского университета Роберт Аксельрод предложил специалистам по теории игр со всего мира разработать стратегии решения дилеммы заключенных в виде компьютерных программ. Они были распределены по парам, каждая из которых разыгрывала дилемму заключенных 150 раз. На основании набранных очков составили рейтинг программ, принимавших участие в турнире.

Победителем стал профессор математики университета в Торонто Анатолий Рапопорт. Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для Роберта Аксельрода этот результат явился большой неожиданностью, поэтому он решил провести еще один турнир, увеличив число участников. Рапопорт и в этот раз подал программу, основанную на той же стратегии, – и снова победил.

Стратегия равноценных ответных действий – один из вариантов правила поведения «поступайте с другими так, как они поступают с вами». Если говорить более точно, эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял соперник на предыдущем этапе.

По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается на четыре принципа, которые должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и прощение. Стратегия равноценных ответных действий очень проста и понятна: сопернику нет необходимости долго размышлять над вашим следующим ходом или просчитывать его. В основе такой стратегии лежит доброжелательность: она никогда не инициирует обман. В этой стратегии есть элемент возмездия: она не оставляет обман безнаказанным. Кроме того, эта стратегия стимулирует прощение: участники игры не держат зла друг на друга слишком долго и готовы возобновить сотрудничество.

Одна из самых впечатляющих характеристик стратегии равноценных ответных действий состоит в том, что она показала лучшие результаты по итогам всего турнира, хотя и не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом противостоянии с ними. В лучшем случае эта стратегия может только сравнять счет с соперником. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель получает все», стратегия равноценных ответных действий имела бы на своем счету только проигрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира.

Однако Аксельрод оценивал парные игры между компьютерными программами не по принципу «победитель получает все»: в его турнирах учитывался такой фактор, как готовность к сотрудничеству. Большое преимущество этой стратегии заключается в том, что она сближает соперников. В худшем случае эта стратегия может потерпеть поражение из-за одного предательства, но дальше – только ничья.

Стратегия равноценных ответных действий стала победителем этих соревнований именно потому, что стимулировала сотрудничество, не допуская при этом эксплуатации. Другие стратегии были либо слишком ориентированными на доверие и открытыми для эксплуатации, либо слишком агрессивными и побуждающими игроков выбивать друг друга из игры.

И все-таки мы считаем, что стратегия равноценных ответных действий – ошибочная. Малейший промах или неправильное толкование результатов приводят к полному провалу стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования между компьютерными программами, поскольку там просто исключались ошибки и неправильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки и заблуждения неизбежны, а результат может оказаться катастрофическим.

Проблема стратегии равноценных ответных действий состоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоянии может и не наступить момент, когда одна из сторон приняла бы наказание без ответного удара.

Предположим, Флад и Дрешер разыгрывают стратегию равноценных ответных действий. Поначалу ни один из них не идет на предательство, поэтому какое-то время все складывается хорошо. Затем, скажем, в 11-м раунде игры Флад по ошибке выбирает стратегию «предать» или останавливается на стратегии «сотрудничать», но Дрешер по ошибке считает, что Флад выбрал предательство. В любом случае Дрешер выберет в 12-м раунде ход «предать», но Флад выберет стратегию «сотрудничать», поскольку Дрешер выбрал сотрудничество в 11-м раунде. В 13-м раунде они поменяются ролями. Ситуация, когда один из игроков выберет сотрудничество, а другой – предательство, будет повторяться снова и снова до тех пор, пока очередная ошибка или заблуждение не восстановят сотрудничество между соперниками или не заставят каждого из них выбрать предательство.

Такие циклы или ответные удары часто наблюдаются во время реальных конфликтов между израильтянами и арабами на Ближнем Востоке, или между католиками и протестантами в Северной Ирландии, или между индусами и мусульманами в Индии. На границе между штатами Западная Вирджиния и Кентукки шла памятная вражда между Хэтфилдами и Маккоями. В художественной литературе тоже можно найти яркие примеры того, как такие действия могут привести к непрекращающемуся циклу ответных ударов, как в случае вражды между Грэнджерфордами и Шепердсонами в романе Марка Твена.

Да из-за чего же вышла ссора, Бак? Из-за земли?

– Я не знаю. Может быть.

– Ну а кто же первый стрелял? Грэнджерфорд или Шепердсон?

– Господи, ну почем я знаю! Ведь это так давно было.

– И никто не знает?

– Нет, папа, я думаю, знает, и еще кое-кто из стариков знает; они только не знают, из-за чего в самый первый раз началась ссора.

Стратегия равноценных ответных действий не предполагает возможности остановить этот порочный круг. Она слишком ориентирована на возмездие и недостаточно стимулирует прощение. В следующих версиях соревнований, которые устраивал Роберт Аксельрод, предусматривалась возможность ошибок и заблуждений; в итоге другие, более бескорыстные, стратегии показали свое превосходство над стратегией равноценных ответных действий.

Здесь мы можем научиться чему-то даже у обезьян. В ходе одного эксперимента с хохлатыми тамаринами одной из обезьян давали возможность потянуть рычаг, чтобы другая могла достать пищу. Однако для того, чтобы потянуть рычаг, следовало приложить усилие. Теоретически каждой обезьяне было бы выгоднее ничего не делать, пока партнер тянет рычаг. Но тамарины научились сотрудничать, чтобы избежать возмездия. Их сотрудничество сохранялось до тех пор, пока одна из обезьян два раза подряд не совершила предательство. Эта стратегия представляет собой разновидность стратегии «зуб за зуб», а именно – «два зуба за зуб».

Более поздние эксперименты

Дилемма заключенных стала объектом тысяч экспериментов с участием разного числа игроков, с повторениями и с другой трактовкой условий игры. Вот некоторые важные выводы, сделанные в ходе этих экспериментов.

Первый и самый важный вывод состоит в том, что игроки выбирают стратегию сотрудничества достаточно часто, даже если два игрока попадают в одну пару только один раз. В среднем почти половина игроков отдают предпочтение сотрудничеству. Самое впечатляющее доказательство этого факта было получено в ходе проведения телевикторины Friend or Foe («Друг или враг») на канале Game Show Network. Командам из двух человек задавали достаточно простые вопросы. Деньги, полученные участниками за правильные ответы, уходили в «трастовый фонд»; за 105 эпизодов в таком фонде накапливалось от 200 до 16 400 долларов. Для того чтобы разделить эти деньги, двум участникам предстояло решить следующую дилемму.

Каждый игрок должен был написать на листе бумаги слово «друг» или «враг». Если оба написали «друг», деньги делились поровну. Если один игрок написал «враг», а другой – «друг», весь выигрыш получал тот, кто написал «враг». Но если оба игрока написали «враг», ни один из них не получал ничего. Что бы ни сделала другая сторона, каждый игрок мог получить минимум столько же, сколько его соперник (или даже больше), если бы он написал «враг», а не «друг». Тем не менее почти половина участников шоу писали слово «друг». Даже когда призовой фонд увеличивался, вероятность того, что игроки выберут сотрудничество, оставалась прежней. Люди были в равной степени готовы сотрудничать, когда на кону стояло три и пять тысяч долларов. К таким же выводам пришли в ходе исследований Феликс Оберхольцер-Джи, Джоэль Вальдфогель, Мэтью Уайт и Джон Лист.

Если вы сомневаетесь, можно ли считать телевизионное шоу научным исследованием, обратите внимание на следующий факт: участникам телевикторины выплатили более 700 тысяч долларов. У этого эксперимента с дилеммой заключенных оказалось самое лучшее финансирование за всю историю экспериментов такого рода. Кроме того, по результатам викторины было сделано много важных выводов. Оказалось, что женщины в большей степени готовы идти на сотрудничество, чем мужчины: 53,7 процента (в первом сезоне – 47,5 процента). В первом сезоне участники шоу не имели возможности увидеть результаты других состязаний перед тем, как принимать решение. А вот во втором сезоне были оглашены результаты первых 40 эпизодов, что позволяло увидеть закономерность. Участники шоу учились на опыте своих предшественников. Если команда состояла из двух женщин, коэффициент сотрудничества повышался до 55 процентов, а когда в состав команды входили одна женщина и один мужчина, этот коэффициент падал до 34,2 процента. У мужчин в этом случае коэффициент сотрудничества тоже снижался до 42,3 процента. В целом готовность участников шоу сотрудничать уменьшалась на десять пунктов.

Когда группу участников эксперимента несколько раз разбивают по парам, каждый раз формируя новые пары, число людей, которые выбирают сотрудничество, со временем сокращается. Тем не менее это число не сводится до нуля; вместо этого формируется небольшая группа участников эксперимента, неизменно отдающих предпочтение сотрудничеству.

Если одна и та же пара играет в базовую игру с дилеммой заключенных много раз подряд, в большинстве случаев образуется весьма значительная последовательность взаимного сотрудничества; это продолжается до тех пор, пока один из игроков уже в самом конце серии игр не выберет стратегию предательства. Именно это произошло в ходе первого эксперимента с дилеммой заключенных. Как только Меррил Флад и Мелвин Дрешер придумали эту игру, они предложили двум своим коллегам сыграть в нее 100 раз. В 60 раундах игры оба участника выбрали стратегию сотрудничества. Длинный период взаимного сотрудничества продолжался с 83-го по 98-й раунд, пока в 99-м раунде один из игроков не выбрал стратегию предательства.

Если следовать строгой логике теории игр, то в действительности этого не должно было произойти. Если игра повторяется ровно 100 раз, она представляет собой серию игр с одновременными ходами, а значит, мы можем применить к ней логику обратных рассуждений. Определите, что произойдет в сотом раунде. Это последний раунд игры, поэтому предательство не может быть наказано в следующих раундах. В таком случае, согласно принципу доминирующей стратегии, оба игрока должны выбрать в последнем раунде стратегию предательства. Но как только принимается такое предположение, последним становится, по сути, 99-й раунд. Хотя игрокам предстоит еще один раунд, выбор стратегии предательства в 99-м раунде не может быть наказан в 100-м раунде, поскольку сделанный в этом раунде выбор предопределен. Следовательно, логика доминирующей стратегии применима и к 99-му раунду. Эти рассуждения можно продолжить до первого раунда. Однако в реальной игре, будь то в лаборатории или в реальном мире, игроки склонны игнорировать эту логику и пытаются извлечь выгоду из взаимного сотрудничества. Поведение, которое на первый взгляд может показаться иррациональным (отказ от доминирующей стратегии), оказывается правильным выбором при условии, что другие игроки ведут себя столь же иррационально.

Специалисты по теории игр предлагают следующее объяснение этого феномена. В этом мире есть люди, которые всегда поступают с другими так, как поступают с ними; такие люди готовы сотрудничать до тех пор, пока другие делают то же самое. Предположим, вы не принадлежите к числу этих достаточно милых людей. Если бы в игре с конечным числом повторений вы вели себя так, как того требует ваш тип личности, вы начали бы с обмана. Это раскрыло бы ваш характер другому игроку. Для того чтобы скрыть правду (хотя бы на какое-то время), вам придется вести себя достойно. Зачем вам делать это? Предположим, вы начнете игру, поступив порядочно. Если другой игрок не относится к тем, кто всегда платит той же монетой, он подумает, что вы, возможно, принадлежите к числу тех немногих людей, которых можно назвать порядочными. Временное сотрудничество может принести определенную выгоду, поэтому другой игрок, желая получить эту выгоду, попытается ответить на вашу порядочность тем же. Это пойдет на пользу и вам. Разумеется, при этом вы (так же, как и другой игрок) планируете перейти к стратегии предательства к концу игры. Тем не менее на начальном этапе игры вы оба можете поддерживать взаимовыгодное сотрудничество. Хотя каждый игрок ждет момента, когда удастся воспользоваться порядочностью другого, этот взаимный обман приносит пользу им обоим.

В ходе некоторых экспериментов вместо распределения испытуемых по парам и проведения серии игр с дилеммой заключенных организуется большая игра с участием всей группы. Мы хотим привести здесь особенно интересный и поучительный пример. Профессор Реймонд Батталио из Техасского сельскохозяйственно-машиностроительного университета организовал следующую игру с участием 27 студентов. Все студенты, якобы владельцы гипотетических компаний, должны были решить (одновременно и независимо друг от друга, написав свое решение на листике бумаги), какой объем продукции будет выпускать их компании: 1, который поможет сохранить совокупное предложение на низком уровне, а цены – на высоком, или 2, который позволит получить дополнительный доход за счет других. В зависимости от числа студентов, которые выберут объем продукции 1, деньги будут выплачены им по следующей схеме:

На графике эта схема представлена в наглядном виде.

Игра построена таким образом, чтобы студенты, выбравшие 2 («предать»), всегда получали на 50 центов больше, чем студенты, выбравшие 1 («сотрудничать»), но чем больше студентов выбирают 2, тем меньше их совокупный выигрыш. Предположим, все 27 студентов начинают с выбора 1; в таком случае каждый из них получит по 1,08 доллара. А теперь представьте себе, что один из них переключается на вариант 2. В игре остается 26 студентов, выбравших 1; каждый из них получит по 1,04 доллара (на 4 цента меньше, чем по первоначальному плану), но студент, изменивший стратегию, получит 1,54 доллара (на 46 центов больше). Такое распределение выигрыша не зависит от первоначального числа студентов, намеревающихся выбрать 1, а не 2. В данном случае вариант 2 – это доминирующая стратегия. Каждый студент, который переключается со стратегии 1 на стратегию 2, увеличивает свой выигрыш на 46 центов, но в то же время сокращает выигрыш каждого из оставшихся 26 участников игры на 4 цента. Когда все участники игры начнут действовать эгоистично, пытаясь получить максимальный выигрыш, каждый из них получит по 50 центов. Если бы они могли успешно объединить свои усилия и выбрать такой образ действий, который свел бы их общий выигрыш к минимуму, каждый из них получил бы по 1,08 доллара. А как вы сыграли бы в эту игру?

Когда эта игра проводилась на практике (один раз без обсуждения в группе, другой раз с обсуждением, для того чтобы выработать согласованные действия), число студентов, которые были готовы сотрудничать и выбрали вариант 1, колебалось от 3 до 14. В последней игре, в которой студенты объединили свои усилия, их было 4. Совокупный выигрыш составил 15,82 доллара, что было на 13,34 доллара меньше, чем в том раунде игры, в котором студентам удалось договориться. «Я больше никогда в жизни не стану никому доверять!» – недовольно пробормотал студент, который больше всех выступал за согласованные действия. Но каким был его выбор? «Ну, я выбрал 2», – сказал он. Йоссариан понял бы его.

В современных экспериментах с играми в дилемму заключенных с несколькими участниками используется вариант, получивший название «игра со взносами в общий фонд». Каждому игроку предоставляется некая начальная сумма, скажем, 10 долларов. После этого он решает, какую часть этой суммы оставит себе и какую отдаст в общий фонд. Затем экспериментатор удваивает сумму, накопившуюся в общем фонде, и делит ее поровну между всеми участниками игры (как теми, которые сделали взнос в общий фонд, так и теми, которые оставили всю сумму себе).

Предположим, в группу входят четыре игрока: А, Б, В и Г. Независимо от действий других игроков, если А решит внести 1 доллар в общий фонд, после удваивания сумма в общем фонде увеличится на 2 доллара. Но 1,5 доллара достанется при этом игрокам Б, В и Г; сам игрок А получит всего 50 центов. Следовательно, игрок А потеряет еще больше денег, если увеличит взнос в общий фонд; напротив, он будет в выигрыше, если сократит размер этого взноса. И такая ситуация складывается независимо от того, какой взнос в общий фонд делают другие игроки (и делают ли они его вообще). Иными словами, для игрока А доминирующая стратегия состоит в том, чтобы не вносить в общий фонд ничего. То же самое верно и для игроков Б, В и Г. Согласно этой логике, каждый участник игры должен рассчитывать на то, что он сможет стать «безбилетником» – получить выгоду от действий других игроков, не делая никакого взноса в общий фонд. Если все четыре игрока будут придерживаться своей доминирующей стратегии, общий фонд останется пустым, а каждый участник игры просто сохранит свою первоначальную сумму 10 долларов. Если каждый попытается проехаться «зайцем», автобус так и не сдвинется с места. С другой стороны, если бы каждый игрок внес в общий фонд всю имеющуюся у него сумму – 10 долларов, после удваивания в фонде оказалось бы 80 долларов, а доля каждого игрока составила бы 20 долларов. Но у каждого из них свои мотивы в такой игре. В этом и состоит их дилемма.

Игра со взносами в общий фонд – это не только объект лабораторных экспериментов или теоретических изысканий; она разыгрывается в реальном мире в тех случаях социального взаимодействия, когда некое общее благо можно создать только благодаря добровольному вкладу членов группы, но доступ к нему нельзя запретить тем членам группы, которые не внесли свой вклад в общее дело. Такая ситуация складывается, например, в случаях борьбы с наводнениями или рационального использования природных ресурсов: дамбы или плотины невозможно построить так, чтобы паводковые воды затопляли поля только тех обитателей деревни, которые не принимали участия в строительстве противопаводковых сооружений. Что касается рационального использования газа и рыбных ресурсов, на практике просто невозможно в будущем не допускать к этим ресурсам тех, кто сверх меры потреблял их в прошлом. Именно это и создает дилемму в игре с участием нескольких игроков: каждый игрок испытывает соблазн уклониться от работы или не делать взнос в общий фонд, рассчитывая на получение выгоды от вклада других участников группы. Когда так рассуждают все игроки, результат совместных действий оказывается совсем небольшим или вообще отсутствует, что негативно сказывается на всей группе. Эта ситуация встречается настолько часто, что во всех областях социальной теории и социальной политики возникла потребность в глубоком понимании методов решения данной дилеммы.

Возможно, самый интересный вариант этой игры – когда игрокам предоставляется возможность наказывать тех, кто нарушает принятое по умолчанию социальное соглашение о сотрудничестве. Однако связанные с этим издержки должны взять на себя все участники. После того как игра со взносами в общий фонд завершена, информация о взносе каждого игрока доводится до сведения всех остальных. Затем проводится второй этап игры, в ходе которого каждый игрок может предпринять действия, направленные на сокращение выигрыша других игроков, но это обойдется ему в какую-то сумму (как правило, около 33 центов) на каждый доллар того сокращения, которое он выбрал. Иными словами, если игрок А решает сократить выигрыш игрока Б на три доллара, выигрыш игрока А сократится на один доллар. Деньги, высвободившиеся в результате такого сокращения, не передаются никому другому, а возвращаются в фонд экспериментатора.

Результаты этого эксперимента говорят о том, что его участники склонны наказывать нарушителей социальных договоренностей (так называемых социальных обманщиков), взыскивая с них значительную сумму денег. Перспектива наказания существенно увеличивает размер взносов в общий фонд на первом этапе игры. По всей вероятности, наказание – это эффективный способ достижения сотрудничества, который приносит пользу всей группе. Однако тот факт, что люди действительно прибегают к этому методу, кажется неожиданным только на первый взгляд. Наказание других за свой счет – это уже вклад в общее благо. Это доминируемая стратегия, но если она стимулирует обманщика вести себя лучше в будущем, это приносит пользу всей группе, а наказавший получает только малую долю от этой выгоды. Следовательно, наказание должно быть следствием чего-то большего, чем сугубо эгоистический расчет. И это действительно так. В ходе ряда экспериментов проводилась позитронно-эмиссионная томография мозга игроков. Оказалось, что применение наказания активизирует дорсальный стриатум – участок головного мозга, который отвечает за удовольствие и удовлетворенность. Иными словами, люди действительно получают психологическую выгоду или удовольствие, наказывая нарушителей коллективных договоренностей. По всей вероятности, этот инстинкт имеет глубокие биологические корни и прошел процесс отбора потому, что обеспечивает эволюционное преимущество.

Как достичь сотрудничества

На основании всех этих примеров и экспериментов можно выделить ряд предпосылок и стратегий успешного сотрудничества. Далее представлено систематизированное описание этих концепций, а также приведены примеры их применения в реальной жизни.

Успешная система наказания должна удовлетворять ряду требований.

Определение обмана. Нельзя наказывать кого-то за обман, не установив сам факт обмана. Если обман обнаруживается быстро и безошибочно, наказание может быть незамедлительным и адекватным. Это позволяет снизить выигрыш от обмана и увеличить связанные с ним издержки, а значит, повышает вероятность успешного сотрудничества. Так, авиакомпании постоянно отслеживают цены конкурентов; если бы в American Airlines захотели снизить плату за перелет из Нью-Йорка в Чикаго, в United Airlines могли бы ответить тем же не более чем через пять минут. Однако компании, желающие снизить свои цены, могут сделать это посредством тайных сделок с клиентами или скрыть снижение цен в сложных сделках со множеством разных условий, таких как сроки доставки, качество продукции, гарантийные обязательства и так далее. В самом крайнем случае каждая компания может отслеживать данные только о своих продажах и прибылях, которые зависят и от ряда случайных факторов, в том числе действий других компаний. Например, объем продаж компании бывает обусловлен колебаниями спроса, а не только тайным снижением цен конкурирующей компанией. В таком случае процесс обнаружения обмана и наказания за него протекает не только медленно, но и не совсем правильно, что усиливает искушение обмануть снова.

В заключение следует отметить, что, когда в одном сегменте рынка работают две-три компании одновременно, они должны установить не только сам факт обмана, но и кем совершен этот обман. В противном случае наказание носит не адресный, а расплывчатый характер и может развязать ценовую войну, которая повредит всем без исключения.

Характер наказания. Далее необходимо решить, каким именно должно быть наказание. Иногда в распоряжении игроков есть возможность наказать других участников игры буквально сразу же после обнаружения обмана даже в процессе однократного взаимодействия. Как мы уже отметили при обсуждении дилеммы, возникшей перед героями фильма «Секреты Лос-Анджелеса», друзья Рэя Коутса и Тайрона Джонса дождутся, когда Лерой Фонтейн выйдет из тюрьмы, и накажут его за то, что он стал государственным свидетелем ради более мягкого приговора. В эксперименте с участием студентов Техасского университета, когда они могли определить, кто нарушил договоренность о выборе варианта 1, у них была возможность применить к обманщикам социальные санкции, такие как остракизм. В этом случае мало кто из студентов пошел на такой риск ради 50 центов.

Другие виды наказания возникают благодаря самой структуре игры. Как правило, это происходит в повторяющихся играх, когда выигрыш от обмана в одном раунде игры приводит к проигрышу в будущих раундах. Достаточно ли этого, чтобы удержать от обмана того игрока, который допускает такую возможность, зависит от размера выигрыша и проигрыша, а также от важности будущих событий по отношению к настоящим. Далее мы проанализируем этот аспект.

Понятность. Потенциальный обманщик должен понимать границы приемлемого поведения, а также последствия обмана. Если эти аспекты игры слишком сложны, игрок может допустить обман по ошибке или потому, что не сумел просчитать свои ходы и играл интуитивно. Возьмем в качестве иллюстрации такой пример. Предположим, компании Rainbow’s End и B. B. Lean постоянно играют в игру с установлением цен и в RE приходят к выводу, что если средняя дисконтированная прибыль RE за последние 17 месяцев окажется на 10 процентов ниже реальной средней нормы прибыли на промышленный капитал за тот же период, это будет означать, что в ВВ пошли на обман. ВВ ничего не известно об этом правиле напрямую; специалистам этой компании придется делать косвенные выводы о том, какое правило применяют в RE, наблюдая за действиями этой компании. Однако сформулированное здесь правило может оказаться слишком сложным для ВВ, так что это не такой уж хороший способ удержать ВВ от обмана. А вот стратегия равноценных ответных действий совершенно понятна: если ВВ пойдет на обман, RE сразу же ответит на это снижением цен.

Неизбежность. Игроки должны быть уверены в том, что предательство будет наказано, а сотрудничество – вознаграждено. Отсутствие такой уверенности – основная проблема некоторых международных соглашений, таких как соглашения о снятии торговых ограничений, которые заключает Всемирная торговая организация (ВТО). Когда одна страна жалуется на то, что другая нарушила соглашение, ВТО инициирует административный процесс, который тянется несколько месяцев или даже лет, а наказание зависит скорее не от фактических обстоятельств дела, а от требований международной политики и дипломатии. Вряд ли такие меры по обеспечению выполнения соглашений можно назвать эффективными.

Размер. Насколько суровым должно быть наказание? По всей видимости, здесь не следует устанавливать никаких ограничений. Если наказание достаточно суровое, чтобы удержать игроков от обмана, просто не будет необходимости его применять. Следовательно, можно ввести достаточно серьезное наказание, которое действительно станет сдерживающим фактором. Например, ВТО предусмотрит в своем уставе пункт о применении ядерного оружия против страны, которая помешает попыткам этой организации удерживать протекционистские тарифы на низком уровне, установленном по общему согласию стран – членов ВТО. Вы наверняка содрогнулись от ужаса – отчасти потому, что допускаете возможность ошибки, которая повлечет за собой такие последствия. Если ошибки действительно возможны (как это и бывает в реальной жизни), наказание необходимо устанавливать на минимальном уровне, обеспечивающем успешное сдерживание при любых обстоятельствах. В самых крайних случаях бывает целесообразно даже простить отдельные случаи нарушения договоренностей. Компании, которая борется за выживание, можно позволить немного снизить цены, не опасаясь ответных мер со стороны конкурентов.

Повторяемость. Вернемся к ценовой игре между компаниями Rainbow’s End и B. B. Lean. Предположим, им из года в год удается поддерживать цены на оптимальном для обеих компаний уровне – 80 долларов. Но вот менеджеры RE рассматривают возможность снизить цену до 70 долларов. По их подсчетам, это принесло бы RE дополнительную прибыль в размере 110 000 – 72 000 = 38 000 долларов. Однако это может разрушить доверие между компаниями. В RE должны понимать, что в будущем ВВ тоже решат снизить цену до 70 долларов и обе компании смогут зарабатывать только по 70 000 долларов в год. Если бы в RE придерживались первоначальной договоренности, обе компании зарабатывали бы по 72 000 долларов. Следовательно, если RE снизит цену, это обойдется ей в 72 000 – 70 000 = 2000 долларов за каждый будущий год. Стоит ли разовый выигрыш в размере 38 тысяч долларов того, чтобы все последующие годы терять по две тысячи долларов в год?

Процентная ставка – один из главных факторов, от которых зависит равновесие между настоящим и будущим. Предположим, процентная ставка составляет 10 процентов в год. Компания RE может положить на счет свои 38 тысяч долларов и зарабатывать по 3800 долларов в год. Это полностью покрывает убытки компании в размере двух тысяч долларов за каждый очередной год. Следовательно, RE выгодно пойти на обман конкурента. Но если процентная ставка составляет только пять процентов в год, тогда сумма 38 тысяч долларов принесет компании всего 1900 долларов в каждом следующем году, а это меньше убытков в размере двух тысяч долларов, которые понесет RE вследствие нарушения договоренности, поэтому компания решает не снижать цену. Процентная ставка, при которой будет достигнуто равновесие, равна 2∕38 = 0,0526, или 5,26 процента в год.

Основная идея всех этих рассуждений выглядит следующим образом: если процентная ставка достаточно низкая, будущее имеет относительно более высокую ценность. Например, если процентная ставка – 100 процентов, будущее имеет низкую ценность по отношению к настоящему: год спустя один доллар – это всего 50 центов сейчас, поскольку через год вы можете превратить эти 50 центов в один доллар, заработав еще 50 центов на процентах за этот год. Но если процентная ставка равна нулю, то год спустя один доллар будет стоить столько же, сколько сейчас.

В нашем примере более близкая к реальности процентная ставка – пять процентов, поэтому соблазн каждой компании снизить цену на 10 долларов ниже оптимальной для них обеих цены 80 долларов хорошо сбалансирован, а согласование действий в повторяющейся игре не всегда бывает возможным. В мы увидим, насколько может упасть цена, если над участниками игры не нависает тень будущего, а соблазн обмануть соперника становится непреодолимым.

Еще один важный фактор, который необходимо учитывать в играх такого рода, – это вероятность дальнейшего взаимодействия. Если рубашка – это предмет преходящей моды, который может и не продаваться на протяжении всего следующего года, перспектива будущих убытков не подавит соблазн обмануть конкурента в текущем году.

Однако Rainbow’s End и B. B. Lean продают много других товаров, кроме этой рубашки. Не приведет ли попытка снизить цену на рубашку к ответным действиям конкурента по всем остальным товарам? И разве перспектива такого серьезного ответного хода недостаточна для того, чтобы удержаться от стратегии предательства? Увы, не так уж просто достичь устойчивого сотрудничества между компаниями, опираясь на практическую ценность их взаимодействия по всему ассортименту товаров. Перспектива ответных действий по всем товарам неразрывно связана с перспективой получить немедленный выигрыш благодаря серии обманных действий по всем этим направлениям, а не только по одному. Если бы таблицы выигрышей по всем товарам были идентичными, прибыли и убытки увеличились бы ровно во столько раз, сколько товаров есть у каждой компании, и это не повлияло бы на общий итог. Следовательно, успешное наказание в дилемме со множеством товаров носит не столь явный характер и зависит скорее от различий между самими товарами.

Третий важный момент, имеющий отношение к данной теме, – это прогнозируемое изменение объема бизнеса в течение продолжительного периода. У такого изменения может быть два аспекта: устойчивый рост или падение и колебания. Если бизнес будет расти, компании, которая рассматривает возможность предательства в текущий момент, необходимо учитывать, что в будущем она рискует понести более серьезные убытки из-за потери сотрудничества. Напротив, если объем бизнеса сокращается, компании испытывают более сильное искушение пойти на предательство и получить максимум возможного сейчас, зная, что их будущее под угрозой. Что касается колебаний, компании более склонны обманывать конкурентов, когда наступает временный подъем: в таком случае обман обеспечит им больше прибыли уже сейчас, тогда как негативное влияние потери сотрудничества ударит по ним лишь в будущем, когда объем бизнеса окажется на среднем уровне. Следовательно, можно предположить, что ценовые войны должны возникать в период высокого спроса. Но так бывает не всегда. Если период низкого спроса наступает вследствие общего падения экономики, у потребителей сокращаются доходы и они делают покупки более осторожно: их лояльность по отношению к той или иной компании может измениться, а реакция на различия в ценах – ускориться. При таком развитии событий компания, снижающая цены, вправе рассчитывать на то, что ей удастся привлечь на свою сторону больше клиентов, переманив их от конкурента, а значит, и получить за счет такого обмана больше прибыли в ближайшем будущем.

И последнее: большую роль в достижении сотрудничества играет состав группы игроков. Если он стабилен и предполагается, что он останется таким и в будущем, это способствует поддержанию сотрудничества. Новые игроки, не заинтересованные в сотрудничестве или у которых нет истории участия в данном соглашении о сотрудничестве, с меньшей вероятностью будут его придерживаться. Если существующая группа игроков ожидает, что в ближайшем будущем появятся новые игроки, которые нарушат принятую по умолчанию договоренность о сотрудничестве, это усиливает их готовность обмануть конкурентов и воспользоваться хотя бы какими-то дополнительными выгодами уже сейчас.

Категорический императив Канта и дилемма заключенных

Иногда можно услышать утверждения, будто участники игры с дилеммой заключенных выбирают сотрудничество потому, что принимают решение не только ради себя, но и ради соперника. На самом деле это заблуждение, но люди поступают подобным образом, будто это действительно так и есть.

Каждый участник игры хочет, чтобы другой игрок выбрал сотрудничество, и решает для себя, что его соперник придерживается такой же логики принятия решений, что и он. По мнению такого участника игры, другой игрок должен сделать такие же логические выводы, какие сделал он сам. Следовательно, если игрок выбирает сотрудничество, он считает, что другой игрок сделает то же самое; если же он выбирает стратегию предательства, он приходит к выводу, что это заставит другого игрока тоже предать. Это напоминает категорический императив Канта: «Поступай лишь согласно той максиме, которую ты желал бы видеть всеобщим законом».

Разумеется, это очень далеко от истины. Действия одного игрока не оказывают никакого влияния на другого игрока. И все же людям кажется, что их действия, даже если они незаметны, могут повлиять на выбор других участников игры.

Сила такого образа мыслей была показана в ходе эксперимента с участием студентов Принстонского университета, который провели Эльдар Шафир и Амос Тверски. Исследователи предложили студентам сыграть в игру с дилеммой заключенных. Однако в отличие от обычной схемы проведения такой игры в некоторых случаях они сообщали одному игроку, что сделал другой. Когда студентам говорили, что другой игрок выбрал стратегию предательства, только три процента отвечали на это сотрудничеством. Когда игрокам говорили, что их соперник выбрал сотрудничество, это приводило к увеличению доли игроков, выбравших сотрудничество, до 16 процентов. Следовательно, подавляющее большинство студентов все же предпочитали действовать исходя из собственных интересов. Тем не менее многие из них были готовы ответить сотрудничеством на сотрудничество, даже если ради этого им приходилось чем-то пожертвовать.

Как вы думаете, что происходило, когда студентам не сообщали о выборе других игроков? Осталась ли доля участников игры, готовых пойти на сотрудничество, в пределах от 3 до 16 процентов? Нет, она увеличилась до 37 процентов. На первый взгляд может показаться, что это лишено всякого смысла. Если вы не выбрали сотрудничество, ни тогда, когда знали, что другая сторона выбрала стратегию предательства, ни тогда, когда знали, что другая сторона выбрала стратегию сотрудничества, с какой стати вам выбирать сотрудничество, если вы не знаете, что сделала другая сторона?

Эльдар Шафир и Амос Тверски называют это «квазимагическим мышлением» – верой в то, что, предпринимая какие-либо действия, вы можете повлиять на действия другой стороны. Когда людям сообщают, что сделала другая сторона, они осознают, что не могут этого изменить. Но если они не знают об этом, им кажется, что их действия могут иметь какое-то влияние или что другая сторона так или иначе применит ту же цепочку рассуждений и придет к тем же выводам, что и они. Поскольку вариант «сотрудничать, сотрудничать» более предпочтителен по сравнению с вариантом «предать, предать», они выбирают сотрудничество.

Следует отметить, что такая логика совершенно нелогична. Ваши мысли и действия не имеют никакого влияния на мысли и действия других людей. Им приходится принимать решения, не зная, что вы думаете и какие действия предпринимаете. Тем не менее факт остается фактом: если бы членам общества было свойственно такое квазимагическое мышление, они не становились бы жертвами дилеммы заключенных и получали более весомый выигрыш от взаимодействия друг с другом. Может ли человеческое общество намеренно прививать своим членам такое мышление ради этой великой цели?

Примеры дилеммы заключенных в бизнесе

Вооружившись в предыдущих разделах таким набором инструментов, как экспериментальные данные и теоретические концепции, выйдем из лаборатории в реальный мир, проанализируем некоторые примеры дилеммы заключенных и попытаемся найти ее решение.

Начнем с дилеммы, которая возникает у конкурирующих компаний в той или иной отрасли. Их общим интересам больше всего отвечают монополизация или картелизация этой отрасли и поддержание цен на высоком уровне. Однако каждая из этих компаний сумеет добиться большего для себя, если нарушит соглашение и пойдет на снижение цен, для того чтобы отнять бизнес у конкурентов. Что же могут сделать эти компании в такой ситуации? Некоторые факторы, способствующие успешному сговору между компаниями (такие как повышение спроса или отсутствие нового игрока, способного нарушить сложившуюся ситуацию), останутся – как минимум частично – вне их контроля. Однако компании могут создать условия для успешного обнаружения обмана и разработать эффективную стратегию наказания.

Достичь такого сговора легче, если компании регулярно проводят встречи своих представителей и обмениваются информацией. В таком случае в процессе переговоров они постараются найти компромисс по поводу того, какие методы работы считать приемлемыми и что представляет собой обман. Процесс переговоров и его итоги способствуют внесению ясности в сложившуюся ситуацию. Если происходит событие, которое можно расценивать как обман (при отсутствии доказательств противного), еще одна встреча позволит понять, что это на самом деле – невинная случайная ошибка или сознательный обман. Следовательно, такой подход способен предотвратить ненужные наказания. Кроме того, встреча помогает выработать адекватные действия в случае, если наказание все-таки понадобится.

Проблема состоит в том, что успешное решение такой дилеммы в рамках группы участников отрасли наносит вред интересам общества. Потребители вынуждены платить завышенную цену, а компании не поставляют часть своих запасов на рынок, чтобы поддерживать цены на высоком уровне. Как сказал Адам Смит, «люди одной профессии редко собираются вместе даже для развлечения, но их встречи заканчиваются заговором против общества или планом увеличить расценки». Правительства, которые стремятся защитить интересы общества, вмешиваются в подобные ситуации и вводят в действие антимонопольные законы, запрещающие компаниям вступать в сговор. В США антимонопольный закон Шермана запрещает любой сговор, направленный на ограничение торговли и монополизацию отрасли. Ценовой сговор или сговор в целях закрепления доли на рынке – самые распространенные примеры такого сговора. Верховный суд США не только вынес запрет на официальные соглашения подобного рода, но и постановил, что любая явная или негласная договоренность между компаниями, которая приводит к фиксации цен, – это нарушение закона Шермана независимо от первоначальных намерений. Нарушение антимонопольных законов может повлечь за собой не только корпоративные штрафы, но и тюремное заключение высших должностных лиц компании.

Все это не означает, что компании не пытаются применять незаконные методы и избежать наказания за это. В 1996 году ведущая американская компания по переработке сельскохозяйственной продукции Archer Daniels Midland (ADM) и ее японский партнер, компания Ajinomoto, были пойманы на таком сговоре. Они заключили соглашение о разделе рынка и о ценообразовании по различным продуктам, таким как лизин (который производится из кукурузы и используется в целях обогащения корма для кур и свиней). Цель соглашений заключалась в том, чтобы поддерживать высокие цены в ущерб потребителям. Эти компании руководствовались в своих действиях таким принципом: «Конкуренты – это наши друзья, а потребители – наши враги». Неправомерные действия компаний были обнаружены благодаря тому, что один из участников переговоров со стороны ADM стал информатором ФБР и сделал много аудиозаписей и даже несколько видеозаписей встреч между представителями компаний.

Самый известный случай нарушения антимонопольных законов, который используется в школах бизнеса в качестве учебного примера, произошел на рынке больших турбин для производства электроэнергии. В 1950-х годах на американском рынке турбин работали три компании: GE была самой крупной из них – на ее долю приходилось 60 процентов рынка; Westinghouse – около 30 процентов рынка и Allied-Chalmers – около 10 процентов. Они сохраняли за собой эти рыночные доли и поддерживали высокие цены с помощью тщательно продуманной схемы координации действий. Вот как она работала. Электроэнергетические компании объявляли тендер на турбины, которые они собирались покупать. Если приглашение на участие в тендере поступало с 1-го по 17-й день лунного месяца, Westinghouse и Allied-Chalmers должны были выставить очень высокие цены на свои турбины, с тем чтобы их предложения наверняка проиграли тендер, а GE по взаимному сговору становилась победителем тендера, предложив самую низкую цену (которая была все же монопольной ценой, обеспечивающей высокую прибыль). Точно так же компания Westinghouse становилась заранее известным победителем, если приглашение на тендер поступало с 18-го по 25-й лунный день, и Allied-Chalmers – с 26-го по 28-й лунный день. Поскольку электроэнергетические компании рассылали приглашения на участие в тендере не по лунному календарю, со временем каждый из производителей получал свою долю на рынке. Любая попытка нарушить договоренность сразу же была бы замечена конкурентами. Однако, поскольку сотрудникам Министерства юстиции даже не пришло в голову привязывать победителей тендера к лунному циклу, этот сговор был защищен от угрозы обнаружения. В итоге органы власти все-таки разобрались в ситуации, некоторые руководители этих трех компаний были приговорены к тюремному заключению, а столь прибыльный сговор провалился. Впоследствии предпринимались и другие попытки применить различные схемы сговора.

В 1996–1997 годах вариант схемы с турбинами использовали в процессе подачи заявок на участие в аукционе лицензий на частоты мобильной связи. Компания, которая хотела получить лицензию на использование частоты в том или ином городе, сообщала другим о своем решении бороться за эту лицензию, указав телефонный код этого города в качестве последних трех цифр предлагаемой цены. Другие компании давали ей возможность выиграть аукцион. При условии, что одна и та же группа компаний принимает участие в большом числе таких аукционов на протяжении длительного периода, а также что антимонопольные органы не обнаружат схему, она может действовать достаточно долго.

Однако гораздо чаще компании той или иной отрасли предпринимают попытки достичь негласного соглашения, или соглашения по умолчанию, не поддерживая непосредственных контактов. Это исключает риск уголовного преследования за нарушение антимонопольного законодательства, хотя в распоряжении антимонопольных органов есть и другие меры, направленные на разрушение даже негласного сговора. Сложность этой ситуации заключается в том, что такое соглашение не совсем понятно его участникам, а попытки нарушить его трудно обнаружить. Тем не менее компании в состоянии найти способ преодолеть и то и другое.

Вместо установления фиксированных цен они могут договориться о разделе рынка по территориальному признаку, по категории продуктов или по любому другому признаку такого рода. В этом случае обман заметить гораздо легче: ваши продавцы сразу же узнают о том, что конкурирующая компания отняла у вас часть рынка.

Процесс обнаружения факта снижения цен (особенно в розничной торговле) можно упростить, а возмездие сделать быстрым и автоматическим с помощью таких схем, как обещания не уступать и даже превзойти конкурентов и создать самые благоприятные условия для потребителей. Многие компании по продаже электронных приборов и других товаров для дома во всеуслышание заявляют, что продадут свой продукт по цене ниже цены любого конкурента. Некоторые из них даже обещают, что если вы найдете более низкую цену на тот же продукт в течение месяца после его покупки, то они возместят вам разницу или даже удвоят сумму. На первый взгляд может показаться, что такие стратегии стимулируют конкуренцию, гарантируя низкие цены. Однако даже поверхностный анализ этой ситуации с точки зрения теории игр показывает, что в действительности эти стратегии могут иметь прямо противоположный эффект. Предположим, компании Rainbow’s End и B. B. Lean взяли такую стратегию на вооружение и договорились назначить на свои рубашки цену 80 долларов. Теперь каждая из них знает, что, если она снизит цену до 70 долларов, конкурент сразу же узнает об этом. На самом деле самая большая хитрость этой стратегии состоит в том, что она перекладывает задачу раскрытия обмана на потребителей, которые больше всего заинтересованы в обнаружении низких цен. А потенциальный нарушитель договоренности тоже знает, что его конкурент может незамедлительно принять ответные меры, снизив свои цены, – для этого даже не нужно ждать выхода каталога на следующий год.

Обещания не уступать и даже превзойти конкурентов по цене или качеству продукции могут быть достаточно изощренными и уклончивыми. В ходе конкурентной борьбы между Pratt & Whitney (P&W) и Rolls-Royce (RR) за поставку реактивных авиационных двигателей для самолетов Boeing 757 и Boeing 767 компания P&W обещала всем потенциальным покупателям, что ее двигатели будут на восемь процентов более экономичными с точки зрения расхода топлива, чем двигатели RR, в противном случае P&W возместит разницу в затратах на топливо.

Принцип наибольшего благоприятствования потребителям гласит, что продавец предложит самую лучшую цену всем, а не избранным потребителям. Если принимать это обещание за чистую монету, может показаться, что производители гарантируют низкие цены. Но давайте глубже проанализируем ситуацию. Этот принцип означает, что производитель не может вести конкурентную борьбу, предлагая выборочные скидки, для того чтобы переманить клиентов от конкурента, и в то же время продавая продукцию по прежним высоким ценам постоянным клиентам. Такой производитель вынужден пойти на общее снижение цен, что обходится ему дороже, поскольку приводит к сокращению маржи прибыли по всем продажам. Как видите, это создает явное преимущество для картеля: выигрыш от обмана становится меньше, что повышает вероятность того, что картель сохранит свое влияние.

Федеральная комиссия по торговле (одна из ветвей американской системы применения антимонопольных законов) проводила расследование о применении этого принципа компаниями DuPont, Ethyl и другими производителями антидетонационных присадок к бензину. По результатам расследования комиссия пришла к выводу об антиконкурентном характере такой практики и запретила компаниям включать такие пункты в контракты с клиентами.

Трагедия общин

В начале этой главы мы упомянули о чрезмерном использовании рыбных ресурсов. Подобные проблемы обусловлены тем, что каждый человек стремится потреблять как можно больше ресурсов ради личной выгоды, перекладывая последствия своих действий на всех остальных людей или на будущие поколения. Профессор Калифорнийского университета Гаррет Хардин назвал этот феномен трагедией общин и использовал в качестве одного из примеров чрезмерный выпас общих пастбищ в Англии в XV и XVI столетиях. Проблема чрезмерного использования общих ресурсов получила широкую известность под тем самым названием, которое и использовал Хардин, – «трагедия общин». В настоящее время заявил о себе более значительный пример этой проблемы – глобальное потепление. Никто не извлекает личной выгоды из сокращения выбросов углекислого газа, но если каждый будет преследовать только собственные интересы, от этого пострадают все.

Это и есть дилемма заключенных со многими участниками, подобная той, с которой столкнулся Йоссариан в романе «Уловка-22», стараясь не рисковать жизнью во время войны. Безусловно, общество осознаёт последствия нерешенности таких дилемм и предпринимает попытки исправить ситуацию. Но как определить, насколько они успешны?

Политолог Университета штата Индиана Элинор Остром вместе со своими коллегами и студентами провела масштабные исследования попыток решения такой дилеммы, как трагедия общин, – иными словами, проблемы рационального потребления и сохранения общественных ресурсов, а также предотвращения чрезмерной эксплуатации и быстрого истощения природных ресурсов. Исследователи изучили как успешные, так и неудачные попытки и определили предпосылки, необходимые для эффективной координации усилий в этой сфере.

Во-первых, должны быть установлены четкие правила в отношении членов группы игроков в данной игре – тех, кто имеет право на использование соответствующих ресурсов. Как правило, в качестве такого критерия выступает географическое положение или место постоянного проживания, а также этническая принадлежность, навыки или членство, которое может продаваться на аукционе или предоставляется за вступительный взнос.

Во-вторых, следует установить четкие правила, определяющие разрешенные и запрещенные действия. К числу таких правил относятся ограничения на период использования (открытый или закрытый сезон для охоты или рыбной ловли), место (фиксированный участок или ротация участков для вылова рыбы), технологию (размер рыболовных сетей) и, наконец, на количество или долю ресурса (например, количество дров, которые разрешается собрать и вынести из леса одному человеку).

В-третьих, должна быть введена прозрачная и понятная для всех сторон система штрафов за нарушение перечисленных правил. Эта система не обязательно должна представлять собой подробный свод правил; общие нормы поведения в стабильном сообществе могут быть не менее прозрачными и эффективными. Против нарушителей правил могут применяться самые разные санкции – от устного порицания или социального остракизма до штрафов, лишения будущих прав, а в некоторых крайних случаях – лишения свободы. Тяжесть каждого вида наказания тоже может быть разной, но важно придерживаться принципа постепенного ужесточения наказания. В случае первого возможного нарушения правил чаще всего применяется такой метод: установить с нарушителем прямой контакт и потребовать, чтобы он решил возникшую проблему. За первый или второй случай нарушения назначаются достаточно низкие штрафы, которые повышаются только в случае, если нарушения продолжаются или становятся более серьезными.

В-четвертых, должна быть введена эффективная система обнаружения нарушений. Самый лучший метод состоит в том, чтобы нарушения обнаруживались автоматически в ходе повседневной деятельности игрока. Например, рыболовная компания, у которой есть как хорошие, так и плохие участки, может организовать ротацию прав на хорошие участки. Рыболов, получивший хорошее место для вылова рыбы, сразу же заметит, использует ли это место нарушитель; он лично заинтересован в том, чтобы сообщить о нарушении остальным членам группы и добиться применения адекватных санкций против нарушителя. Еще один пример – введение требований о том, что сбор урожая в лесу или в других зонах общего пользования должен производиться только группами: так обеспечивается взаимный контроль и устраняется необходимость в найме охраны.

В некоторых случаях правила, определяющие разрешенные действия, необходимо разрабатывать, учитывая, существуют ли реалистичные способы обнаружить нарушения. Например, иногда бывает трудно контролировать размер улова, даже если рыболов имеет самые добрые намерения. Поэтому правила рыбного промысла, основанные на количестве выловленной рыбы, используются достаточно редко. Квоты на количество того или иного ресурса более эффективны в случаях, когда это количество легче отслеживать и можно точно измерить, как, например, воду, поставляемую из водохранилищ, а также собранную лесную продукцию.

В-пятых, когда создаются такие правила и системы их введения в действие, очень важно, чтобы информация об этом была доступна потенциальным пользователям ресурсов. Хотя уже после введения правил у каждого пользователя может возникнуть соблазн их нарушить, все они в равной степени заинтересованы в создании эффективной системы правил. При ее создании пользователи могут применить свои знания соответствующего ресурса и технологии его использования, знания о практической осуществимости мер по обнаружению нарушений, а также понимание степени доверия членов их группы к различным видам санкций за нарушение правил. Как показывает практика, в случае централизованного или иерархического управления многие из этих аспектов трактуются неправильно, поэтому такая система регулирования общих ресурсов неэффективна.

В целом Элинор Остром и ее коллеги оптимистично оценивают возможность эффективного решения многих проблем коллективной деятельности посредством использования информации о местных условиях и системах правил, но в то же время она предостерегает против чрезмерного перфекционизма: «Эта дилемма никогда не исчезнет, даже в тех системах, которые работают наилучшим образом. <…> Никакой мониторинг или применение санкций не сможет свести соблазн к нулю. Вместо того чтобы думать о преодолении трагедии общин, необходимо создать системы самоорганизации, которые справятся с этой проблемой лучше других».

Суровые законы природы

Как и следовало ожидать, дилемма заключенных возникает не только у человека, но и у других биологических видов. В таких ситуациях, как постройка гнезда, добыча пищи и спасение от хищников, животное может действовать либо эгоистично (в собственных интересах и в интересах близкой родни), либо в интересах всей группы. Какие обстоятельства способствуют эффективным коллективным действиям? Биологи-эволюционисты провели исследования по этому вопросу и обнаружили ряд удивительных примеров и идей. Вот один из таких примеров.

Когда британского биолога Джона Холдейна спросили, станет ли он рисковать жизнью ради другого человека, он ответил: «За двух своих братьев или за восьмерых кузенов – да». У вас половина общих генов с родным братом (кроме однояйцевых близнецов) и одна восьмая – с кузеном; следовательно, такие действия увеличивают ожидаемое число копий ваших генов, которые передадутся следующему поколению. Подобное поведение совершенно оправдано с биологической точки зрения: процесс эволюции отдает ему предпочтение. Такая сугубо биологическая основа для кооперативного поведения среди близких родственников объясняет удивительное и сложное взаимодействие, которое наблюдается в колониях муравьев и роях пчел.

При отсутствии похожих генетических связей альтруизм среди животных – редкое явление. Однако взаимный альтруизм возникает и сохраняется между членами группы животных с более низкой генетической идентичностью, если взаимодействие между этими животными носит устойчивый и долгосрочный характер. Вот немного страшный, но интересный пример: летучие мыши-вампиры, обитающие в Коста-Рике, живут колониями около десяти особей, но охотятся порознь. Каждый день может оказаться для одних вампиров удачным, а для других – неудачным. Удачно поохотившиеся вампиры возвращаются в дуплистое дерево, в котором обитает их группа, и могут поделиться добычей, отрыгивая кровь, которую они принесли с охоты. Летучей мыши, которая три дня не получает свою порцию крови, грозит гибель. В колониях мышей-вампиров применяются эффективные методы взаимной страховки против такой угрозы с помощью разделения добычи.

Биолог Мэрилендского университета Джеральд Уилкинсон исследовал базовые причины такого поведения, собрав летучих мышей из разных мест и объединив их в одну группу. Он систематически отбирал кровь у некоторых из них и наблюдал за тем, делятся ли с ними кровью другие мыши. В итоге Уилкинсон обнаружил, что мыши делятся кровью только в случае, если один из членов группы находится на грани смерти, но не раньше. По всей вероятности, летучие мыши способны отличить реальную потребность от временного невезения. Еще более интересно то, что кровью делились между собой только те мыши, которые знали друг друга по предыдущим группам, и что они охотнее делились с теми членами группы, которые когда-то уже приходили им на помощь. Иными словами, летучие мыши способны идентифицировать других мышей и запоминать их поведение в прошлом, что приводит к формированию эффективной системы взаимного альтруизма.

Учебный пример: дилемма ранней пташки

Галапагосские острова – среда обитания дарвиновских вьюрков. На этих вулканических островах очень трудные условия для жизни, поэтому эволюционный отбор действует там достаточно сильно. Изменение размера клюва вьюрка даже на миллиметр может оказаться решающим фактором в борьбе за выживание.

На каждом из островов свои источники пищи, и клюв вьюрка отражает эти различия. На большом острове Дафне основной источник пищи – кактус. На этом острове птицы с весьма точным названием «кактусовые вьюрки» эволюционировали так, что их клюв идеально приспособлен к сбору пыльцы и нектара из цветков кактуса.

Эти птицы не ведут осознанную игру друг против друга. Тем не менее каждый вариант адаптации их клюва можно считать их стратегией. Стратегии, которые дают вьюркам преимущество в добыче пищи, обеспечивают выживание, выбор партнеров для спаривания и получение большего числа потомства. Клюв вьюрка – это результат такого сочетания естественного и полового отбора.

Однако даже если на первый взгляд все обстоит как нельзя лучше, генетика порой подбрасывает сюрпризы. Старая поговорка гласит: кто рано встает, тому бог подает. На острове Дафне именно вьюрок стал той ранней пташкой, которой достается нектар. Вместо того чтобы ждать девяти часов утра, когда цветки кактуса раскрываются сами, некоторые вьюрки попытались попробовать нечто новое. Они сами вскрывали цветки кактуса, чтобы поживиться раньше всех.

На первый взгляд может показаться, что это дает вьюркам преимущество перед соперниками, прилетающими немного позже. Единственная проблема в том, что, когда птицы вскрывают цветок, они часто обламывают рыльце. Джонатан Вейнер объясняет это так:

Рыльце – это верхушка тонкостенной трубки, которая выступает в виде длинной прямой соломинки в центре каждого цветка. Когда рыльце сломано, цветок становится бесплодным. Мужские гаметы, которые содержатся в пыльце, не могут соединиться с женскими гаметами цветка. В итоге цветок кактуса увядает, не завязав плод.

Если у кактуса увядает цветок, исчезает основной источник пищи кактусовых вьюрков. Можно предположить, каким будет результат такой стратегии: нет нектара, нет пыльцы, нет семян, нет плодов – и в итоге нет кактусовых вьюрков. Означает ли это, что в ходе эволюции вьюрки столкнулись с дилеммой заключенных, из-за которой этот вид может вымереть?

Анализ примера

Это не совсем так по двум причинам. Вьюрки занимают определенную территорию, а значит, эти птицы (и их потомки), если на месте их обитания не останется кактусов, могут погибнуть. В этом смысле уничтожение источника пищи для птиц, которые будут обитать в этом районе в следующем году, не стоит лишней порции пыльцы. Следовательно, у птиц с таким отклонением от нормы не окажется преимущества перед другими. Однако вывод будет иным, если эта стратегия получит широкое распространение. Вьюрки расширят поиск пищи, и даже если останутся птицы, которые будут ждать естественного раскрытия цветков, это все равно не спасет рыльца их кактусов. После этого наступит голод, и тогда больше всего шансов выжить будет у тех птиц, которые с самого начала имели сильные преимущества. В таком случае дополнительный глоток нектара сыграет решающую роль.

Здесь мы видим адаптацию по принципу опухолевых клеток. Если популяция остается маленькой, она может вымереть. Но если популяция разрастается до слишком больших размеров, эта стратегия становится самой лучшей. Поскольку такая стратегия становится выигрышной даже в относительном масштабе, единственный способ остановить этот процесс – уничтожить всю популяцию и начать все с самого начала. Если на острове Дафне совсем не останется вьюрков, больше некому будет ломать рыльца цветков и кактусы снова начнут цвести. Когда на остров прилетит пара удачливых вьюрков, у них будет возможность повторить весь процесс с самого начала.

Игра, о которой здесь идет речь, весьма напоминает дилемму заключенных, это один из вариантов игры «охота на оленя», которую проанализировал в свое время философ Жан-Жак Руссо. Если во время такой охоты все участники работают вместе, чтобы поймать оленя, им это удается. Проблема возникает только тогда, когда мимо кого-то из охотников пробегает заяц. Если в погоню за зайцем бросаются слишком много охотников, оставшихся мало для того, чтобы поймать оленя. В таком случае всем лучше пуститься в погоню за зайцами. В охоте на оленя оптимальная стратегия выглядит так: преследовать оленя стоит тогда и только тогда, когда вы уверены в том, что все остальные охотники сделают то же самое. У вас нет причин не преследовать оленя, кроме случаев, когда вы не доверяете другим охотникам.

В итоге мы получаем игру в доверие. Существует два способа играть в эту игру: все действуют сообща – и жизнь прекрасна или каждый преследует только свои интересы – и жизнь становится ужасной, жестокой и короткой. Это не классическая дилемма заключенных, в которой у каждого человека есть стимул обмануть других игроков, какие бы действия они ни предпринимали. В данном случае нет никаких причин нарушать правила, если вы уверены в том, что другие поступают так же. Но доверяете ли вы им? Если даже доверяете, можете ли вы положиться на то, что они поверят вам? Или можете ли вы поверить тому, что они поверят в то, что вы доверяете им? Как сказал Франклин Рузвельт (в другом контексте), нам нечего бояться, кроме самого страха.

Для того чтобы применить свои знания о дилемме заключенных на практике, ознакомьтесь со следующими учебными примерами, приведенными в главе 14: и .

Назад: Глава 2 Решение игр методом обратных рассуждений

Дальше: Глава 4 Прекрасное равновесие