Дилемма Бенджена и Хиллера
Двое заключенных в одной ловушке – логика сотрудничества и логика измены – турнир Аксельрода – Милашка, Подлец и Марио Барт – око за око – трагедия альменды
Как лучше поступить заключенному Бенджену? Он задается вопросом, какие вообще варианты есть у него и какие у его подельника Хиллера, сидящего в соседней камере. Он обдумывает возможное поведение Хиллера и прикидывает, как ему наилучшим образом поступить в каждом случае. Сложная ситуация упрощается за счет того, что есть два варианта отказа от дачи показаний, один из которых – свидетельствовать против подельника. В общем, выражаясь юридическим языком, либо войти в сговор, либо выдать соучастника преступления. Скажем, Хиллер решает войти в сговор. Тогда и Бенджен может поступить так же, и обоим придется отсидеть год в тюрьме. Но он может и выдать Хиллера, и уйти от ответственности. Итак, предательство – наилучшая стратегия для Бенджена, если Хиллер молчит.
Если же Хиллер станет валить на Бенджена, в то время как тот молчит, последнему светит срок в 10 лет. Если же Бенджен тоже заговорит, оба отправятся за решетку на 5 лет. То есть если Хиллер выдал подельника, то Бенджену надо поступить аналогично, чтобы получить наиболее приемлемый результат.
В том-то вся и хитрость дилеммы заключенного: то, что правильно для Бенджена, является и наилучшим раскладом для Хиллера. Независимо от того, знают ли оба, как поступил другой, предательство – лучшая стратегия для обоих. Если каждый решится на нее, то оба отправятся в тюрьму на 5 лет. Если же они будут хранить молчание, то исход для обоих будет еще лучше, но это только если у каждого на уме исключительно собственная выгода. Поэтому вся ситуация представляет собой дилемму.
Как бы проста ни была дилемма заключенного, основной принцип последствий сотрудничества и предательства обнаруживает себя в повседневной жизни людей и животных. Независимо от того, каков вклад другого, сотрудничество с партнером всегда имеет свою цену, а преимущества оно дает лишь тогда, когда и партнер готов к нему. Именно это кажется неумным с точки зрения издержек.
Так выглядит ситуация с позиции теории игр. Как же живым организмам, корысть которых продиктована самими эволюционными правилами, удалось преодолеть этот барьер и объединиться? Разве не должна была природа навеки остаться камерой убийств, в которой все борются против всех в этом бесконечном поединке реслеров? Этот вопрос занимал исследователей с самого появления теории эволюции, но до начала 80-х годов XX столетия оставался без ответа.
Ученый-политолог Роберт Аксельрод организовал турнир (3). Его участники, оседлав компьютеры – эту новую форму жизни, – сражались друг с другом – или друг против друга. Правда, в схватку вступали не они сами, а их запрограммированные представители. Компьютерные программы, разработанные участниками, снова и снова раунд за раундом проигрывали дилемму заключенного.
Независимо от того, каков вклад другого, сотрудничество с партнером всегда имеет свою цену, а преимущества оно дает лишь тогда, когда и партнер готов к нему.
Суть турнира состояла в том, что каждая программа играла против других, против собственной копии и против программы, которая действовала случайным образом. «Победителем» становился «участник», получивший наименьшее суммарное количество лет тюремного заключения. Для того чтобы почувствовать себя участниками турнира, мы можем рассмотреть некоторые из возможных стратегий. Простейшие: с одной стороны, всегда сотрудничать и, с другой, всегда предавать.
Что произошло, если бы в турнире участвовали только эти два типа игроков – Милашка и Подлец? Если Милашка вступится за Подлеца, то кончит плохо: за раунд он получит 10 лет тюрьмы. Если же он выступит против, оба пойдут на сотрудничество и в следующем раунде получат по году. В сумме срок Милашки составит 11 лет. В раунде против Милашки Подлец выйдет сухим из воды и избежит наказания. Играя против другого Подлеца, он заработает 5 лет тюрьмы за раунд, а в итоге и за игру.
Итак, Подлец выигрывает турнир с двумя противниками с крупным счетом. Неудивительно, ведь мы уже убедились, что наилучшая стратегия – всегда предавать в независимости от действий другого. Поскольку в турнире Аксельрода принимали участие компьютеры, то дело усложнялось настолько, насколько было способно программирование в 80-е годы. При этом учитывалось, как повел себя другой игрок в предыдущих раундах. Стала возможной такая стратегия, при которой он вступал в сговор, и это длилось до тех пор, пока партнер не предавал его. С этого момента он последовательно использовал обратную стратегию, играя с третьим участником. Этому новому игроку, назовем его Марио Барт, явно не до веселья.
Марио играет теперь в роли Милашки как против Милашки, так и против другого Марио. Против другого Подлеца он сам выступает Подлецом, за исключением самого первого раунда, в котором он один-единственный раз даст обставить себя другому Подлецу. Таким образом, в турнире из трех игроков Милашка набирает 12 лет тюрьмы. У Подлеца в результате дуэли с Марио добавляется 5 лет с учетом того, что в одном раунде против него он не получил срок. В сумме это 10 лет. Сам Марио, игравший против Милашки и Марио-Милашки, а также против Подлеца в роли Подлеца, зарабатывает 1+1+5=7 лет. Стратегия Марио бьет как по Милашке, так и по Подлецу, и Марио выигрывает турнир.
Милашка, Подлец и Марио Барт ставят в тупик Герхарда Бенджена и Макса Хиллера
Мы видим, что в ходе соревнования компьютеры приобретают своего рода личность, и в эту простую проблему вводится новое измерение – нравственное. Туда, где до сих пор речь шла лишь о слепом сотрудничестве или использовании партнера в собственных целях, просочился еще один аспект – доверять или не доверять. Получается, что простая стратегия Марио Барта – лучшее, что можно сделать здесь?
На примере с тремя игроками можно догадаться, насколько сильно все запутывается. Множество различных стратегий конкурируют друг с другом, особенно если каждая из них представляет собой реакцию на поведение партнера. Блестящая идея Аксельрода избежать этой проблемы, переложив всю запутанную работу на компьютер, окупилась весьма примечательным образом.
Турнир выиграл не Марио Барт – лишенная психологии машина, способная просчитать все возможные стратегии и целенаправленно их применять. Победила программа под названием «Око за око», разработанная американским математиком и психологом российского происхождения Анатолием Рапопортом. Название «Око за око» не случайно напоминает одну из древнейших традиционных правовых норм человечества. Но в отличие от боевого клича «око за око, зуб за зуб», высеченного на древней стеле, известной как Кодекс Хаммурапи, и угрожающего возмездием, программа менее воинственна. Ее, скорее, следует понимать как «подзатыльник за подзатыльник» или «как ты мне, так и я тебе».
В отличие от некоторых поистине сложных программ, заявленных на турнире Аксельрода, «Око за око» состояла из убогих четырех строчек кода, где было записано: «Око за око» сначала сотрудничает, а потом поступает так же, как партнер в предыдущем раунде.
Она выступила против самых продвинутых и сложных разработок того времени. Аксельрод создал программу, которая имитировала поведение своего партнера по принципу Цепи Маркова и применяла при этом формулу Байеса, чтобы как можно точнее спрогнозировать, как будет действовать другой игрок в следующем раунде. И даже эта в 100 раз более умная программа проиграла незамысловатому принципу «Как ты мне, так и я тебе». И не просто проиграла. Поскольку турнир был полон сюрпризов, Аксельрод организовал его повторно. Программистам предоставили в распоряжение результаты первого турнира, и они смогли проанализировать слабые стороны своих детищ и устранить их. Безуспешно. Снова победу одержала чарующе незамысловатая четырехстрочная «Око за око».
Этот результат предложил материал для изучения ученым-эволюционистам, философам, занимающимся вопросами морали, теологам и всем прочим, кому важно понимать феномен сотрудничества между людьми, любовь к ближнему и сочувствие. В основе многих концепций как прежде, так и сейчас лежит положение, что приносить себя в жертву ради других – благо с моральной точки зрения. В религии его часто творит высшая инстанция, бог или его помощники. Это, пожалуй, основная причина, почему атеистам часто в качестве контраргумента приводят утверждение, что без веры произойдет моральное падение человечества. Такое утверждение совершенно логично, потому что, если радушное отношение между людьми достигается путем авторитарного распоряжения со стороны всемогущего бога, то его отмена приведет и к отмене радушия.
Противная сторона (назовем ее атеистами) заносчиво ссылается на то, что зло творит по отношению к человечеству тот, кто угрожает им наказанием. Учитывая уроки, вынесенные из победы темной лошадки, созданной Рапопортом по имени «Око за око», атеисты тоже совершенно правы. Поведение в убыток себе и на благо других не достигается внешним принуждением, а мотивировано самим индивидом. Можно было бы сказать так: его свободной волей, если бы таковая существовала. Вместе с тем не бывает бескорыстия, а только выгодная для индивида стратегия поведения (4).
Возьмем старые как мир 2 противоположности – эгоизм и альтруизм. Наш мозг, пытаясь привнести порядок в хаос чувственных данных, склонен формировать пары из противоположностей. Все на планете – люди, животные, растения – в равной мере были отправлены в этот мир без спроса. Эгоизм и альтруизм – два аспекта поведения, которое помогало нашим предкам ориентироваться в мировом хаосе и быть успешнее, чем сородичи. Цель каждого организма в первую очередь – размножение. Она эгоистична, однако достижима, если оказывается помощь другим. Возможно, звучит парадоксально, но это так.
«Око за око» объясняет, как эгоист может быть одновременно и альтруистом. Такой вывод напрашивается лишь при соблюдении некоторых условий, которые и были заданы на турнире: взаимодействие именно двух партнеров, которые знакомы между собой и постоянно контактируют.
Если представить альтруизм как основную тенденцию учитывать не только личные, но и общественные интересы, то в реальном мире он имеет свои границы. Стоит лишь подумать о морях, где популяции рыб катастрофически снизились вследствие их ловли, об отравленных химикатами почвах или вырубленных лесах, получится длинный удручающий список ситуаций, когда недальновидное эгоистичное поведение выходит за рамки здравого смысла и наносит ущерб всему вокруг. И этот список с каждым днем становится все длиннее.
Эгоизм и альтруизм – два аспекта поведения, которое помогало нашим предкам ориентироваться в мировом хаосе и быть успешнее, чем сородичи.
Явление само по себе не ново. С момента выхода в свет в 1833 году эссе британского экономиста Уильяма Форстера Ллойда оно известно как «трагедия альменды». В эссе автор приводил гипотетический пример луга, который использовался крестьянами как пастбище и никому конкретно не принадлежал. Каждому отдельному крестьянину было выгодно водить на луг больше скота, чем другие. Но когда так поступают все, это приводит к тому, что на лугу пасется слишком много животных, и со временем он будет просто опустошен. Аналогично дилемме заключенного, в трагедии альменды выгода каждого обращалась в убыток для всех. Но в отличие от дилеммы заключенного здесь не существует простого решения.
В 60-х годах эколог Гарретт Хардин откопал работу Ллойда и заимствовал его идею, чтобы довести до сознания человечества экологическую катастрофу – перенаселенность планеты (5). Мораль трагедии альменды для Хардинга заключалась в том, что людей необходимо принудить действовать на собственное благо, так как если им позволить подчиняться своим импульсам, они погубят сами себя.
И турнир Аксельрода, и программа Рапопорта четко показывают границы альтруизма в реальном мире. Если бы участники играли лишь один раз, а не 200, как это было, логика бы изменилась. У них не было бы причин для альтруизма и принцип «ты мне, я тебе» полетел бы в тартарары. Здесь мы сталкиваемся с оборотной стороной медали: если альтруизм представляет собой эгоизм, прирученный путем личностных взаимоотношений, то если устранить их, исчезнет и альтруизм. Неожиданным образом объяснение готовности человека помочь обосновывает тот факт, почему недоверие к чужакам является универсальным человеческим качеством и почему чужаки склонны разорвать общественный договор в одностороннем порядке.
В сообществе, где большинство членов объединяются (то есть тратят энергию и ресурсы во благо других), может быть успешной идея, которая в группе эгоистов чистейшей воды совершенно бессмысленна – стратегия психопата. Она состоит в том, чтобы делать вид, что сотрудничаешь, но принимать помощь других.
Как ошибки – это не недостаток, а часть природы восприятия, так и наличие психопатов в обществе (по серьезным оценкам, их количество колеблется от 1 % до 20 %, и места их концентрации – высшие эшелоны власти и партийные ячейки) (6) – не дефект, а характерная черта кооперации. Как и все ошибочные выводы и слабые места восприятия не перевешивают его сильные стороны, так и предрасположенность к жульничеству и предательству – это лишь небольшая плата за несоизмеримо большие преимущества, которые привнесла с собой в жизнь человека способность к сотрудничеству.
Одно из этих преимуществ, которое возвышается над всеми прочими, – это наличие профессий и экспертов. Возьмем, например, крестьянина. Так безобидно звучащее слово возникло 10 000 лет назад, но с тех пор крестьянин прошел длинный путь неолитической революции, становления современного общества, развития городов, появления атомного оружия и телевизионных дискуссий. Даже если перед ним встанет угроза быть замененным программируемой косодробильнодоильнозабойной машиной, этот род деятельности гарантированно будет принадлежать к пяти самым влиятельным наряду с профессиональными наблюдателями, журналистами, философами и учеными.
Однако прежде чем мы обратимся к профессиональному наблюдению, следует упомянуть еще об одном неудобном вопросе, который мы должны себе задать: компетентное наблюдение и сотрудничество – это замечательно, но ведь большинство из нас списывают друг у друга.