Глава третья. В которой компьютеры учатся сотрудничеству
Дилемма заключенного
«Таким образом, я приучаюсь оказывать другому человеку услугу, даже не чувствуя к нему истинного расположения, ибо предвижу, что он ответит мне тем же, тоже ожидая ответной услуги и рассчитывая на поддержание взаимного обмена услугами со мной и с другими людьми. Следовательно, если я оказал ему услугу и он воспользовался выгодой, проистекающей из моего поступка, он вынужден внести и свою долю [в обмен услугами], так как предвидит последствия своего отказа».
Дэвид Юм. Трактат о человеческой природе. 1740
В опере Пуччини «Тоска» главная героиня сталкивается с ужасной дилеммой. Ее возлюбленный Каварадосси приговорен к смерти Скарпиа, начальником полиции. Последний предлагает Тоске сделку. Если она подарит ему ночь, он спасет жизнь ее любимого, приказав расстрельной команде использовать холостые патроны. Тоска решает обмануть Скарпиа: она соглашается на его требование, но после того, как тот отдает соответствующий приказ, убивает его. Увы, слишком поздно выясняется, что Скарпиа тоже солгал: патроны настоящие, и Каварадосси погибает. Тоска заканчивает жизнь самоубийством. В итоге мертвы все трое.
Хотя прямо они об этом не говорили, но Тоска и Скарпиа играли в игру — самую известную во всей теории игр, мудреном разделе математики, представляющем собой необычный мост между биологией и экономикой. Игра эта явилась главным элементом одного из наиболее волнительных научных открытий последних лет: понимания причин доброго отношения людей друг к другу. Более того, и Тоска, и Скарпиа играли так, как, согласно теории игр, они и должны были это делать, несмотря на катастрофический исход для каждого. Как же это может быть?
Игра называется дилеммой заключенного и применима везде, где имеет место конфликт между личными интересами и общим благом. С одной стороны, и Тоска, и Скарпиа только выиграли бы, придерживаясь каждый своей части сделки: девушка выручила бы из беды любимого, а мужчина переспал бы с ней. С другой стороны, каждому в отдельности гораздо выгоднее было заставить другого выполнить свою часть сделки, а самому обмануть: Тоска спасла бы возлюбленного и свою честь, а Скарпия получил бы удовольствие и отделался от врага.
Дилемма заключенного представляет собой очевидный пример того, как добиться сотрудничества эгоистов — не зависящего ни от запретов, ни от моральных ограничений, ни от этического императива. Как личные интересы могут заставить человека служить общему благу? Свое название игра получила благодаря байке о двух арестантах, которой обычно и объясняют ее суть. Перед каждым стоит выбор: либо дать показания против другого и тем самым скостить себе срок, либо промолчать. Дилемма заключается в следующем: если не донесет никто, полиция приговорит обоих за меньшее преступление. Оба только выиграют, если будут хранить молчание, но каждый в отдельности выиграет больше, если донесет.
Почему? Выкиньте из головы заключенных и представьте себе простую математическую игру, в которую вы играете с другим человеком на очки. Если вы оба выбираете сотрудничество («храните молчание»), каждый получает три пункта (это называется «наградой»); если вы оба предаете, каждый получает по одному («наказание»). Но если один предает, а другой сотрудничает, последний получает ноль очков («штраф простофиле»), а первый — пять («искушение»). То есть, если ваш партнер предает, вам тоже лучше предать. Таким образом, вы получите одно очко — и это явно лучше, чем вообще ничего. Если же ваш партнер сотрудничает, вам все равно лучше предать: получите вместо трех баллов все пять. Вывод: что бы ни делал другой человек, вам всегда лучше предавать. Поскольку ваш партнер рассуждает точно так же, результат всегда один и тот же: обоюдное предательство. И по одному очку каждому, хотя можно было заработать по три.
Не позволяйте собственной нравственности ввести себя в заблуждение. Тот факт, что, сотрудничая, вы оба проявляете благородство, для данного вопроса совершенно неуместен. Мы ищем не «правильный» поступок, а логически «наилучшее» действие в моральном вакууме. А это предательство. Быть эгоистичным — рационально.
Дилемма заключенного стара как мир; Гоббс точно ее понимал. Как и Руссо, в своей короткой, но знаменитой истории об охоте на оленя мельком описавший более утонченную ее версию, известную под названием координационной игры. Изображая примитивных людей на охоте, он писал:
«Если охотились на оленя, то каждый понимал, что для этого он обязан оставаться на своем посту; но если вблизи кого-либо из охотников пробегал заяц, то не приходилось сомневаться: этот охотник без зазрения совести пустится за ним вдогонку и, настигнув его, весьма мало будет сокрушаться о том, что таким образом лишил добычи своих товарищей»54.
Дабы понять, что имел в виду Руссо, предположим, будто на охоту отправилось все племя. Как правило, охотники окружают чащу, в которой затаился олень, и начинают сходиться. Рано или поздно животное попытается прорваться сквозь оцепление. В этот момент, если все идет хорошо, его убивает ближайший к нему охотник. Но представьте, что один из них вдруг вспугнет зайца. Он точно его поймает — но только если выйдет из круга. В результате, образуется небольшой промежуток, через который олень и убегает. С охотником, поймавшим зайца, все в порядке — мясо у него есть. А вот остальные расплачиваются за его эгоизм пустыми желудками. Выходит, решение, правильное для индивида, оказалось неправильным для группы. Это лишний раз доказывает, каким бесперспективным и безнадежным проектом является социальная кооперация (холодно добавляет мизантроп Руссо).
Что бы ни делал другой человек, вам всегда лучше предавать. Поскольку ваш партнер рассуждает точно так же, результат всегда один и тот же: обоюдное предательство.
Современную версию охоты на оленя предложил Дуглас Хофштадтер. Называется она «дилемма волка». 20 человек сидят каждый в своей кабинке, держа руку на кнопке. Каждый получает 1000 долларов, если в течение 10 минут ее никто не нажимает. Человек, который делает это, получает 100 долларов, а все остальные — ничего. Если вы умны, то не станете нажимать кнопку и заберете 1000 долларов. Если вы очень умны, то осознаете крошечную вероятность того, что кто-то окажется достаточно глуп и таки нажмет свою кнопку, — а значит, вам лучше нажать свою первым. А если вы очень-очень умны, то понимаете, что очень умные люди тоже это понимают и тоже нажмут свои кнопки. В этом случае вам опять-таки лучше нажать свою, причем как можно быстрее. Как и в дилемме заключенного, логика ведет к коллективной катастрофе55.
Несмотря на свой почтенный возраст, дилемма заключенного была впервые сформулирована в качестве игры лишь в 1950 году двумя — математиками корпорации RAND (Калифорния) Мерриллом Флудом и Мелвином Дрешером. Несколько месяцев спустя Альберт Такер из Принстонского университета представил ее в качестве истории о двух заключенных. Флуд и Дрешер понимали: дилеммы заключенного окружают нас повсюду. Грубо говоря, любая ситуация, в которой вы хотите сделать нечто, но знаете, что если так же поступят все остальные, то это будет ошибкой, скорее всего — дилемма заключенного. (Согласно формальному математическому определению, дилемма заключенного — везде, где искушение больше, чем награда, которая больше, чем наказание, которое больше, чем штраф простофиле, хотя если искушение огромно, игра меняется). Если бы на каждого можно было положиться в том, что он не угонит чужой автомобиль, машины не пришлось бы запирать и удалось бы сэкономить уйму времени и денег на страховку, сигнализацию и тому подобное. Все мы только выиграем от этого. Но в таком доверчивом мире каждый обретет еще больше, если отступит от общественного договора и таки украдет авто. Аналогичным образом, рыбаки только выиграют, если каждый проявит сдержанность и не станет ловить слишком много рыбы. Но если каждый ловит столько, сколько может, проявляющий сдержанность всего-навсего лишается своей доли в пользу более эгоистичного товарища. То есть все мы коллективно расплачиваемся за индивидуализм.
Тропические дождевые леса, как ни странно — результат дилемм заключенного. Деревья тратят огромное количество энергии на рост, а не на размножение. Если бы они могли прийти к соглашению с конкурентами, объявить стволы вне закона и соблюдать максимальную высоту в три метра, все бы от этого только выиграли. Но они не могут.
Таким вот вещам, сведению сложностей жизни к глупой игре, экономисты и обязаны своей дурной славой. Впрочем, суть не в том, чтобы запихнуть всякую проблему реальной жизни в коробку под названием «дилемма заключенного», а в том, чтобы создать идеализированную версию происходящего в условиях конфликта между коллективными и индивидуальными интересами. Затем можно спокойно экспериментировать с идеалом, пока не удастся открыть нечто, заслуживающее внимания, после чего вернуться к реальному миру и посмотреть, проливает ли оно свет на происходящее в действительности.
Именно так поступили с «дилеммой заключенного» (хотя некоторых теоретиков, брыкающихся и вопящих, пришлось втаскивать обратно в реальный мир насильно). Суровый безрадостный вывод, что предательство является единственным рациональным подходом, математиков, разумеется, не устраивал. Поэтому в 1960-х они чуть ли не с маниакальной настойчивостью принялись искать опровержение. И неоднократно заявляли, что нашли таковое, главным образом в 1966 году, когда Найджел Говард переформулировал игру в терминах намерений игроков, а не их действий. Однако предложенное решение наряду со всеми другими оказалось всего-навсего попыткой выдать желаемое за действительное, самообманом. Учитывая начальные условия игры, кооперация просто нелогична.
Этот вывод вызывал глубокую антипатию. Дело было не только в том, что он представлялся абсолютно безнравственным в своих последствиях. Он, казалось, существенно расходился с поведением живых людей. Сотрудничество — обычная черта человеческого общества, а доверие — фундамент социальной и экономической жизни. Разве они нерациональны? Неужели мы вынуждены подавлять свои инстинкты, чтобы быть милыми по отношению друг к другу? Оправдывает ли себя преступление? Честны ли люди только тогда, когда им это выгодно?
К концу 1970-х дилемма заключенного стала олицетворять собой все, что было не так с выпестованной экономистами личной выгодой. Если игра доказывала: с точки зрения индивида, единственным рациональным поступком был эгоистичный, значит, главное допущение являлось неадекватным. Поскольку люди эгоистичны не всегда, они должны руководствоваться не личной выгодой, а общим благом. Поскольку же вся классическая экономика построена на личной выгоде, выходит, все 200 лет ее существования экономисты лаяли не на то дерево.
Теория игр родилась в 1944 году в плодовитом, но «бесчеловечном» мозгу венгерского гения Джона фон Неймана, позже став отраслью математики, в особенности отвечающей потребностям «мрачной науки» экономики. Объяснение просто: эта теория касается той области, где правильность поступков одних определяется действиями других. Что бы ни творилось на свете, имеется всего одно правильное решение примера «2+2». Но вот намерение купить или продать ценные бумаги, например, целиком и полностью зависит от обстоятельств — в частности, от решений других людей. Даже в этом случае, однако, может существовать безопасная линия поведения, стратегия, работающая вне зависимости от действий окружающих. Найти ее в реальной ситуации — такой, как принятие решения об инвестиции — практически невозможно. Хотя это и не означает, что идеальной стратегии вообще не существует. Смысл теории игр в том, чтобы найти универсальный рецепт в упрощенных версиях реального мира. Это назвали «равновесием Нэша» — в честь принстонского математика Джона Нэша, выдвинувшего эту теорию в 1951 году, а в 1994-м, после долгой борьбы с шизофренией, получившего за нее Нобелевскую премию. Вот ее определение: равновесие возникает тогда, когда стратегия каждого игрока является оптимальной реакцией на стратегии, принятые другими игроками, и отклоняться от выбранной стратегии не выгодно никому.
В качестве примера рассмотрим игру, придуманную Питером Хаммерштайном и Рейнхардом Селтеном. Есть два человека, Конрад и Нико; их задача — поделить деньги друг с другом. Конрад делает первый ход и должен решить, как они разделят деньги: пополам (справедливо) или нет (несправедливо). Нико делает второй ход и должен решить, сколько денег они поделят: много или мало. Если Конрад выбирает «несправедливо», он получает в девять раз больше, чем Нико. Если Нико выбирает «много», каждый получает в десять раз больше, чем получил бы при выборе «мало». Конрад может потребовать в девять раз больше, чем Нико, и последний ничего не может с этим поделать: выбирая «мало», он наказывает не только оппонента, но и себя. Следовательно, несчастный Нико не может даже пригрозить наказать Конрада, ибо все его угрозы выбрать «мало» неубедительны. Равновесие Нэша: один выбирает «несправедливо», а другой — «много». Это не идеальный исход для Нико, но это лучшее, что можно сделать в данной ситуации56.
Равновесие возникает тогда, когда стратегия каждого игрока является оптимальной реакцией на стратегии, принятые другими игроками, и отклоняться от выбранной стратегии не выгодно никому.
Заметьте, в равновесии Нэша наилучший результат достигается не всегда. Далеко не всегда. Часто оно устанавливается между двумя стратегиями, приводящими к неудаче одного или обоих партнеров, однако ни один из них не сумеет добиться лучших результатов, даже если поступит иначе. Дилемма заключенного — как раз такая игра. В случае, когда партнеры играют в игру впервые и только один раз, существует только одно равновесие Нэша: оба партнера предают — то есть отказываются от сотрудничества.