Ястребы и Голуби
А потом один эксперимент поставил этот вывод с ног на голову. Выяснилось, что на протяжении целых 30 лет из дилеммы заключенного извлекали неверный урок. Эгоизм не является рациональным решением, если…. Если игра повторяется неоднократно.
По иронии судьбы, на решение головоломки наткнулись в сам момент ее изобретения, но впоследствии просто забыли о нем. Флуд и Дрешер сразу обнаружили весьма странный феномен. Когда они попросили двух коллег — Армена Алчия-на и Джона Уильямса — сыграть на небольшие суммы денег 100 раз, «подопытные кролики» оказались на удивление расположены к кооперации: в 60 из 100 попыток оба сотрудничали и извлекали выгоду из взаимной помощи. На протяжении всей игры каждый вел записи. В них оба отметили, что старались быть благодушными по отношению к партнеру, чтобы тот был таким же в ответ — вплоть до самого конца игры, когда каждый решил воспользоваться шансом быстренько нажиться за счет другого. Когда два человека играют многократно, в течение неопределенного периода времени явно превалирует добропорядочность, а не низость57.
О турнире Алчияна — Уильямса скоро позабыли. Впрочем, когда бы людей ни просили сыграть в «дилемму заключенного», они неизменно склонялись к сотрудничеству — тактике, с точки зрения логики, неверной. Подобную неуместную готовность к сотрудничеству снисходительно приписали их нерациональности и, в основном, не поддающейся объяснению любезности. «Очевидно, — писала одна пара теоретиков, — заурядные игроки недостаточно сведущи в стратегических вопросах и, как следствие, не понимают, что единственная рационально оправданная стратегия — это ОП (оба предают)». Мы были слишком тупы, чтобы это сообразить58.
В начале 1970-х годов один биолог снова пришел к выводам, вытекавшим из турнира Алчияна — Уильямса, только уже в своей области. Инженер-генетик Джон Мейнард Смит никогда не слышал о дилемме заключенного, но полагал, что биология может использовать теорию игр не менее эффективно, чем экономика. Как рациональные индивиды должны выбирать стратегии, согласно теории игр, являющиеся «наименьшими из двух зол» в любых обстоятельствах, утверждал он, так и естественный отбор должен вырабатывать у животных инстинктивное поведение, в основе которого лежат схожие стратегии. Другими словами, к мысли о выборе равновесия Нэша можно прийти как сознательной, рациональной дедукцией, так и размышляя об эволюционной истории. Решение может принимать не только индивид, оно может быть определено отбором. Мейнард Смит назвал развитый инстинкт, отвечающий равновесию Нэша, «эволюционно стабильной стратегией»: ни одно животное, принявшее ее, не окажется в более затруднительном положении, чем то, которое выбрало другую стратегию.
Первый пример Мейнарда Смита являл собой попытку пролить свет на то, почему звери обычно не дерутся до смерти. Он представил ситуацию в виде борьбы Ястреба и Голубя. Первый, выступающий грубым эквивалентом «предательства» в дилемме заключенного, легко побеждает второго, но получает страшные раны в сражении с другим Ястребом. Голубь, выступающий эквивалентом «сотрудничества», извлекает выгоду из встречи с другим Голубем, но не может противостоять Ястребу. Если игра повторяется много раз, более мягкие качества Голубя приносят большую пользу. В частности, весьма успешной оказывается стратегия «Отпорщик» — когда он, встречаясь с Ястребом, тоже превращается в него. Более подробно мы остановимся на ней чуть позже59.
Поскольку игры Мейнарда Смита относились к сфере биологии, экономисты их проигнорировали. Но вот в конце 1970-х происходит нечто странное и, я бы сказал, тревожное. В дилемму заключенного начинают играть компьютеры. Несмотря на свои холодные, безжалостные, рациональные мозги, машины, в сущности, делают то же самое, что и глупые, наивные людишки — вопреки всякой рациональности, они стремятся к сотрудничеству. Математики забили тревогу. В 1979 году, задавшись целью изучить логику взаимодействия, молодой политолог Роберт Аксельрод организовал турнир. Он призвал коллег по всему миру разработать компьютерные программы, которые играли бы в эту игру 200 раз — против всех представленных программ, против себя и против случайной программы. В ходе соревнования каждая должна была набрать определенное количество очков.
«Разработки различного уровня сложности прислали 14 человек. Ко всеобщему изумлению, «добрые» программы оказались весьма успешны. Ни одна из восьми лучших из них не инициировала предательство. Более того, победила самая «добрая» из всех — и самая простая. Анатоль Рапопорт, канадский политолог и бывший пианист, интересующийся ядерной конфронтацией и, вероятно, знающий о дилемме заключенного больше кого бы то ни было, прислал программу под названием «Око за око». Ее стратегия заключалась в следующем: начинать с сотрудничества, а затем делать то, что делал оппонент на предыдущем ходу. «Око за око» — просто другое название «Отпорщика» Мейнарда Смита»60.
Аксельрод провел новый турнир. Теперь перед участниками стояла задача победить «Око за око». Были испробованы 62 программы, и самой успешной оказалась… сама «Око за око», снова вышедшая на первое место.
В своей книге Аксельрод пишет:
«Стойкий успех «Око за око» объясняется присущей ей комбинацией добропорядочности, мстительности, незлопамятности и ясности. Добропорядочность препятствует попаданию в ненужные неприятности. Мстительность отбивает охоту у другой стороны настаивать на предательстве. Незлопамятность помогает восстановить взаимное сотрудничество. А ясность делает ее доступной пониманию оппонента, что обеспечивает длительное сотрудничество»61.
В ходе следующего турнира Аксельрод устроил настоящую войну между стратегиями по типу «выживает сильнейший» — один из первых примеров того, что позже получило название «искусственной жизни». Естественный отбор, движущую силу эволюции, довольно легко сымитировать на компьютере: программы борются за пространство на мониторе так же, как настоящие живые существа размножаются и борются за пространство в реальном мире. В версии Аксельрода — неуспешные стратегии постепенно исчезали, оставляя все поле в распоряжение наиболее сильной программы. При этом наблюдалась целая серия увлекательных событий. Сначала «непорядочные» стратегии преуспевали за счет «добрых» и наивных. Не отставали от них только такие «отпорщики», как «Око за око». Постепенно, однако, у «непорядочных» стратегий закончились легкие жертвы. Тогда они начали сталкиваться друг с другом, и их количество стало быстро уменьшаться, в результате чего вперед вышла «Око за око». Именно она, отвоевав все поле, в итоге и стала победительницей. Опять.