Доминирующие стратегии: к лучшему или к худшему

Книга: Алгоритмы для жизни: Простые способы принимать верные решения

Даже если мы можем достичь равновесия, то тот факт, что оно устойчиво, не означает, что это хорошо. Это может показаться парадоксальным, но равновесная стратегия – при которой ни один игрок не готов изменить тактику – вовсе не обязательно приводит к лучшим результатам для игроков. Нигде это не иллюстрируется так наглядно, как в самой известной, провокационной и спорной игре для двух игроков под названием «дилемма заключенного».

Дилемма состоит в следующем. Представьте себе, что вы и ваш сообщник были арестованы после ограбления банка. Вас содержат в отдельных тюремных камерах. Теперь вы должны решить, будете ли вы поддерживать друг друга, храня молчание, или нарушите прежние договоренности о партнерстве и донесете на сообщника. При этом вы оба знаете, что если каждый будет хранить молчание, то суд, не имея достаточных доказательств для вынесения обвинительного приговора, будет вынужден освободить вас обоих и вы сможете разделить добычу поровну, получив, скажем, по $0,5 млн каждый. Если же один из вас донесет на сообщника, а другой при этом будет хранить молчание, то информатор выйдет на свободу и ему достанется весь $1 млн, в то время как молчаливый сообщник будет осужден и как единственный виновник преступления получит 10 лет тюрьмы. А если вы оба начнете доносить друг на друга, то оба будете осуждены и разделите наказание: пять лет каждому.

Вот тут-то и зарыта собака. Не так важно, что будет делать ваш подельник: в любом случае наилучший для вас вариант – это нарушить договоренность и донести на сообщника.

Потому что если подельник донесет на вас, а вы, в свою очередь, донесете на него, то это вернет вам пять лет вашей жизни: вы получите каждый по пять лет, а не будете нести всю тяжесть наказания и отсиживать весь срок в одиночку. А если ваш соучастник будет молчать, то это вернет вам и вторые пять лет, и к тому же вы получите в свое распоряжение весь $1 млн. В любом случае получается так, что для вас всегда лучше донести, чем молчать, независимо от того, что выберет ваш соучастник. В противном случае вы всегда окажетесь в худшем положении, каким бы оно ни было.

В реальности это превращает отступничество не просто в стратегию равновесия, а в то, что характеризуется как доминирующая стратегия. Доминирующая стратегия, будучи лучшим ответом на все возможные стратегии оппонентов, позволяет избежать рекурсии вообще, потому что вам даже не нужно утруждать себя попытками проникнуть в их головы. Это весьма мощная штука.

Но теперь мы пришли к парадоксу. Если каждый из вас выберет рациональное поведение и будет придерживаться доминирующей стратегии, то вся эта история закончится для вас обоих пятью годами отсидки, что – по сравнению со свободой и гарантированной половиной миллиона каждому – будет значительно худшим вариантом для обоих. Как же так получается?

Это стало одним из важнейших прозрений в традиционной теории игр: равновесие для множества игроков, рационально действующих в своих собственных интересах, может не быть результатом, который на самом деле является наилучшим для этих игроков.

Алгоритмическая теория игр, в соответствии с принципами информатики, приняла это во внимание и создала количественную меру под названием «цена анархии». Цена анархии измеряет разрыв между сотрудничеством (централизованно разработанное или согласованное решение) и конкуренцией (когда каждый участник самостоятельно пытается добиться для себя максимально хорошего результата). В такой игре, как дилемма заключенного, эта цена фактически бесконечна: увеличение денежной ставки и удлинение тюремного срока могут сделать разрыв между возможными результатами сколь угодно широким, даже если доминирующая стратегия остается неизменной. То есть нет предела тому, насколько болезненными могут быть результаты для игроков, если они не координируют свои действия. Вместе с тем в других играх, которые могли бы быть изучены теоретиками алгоритмических игр, цена анархии не так плоха.

Рассмотрим, например, транспорт. Будут ли это отдельные водители, проделывающие привычный путь в пробках, или маршрутизаторы, гоняющие TCP-пакеты через интернет, – каждый в этой системе хочет получить то, что будет самым удобным лично для него.

Водители просто хотят проехать самым быстрым маршрутом, маршрутизаторы хотят тасовать свои пакеты с минимальными усилиями; но в обоих случаях это может привести к перегрузкам на критических направлениях, создавая заторы, наносящие вред каждому из них.

Хотя о каком, собственно, вреде идет речь? Удивительно, но Тим Ругарден и Ева Тардос из Корнеллского университета доказали в 2002 году, что у такого подхода («эгоистичная маршрутизация») цена анархии не превышает 4/3. То есть свободный и доступный для всех выбор всего лишь на 33 % хуже, чем идеально просчитанный и совершенным образом скоординированный.

Работа Ругардена и Тардос оказала существенное влияние не только на планирование маршрутов городского транспорта, но и на сетевую инфраструктуру. Именно эгоистичная маршрутизация с низкой ценой анархии объясняет, например, почему тот же интернет хорошо работает без какого-либо центрального координирующего органа, управляющего маршрутизацией отдельных пакетов. При том что даже если такая координация была бы возможна, она не принесла бы значимых преимуществ.

Если же рассматривать маршрутизацию с урбанистической точки зрения, то низкая цена анархии – палка о двух концах. Хорошая новость заключается в том, что отсутствие централизованной координации делает ваши перемещения всего лишь на 33 % хуже. С другой стороны, если вы предполагаете, что самостоятельно разъезжающие автономные автомобили – это транспортная утопия будущего, вас может разочаровать тот факт, что сегодняшние эгоистичные, несогласованные и некоординированные действия водителей уже довольно близки к оптимальным. Не секрет, что автономное движение уменьшает количество ДТП и сокращает дистанцию между автомобилями, что в общем и целом увеличивает среднюю скорость движения. Но тот факт, что загруженность абсолютно неорганизованного движения составляет лишь 4/3 от таковой для идеально согласованного, означает, что загруженность идеально скоординированного ежедневного трафика будет составлять всего лишь 3/4 от нынешнего показателя. Это напоминает известную строчку Джеймса Кейбелла: «Оптимист утверждает, что мы живем в лучшем из возможных миров, а пессимист опасается, что это правда». Перегруженность всегда будет проблемой, в большей степени решаемой проектировщиками на основании общего спроса, чем решениями отдельных водителей, основанными на человеческом факторе или расчетливыми, эгоистичными или альтруистичными.

Исчисляемость цены анархии дала пространство для конкретного и строгого способа оценки плюсов и минусов децентрализованных систем, что имело далеко идущие последствия для тех многих сфер, где люди оказываются вовлеченными в игру (знают они об этом или нет). Низкая цена анархии означает, что система более-менее хороша сама по себе по сравнению с тем, как если бы она тщательно управлялась. Высокая цена анархии, с другой стороны, означает, что ситуация имеет потенциал к улучшению, если она будет тщательно координироваться (хотя при этом некоторые формы вмешательства могут спровоцировать катастрофу). Дилемма заключенного явно относится к последнему типу. К сожалению, нас окружает слишком много критичных игр, в которые мир вынужден играть.

Назад: Достижение равновесия

Дальше: Трагедия общин