Книга: Теория игр. Искусство стратегического мышления в бизнесе и жизни
Назад: Часть II
Дальше: Глава 6 Стратегические ходы

Глава 5
Выбор и случай

Конец остряка

The Princess Bride («Принцесса-невеста») – блестящая комедия, в которой много запоминающихся сцен. Самая интересная из них – сражение на смекалку между героем (Уэстли) и злодеем (сицилийцем Виццини). Уэстли предлагает Виццини сыграть в игру: Уэстли отравит вино в одном из бокалов так, чтобы Виццини не видел, в каком именно. Затем Виццини должен выбрать один из бокалов и выпить вино из него, а Уэстли выпьет из другого бокала. Виццини заявляет, что он гораздо умнее Уэстли: «Ты слышал что-нибудь о Сократе, Платоне, Аристотеле? <…> Дуралей». Он убежден в том, что может выиграть, воспользовавшись логическими рассуждениями:
Все, что мне нужно сделать, – это угадать, опираясь на то, что я знаю о тебе: ты человек, который положит яд в свой бокал или в бокал своего врага? Умный человек положит яд в свой бокал, потому что он знает, что только полный дурак выберет тот бокал, который предназначен для него. А я не полный дурак и не могу выбрать бокал, стоящий перед тобой. Но ты, наверное, знал, что я не полный дурак, и рассчитывал на это, поэтому я не могу выбрать вино, стоящее передо мной.
Виццини рассуждает дальше, придерживаясь той же логики. В конце концов он отвлекает внимание Уэстли, меняет кубки местами и смеется, уверенный в своей победе, когда они оба пьют вино из своих кубков. Виццини говорит Уэстли: «Ты пал жертвой грубой ошибки. Всем известно, что нельзя ввязываться в земельный спор в Азии; точно так же нельзя спорить с сицилийцем, когда на кону стоит смерть». Виццини все еще смеется, радуясь своей победе, когда внезапно падает замертво.
Почему логические рассуждения Виццини не принесли ему успеха? Каждый из его аргументов содержал внутреннее противоречие. Если Виццини считает, что Уэстли отравит вино в кубке А, он приходит к выводу, что ему следует выбрать кубок Б. Но Уэстли тоже может сделать такой же логический вывод, и в этом случае он подсыплет яд в кубок Б. Но Виццини должен предвидеть это, а значит, ему следует выбрать кубок А. Но… этому циклу логических рассуждений нет конца.
Дилемма, с которой столкнулся Виццини, возникает во многих играх. Представьте себе, что вам предстоит сделать штрафной удар во время футбольного матча. Вы направите удар по левую или по правую сторону от вратаря? Предположим, руководствуясь определенными соображениями (что вы делаете удар с левой, а не с правой ноги; что вратарь левша, а не правша или что вы выбрали ту или иную сторону, когда в прошлый раз били пенальти), вы приходите к выводу, что следует направить удар по левую сторону от вратаря. Если вратарь способен выстроить такую же цепочку рассуждений, он мысленно и даже физически подготовится к тому, чтобы прикрыть именно эту сторону, так что вам лучше направить удар по правую сторону. Но что если вратарь пойдет в своих рассуждениях дальше? Тогда вам лучше придерживаться первоначального плана и быть по левую сторону от него. И так далее. Где заканчивается этот круг рассуждений?
В подобных ситуациях единственный логически обоснованный вывод состоит в том, что, если вы будете выбирать свои ходы, придерживаясь той или иной системы или закономерности, другой игрок непременно воспользуется этим на пользу себе и в ущерб вам. Следовательно, вы не должны придерживаться никакой системы или закономерности. Если всем известно, что вы бьете по мячу левой ногой, вратари будут более тщательно прикрывать эту сторону и чаще отражать ваши удары. Вы должны заставить их строить догадки, совершая бессистемные или случайные действия в каждом отдельном случае. Осознанный выбор случайных действий может показаться иррациональным решением в ситуации, которая подразумевает необходимость рационального стратегического мышления, однако в этой кажущейся непоследовательности есть своя логика. Ценность рандомизации можно не только осознавать в абстрактном, общем смысле, но и выразить в количественной форме. Мы подробно объясним этот метод в данной главе.

Смешивание стратегий на футбольном поле

Штрафной удар в футболе – самый простой и самый известный пример ситуации, требующей случайных ходов, или, если говорить в терминах теории игр, смешанных стратегий. Этот удар был тщательно изучен в ходе теоретических и эмпирических исследований игр и широко обсуждался в средствах массовой информации.
Пенальти назначается, если игроки защиты совершают любое запрещенное действие или нарушение в штрафной площадке своих ворот. Кроме того, серия штрафных ударов выполняется после окончания футбольного матча для определения победителя в случае ничьей. Ширина футбольных ворот 7,32 метра, высота – 2,44 метра. Мяч устанавливается на линии, расположенной в 11 метрах от линии ворот, напротив центра ворот. Игрок, выполняющий удар, должен послать мяч в ворота непосредственно с этого места. Вратарь должен стоять на линии ворот до момента нанесения удара по мячу.
Мяч, по которому сделан сильный удар, долетает с 11-метровой отметки до ворот за две десятые секунды. У вратаря, который ждет момента удара, чтобы увидеть, куда направляется мяч, нет никаких шансов остановить его, если только мяч не был нацелен на самого вратаря. Футбольные ворота достаточно широкие; следовательно, вратарь должен заранее решить, следует ли ему делать прыжок, чтобы прикрыть одну из сторон, и если да, то в какую сторону необходимо двигаться – налево или направо. Игрок, выполняющий пенальти, тоже должен выбрать направление удара еще до того, как увидит, куда наклоняется вратарь. Разумеется, каждый из них сделает все возможное, чтобы скрыть свой выбор от другого. Следовательно, эту ситуацию лучше всего рассматривать как игру с параллельными ходами. В действительности крайне редко бывает так, что вратарь стоит в центре ворот, не прыгая налево или направо; игроки, выполняющие пенальти, тоже сравнительно редко бьют в центр ворот, и такое поведение можно объяснить теоретически. Поэтому мы упростим свои выкладки, ограничив выбор каждого игрока двумя вариантами. Поскольку игроки, выполняющие пенальти, бьют по мячу внутренней стороной ступни, естественное направление удара для игрока, бьющего правой ногой, – в правую сторону от вратаря, а для игрока, бьющего левой, – в левую сторону. Для простоты будем называть естественную сторону «справа». Следовательно, у каждого игрока есть два варианта выбора: «справа» и «слева». Когда вратарь выбирает вариант «справа», это означает естественную сторону выполнения удара игроком, бьющим пенальти.
Учитывая, что у каждого игрока есть два варианта выбора и что оба делают свои ходы одновременно, мы можем отобразить результаты в обычной таблице выигрышей 2 × 2. В каждом сочетании вариантов выбора «слева» и «справа», сделанного каждым из игроков, есть элемент случайности. Например, мяч может пролететь над перекладиной ворот или вратарь может направить мяч в сетку ворот, слегка коснувшись его. В представленной таблице выигрыш игрока, выполняющего пенальти, – это выраженное в процентах число раз, когда мяч забит, а выигрыш вратаря – выраженное в процентах число раз, когда мяч не забит.
Разумеется, все эти показатели относятся к конкретному игроку, выполняющему штрафной удар, и конкретному вратарю. Подробную информацию о показателях игроков можно получить в профессиональных футбольных лигах разных стран. Для общего сведения ознакомьтесь со средними показателями ряда разных вратарей и игроков, выполнявших штрафной удар, которые рассчитал Игнасио Паласиос Уэрта на основании данных футбольных лиг Италии, Испании и Англии за период с 1995-го по 2000 год. Не забывайте, что в левом нижнем углу каждой ячейки показан выигрыш бьющего игрока, которому соответствуют строки, а в правом верхнем углу – выигрыш вратаря, которому соответствуют столбцы таблицы. Выигрыш бьющего игрока выше, если оба выбирают противоположные стороны; процент забитых мячей у такого игрока почти одинаковый независимо от того, выбирает он естественную сторону или нет: единственная причина неудачи – когда удар направлен выше ворот или мимо ворот. В случае, если оба выбирают одну и ту же сторону, выигрыш бьющего игрока выше, когда он предпочитает свою естественную сторону. Все эти действия носят в какой-то мере интуитивный характер.

 

 

Попробуем найти равновесие Нэша для этой игры. Если оба игрока выбирают позицию «слева», это не будет равновесием, поскольку, когда вратарь выбирает левую сторону, бьющий игрок может повысить свой выигрыш с 58 до 93, переключившись на позицию «справа». Это тоже не может быть равновесием, поскольку в таком случае вратарь может повысить свой выигрыш с 7 до 30, тоже переключившись на позицию «справа». Однако в таком случае игрок, выполняющий пенальти, получит более высокий выигрыш, переключившись на позицию «слева»; тогда и вратарю будет лучше переключиться на позицию «слева». Иными словами, в этой игре в таком виде, в каком она отображена на таблице, равновесия Нэша не существует.
Циклы переключения с одной позиции на другую полностью соответствуют круговой логике рассуждений Виццини о том, в каком кубке находится яд. Тот факт, что в данной игре с указанными парами стратегий нет равновесия Нэша, подтверждает правильность одного из постулатов теории игр, касающегося важности смешивания ходов. В данном примере необходимо ввести смешивание ходов как еще одну, принципиально новую, стратегию и попытаться найти равновесие Нэша в расширенном множестве стратегий. Исходные стратегии каждого игрока («слева» и «справа») будем называть чистыми стратегиями.
Прежде чем продолжить анализ, упростим таблицу игры. У этой игры есть одна особенность: интересы двух игроков полностью противоположны. В каждой ячейке выигрыш вратаря равен 100 минус выигрыш бьющего игрока. Следовательно, если сравнить данные в ячейках, становится очевидным, что, когда выигрыш больше у бьющего игрока, он меньше у вратаря, и наоборот.
Многие люди, опираясь на свой опыт игр подобного рода, интуитивно считают, что в любой игре должен быть победитель и проигравший. Однако в огромном мире стратегических игр сравнительно редко встречаются игры, в которых наблюдается чистый конфликт. В мире экономики, где игроки сознательно идут на компромисс ради взаимной выгоды, возможен такой исход игры, когда выигрывают все. Пример ситуации, в которой все могут проиграть, – дилемма заключенных. А в игре с торгом и игре в труса возможен односторонний исход, когда одна сторона выигрывает за счет другой. Таким образом, большинству игр свойственно сочетание конфликта и общих интересов. Тем не менее данный пример игры с абсолютным конфликтом первым был изучен теоретически, поэтому представляет особый интерес. Как мы уже говорили, такие игры называются играми с нулевой суммой (выигрыш одного игрока означает проигрыш другого) или, в более общем случае, играми с постоянной суммой, как в нашем текущем примере, где сумма выигрышей двух игроков всегда равна 100.
Таблицы выигрышей для таких игр можно упростить, указывая в них выигрыш одного игрока, поскольку выигрыш другого можно рассматривать как величину, равную разнице между постоянной суммой (в нашем примере 100) и выигрышем первого игрока. Как правило, в явной форме указывается выигрыш игрока, которому соответствуют строки таблицы. В данном примере для такого игрока предпочтителен результат с более высокими показателями, а для игрока, которому соответствуют столбцы таблицы, оптимален результат с более высокими показателями. С учетом этих правил таблица выигрышей для штрафного броска выглядит так:

 

 

Если вы игрок, выполняющий штрафной удар, какой из двух стратегий отдали бы предпочтение? Если вы выберете стратегию «справа», вратарь может удержать ваш процент забитых мячей на уровне не выше 58, выбрав стратегию «слева»; если же вы выберете стратегию «справа», вратарь может удержать ваш процент забитых мячей на уровне не выше 70, тоже выбрав стратегию «справа». Из этих двух вариантов вам лучше выбрать сочетание «справа», «справа».
Можете ли вы получить лучшие результаты? Предположим, вы выбираете стратегию «слева» или «справа» случайным образом в пропорции 50:50. Например, когда вы уже готовы подбежать к мячу и нанести по нему удар, подбросьте монетку, которую держите в руке так, чтобы этого не видел вратарь, и выберите «слева», если выпадет решка, и «справа», если выпадет орел. Если вратарь выберет стратегию «слева», ваша смешанная стратегия обеспечит вам попадание в ½ × 58 + ½ × 93 = 75,5 процентах случаев; если вратарь выберет стратегию «справа», ваша стратегия обеспечит вам успех в ½ × 95 + + ½ × 70 = 82,5 процентах случаев. Если вратарь знает, что вы делаете свой выбор по такому принципу, он выберет стратегию «слева», чтобы удержать процент успешных ударов на уровне 75,5 процента. Но это все же больше, чем 70 процентов забитых мячей, которые вы получили бы в случае применения двух чистых стратегий.
Легкий способ проверить, нужна ли такая случайность при выборе стратегий, – попытаться понять, причинит ли вам вред, если вы позволите другому игроку узнать о вашем фактическом выборе до того, как он сделает ответный ход. Если вам это невыгодно, значит случайный выбор, который заставит другого игрока строить догадки, принесет вам пользу.
Можно ли назвать смешивание стратегий по принципу 50:50 лучшим для вас? Нет. Попробуйте другой вариант – когда вы будете выбирать стратегию «слева» в 40 процентах случаев, а стратегию «справа» – в 60 процентах случаев. Положите в карман маленькую книжку, а когда будете готовы подбежать к мячу и сделать удар, достаньте ее и откройте на любой странице (снова так, чтобы не видел вратарь). Если последняя цифра номера страницы попадает в диапазон от 1 до 4, выберите стратегию «слева», а если от 5 до 10 – стратегию «справа». Теперь процент успешных ударов в случае, если вратарь выберет стратегию «слева», составит 0,4 × 58 + 0,6 × 93 = 79, а если стратегию «справа» – 0,4 × 95 + 0,6 × 70 = 80. Вратарь может держать вас на уровне 79 процентов, выбрав стратегию «слева», но это лучше, чем 75,5 процента успешных ударов, которые вы могли бы сделать в случае смешивания стратегий по принципу 50:50.
Обратите внимание на следующий факт: чем лучше пропорции смешивания стратегий игрока, выполняющего штрафной удар, тем меньше разница между показателями успешных ударов в случаях, когда вратарь выбирает стратегию «слева» и стратегию «справа». При выборе чистых стратегий эти показатели составляют 93 и 70 процентов; в случае смешивания стратегий по принципу 50:50–82,5 и 75,5 процента, а при смешивании стратегий в пропорции 40:60–80 и 79 процентов. Очевидно, что смешивание стратегий в оптимальной пропорции обеспечивает один и тот же процент успешных ударов независимо от того, какую стратегию выберет вратарь. Кроме того, это согласуется и с интуитивным предположением, что смешивание ходов – правильный подход, поскольку он не позволяет другому игроку извлекать для себя выгоду из любой системы или закономерности выбора.
Расчеты, о которых пойдет речь в одном из следующих разделов данной главы, свидетельствуют, что для игрока, выполняющего пенальти, лучше всего смешивать стратегии по такому принципу: выбирать стратегию «слева» в 38,3 процентах случаев и стратегию «справа» – в 61,7 процентах. Это обеспечит 0,383 × 58 + 0,617 × 93 = 79,6 процентах забитых мячей, если вратарь выберет стратегию «слева», и 0,383 × 95 + 0,617 × 70 = 79,6 процента забитых мячей, если вратарь выберет стратегию «справа».
А что насчет стратегии вратаря? Если он выберет чистую стратегию «слева», бьющий игрок может получить 93 процента забитых мячей, выбрав стратегию «справа»; если вратарь выберет чистую стратегию «справа», у бьющего игрока есть шансы получить 95 процентов забитых мячей при условии выбора стратегии «слева». Смешав свои стратегии, вратарь может удержать число успешных ударов игрока, выполняющего пенальти, на гораздо более низком уровне. Для вратаря оптимальна та пропорция смешивания стратегий, при которой у бьющего игрока сохранится процент успешных ударов независимо от того, какую стратегию он выберет – «слева» или «справа». С учетом этого условия вратарь должен выбрать смешивание стратегий «слева» и справа» в пропорции 41,7 процента и 58,3 процента соответственно; бьющему игроку это обеспечивает 79,6 процента успешных ударов.
Обратите внимание на следующий факт – на первый взгляд он кажется совпадением: процент положительных исходов, который может обеспечить себе бьющий игрок, выбрав оптимальное смешивание стратегий (а именно 79,6 процента), совпадает с процентом положительных исходов, которым вратарь может ограничить бьющего игрока, выбрав свое оптимальное смешивание стратегий. На самом деле это не совпадение, а важное общее свойство равновесия в смешанных стратегиях в играх с чистым конфликтом (играх с нулевой суммой).
Этот результат, который получил название «теорема о минимаксе», впервые сформулировал математик Принстонского университета, человек энциклопедических знаний Джон фон Нейман. Впоследствии в соавторстве с экономистом Принстонского университета он развил эту идею в классической книге Theory of Games and Economic Behavior, которая и положила начало теории игр.
Теорема о минимаксе гласит, что в играх с нулевой суммой, в которых интересы игроков прямо противоположны (выигрыш одного означает проигрыш другого), один игрок должен стремиться к тому, чтобы минимизировать максимальный выигрыш соперника, тогда как его соперник стремится максимизировать свой минимальный выигрыш. Такой подход к ведению игры приводит к поразительному выводу: минимальный из максимальных выигрышей (минимакс) эквивалентен максимальному из минимальных выигрышей (максимин). Общее доказательство теоремы достаточно сложное, но результат полезен и его стоит запомнить. Если все, что вам нужно знать, – это выигрыш одного игрока или проигрыш другого в случае, когда оба применяют во время игры оптимальное смешивание стратегий, необходимо только рассчитать оптимальную пропорцию смешивания стратегий для одного из них и определить результат такого смешивания.

Теория и реальность

Насколько близки показатели реальных игроков, выполняющих штрафной удар, и вратарей нашим теоретическим расчетам соответствующих оптимальных смешанных стратегий? Обратите внимание на таблицу, составленную по данным, которые получил Игнасио Паласиос Уэрта, а также по данным наших расчетов.

 

 

Неплохо, не правда ли? Во всех случаях фактический процент стратегии «слева» в смешанной стратегии достаточно близок к оптимальному. Фактические смешанные стратегии обеспечивают почти одинаковый процент положительных результатов при любом выборе другого игрока, а значит, делают первого игрока неуязвимым к попыткам эксплуатации, предпринимаемым другим игроком.
Аналогичные доказательства совпадения фактических результатов игры и теоретических прогнозов были получены в процессе анализа профессиональных теннисных матчей высшего уровня. В этом нет ничего удивительного. Одни и те же люди регулярно играют друг против друга и изучают методы соперника, поэтому любая более или менее очевидная схема будет замечена и использована противником с выгодой для себя. Ставки же в таких матчах очень высоки в плане денег, достижений и славы; следовательно, игроки весьма заинтересованы в том, чтобы не совершать ошибок.
Тем не менее теория игр не всегда обеспечивает благоприятный исход. Далее в этой главе мы проанализируем, насколько эффективен или неэффективен метод смешивания стратегий в других играх и почему. Но сначала давайте кратко сформулируем то, о чем шла речь, в виде очередного правила:
ПРАВИЛО № 5: в игре с чистым конфликтом (игре с нулевой суммой), если вам невыгодно заранее раскрывать сопернику свой фактический выбор, следует случайным образом выбрать одну из имеющихся у вас чистых стратегий. Смешивать стратегии нужно в такой пропорции, чтобы соперник не смог извлечь для себя выгоду из вашего выбора, придерживаясь любой из имеющихся в его распоряжении чистых стратегий. Иными словами, вы получаете один и тот же средний выигрыш, если ваша смешанная стратегия противопоставлена каждой из чистых стратегий соперника.
Если один игрок придерживается этого правила, другой не сможет добиться большего выигрыша, применив одну из своих чистых стратегий. Следовательно, для него не имеет большого значения, какую именно стратегию выбрать, и единственное, что ему остается сделать, – это использовать смешанную стратегию, предписанную ему тем же правилом. Когда этого правила придерживаются оба игрока, ни один из них не сможет добиться большего выигрыша, отклонившись от данной линии поведения. Это полностью соответствует определению равновесия Нэша, представленному в . Иными словами, в ситуации, когда оба игрока следуют этому правилу, мы имеем равновесие Нэша в смешанных стратегиях. Следовательно, теорему о минимаксе Неймана – Моргенштерна можно рассматривать как частный случай более общей теории Нэша. Теорема о минимаксе применима только к играм с нулевой суммой, рассчитанным на двух игроков, тогда как концепцию равновесия Нэша допускается использовать в играх с любым числом игроков и любым сочетанием конфликта и общности интересов.
В играх с нулевой суммой равновесие возможно и при отсутствии смешанных стратегий. Вот простой пример: предположим, у игрока, выполняющего пенальти, очень низкий процент успешных ударов слева от вратаря (это не его естественная сторона), даже когда вратарь неправильно угадывает его действия. Это может быть связано с высокой вероятностью того, что бьющий игрок в любом случае промахнется, если будет бить внешней стороной ступни. Предположим, таблица выигрышей в этом случае выглядит так:

 

 

В данном случае стратегия «справа» доминирующая для бьющего игрока и у него нет причин смешивать стратегии. В более общем случае равновесие возможно даже при наличии чистых стратегий, среди которых нет доминирующих. Но и здесь нет причин для беспокойства: методы поиска равновесия в смешанной стратегии также позволяют обнаружить равновесие в случае чистой стратегии как частный случай смешивания стратегий, в котором доля одной из них составляет 100 процентов.

Детская забава

23 октября 2005 года Эндрю Бергель из Торонто получил титул чемпиона мира в игре «камень, ножницы, бумага» (КНБ), а также золотую медаль Всемирной ассоциации игроков в КНБ. Стэн Лонг из Ньюарка выиграл серебряную медаль, а Стюарт Уолдман из Нью-Йорка – бронзовую.
Всемирная ассоциация игроков в КНБ поддерживает сайт , на котором публикуются правила игры и различные рекомендации по поводу стратегии. Кроме того, ассоциация проводит ежегодный чемпионат мира по игре КНБ. Знали ли вы о том, что игра, в которую вы играли в детстве, вышла на такой серьезный уровень?
Правила игры в КНБ сейчас те же, что были в вашем детстве; они описаны в . Два игрока одновременно выбирают (на жаргоне этой игры «выбрасывают») один из знаков рукой: кулак символизирует камень, расположенная горизонтально ладонь – бумагу, а указательный и средний пальцы, расставленные под углом и указывающие на соперника, – ножницы. Если оба игрока показали один знак, засчитывается ничья. Если игроки выбирают разные знаки, камень побеждает (ломает) ножницы, ножницы побеждают (режут) бумагу, а бумага побеждает (обертывает) камень. Каждая пара игроков проводит несколько раундов игры подряд, а участник соревнований, победивший в максимальном числе раундов, становится победителем матча.
Тщательно продуманные правила, опубликованные на сайте Всемирной ассоциации игроков в КНБ, регламентируют два важных момента соревнований по этой игре. Во-первых, точно описаны жесты, которые символизируют камень, ножницы и бумагу в момент выброса. Это предотвращает любые попытки мошенничества, когда один игрок делает жест, допускающий двоякое толкование, а затем заявляет, что его знак побеждает знак соперника. Во-вторых, в этих правилах описана последовательность действий, которые обозначаются как «исходная позиция, готовность, выброс», для того чтобы обеспечить одновременность ходов двух игроков. При таком подходе один игрок не может заранее увидеть, что сделал другой, и выбрать в ответ тот знак, который обеспечил бы ему победу.
Таким образом, мы имеем игру с параллельными ходами с участием двух игроков, у каждого из которых есть три чистые стратегии. Предположим, за победу засчитывается 1 очко, за поражение – 1, за ничью – 0; игроков назовем Эндрю и Стэн в честь победителей на чемпионате мира в 2005 году. Таблица этой игры выглядит так:

 

 

Что порекомендовала бы в этом случае теория игр? Это игра с нулевой суммой, поэтому раскрывать свой ход заранее невыгодно. Если Эндрю делает только один чистый ход, Стэн сможет ответить выигрышным ходом и сократить выигрыш Эндрю до –1. Если Эндрю смешает три хода в равных пропорциях, по ⅓ на каждый ход, это обеспечит ему средний выигрыш ⅓ × 1 + ⅓ × 0 + ⅓ × (–1) = 0 против любой из чистых стратегий Стэна. Поскольку игра имеет симметричную структуру, очевидно, что это лучшее, на что может рассчитывать Эндрю, и расчеты подтверждают эту интуитивную оценку. Та же аргументация верна и для Стэна. Следовательно, смешивание всех трех стратегий в равной пропорции – оптимальное решение для обоих игроков, которое и представляет собой равновесие Нэша в смешанных стратегиях.
Однако далеко не все участники чемпионата мира по игре «камень, ножницы, бумага» придерживаются такого подхода. На сайте ассоциации этот подход называют хаотичной игрой и не рекомендуют применять. «Критики этой стратегии настаивают на том, что случайного выброса просто не существует. Люди неизменно подчиняются какому-либо импульсу или склонности при выборе знака, а значит, придерживаются подсознательной, хотя и предсказуемой схемы игры. “Школа хаоса” теряет свое влияние в последнее время, поскольку статистика проведения турниров свидетельствует о более высокой эффективности таких стратегий».
Формирование «подсознательной, хотя и предсказуемой схемы игры» – это действительно серьезная, заслуживающая дальнейшего обсуждения проблема, и мы вернемся к ней немного позже. Но сначала посмотрим, каким стратегиям отдают предпочтение участники чемпионата мира по игре «камень, ножницы, бумага».
На сайте перечислен ряд «гамбитов», в частности стратегия с весьма удачным названием «бюрократ», которая сводится к трем последовательным выбросам знака «бумага», или стратегия «сэндвич с ножницами», которая состоит из ходов «бумага», «ножницы», «бумага». Достаточно часто используется стратегия исключения, когда игрок пропускает один из знаков. Идея таких стратегий заключается в том, что соперники сфокусируют все свое внимание на изменении схемы или на появлении пропущенного знака, а вы постараетесь воспользоваться этим слабым местом в их рассуждениях.
Кроме того, у игроков могут быть хорошо развиты навыки обмана и обнаружения обмана со стороны соперника. Такие игроки наблюдают за движениями тела и рук друг друга в поисках признаков того, какой именно знак те выбросят. С другой стороны, они пытаются ввести соперника в заблуждение, делая движения, которые предполагают один знак, а вместо этого выбирают совсем другой. Вратари и футболисты, выполняющие штрафной удар, тоже наблюдают за движениями ног и тела друг друга, чтобы догадаться, в какую сторону будет двигаться соперник. Такие навыки имеют очень большое значение. Например, во время серии послематчевых пенальти, которая решила исход матча в четвертьфинале чемпионата мира по футболу 2006 года между сборными Англии и Португалии, вратарь португальской команды каждый раз правильно угадывал направление удара и отбил три мяча, что обеспечило его команде победу.

Смешивание стратегий в лаборатории

В отличие от поразительной согласованности теоретических прогнозов и реальных результатов смешанных стратегий на футбольном поле или на теннисном корте во время лабораторных экспериментов были получены разнородные или отрицательные выводы. В одной из первых книг, посвященных экспериментальной экономике, в достаточно категоричной форме сказано: «Участники экспериментов редко (почти никогда) не используют подбрасывание монеты». Каковы причины этого различия?
Некоторые из этих причин совпадают с теми, о которых шла речь в , когда мы сравнивали два типа эмпирических данных. В лабораторных условиях игры искусственно структурированы, а играют в них новички ради сравнительно небольшого выигрыша. С другой стороны, в реальных условиях опытные игроки ведут знакомые им игры ради огромного выигрыша – славы, престижа, а во многих случаях и денег.
На результатах экспериментов сказывается еще один ограничивающий фактор. Эксперименты всегда начинаются с объяснения правил игры; экспериментаторы делают все возможное, чтобы участники игры действительно их поняли. Однако в этих правилах в явной форме не упоминается о возможности рандомизации; не говорится что-либо в таком роде: «При желании вы можете подбросить монету или бросить кости для того, чтобы решить, что вы будете делать». В таком случае вряд ли стоит удивляться тому, что участники эксперимента, которым было указано строго придерживаться правил игры, не бросают монету. Еще со времени проведения знаменитого эксперимента Стэнли Милгрэма известно, что испытуемые воспринимают экспериментаторов как авторитетных лиц, которым необходимо подчиняться. Поэтому нет ничего удивительного в том, что они строго придерживаются правил игры и даже не думают о случайном выборе стратегий.
Однако факт остается фактом: даже в тех случаях, когда структура лабораторных игр была аналогична структуре футбольных пенальти, где ценность смешивания стратегий не вызывала сомнений, участники этих игр даже с течением времени не применяли рандомизацию надлежащим образом.
Таким образом, у нас есть противоречивые выводы относительно успеха и провала теории смешанных стратегий. Проанализируем некоторые из этих выводов глубже, для того чтобы понять, что нам следует ожидать от тех игр, которые мы наблюдаем, а также чтобы научиться играть более эффективно.

Внесение элемента случайности

Рандомизация – не простое чередование чистых стратегий. Если питчеру говорят, чтобы он смешивал фастболы и форкболы в равных пропорциях, это не означает, что ему следует бросать фастбол, затем форкбол, затем снова фастбол и так далее по очереди. Бэттеры сразу же заметят эту схему и используют ее в своих интересах. Точно так же, если соотношение фастболов и форкболов должно составлять 60:40, это не значит, что нужно бросать сначала шесть фастболов, а затем четыре форкбола.
Что же должен делать питчер, для того чтобы случайным образом смешивать фастболы и форкболы в равных пропорциях? Один из способов – выбрать число от 1 до 10; если выбранное число меньше 5, бросать фастбол, а если больше 6 – форкбол. Безусловно, это снимает только часть проблемы. Как обеспечить случайный выбор чисел от 1 до 10?
Начнем с более простой задачи – попытки записать случайную последовательность выпавших сторон монеты. Если это действительно случайная последовательность, тогда любой, кто попытается догадаться, что именно вы записываете, будет прав в среднем не более чем на 50 процентов. Однако записать такую «случайную» последовательность труднее, чем можно себе представить.
Психологи обнаружили интересный факт: люди склонны забывать о том, что, если выпадает орел, в следующий раз с равной вероятностью могут выпасть и орел, и решка. В итоге они слишком часто выбирают противоположный вариант, а в их догадках слишком мало последовательностей, состоящих из одних только орлов. Если при подбрасывании монеты тридцать раз подряд выпадает орел, в следующий раз с одинаковой вероятностью могут выпасть и орел, и решка. Понятия «теперь должна выпасть решка» просто не существует. То же самое касается и лотереи: число, которое выпало на прошлой неделе, может выпасть снова с той же вероятностью, что и все остальные числа.
Тот факт, что многие люди допускают ошибку, слишком часто чередуя возможные варианты, объясняет использование такого множества стратагем и гамбитов участниками чемпионатов мира по КНБ. Игроки предпринимают попытки извлечь для себя выгоду из этой слабости соперников, а на более высоком уровне пытаются использовать, в свою очередь, и сами попытки такого рода. Игрок, который три раза подряд выбрасывает знак «бумага», рассчитывает на то, что его соперник подумает: маловероятно, чтобы и в четвертый раз была «бумага». Игрок, который пропускает один из знаков и смешивает очередность выбрасывания оставшихся двух на протяжении ряда следующих друг за другом раундов игры, пытается воспользоваться тем, что соперник думает, будто недостающий знак вот-вот «должен быть» выброшен.
Для того чтобы предотвратить такое «упорядочение хаоса», необходимы более объективные или независимые способы. Один из них сводится к тому, чтобы придерживаться определенного твердого правила, но это правило необходимо держать в тайне и оно должно быть достаточно сложным, чтобы его трудно было обнаружить. Возьмем в качестве примера длину предложений в нашей книге. Если в предложении нечетное число слов, присвоим ему имя «орел», а если четное – «решка». Это и есть достаточно эффективный генератор случайных чисел. Если рядом с вами нет нашей книги, не беспокойтесь: мы можем предложить вам и другие способы формирования последовательности случайных чисел. Возьмите несколько дат рождения ваших друзей и родственников и загадывайте «орел» на четные даты, а «решку» – на нечетные. Или посмотрите на секундную стрелку своих часов. Если ваши часы не выставлены с точностью до секунды, никто, кроме вас, не узнает, на какой отметке находится секундная стрелка. Мы рекомендуем питчеру, который должен смешивать броски в пропорции 50:50, или кэтчеру, готовящемуся принять подачу, перед каждым броском смотреть на часы. Если секундная стрелка указывает на четное число, необходимо бросить фастбол, если на нечетное – форкбол. С помощью секундной стрелки обеспечивается случайный выбор бросков в любой пропорции. Для того чтобы бросать фастболы в 40 процентовах случаев, а форкболы – в 60 процентовах, необходимо выбирать фастбол, когда секундная стрелка попадает в диапазон от 1 до 24, и форкбол – от 25 до 60.
Насколько успешно применяли метод рандомизации лучшие профессиональные теннисисты и футболисты? Анализ данных о финальных матчах турниров «Большого шлема» позволил обнаружить интересную закономерность: теннисисты переключались с подачи справа на подачу слева чаще, чем это могло происходить случайно (если говорить на языке статистики, наблюдалась отрицательная сериальная корреляция). Однако эта закономерность была, по всей видимости, слишком слабой, чтобы соперники заметили и использовали ее в своих интересах, что подтверждает статистически несущественная разница между показателями эффективности разных подач. Что касается штрафных ударов в футболе, рандомизация была почти безупречной, а смена стратегий (отрицательная сериальная корреляция) – статистически несущественной. Это вполне закономерно: между штрафными ударами, которые выполняет один и тот же игрок, проходит несколько недель, поэтому тенденция к смене стратегий менее заметна.
Судя по всему, участники чемпионатов по игре «камень, ножницы, бумага» придают слишком большое значение стратегиям, подразумевающим сознательный отказ от рандомизации, и пытаются использовать с выгодой для себя попытки соперников распознавать закономерности в игре. Насколько успешны эти попытки? Судить об этом можно, в частности, по стабильности успеха. Если некоторые игроки добиваются более весомых результатов, когда применяют нерандомизированные стратегии, они должны выигрывать одно соревнование за другим, из года в год. Но у Всемирной ассоциации игроков в КНБ «нет персонала, который фиксировал бы результаты всех участников чемпионатов, а этот вид спорта еще не получил достаточно широкого распространения, чтобы эту информацию отслеживал кто-то еще. В целом среди участников чемпионатов не так уж много игроков, которые добиваются статистически устойчивых результатов, хотя серебряный медалист чемпионата 2003 года снова вошел в финальную восьмерку в следующем году». Все это говорит о том, что тщательно продуманные стратегии не обеспечивают игрокам устойчивого преимущества.
Почему бы не положиться на то, что другой игрок использует метод рандомизации стратегий? Если один участник игры применяет оптимальное смешивание стратегий, то его показатель эффективности останется неизменным, что бы ни сделал соперник. Предположим, в примере с пенальти вы футболист, выполняющий штрафной удар, а вратарь использует оптимальное смешивание стратегий: «слева» – 41,7 процента, «справа» – 58,3 процента. В данной ситуации вы забьете гол в 79,6 случаев, какую бы стратегию ни выбрали: слева, справа или любое их сочетание. Когда вы поймете это, может появиться соблазн обойтись без расчета своего оптимального варианта смешивания стратегий, а вместо этого просто придерживаться какой-то одной линии поведения и рассчитывать на то, что другой игрок использует свой оптимальный вариант. Проблема в том, что, если вы не применяете свою оптимальную смешанную стратегию, у вашего соперника нет стимула продолжать использовать свой вариант смешивания стратегий. Например, если вы будете неизменно выбирать стратегию «слева», вратарь тоже начнет прикрывать только свою левую сторону. В этом и состоит причина: вы должны применить свою оптимальную смешанную стратегию, для того чтобы заставить соперника и дальше использовать свой оптимальный вариант смешивания стратегий.

Уникальные ситуации

Эта логика имеет смысл в таких играх, как футбол, бейсбол или теннис, в которых одна и та же ситуация складывается много раз в течение одного матча, а в борьбу во многих матчах вступают одни и те же игроки. Кроме того, в этих играх есть время и возможность обнаружить любые системные действия соперников и отреагировать на них. С другой стороны, важно избегать в игре таких схем, которые соперники могут использовать с выгодой для себя, и придерживаться оптимальной смешанной стратегии. Но как быть с играми, которые происходят только один раз?
Рассмотрим в качестве примера выбор позиций для наступления и обороны во время сражения. Эта ситуация поистине уникальна: противник не может вывести какую бы то ни было закономерность на основании ваших прошлых действий. Однако необходимость в случайном выборе возникает в связи с возможностью шпионажа. Если вы выберете определенный курс действий, а противник узнает, что вы собираетесь делать, он изменит свой план так, чтобы поставить вас в самое невыгодное положение. Вам необходимо застать противника врасплох, а самый верный способ сделать это сводится к тому, чтобы действовать неожиданно даже для самих себя. Вы должны как можно дольше воздерживаться от выбора и сделать его в самый последний момент, применив для этого непредсказуемый, а значит, защищенный от шпионажа, способ. При этом соотношение разных вариантов выбора в вашей стратегии должно быть таким, чтобы противник, узнав об этом, не смог воспользоваться данной информацией в своих целях. Это и есть оптимальное смешивание стратегий, о котором шла речь.
И наконец, хотелось бы сделать одно предостережение. Даже если вы используете оптимальный вариант смешивания стратегий, все равно в некоторых случаях вы будете получать плохой результат. Даже если игрок, выполняющий пенальти, действует непредсказуемо, вратарь может угадать направление удара и отразить его. В американском футболе, когда после третьей попытки осталось пройти один ярд, разумно прорываться с мячом посередине, но важно также время от времени делать длинный пас, чтобы не дать защищающейся команде разгадать схему нападения. Если такой пас оказывается успешным, болельщики и спортивные комментаторы восхищаются столь изобретательным выбором схемы игры и называют тренера гением. В случае неудачного паса тренера подвергают жесткой критике: как он мог делать ставку на длинный пас, вместо того чтобы выбрать более безопасную схему игры?
Разъяснять стратегию тренера необходимо еще до ее применения в том или ином матче. Тренер должен донести до всеобщего сведения тот факт, что прорыв с мячом посередине поля остается элементом осторожной и методичной схемы игры именно благодаря отвлечению части игроков защищающейся команды на оборону от случайного длинного паса, который может обойтись команде слишком дорого. Однако мы допускаем, что даже если накануне игры тренер во всеуслышание заявит об этом во всех газетах и на всех телеканалах, а затем использует длинный пас, который окажется неудачным, на него все равно обрушится лавина критики, как если бы он и не пытался объяснить широкой публике элементы теории игр.

Смешивание стратегий в неантагонистических играх

До сих пор мы рассматривали в этой главе только антагонистические игры, в которых интересы игроков полностью противоположны: игры с нулевой суммой или игры с постоянной суммой. Однако мы неизменно подчеркиваем, что в реальной жизни интересы людей могут совпадать, а могут и противоречить друг другу. Играет ли смешивание стратегий значимую роль в играх с ненулевой суммой? Да, но с некоторыми условиями.
В качестве иллюстрации еще раз рассмотрим охотничью версию игры «семейный спор», о которой шла речь в . Вспомните наших отважных охотников Фреда и Барни, которые решают (каждый в своей пещере), на какого зверя им охотиться – на оленя или на бизона. Удачная охота требует совместных усилий обоих охотников, поэтому, если они выберут противоположные варианты, никто из них не добудет мяса. И Фред, и Барни заинтересованы в том, чтобы предотвратить такой итог. Однако помимо двух вариантов благополучного исхода (при условии, что они охотятся на одном участке) нужно учесть, что Фред отдает предпочтение мясу оленя и оценивает результат совместной охоты на этого зверя как четыре вместо трех единиц мяса, тогда как у Барни противоположные предпочтения. Следовательно, таблица их выигрышей выглядит так:

 

 

Как мы уже убедились, в этой игре есть два равновесия Нэша; в таблице они выделены серым цветом. Теперь мы назвали бы их равновесиями в чистых стратегиях. Но возможно ли такое равновесие в игре со смешанной стратегией?
По каким причинам Фред выбрал бы смешанную стратегию? Возможно, он не уверен в том, что именно выберет Барни. Если под влиянием этих субъективных сомнений Фред оценивает число случаев, когда Барни выберет охоту на оленя и на бизона, как y и (1 – у) соответственно, тогда он рассчитывает на выигрыш в размере 4y + 0(1 – y) = 4y, если он сам выберет охоту на оленя, и 0y + 3(1 – y), если он сам выберет охоту на бизона. Если y имеет значение, при котором 4y = 3(1 – y), или 3 = 7y, или y = 3∕7, тогда Фред получит один и тот же выигрыш, выбрав стратегию охоты на оленя или на бизона, а также если он решит использовать обе стратегии в любой пропорции. Предположим, что Фред смешивает стратегию охоты на оленя и на бизона в таких пропорциях, что для Барни не имеет значения, какую из чистых стратегий выбрать. (Эта игра симметрична, поэтому вы можете предположить – и подтвердить это предположение расчетами, – что Фред должен смешивать свои стратегии, выбирая охоту на оленя в x = 4∕7 случая.) При этом Барни тоже мог бы смешивать свои стратегии по такому принципу, чтобы Фреду было все равно, какую стратегию выбрать, а значит, Барни сам мог бы выбрать оптимальную стратегию. Эти два варианта смешивания стратегий – x = 4∕7 и y = 3∕7 – образуют равновесие Нэша в смешанных стратегиях.
Всегда ли такое равновесие обеспечивает удовлетворительный результат? Нет. Проблема в том, что два охотника делают свой выбор независимо друг от друга. Следовательно, Фред выберет охоту на оленя, тогда как Барни выберет охоту на бизона, в 4∕7 × 4∕7 = 16∕49 случаях, и наоборот – в 3∕7 × 3∕7 = 9∕49 случаях. Таким образом, в 25∕49 или немногим более половины случаев два охотника окажутся на разных участках и получат нулевой выигрыш. Воспользовавшись приведенными формулами, мы увидим, что каждый из них получит выигрыш в размере 4 × 3∕7 + 0 × 4∕7 = 12∕7 ≈ 1,71, что меньше выигрыша 3 в случае неблагоприятного равновесия в чистых стратегиях.
Для того чтобы избежать таких ошибок, Фреду и Барни необходимо согласовать свои действия в плане смешивания стратегий. Могут ли они сделать это, находясь в отдаленных пещерах и не имея никаких средств связи? Возможно, охотники могли бы заранее договориться о согласовании действий, опираясь на то, в каких условиях оба будут собираться на охоту. Предположим, в их местности половину дней в году по утрам идет дождь. Фред и Барни могут договориться, что оба отправятся охотиться на оленя, если в тот день пойдет дождь, и на бизона – если будет сухо. В таком случае каждый из них получит средний выигрыш в размере ½ × 3 + ½ × 4 = 3,5. Таким образом, скоординированная рандомизация обеспечивает охотникам изящный способ найти нечто среднее между благоприятным и неблагоприятным равновесием Нэша в чистых стратегиях, иными словами, воспользоваться таким инструментом, как переговоры.
Нескоординированное равновесие Нэша в смешанных стратегиях не только обеспечивает игрокам низкий выигрыш, но и является хрупким и нестабильным. Если оценка Фредом вероятности того, что Барни выберет охоту на оленя, хотя бы немного превысит значение 3∕7 ≈ 0,42857 и составит, скажем, 0,43, тогда выигрыш Фреда от выбора охоты на оленя, а именно 4 × 0,43 + 0 × 0,57 ≈ 1,72, превысит выигрыш от выбора охоты на бизона – 0 × 0,43 + 3 × 0,57 ≈ 1,71. Следовательно, Фреду нет смысла смешивать стратегии, а лучше выбрать чистую стратегию охоты на оленя. В таком случае лучший ответный ход Барни – чистая стратегия охоты на оленя, а это значит, что равновесие в смешанных стратегиях нарушено.
В заключение хотелось бы обратить ваше внимание на то, что у равновесия в смешанных стратегиях есть необычное свойство, не совсем понятное интуитивно. Предположим, выигрыш Барни изменится с 3 и 4 на 6 и 7 единиц соответственно, а выигрыш Фреда останется неизменным. Как это повлияет на пропорции смешивания стратегий? Снова обозначим символом y относительное число случаев, когда Барни, по мнению Фреда, должен выбрать охоту на оленя. В данной ситуации Фред все равно получит выигрыш в размере 4y от выбора чистой стратегии охоты на оленя и 3(1 – y) – от выбора чистой стратегии охоты на бизона. В итоге при значении y = 3∕7 для Фреда не будет иметь значения, какую стратегию выбрать, и он будет готов к смешиванию стратегий. С другой стороны, присвоив значение х относительному числу случаев выбора охоты на оленя в смешанной стратегии Фреда, Барни получит выигрыш 6x + 0(1 – x) = 6x за счет чистой стратегии охоты на оленя и 0x + 7(1 – x) = 7(1 – x) за счет чистой стратегии охоты на бизона. Приравняв эти два выражения, получим x = 7∕13. Таким образом, изменение выигрыша Барни никак не скажется на равновесии в его смешанной стратегии, но изменит пропорции в смешанной стратегии Фреда!
Поразмышляв еще немного, вы поймете, что это не так уж и странно. Возможно, Барни готов смешивать свои стратегии только потому, что он не уверен в действиях Фреда. Следовательно, в приведенных расчетах учтен выигрыш Барни и вероятность выбора, который сделает Фред. Если мы приравняем два итоговых выражения и решим полученное уравнение, то увидим, что вероятность того, какую именно пропорцию смешивания стратегий выберет Фред, зависит от выигрыша Барни, и наоборот.
Однако это настолько тонкие и на первый взгляд непривычные рассуждения, что во время проведения экспериментов большинство игроков не могут понять этого даже тогда, когда им предлагают рандомизировать выбор стратегий. Они меняют вероятность смешивания стратегий, когда меняется их собственный выигрыш, а не выигрыш другого игрока.

Смешивание стратегий в деловых и других войнах

Приведенные в этой книге примеры смешанных стратегий взяты из мира спорта. Почему так мало примеров случайного выбора в реальном мире бизнеса, политики или войны? Во-первых, в этом мире большинство игр – это игры с ненулевой суммой, а мы считаем, что смешивание стратегий в подобных ситуациях имеет более ограниченную область применения, носит более нестабильный характер и не всегда приводит к положительным результатам. Однако существуют и другие причины.
Достаточно трудно положиться на волю случая в корпоративной культуре, основной принцип которой – контроль над результатами. Это особенно относится к ситуациям, когда что-то идет не так, а это практически неизбежно, если действия выбираются случайным образом. Хотя некоторые люди и способны понять, что футбольный тренер должен время от времени включать в игру своей команды ложный пант, чтобы ввести защищающуюся команду в заблуждение, в бизнесе такая рискованная стратегия может привести к увольнению, если закончится неудачей. Но дело не в том, что рискованная стратегия всегда обеспечивает ожидаемые результаты, а в том, что она позволяет избежать опасности, которую несут в себе сложившиеся стереотипы и предсказуемость.
Купоны на скидки – это один из случаев, когда применение смешанных стратегий повышает эффективность бизнеса. Компании используют этот метод для формирования доли на рынке. Идея состоит в том, чтобы привлечь новых покупателей, не предоставляя такие же скидки имеющимся. Если конкуренты предложат купоны на скидки в тот же период, покупатели не будут заинтересованы в том, чтобы переходить на другой бренд. Вместо этого они останутся с прежним брендом и воспользуются предложенной скидкой. Потенциальные покупатели захотят попробовать новый продукт только в случае, если одна компания предлагает купоны на скидки, а другая – нет.
Для таких конкурентов, как, например, Coca-Cola и PepsiCo, игра с купонами на скидки аналогична задаче на координацию действий, которую решали Фред и Барни. Каждой компании необходимо быть единственной компанией, предлагающей купоны на скидки, – точно так же, как каждый из наших охотников стремится выбрать именно тот участок для охоты, которому отдает предпочтение. Однако если они попытаются сделать это одновременно, эффект от выпуска купонов на скидку будет сведен на нет и обе компании понесут убытки. Одно из возможных решений состоит в том, чтобы придерживаться предсказуемой схемы предложения купонов на скидки (скажем, каждые шесть месяцев), а также чередовать эти периоды с конкурентом. Проблема в том, что, если в компании Coca-Cola знают, что в PepsiCo вот-вот выпустят купоны на скидки, они могут сделать это первыми и опередить конкурента. Единственный способ избежать таких упреждающих действий со стороны конкурента – сохранить элемент неожиданности, созданный посредством рандомизированной стратегии.
Безусловно, если конкурирующие компании применяют такую рандомизацию независимо друг от друга, они могут допустить ту же ошибку, что и наши герои-охотники каменного века Фред и Барни. Однако конкуренты добьются гораздо более весомых результатов, согласовав свои действия. Существуют убедительные статистические доказательства того, что компании Coca-Cola и PepsiCo пришли именно к такому согласованному решению данной проблемы. На протяжении 52 недель они проводили кампании по продвижению своей продукции за счет временного снижения цен – по 26 недель каждая, не пересекаясь друг с другом. Если бы каждая компания осуществляла такое продвижение на протяжении любой недели, выбранной произвольно с вероятностью 50 процентов, и обе компании делали бы это независимо друг от друга, вероятность нулевого совпадения составляла бы 1∕495918532948104, или менее одного случая на квадриллион (миллиард миллиардов)! Это был настолько поразительный вывод, что о нем заговорили даже в СМИ, в том числе в программе 60 Minutes («60 минут») на канале CBS.
Цель кампании по продвижению продукции посредством выпуска купонов на скидку состоит в том, чтобы увеличить долю компании на рынке. Однако в каждой компании осознают: для того чтобы получить требуемый результат, необходимо предлагать купоны на скидку только тогда, когда конкурент не делает этого. Стратегия случайного выбора недель для распространения купонов может быть рассчитана на то, чтобы застать другую компанию врасплох. Но если обе компании применяют аналогичные стратегии, на протяжении многих недель они будут предлагать купоны одновременно. В эти недели их мероприятия по продвижению продукции просто сведут друг друга на нет: ни одна из компаний не увеличит свою долю на рынке и они обе получат более низкую прибыль. В итоге применение таких стратегий создает дилемму заключенных. В компаниях, постоянно поддерживающих взаимодействие друг с другом, понимают, что они обе могут добиться большего, решив эту дилемму. Один из способов сделать это – предлагать свои товары по сниженным ценам поочередно, а после окончания кампаний по стимулированию сбыта возвращаться к своим обычным ценам. Именно это и сделали компании Coca-Cola и PepsiCo.
Существуют и другие ситуации, в которых компании должны избегать шаблонов и предсказуемости действий. Некоторые авиакомпании предлагают билеты со скидками тем путешественникам, которые готовы приобрести билеты в последнюю минуту. Однако не сообщают, сколько свободных мест осталось, для того чтобы можно было оценить шансы на успешную покупку билета. Если бы наличие билета, который можно купить в последнюю минуту, являлось более предсказуемым, тогда возникло бы гораздо больше возможностей для эксплуатации этой системы и авиакомпании потеряли бы больше своих клиентов из числа тех, кто в большинстве случаев покупают билеты обычным способом.
В бизнесе рандомизированные стратегии чаще всего применяются для мотивации соблюдения установленных правил при одновременном снижении затрат на мониторинг. Это касается самых разных ситуаций – от налоговых проверок и тестов на наркотики до парковочных счетчиков. Кроме того, это объясняет, почему наказание не всегда должно соответствовать преступлению.
Как правило, штраф за нарушение правил парковки во много раз превышает плату за парковку. Если стоимость парковки по счетчику составляет 1 доллар в час, достаточно ли штрафа в размере 1,01 доллара для того, чтобы люди придерживались правил? Достаточно, но только при условии, что дорожная полиция обязательно поймает вас каждый раз, когда вы не заплатите за парковку. Такая система контроля за соблюдением правил обходилась бы очень дорого. Заработная плата инспекторов дорожного движения стала бы самой большой статьей расходов, но затраты на систему взыскания штрафов, необходимую для обеспечения эффективности такой политики, тоже были бы достаточно большими.
Вместо этого органы власти используют столь же эффективную, но менее затратную стратегию: ввести более крупные штрафы и ослабить контроль за соблюдением правил парковки. Если штраф составляет 25 долларов, риска быть пойманным с вероятностью 1∕25 вполне достаточно, чтобы заставить вас соблюдать правила. В такой системе задействовано гораздо меньше полицейских, а собранных штрафов достаточно, чтобы покрыть административные расходы.
Это еще один пример практической ценности смешанных стратегий. В чем-то он похож на пример из области футбола, а в чем-то отличается от него. Стоит подчеркнуть еще раз: органы власти выбирают рандомизированную стратегию потому, что она лучше любых системных действий – полное отсутствие контроля за соблюдением правил привело бы к неправильному использованию мест для стоянки автомобилей, которых всегда не хватает, а стопроцентный контроль обходился бы слишком дорого. Для того чтобы наладить эффективную работу автостоянок, органам власти необходимо обеспечить и достаточно строгий контроль, и достаточно высокие штрафы.
Принципы выборочного тестирования на предмет употребления наркотиков аналогичны системе контроля за соблюдением правил парковки. Ежедневная проверка всех сотрудников на наркотики потребовала бы слишком больших затрат времени и денег. Выборочное тестирование позволяет обнаружить тех сотрудников, которые не способны работать без приема наркотиков, и отбивает у остальных желание употреблять наркотики в свободное от работы время. В этом случае вероятность обнаружения тоже достаточно низкая, но наказание очень строгое. То же наблюдается в стратегии проверок Налогового управления США: штрафы слишком маленькие, учитывая вероятность быть пойманным за нарушение налогового законодательства. Когда контроль за соблюдением правил носит выборочный характер, наказание должно быть тяжелее преступления. Необходимо придерживаться такого правила: ожидаемое (в статистическом смысле) наказание должно соответствовать преступлению с учетом вероятности быть пойманным.
Люди, которые стремятся обойти систему контроля за соблюдением правил, используют стратегию выборочного контроля с выгодой для себя. Они могут замаскировать истинное нарушение множеством фальшивых сигналов тревоги и обманных маневров, из-за чего ресурсы контролирующих органов становятся слишком разбросанными, а значит, неэффективными. Например, система противовоздушной обороны должна быть способной уничтожить все без исключения атакующие ракеты. Для атакующей стороны самый эффективный с точки зрения затрат способ преодолеть систему противовоздушной обороны сводится к тому, чтобы окружить настоящую ракету группой фальшивых. Создать фальшивую ракету гораздо дешевле, чем настоящую. До тех пор пока обороняющаяся сторона не распознает их совершенно точно, ей придется останавливать все атакующие ракеты – как реальные, так и фальшивые.
Запуск невзрывающихся артиллерийских снарядов начали практиковать еще в период Второй мировой войны, причем не по причине умышленного выпуска таких снарядов, а в качестве решения проблем с контролем качества. «Отбор бракованных снарядов в процессе их производства требует больших затрат. У кого-то появилась идея выпускать невзрывающиеся снаряды и время от времени стрелять ими. Командиры военных подразделений не могли допустить, чтобы на их позициях лежали такие бомбы замедленного действия, поскольку им не дано было знать, какой снаряд настоящий, а какой бракованный. Такой блеф заставлял их потрудиться над каждым невзорвавшимся снарядом, упавшим в расположении их подразделений».
Когда затраты на оборону пропорциональны числу ракет, которые должны быть сбиты, атакующая сторона может сделать эти затраты непомерно высокими. Это одна из самых сложных проблем создания системы противоракетной обороны, которая, возможно, вообще не имеет решения.

Поиск равновесия в смешанных стратегиях

Многим читателям вполне достаточно понять суть смешанных стратегий на качественном концептуальном уровне и затем возложить задачу вычисления фактических показателей на компьютерную программу, способную рассчитать смешанные стратегии, когда у каждого игрока есть любое число чистых стратегий (при этом некоторые из них могут даже не использоваться в равновесии). Эти читатели могут пропустить оставшуюся часть главы без ущерба для понимания изложенного материала. Но тем читателям, которые знают алгебру и геометрию хотя бы на уровне курса средней школы, мы предлагаем более подробную информацию по этой теме.
Сначала рассмотрим алгебраический метод. Число стратегий «слева» в смешанной стратегии игрока, выполняющего пенальти, – это неизвестное, которое нужно найти; назовем его х. Поскольку это относительная доля, число стратегий «справа» составит (1 – х). Показатель эффективности такой смешанной стратегии в случае, если вратарь выберет стратегию «слева», составит 58x + 93(1 – x) = 93–35x процентов, а если он выберет стратегию «справа» – 95x + 70(1 – x) = 70 + 25x процентов. Эти два показателя будут равными, если 93–35x = 70 + 25x, или 23 = 60x, или x = 23∕60 ≈ 0,383.
Мы можем также найти решение графическим методом, отобразив результаты различных вариантов смешивания стратегий на графике. Доля ударов слева в смешанной стратегии бьющего игрока, которую мы обозначили как х, отображается на горизонтальной оси от 0 до 1. По каждому варианту смешивания стратегий одна из двух линий отображает показатель эффективности стратегии бьющего игрока в случае, если вратарь выберет чистую стратегию «слева» (обозначенную на графике буквой Л), а другая – показатель эффективности стратегии бьющего игрока, если он выберет чистую стратегию «справа» (буква П). Первая линия начинается в точке, соответствующей значению 93 (значение выражения 93–35x при х = 0), и опускается до значения 58 (значение этого же выражения при х = 1). Вторая линия начинается в точке, соответствующей значению 70 (значение выражения 70 + 25x при х = 0), и повышается до значения 95 (значение этого же выражения при х = 1).

 

 

Вратарю необходимо удерживать показатель эффективности стратегии бьющего игрока на как можно более низком уровне. Следовательно, если бы структура смешанной стратегии бьющего игрока была известна вратарю, он выбрал бы стратегию «слева» или «справа», отображенную одним из тех сегментов двух линий, которые расположены ниже точки пересечения. Эти сегменты, выделенные жирным и образующие перевернутую букву V, отображают минимальный показатель эффективности стратегии игрока, выполняющего штрафной удар, если вратарь использует выбор бьющего игрока с наибольшей выгодой для себя. Бьющему игроку необходимо выбрать из этих минимальных значений максимальный показатель эффективности своей смешанной стратегии. Это значение соответствует вершине перевернутой буквы V, то есть точке пересечения двух линий. Внимательно изучив график, получим те же координаты этой точки, которые дает алгебраическое решение: x = 0,383, а показатель эффективности стратегии – 79,6 процента.
Точно так же можно проанализировать смешанную стратегию вратаря. Обозначим число стратегий «слева» в смешанной стратегии вратаря как y. Тогда (1 – y) – это доля стратегий «справа» в его смешанной стратегии. Если бьющий игрок выберет стратегию «слева» против этой смешанной стратегии, средний показатель эффективности его стратегии составит 58y + 95(1 – y) = 95–37y, а если стратегию «справа» – 93y + 70(1 – y) = 70 + 23y. Эти два показателя будут равными, если 95–37y = 70 + 23y, или 25 = 60y, или y = 25∕60 ≈ 0,417.
Графический анализ смешанной стратегии вратаря представляет собой простую модификацию такого же анализа стратегии игрока, выполняющего пенальти. Для этого построим график, отображающий результаты различных вариантов смешивания стратегий вратаря. Доля позиций «слева» в смешанной стратегии вратаря, которую мы обозначили как y, отображается на горизонтальной оси от 0 до 1. Одна из двух линий отображает показатель эффективности стратегии вратаря в случае, если бьющий игрок выберет чистую стратегию «слева», а другая – тот же показатель, если это будет чистая стратегия «справа». По каждому варианту смешивания стратегий, который выберет вратарь, бьющий игрок должен выбрать тот вариант стратегии «слева» или «справа», который обеспечивает более высокий показатель эффективности. Этот максимум находится в вершине буквы V, образованной теми сегментами двух линий, которые выделены жирным. Вратарь должен удерживать показатель эффективности стратегии бьющего игрока на максимально низком уровне. Он может сделать это, выбрав стратегию, соответствующую нижней точке буквы V, то есть минимум максимальных значений. Этой точке соответствуют координаты y = 0,417, а показатель эффективности стратегии – 79,6 процента.

 

 

Равенство максимума минимальных значений (максимина) бьющего игрока и минимума максимальных значений (минимакса) вратаря – это и есть теорема фон Неймана – Моргенштерна о минимаксе в действии. Возможно, было бы правильнее назвать ее теоремой о равенстве максимина и минимакса, но общепринятое название короче и легче запоминается.

Неожиданные последствия изменений в смешанных стратегиях

Даже в играх с нулевой суммой равенство смешанных стратегий обладает на первый взгляд необычными свойствами. Вернемся к примеру с футбольным пенальти и предположим, что вратарь усовершенствует навыки отражения штрафных ударов, сделанных с естественной для него стороны (справа), что снизит показатель эффективности бьющего игрока с 70 до 60 процентов. Как это скажется на вероятности смешивания стратегий вратаря в разных пропорциях? Ответ на этот вопрос можно получить, сместив соответствующую линию на графике. Число позиций «слева» в равновесной смешанной стратегии вратаря увеличится с 41,7 до 50 процентов. Это означает, что, если вратарь усовершенствует навыки отражения штрафных ударов справа, он будет реже использовать эту сторону!
Хотя на первый взгляд это кажется странным, причина вполне понятна. Когда вратарь улучшает свою способность отбивать пенальти справа, бьющий игрок начнет реже делать удары справа от вратаря. В ответ на увеличение числа ударов слева вратарь увеличит долю стратегий «слева» в своей смешанной стратегии. Смысл укрепления слабых навыков в том, что вам не придется пользоваться ими так часто.

 

 

Вы можете проверить истинность этого утверждения, рассчитав долю ударов слева и справа в смешанной стратегии бьющего игрока после такого изменения навыков вратаря. Вы увидите, что доля ударов слева увеличится с 38,3 до 47,1 процента.
Работа вратаря над усилением навыка отражения ударов справа действительно принесет свои плоды: средний процент забитых мячей при равновесной смешанной стратегии снизится с 79,6 до 79,5.
Если хорошо подумать, этот кажущийся парадокс подчиняется обычной логике теории игр. То, что лучше всего для вас, зависит не только от вас самих, но и от действий других игроков. Именно к этому и сводится суть стратегической взаимозависимости.

Учебный пример: Джанкен на Ступеньках

Действие происходит в суши-баре в деловой части Токио. Такаши и Уити сидят у стойки бара и пьют саке в ожидании своих заказов. Каждый из них заказал фирменное блюдо суши-бара – уни сашими (икра морского ежа). К сожалению, шеф-повар сообщает им, что у него осталась только одна порция этого блюда. Кто из двух молодых людей уступит другому?
В Америке эти двое могли бы подбросить монету. В Японии они скорее сыграют в игру джанкен, на Западе более известную как «камень, ножницы, бумага». Разумеется, к этому моменту вы уже стали настоящими экспертами по этой игре, поэтому для того, чтобы несколько усложнить задачу, мы используем здесь один из ее вариантов, который называется «джанкен на ступеньках».
В этот вариант джанкена играют на ступеньках. Как и обычно, игроки одновременно выбрасывают знаки камня, ножниц и бумаги. Но теперь победитель очередного раунда поднимается вверх по лестнице: на пять ступенек, если он сыграл «бумагой» (раскрытая ладонь с пятью пальцами), на две ступеньки – в случае «ножниц» (два пальца) и на одну ступеньку – если выбросил «камень» (пальцы сложены в кулак). В случае ничьей игра повторяется. Как правило, победителем становится тот, кто находится на верхней ступеньке лестницы. Мы немного упростим игру, приняв предположение, что цель каждого игрока – как можно больше опередить соперника.
Каким будет равновесное сочетание стратегий в этой версии игры джанкен?

Анализ примера

Поскольку с каждой очередной ступенькой победитель продвигается вперед, а проигравший отстает, это игра с нулевой суммой. Проанализировав все возможные пары ходов, получим матрицу игры. Выигрыши в этой таблице измеряются числом ступенек.

 

 

Как найти равновесное сочетание выбрасывания «бумаги», «ножниц» и «камня»? Мы уже рассказали о таких простых методах, как числовые расчеты и построение графика, которые применимы, когда у каждой стороны только одна альтернатива: удар справа и удар слева. Но в игре джанкен на ступеньках – три варианта выбора.
Прежде всего необходимо выяснить, какие стратегии войдут в состав равновесной смешанной стратегии. В данном случае важны все три варианта. Для того чтобы убедиться в этом, представьте себе, что Уити никогда не будет выбрасывать камень. В таком случае Такаши не станет играть бумагой; тогда Уити не будет выбрасывать ножницы. Если продолжить эту цепочку рассуждений, получится, что Такаши не будет использовать камень при условии, что Уити не использует бумагу. Если Уити никогда не будет выбрасывать камень, это сведет на нет все его стратегии, а значит, такое предположение было бы ложным. Аналогичные доводы подтверждают тот факт, что оставшиеся две стратегии тоже необходимо включить в смешанную стратегию Уити (и Такаши).
Теперь мы знаем, что в равновесной смешанной стратегии должны присутствовать все три стратегии. Остается выяснить, когда именно они будут использоваться. Игроки заинтересованы в получении максимального выигрыша, а не в смешивании стратегий ради самого смешивания. Уити готов использовать камень, ножницы и бумагу методом случайного выбора только при условии, что все три стратегии в равной степени привлекательны. (Если бы камень обеспечивал Уити более высокий выигрыш, чем ножницы или бумага, то ему следовало бы играть только камнем, но такая стратегия не была бы равновесной.) Таким образом, особый случай, когда все три стратегии обеспечивают Уити один и тот же ожидаемый выигрыш, определяет структуру равновесной смешанной стратегии Такаши.
Предположим, Такаши использует следующий принцип смешивания:
p = вероятность того, что Такаши выбросит бумагу;
q = вероятность того, что Такаши выбросит ножницы;
1 – (p + q) = вероятность того, что Такаши выбросит камень.
В таком случае, если Уити сыграет камнем, он будет отставать на пять ступенек, если Такаши сыграет бумагой (р), и выиграет одну ступеньку, если Такаши сыграет ножницами (q), а чистый выигрыш составит –5p + q. Точно так же Уити получит следующий выигрыш за счет каждой из своих стратегий:
Камень: –5p + 1q + 0(1 – (p + q)) = –5p + q.
Ножницы: 2p + 0q – 1(1 – (p + q)) = 3p + q – 1.
Бумага: 0p – 2q + 5(1 – (p + q)) = –5p – 7q + 5.
Эти три варианта могут быть в равной степени привлекательными для Уити только при выполнении следующего условия:
– 5p + q = 3p + q – 1 = –5p – 7q + 5.
Решив эти уравнения, получим: p = 1∕8, q = 5∕8 и (1 – p – q) = 2∕8.
Это определяет структуру равновесной смешанной стратегии Такаши. Поскольку эта игра симметрична, Уити будет использовать свои стратегии по методу случайного выбора с такой же вероятностью.
Обратите внимание на то, что, если и Уити, и Такаши используют свое равновесное сочетание стратегий, их ожидаемый выигрыш за счет каждой стратегии будет равен нулю. К такому исходу игры приводят не все смешанные стратегии, однако в симметричных играх с нулевой суммой возможен только такой результат. Нет причин, почему Уити должен находиться в более выгодном положении, чем Такаши, и наоборот.
В главе 14 рассматривается еще один учебный пример, посвященный теме выбора и случая, – .
Назад: Часть II
Дальше: Глава 6 Стратегические ходы