Глава 2. Неприятная правда обо всех нас
Предназначение этих новых машин состоит скорее в замене человеческих суждений на всех уровнях, кроме довольно высокого, чем в замене энергии и сил человека энергией и силами машины.
Норберт Винер, 1949 г.
* * *
Примерно двадцать лет назад мировой бизнес принял разделение труда между человеком и машиной, что казалось весьма разумным. Машины взяли на себя вычисления, ведение документации и работу с данными. Это позволило людям сосредоточиться на принятии решений и оценке результатов, чаще использовать творческие силы и интуицию и взаимодействовать с другими людьми, чтобы решать проблемы и заботиться о клиентах.
От бумажных залежей до стандартного партнерства
Такой подход получил настолько широкое распространение, что сейчас трудно вспомнить канцелярскую работу прежней эпохи, когда бумаги между сотрудниками и отделами приходилось возить на тележках. Однако и сегодня существует страшный пережиток тех времен: там, где в подземельях Управления кадровой службы США в условиях кошмарной неэффективности «разрабатываются» бумажные залежи. Назначение этой инстанции — осуществлять необходимые административные действия, когда какой-либо федеральный служащий уходит на пенсию. Поскольку работа здесь не была компьютеризирована, ею занимаются 600 сотрудников, которые сидят в помещении размером с супермаркет, заполненном высокими шкафами с досье. По причудливому стечению обстоятельств оно находится под землей, на глубине 60 метров, в бывшей известняковой шахте. В 1977 году выполнение всей бумажной (в буквальном смысле слова) работы, которую нужно было проделать в случае ухода на пенсию одного служащего, в среднем занимало 61 день. Сегодня, поскольку процедуры не изменились, это по-прежнему занимает 61 день. В штате Техас, где работу с документами перенесли на компьютеры, ту же самую задачу выполняют за два дня.
Разумный план преодоления бумажной волокиты в мировом масштабе предложили в 1993 году Майкл Хаммер и Джеймс Чампи в книге «Реинжиниринг корпорации». Эта книга пользовалась невероятным успехом. Было продано более двух миллионов экземпляров, а журнал Time назвал ее одной из двадцати пяти наиболее значительных книг о бизнесе.
Основной посыл Хаммера и Чампи состоял в том, что компании должны представлять себя по-другому — не выполняющими задачи внутри отделов, скажем закупку сырья в рамках отдела закупок, а ведущими бизнес-процессы, которые последовательно проходят через отделы, например принятие, сборка и отправка заказа клиенту. Сейчас это звучит банально, но в то время считалось новым и важным. Питер Друкер, один из главных бизнес-авторитетов XX века, сказал тогда: «Реинжиниринг — это что-то новое, и это именно то, что нужно сделать». Такой подход, как правило, позволял выявить множество ненужных операций, которые можно было убрать, или, как говорили Хаммер и Чампи, «уничтожить».
Реинжиниринг бизнес-процессов ускорился в середине 1990-х благодаря двум новым вещам: корпоративным информационным системам и интернету. До появления корпоративных систем компании пользовались множеством компьютерных программ, большей частью между собой не связанных. Чем крупнее была компания, тем большей оказывалась неразбериха. Корпоративные системы позволили заменить эту мешанину единым большим программным объектом, разработанным специально для выполнения конкретного множества универсальных бизнес-процессов. Такое ПО можно было купить «в стандартной комплектации» у поставщиков вроде SAP и Oracle, а потом настроить и подогнать в нужной степени под интересы конкретного пользователя.
Корпоративные системы быстро стали популярными; по одной оценке, к 1999 году свыше 60 процентов компаний из списка Fortune 1000 стали пользоваться хотя бы одной из таких систем. Они могли быть весьма дорогостоящими и требовали много времени для установки и поддержания, но в большинстве случаев выполняли свою работу. Эрик и его коллеги Синан Арал и У Дон-джун, например, установили, что компании, начавшие пользоваться новыми системами, значительно улучшили производительность труда, оборачиваемость запасов и использование активов.
С появлением интернета доступ к системам, сравнимым с корпоративными, получили и отдельные пользователи — с помощью своих компьютеров, а позднее планшетов и телефонов. Всемирная паутина появилась в 1989 году, когда Тим Бернерс-Ли разработал набор протоколов, позволяющих фрагментам контента, например тексту и изображениям, связываться друг с другом; тем самым он воплотил концепцию гипертекста, впервые описанную ученым и инженером Вэниваром Бушем в 1945 году (предложившим использовать микропленку) и первопроходцем компьютерных технологий Тедом Нельсоном, чей проект Xanadu так и не был реализован.
Интернет быстро превратился из чисто текстовой сети в систему, способную работать с изображениями, звуками и прочими видами данных. Это мультимедийное чудо, удобное в навигации, возможности которого были намного больше, чем у всего существовавшего ранее, повсеместно распространилось в 1994 году, когда компания Netscape выпустила первый коммерческий веб-браузер, названный Navigator. (Одним из основателей Netscape был Марк Андриссен, в то время 22-летний программист, работавший над первыми веб-браузерами. В главе 11 вы узнаете о нем больше.) Это совпало с коммерциализацией интернета, которым ранее пользовались преимущественно ученые.
Сеть дала возможность вывести бизнес-процессы за пределы четырех стен компании и даже достучаться до потребителя; этот тренд стал известен под названием интернет-торговли (или электронной торговли). Люди начали использовать сеть не только для того, чтобы искать и изучать продукты, но и чтобы заказывать и оплачивать их. Такое сочетание эффективности и удобства не могло не повлиять на бизнес. Всего через десять лет после запуска Netscape Navigator электронная торговля составляла 10 процентов всех розничных продаж, если не считать продукты питания и автомобили, в Соединенных Штатах.
За два десятилетия корпоративные системы и интернет все больше и больше способствовали развитию бизнес-процессов, помогая делать рутинные вещи: отслеживать сделки и сальдо на счетах, определять правильное количество и время поставки сырья, отправлять чеки работникам, предоставлять клиентам возможность выбирать и оплачивать товары и тому подобное.
ЕСЛИ НАМ СЛЕДУЕТ ПОЛАГАТЬСЯ НА СВОЕ СУЖДЕНИЕ…
Чем же сотрудникам занять то время, которое освободилось у них благодаря корпоративному ПО и интернету? Хаммер и Чампи в «Реинжиниринге корпорации» дали четкий ответ: по мере того как компьютеры все больше берут на себя рутину, людям следует заняться оценкой и вынесением суждений. «Реинжиниринг исключает не только непродуктивные затраты, но и работу, которая не добавляет ценность: большую часть проверок, сверок, ожиданий, отслеживаний… Процесс после реинжиниринга требует от исполнителей расширенных полномочий. Они должны думать, взаимодействовать, применять здравый смысл и принимать решения».
Эта цитата отражает широко распространенное мнение, что даже в мире, полном компьютеров, программ и сетей, люди остаются ценными благодаря способности мыслить неалгоритмически. Большинство из нас согласны с тем, что, если бы наши навыки исчерпывались умением выполнять рутинные задачи, мы уже остались бы без работы, поскольку компьютеры делают это намного лучше. И большинство из нас согласны с тем, что мы способны на большее, чем цифровые технологии, сколь бы мощными и дешевыми они ни становились благодаря действию закона Мура.
Десятилетия исследований подтвердили идею: люди мыслят двумя разными способами. Это фундаментальное открытие принесло Нобелевскую премию Даниэлю Канеману, который вместе с Амосом Тверски стал пионером поведенческой экономики. Работа Канемана и его коллег показала, что у всех нас есть два режима мышления, названные Системой 1 и Системой 2. Система 1 быстрая, автоматическая, древняя с эволюционной точки зрения, требующая малых усилий; она тесно связана с тем, что мы называем интуицией. Система 2, наоборот, медленная, относительно недавно возникшая, нуждающаяся в сознательном приложении значительных усилий. Как писал Канеман в своей книге «Думай медленно… решай быстро»:
Система 1 срабатывает автоматически и очень быстро, не требуя или почти не требуя усилий и не давая ощущения намеренного контроля.
Система 2 выделяет внимание, необходимое для сознательных умственных усилий, в том числе для сложных вычислений. Действия Системы 2 часто связаны с субъективным ощущением деятельности, выбора и концентрации.
Обе системы со временем способны становиться лучше. Систему 2 можно отточить, пройдя курс математики или логики, в то время как Система 1 совершенствуется более естественным и обобщенным способом: нужно просто жить своей жизнью и наблюдать за происходящим вокруг. Пожарные, например, развивают способность ощущать, как огонь распространяется по зданию; у менеджеров по персоналу после интервьюирования множества кандидатов появляется чутье на хороших сотрудников, а игроки в го становятся мастерами, обдуманно играя партию за партией. Конечно, обе системы можно и следует улучшать одновременно. Патологи (медицинские специалисты, диагностирующие определенные болезни) оттачивают свои навыки, одновременно изучая биохимию и наблюдая множество примеров больных и здоровых тканей. Совершенствование часто бывает глубже и происходит быстрее, когда мы понимаем его принципы и можем проиллюстрировать их убедительными примерами.
Ведущий стиль в бизнес-обучении сочетает эти две системы. Студенты бизнес-школы оттачивают навыки Системы 2, проходя курсы бухгалтерского учета, финансов и микроэкономики. Но они также обсуждают множество практических примеров из области предпринимательства, руководства, этики и прочего, чтобы сделать тоньше свою интуицию и способность выносить суждения — то есть умения Системы 1. Многие курсы MBA комбинируют эти подходы. Аналогично обстоит дело в медицинских и юридических учебных заведениях.
Давно известно и доказано, что склонности разных людей к Системе 1 и Системе 2 весьма различны. Кто-то превосходно решает уравнения и разгадывает головоломки, но ему не хватает интуиции и смекалки. Другой не в силах понять арифметику, но отличается замечательным чутьем.
В ситуации, когда технологии распространяются все шире, люди, склонные к Системе 1, отнюдь не оказываются в невыгодном положении. Напротив, они получают преимущество: компьютер делает всю логическую, алгоритмическую работу, а они освобождаются для того, о чем писали Хаммер и Чампи, — для вынесения суждений, принятия решений и взаимодействия с другими людьми; для того, чтобы искать возможности и заботиться о клиентах.
Нам кажется, что в бизнес-сообществе сегодня доминирует Система 1. Бывшие топ-менеджеры пишут книги под названиями вроде «Из самого нутра» и «Трудный выбор», . Слово «технократ» стало ругательством, оно обозначает руководителя, зациклившегося на данных и не готового принять сложность реального мира. В вышедшей в 2010 году книге «Переосмысление MBA: бизнес-обучение на распутье» (Rethinking the MBA: Business Education at a Crossroads) одной из важнейших неудовлетворенных потребностей программ MBA называется умение задействовать суждения и интуицию в запутанных неструктурированных ситуациях. Аргументация там была та же, что и в «Реинжиниринге корпорации»: надо дать людям возможность учиться использовать интуицию и суждения, чтобы принимать толковые решения, раз уж компьютеры взяли на себя расчеты и делопроизводство. Мы наблюдали такое разделение труда между разумом и машиной настолько часто, что назвали это «стандартным партнерством».
…ТО ЛУЧШЕ ДЕЛАТЬ ЭТО НЕ ТАК СКВЕРНО, КАК СЕЙЧАС
Стандартное партнерство кажется хорошей идеей, но иногда его результаты далеки от совершенства. Часто выходит лучше, если вообще избавиться от человеческого фактора, даже когда речь идет об опытных специалистах, и опираться исключительно на числа и формулы.
Этот вывод кажется противоречащим здравому смыслу и, по вполне очевидным причинам, даже неприемлемым. Нам понадобится тщательное обоснование. Перед тем как заняться им, мы хотим подчеркнуть, что Система 1 вовсе не бесполезна в бизнесе. Отнюдь нет. Далее вы увидите, что человеческая интуиция, способность давать оценку и быстро принимать решения все еще играют в бизнесе важнейшую роль. Самые успешные компании используют эти качества нестандартными, гениальными способами — теми, что указывают на возможность лучшего партнерства между разумом и машиной.
Сначала нам нужно продемонстрировать кое-какие слабости Системы 1. Давайте рассмотрим несколько новаторских исследований, которые показывают ограниченность оценочного суждения и интуиции даже у опытных людей.
• Профессор социологии Крис Снейдерс на основании информации о 5200 закупках компьютерного оборудования, сделанных голландскими компаниями, построил математическую модель, определяющую соответствие каждой сделки бюджету, своевременность поставки и удовлетворенность покупателей. Затем он использовал эту модель, чтобы предсказать результаты ряда других сделок, совершенных в нескольких различных областях, после чего попросил группу менеджеров, специализирующихся на закупках именно этих вещей, дать прогнозы о том же наборе сделок. Со своей моделью Снейдерс обошел специалистов, даже тех, что считались профессионалами. Он также обнаружил, что опытные менеджеры в прогнозах не превзошли новичков и что в целом результаты экспертов в их собственной области не выглядели лучше, чем результаты в других отраслях.
• Профессор экономики Орли Ашенфельтер построил простую модель всего на четырех общедоступных переменных, касающихся погоды, чтобы успешно предсказывать качество бордоских вин и цену на них задолго до того, как они будут готовы к употреблению. Сложилось так, что на стоимость таких молодых вин существенно влияет мнение квалифицированных экспертов, но Ашенфельтер писал, что «одним из наиболее интересных моментов [в исследованиях вроде этого] является роль, которую оно играет… Есть подтверждения, что мнение экспертов не связано с основными качествами вина… Это естественным образом приводит нас к вопросу, ответа на который у нас нет, о том, что же определяет востребованность мнения экспертов».
• Эрик работал с Линн Ву (ныне профессором в Уортонской школе бизнеса) над созданием простой модели, предсказывающей объем продаж жилой недвижимости и цены на нее. Исследователи использовали данные Google Trends, в которых сообщалось, насколько часто в каждом из пятидесяти штатов США ежемесячно в поиске используют запросы вроде «агент по недвижимости», «ипотека», «цены на жилье» и тому подобное. Эрик и Ву использовали эту модель, чтобы предсказать будущие продажи жилья, и сравнивали свои прогнозы с теми, что публиковали эксперты из Национальной ассоциации риелторов. Когда появились результаты, оказалось, что модель превзошла экспертов на впечатляющие 23,6 процента. Это демонстрирует, какие возможности открывает статистика Google.
• Еще один проект Эрика был ближе к образованию; в нем разрабатывалась модель в стиле Moneyball для научных кругов. Он работал с Димитрисом Берцимасом, Джоном Зильберхольцем и Шахаром Райхманом (все из Массачусетского технологического института). Целью эксперимента было предсказать, кого зачислят в штат крупнейших университетов. Эрик и коллеги смотрели на данные по ранним публикациям и цитированию работ молодых ученых, а также использовали некоторые понятия теории сетей, чтобы увидеть, чьи труды оказываются самыми эффективными и имеют наибольшее влияние. Модель прогнозировала, какие ученые получат должность в сфере технологических исследований. Результат на 70 процентов совпал с реальными назначениями. В остальных 30 процентах в составленных алгоритмом списках оказались люди, которые в итоге написали больше статей в ведущие научные журналы и чаще цитировались, чем те, что получили должности.
• Исследование Шая Данцигера и его коллег показало, что израильские судьи чаще предоставляют условно-досрочное освобождение в начале дня и после обеденного перерыва. А вот непосредственно перед обедом, когда они, вероятно, устали или у них снизился уровень сахара в крови, они чаще рекомендуют оставить заключенного в тюрьме. Другое исследование подтвердило, что на судебные решения часто влияют факторы, находящиеся за рамками рассматриваемого дела. Экономисты Озкан Эрен и Наджи Моджан выявили, что в одном штате США судьи, которые были выпускниками известного местного университета, выносили значительно более строгие приговоры сразу после того, как команда их альма-матер неожиданно проигрывала футбольный матч, и эти приговоры были необъяснимо более суровыми для чернокожих обвиняемых.
• В округе Броуард штата Флорида детей в программы для одаренных записывают обычно по рекомендациям родителей и учителей. При этом 56 процентов школьников в программах для одаренных — белые, хотя в Броуарде они составляют меньшинство. В первом десятилетии XXI века было принято решение отказаться от субъективного метода и попытаться применить максимально системный и объективный подход. Все дети прошли невербальный тест IQ. Экономисты Дэвид Кард и Лора Джулиано документально подтверждают поразительные результаты этой новации: среди одаренных оказалось на 80 процентов больше школьников-афроамериканцев и на 130 процентов больше испаноязычных.
• Профессора права Тед Ругер и Полин Ким совместно с политологами Эндрю Мартином и Кевином Куинном провели тест, чтобы проверить, может ли простая модель с шестью переменными предсказать решения Верховного суда США на 2002 год лучше, чем группа из восьмидесяти трех известных экспертов. Из привлеченных к эксперименту юристов 38 человек работали помощниками судей Верховного суда, 33 были профессорами права, а шестеро в настоящее время или в прошлом возглавляли юридические факультеты. В среднем представителям этой группы удалось предсказать чуть меньше 60 процентов судебных постановлений. Алгоритм же дал 75 процентов правильных результатов.
Является ли этот список репрезентативным и честным, или мы намеренно, а может, даже неосознанно выбрали случаи, когда человеческое суждение проигрывало алгоритму, оставив без внимания примеры превосходства человека? Впечатляющий объем исследований показывает, что статистика все же на нашей стороне.
Группа под руководством психолога Уильяма Гроува просмотрела литературу за пятьдесят лет в поисках опубликованных рецензируемых примеров прямых сравнений между клиническими и статистическими прогнозами (то есть сравнений оценок квалифицированных экспертов и прогнозов на основе компьютерного анализа данных) в сфере психологии и медицины. Они нашли 136 таких исследований, которые охватывали всё — от тестирования IQ до диагностики сердечных заболеваний. В 48 процентах этих работ значимой разницы обнаружено не было — иными словами, эксперты в среднем угадывали правильный результат не лучше компьютера.
Гораздо более сильный удар по идее превосходства человека в оценочном суждении нанес тот факт, что в 46 процентах рассмотренных исследований эксперты действовали значительно хуже, чем алгоритм. Это означает, что люди продемонстрировали явное превосходство только в 6 процентах случаев. Авторы пришли к заключению, что почти во всех исследованиях, где люди оказывались лучше, «у специалистов было больше данных, чем у программы». Как заметил легендарный психолог Пол Мил, который еще в начале 1950-х годов описывал посредственные результаты суждений людей-экспертов:
В социальных науках не ведутся споры о том, что именно показывает настолько масштабный корпус появившихся недавно качественно разнообразных исследований, ведущихся в едином направлении, одним из которых является это [сравнение статистического и клинического прогнозов]. Когда у вас больше ста работ, прогнозирующих всё — от результатов футбольных матчей до диагностики заболеваний печени, — и при этом вы с трудом можете наскрести полдюжины исследований, где есть хотя бы слабый уклон в пользу клинического прогноза, самое время сделать некий практический вывод.
Мы считаем, что этот практический вывод таков: нам нужно меньше полагаться на суждения и прогнозы экспертов.
Все больше и больше американских компаний приходят к тому же заключению. Работая с Бюро переписи населения США, Эрик и Кристина Макэлерен (сейчас профессор Университета Торонто) при изучении репрезентативной выборки из 18 тысяч заводов установили, что переход к принятию решений на основе данных значительно ускорился. Катализатором этого стало активное применение информационных технологий и значительное улучшение работы компаний, принявших такой подход.
Несмотря на убедительные примеры, нам стоит перестать петь дифирамбы алгоритмам и сделать несколько важных оговорок. Прежде всего, чтобы сравнивать человеческое суждение с его математической моделью, нужно иметь такую модель. Согласно парадоксу Полани, это не всегда возможно. Модели нужно тестировать и оттачивать на многочисленных сходных примерах, поскольку каждая из них описывает только какое-то подмножество решений, которые могут принимать люди. Впрочем, общая идея ясна и подтверждается раз за разом: если грамотно создать и испытать модель, то в целом она будет работать так же хорошо, как эксперты, принимающие аналогичные решения (или даже лучше). Тем не менее мы продолжаем опираться на человеческие суждения там, где лучше справляются машины.
Человеческий ум: гениальный, но склонный к ошибкам
Как может компьютер, опирающийся только на Систему 2, то есть на вычисления, производимые с числовыми данными, быть явно лучше, чем человек, который пользуется Системой 2 и Системой 1 — глубинными, врожденными, инстинктивно используемыми возможностями мышления, которые есть у всех нас? В конце концов, Система 1 работает довольно давно, она помогла нам выжить и благополучно провела через все препятствия эволюции (ведь мы все еще существуем, и нас уже 7,5 миллиарда). Как она могла нас так подвести?!
Это слишком большой вопрос для одной книги, тем более для одной главы. Но в своей работе «Думай медленно… решай быстро» Канеман дал краткую сводку множества исследований (многие из которых провел сам):
Поскольку Система 1 работает автоматически и не может быть отключена по желанию, ошибки интуитивного мышления трудно предотвратить. Предубеждений не всегда можно избежать, поскольку Система 2 может просто не знать об ошибке.
Если говорить коротко, то Система 1 очень хороша, но склонна к ошибкам. Она часто срезает углы, не любит долгих размышлений и удивительно часто сбивается. Исследователи, работавшие в области экономической психологии и поведенческой экономики (дисциплины, которую помогал создавать Канеман), выявили большое количество искажений Системы 1 и даже дали им названия. Полный их список навел бы на вас скуку и вогнал в депрессию; в посвященной этой теме книге Рольфа Добелли «Территория заблуждений» 99 глав, а в «Списке когнитивных искажений» в «Википедии» было 175 пунктов, когда мы заглядывали туда в последний раз. Бастер Бенсон, менеджер по продукции софтверной компании Slack, придумал, по нашему мнению, прекрасный способ сгруппировать эти искажения и удержать в голове все связанные с ними проблемы.
1. Информационная перегрузка — паршивая вещь, потому мы интенсивно фильтруем входящий поток… [Однако] часть отсеиваемой информации на самом деле полезна и важна.
2. Не понимая чего-нибудь до конца, мы путаемся, поэтому нам свойственно заполнять пробелы в знаниях… [Однако] в ходе этого возникают иллюзии. Иногда мы принимаем за истину додуманные нами подробности и конструируем концепции и истории, которых на самом деле не было.
3. [Нам] нужно действовать быстро, чтобы не упустить свой шанс, так что мы всегда спешим с выводами… [Однако] это может иметь неприятные последствия. Некоторые из наших мгновенных реакций и принятых второпях решений оказываются вредными, эгоистичными и контрпродуктивными.
4. Запутавшись, мы пытаемся восстановить в уме важные детали… [Однако] память подкрепляет ошибки. Некоторые из вещей, что впоследствии мы считаем истинными, на самом деле лишь усугубляют вышеназванные проблемы, в результате чего нашим мыслительным процессам наносится больший вред.
Мы хотим обратить внимание на еще одну серьезную проблему когнитивных способностей человека: мы не в силах точно узнать, когда Система 1 работает хорошо, а когда нет. Другими словами, у нас слабое представление о собственной интуиции. Мы не знаем, правильно наше мгновенное решение или вынесенное суждение или оно подверглось воздействию одного или нескольких искажений. В этом видится странная параллель с парадоксом Полани: мы также знаем меньше, чем способны сказать, в данном случае меньше о результатах работы Системы 1. Вычисления и рассуждения Системы 2 чаще всего можно проверить, но, как указывает Канеман, Систему 1 проверить сложнее, тем более самостоятельно.
Недавние исследования выявили один особо коварный сбой, связанный с парадоксом Полани: часто Система 1 выдает заключение, а затем просит Систему 2 объяснить его. Психолог Джонатан Хайдт утверждает: «Суждение и обоснование — это два разных процесса». Вынесение суждений Системой 1 происходит почти непрерывно. Затем каждое из них подтверждается на рациональном и убедительном языке Системы 2. Такая хитрость часто обманывает не только другие умы, но даже тот самый, что ее придумал. Мы часто «говорим больше, чем знаем», как заметили психологи Ричард Несбитт и Тимоти де Камп Уилсон. Характеристики поведения, которые мы называем рационализацией и самооправданием, — не всегда упражнения в отговорках. Это также нечто более фундаментальное, это Система 1 за работой.
В 2006 году Авинаш Каушик и Ронни Кохави, два специалиста по анализу данных, которые в то время работали в Intuit и Microsoft соответственно, придумали акроним HiPPO для обозначения доминантного стиля принятия решений в большинстве компаний. Аббревиатура означает «мнение самого высокооплачиваемого лица». Нам нравится это сокращение, и мы часто его используем, поскольку оно ярко иллюстрирует стандартное партнерство. Даже если решения принимаются не самым высокооплачиваемым работником, они часто, слишком часто бывают основаны на мнениях, суждениях, интуиции, чутье и Системе 1. Очевидно, что такой подход во многих случаях не срабатывает и что HiPPO часто наносят ущерб.
Вперед, к новому партнерству разума и машины
Как использовать все, что мы узнали о несовершенстве человеческого разума? Как эта информация может привести нас к более эффективному принятию решений? Наиболее очевидный подход — позволить машинам принимать решения в тех случаях, когда они способны это делать. Пусть компьютерные аналоги человеческой Системы 2 с их экспоненциальным прогрессом по закону Мура и огромным потоком входящих данных выдают нам ответы без применения Системы 1. Именно такой подход выбирают все больше и больше компаний.
АВТОМАТИЧЕСКАЯ «НЕВИДИМАЯ ЭКОНОМИКА»
Насколько нам известно, одним из самых ранних (он появился на заре компьютеризации корпораций) примеров полностью автоматического принятия решений была разработка кредитного рейтинга, отражающего платежеспособность людей, то есть вероятность того, что они возвратят ссуду определенного размера. Ранее это весьма важное решение традиционно принимали специалисты по кредитованию в филиалах банков, которые оценивали заявления на основе собственного опыта, иногда в сочетании с директивами или инструкциями. Однако Билл Фейр и Эрл Айзек подумали, что машины справились бы лучше. В 1956 году они основали Fair Isaac Corporation и начали вычислять кредитные рейтинги FICO.
Вскоре автоматическая оценка платежеспособности для получения кредита вошла в норму. Издание American Banker сообщало, что к 1999 году «ни один сотрудник не рассматривает просьбы о кредите на сумму в 50 тысяч долларов или меньше — все делает компьютер». Было подтверждено, что рейтинг FICO и его эквиваленты весьма надежно прогнозируют возврат кредита, а поскольку в последние годы увеличилось количество и разнообразие цифровой информации о людях, эти большие данные стали использоваться для улучшения и расширения кредитных рейтингов.
Их разработчики должны быть осторожны, чтобы не перейти «красную черту» и не начать незаконно отказывать или ограничивать размер кредита людям по географическому, расовому или этническому признаку. Впрочем, в целом эти рейтинги полезны, поскольку дают возможность взять кредит большему количеству человек и позволяют заемщикам уверенно расширять свой бизнес. Есть фактические свидетельства того, что случаев пересечения «красной черты» стало действительно меньше, когда решения о выдаче кредитов стали приниматься преимущественно компьютерами. В 2007 году Федеральная резервная система сообщила, что модель кредитного рейтинга «ограничила возможность совершения незаконных дискриминирующих действий… [и] способна уменьшить вероятность того, что на решения о кредитах будут оказывать влияние личностные характеристики или другие факторы, запрещенные законом, включая расовую или национальную принадлежность».
Сегодня можно увидеть массу примеров полезных, эффективных решений, стопроцентно принимаемых компьютерами. Amazon и другие площадки, занимающиеся торговлей в интернете, генерируют рекомендации для покупателя при каждом посещении сайта, и, хотя многие предложения не попадают в цель, некоторые оказываются вполне интересны. Amazon оценивает, что 35 процентов ее сделок становятся возможны в результате кросс-продажной деятельности, например после рекомендации других товаров. Цены на авиабилеты и номера в гостиницах постоянно меняются, реагируя на предполагаемое развитие спроса и предложения. Такой подход к ценообразованию, известный как управление доходами, жизненно важен для несметного множества компаний (в главе 8 мы вернемся к этой теме), и очень редко при автоматическом генерировании цен их перепроверяет человек — если такое вообще бывает. Цены на физические товары сейчас тоже часто меняются автоматически. В 2015 году на следующий день после Дня благодарения Amazon и Walmart изменили цены на все товары в США на 16 и 13 процентов соответственно.
Сегодня столько решений целиком принимается компьютерами, что экономист Брайан Артур использует понятие «невидимой экономики», имея в виду процесс, при котором сделки происходят без человеческого участия — «масштабно, негласно, комплексно, невидимо и независимо от нас». Постепенно эта автоматическая вторая экономика вторгается в традиционную, в которой есть люди-посредники, и алгоритмы берут на себя то, что делали эксперты и лица, принимающие решения. Поскольку все больше и больше информации переходит в цифровую форму, мир представляет собой изобилие данных, помогающих улучшить принятие решений там, где интуицию можно заменить алгоритмом.
Рекламные агентства уже давно помогают клиентам не только в творческой работе над созданием роликов, но и в определении того, когда и где их нужно показывать, — во время каких телепрограмм, на каких рынках и в какое время они будут лучше соответствовать целям и бюджету рекламы. Для этой работы уже не одно десятилетие используются данные и технологии. Так, агентство в популярном телесериале «Безумцы» (Mad Men) в 1969 году применяет свой первый компьютер, IBM System/360, чтобы эффективнее размещать рекламу (и производить впечатление на клиентов), но все-таки в основном опирается на суждения и решения людей.
Будучи старшим аналитиком во время второй успешной избирательной кампании Барака Обамы в 2012 году, Дэн Вагнер видел, насколько большей точности можно добиться в работе и насколько это выгодно. Вагнер с коллегами составили реестр американских избирателей. С помощью машинного обучения, которое мы обсудим в следующей главе, аналитики создали три индивидуальные оценки для каждого избирателя в реестре: оценку поддержки, прогнозировавшую, насколько вероятна поддержка человеком Обамы (по сравнению с его противником Миттом Ромни); оценку явки, прогнозировавшую вероятность, с которой человек придет на выборы и проголосует в ноябре; оценку убежденности, или прогноз вероятности того, что он будет более благожелательно относиться к Обаме после его выступления.
За долгие годы накопились социально-демографические данные по каждой телепередаче — например, сколько мужчин в районе Денвера в возрасте от 18 до 24 лет смотрят повторы анимационного ситкома «Гриффины» по вторникам в 22:00. Специалисты и компании, покупающие эфирное время для рекламы, традиционно опираются на эту информацию в принятии решений. Если бы у кампании Обамы в 2012 году было намерение донести его обращение до мужчин в возрасте от 18 до 24 лет, живущих в Колорадо, множество компаний и людей посоветовали бы запускать рекламу вечером во вторник во время повтора «Гриффинов».
Подобно большинству других специалистов по закупке рекламного времени, люди в команде Обамы знали, что на такие социально-демографические данные лучше не полагаться, так как они очень неточны. Не исключено, что рекламу увидели бы преимущественно сторонники Ромни или же люди, которые уже приняли решение голосовать за Обаму (что тоже было неподходящим вариантом, поскольку средства расходовались впустую). Опираться на демографию — все равно что полагаться на суждения и оценки, которые на деле немногим лучше догадок. Кто сказал, что к мужчинам в возрасте от 18 до 24 лет можно обращаться как к единой группе или что зрители «Гриффинов» (либо мультфильмов в целом) более восприимчивы к выступлениям Обамы?
Вагнер и его коллеги поняли, что, составив всеобъемлющий реестр избирателей, они уже прошли полпути к более эффективной покупке эфирного времени. С его помощью можно было бы вычислить людей, находящихся в тех двух группах, до которых желательнее всего достучаться: сторонников Обамы, не собирающихся идти голосовать, и колеблющихся избирателей, которых нужно уговорить поддержать Обаму. Первая группа получила название «идите голосовать» (GOTV, get out the vote), вторая — «поддающиеся убеждению». Команда аналитиков обнаружила, что участники этих групп принадлежат к самым разным категориям, поэтому выбор телепередач только на основе демографических сведений не позволил бы обратиться к целевой аудитории. Команда также узнала из более ранних экспериментов, что эти две группы реагируют на разные виды агитации, так что при покупке времени на телевидении необходимо было их дифференцировать.
К 2012 году некоторые рейтинговые компании вышли далеко за рамки использования одних только демографических данных и были в состоянии указать, какие отдельные люди их смотрят. Этих-то данных и не хватало Вагнеру и его коллегам. Они предоставили таким компаниям списки GOTV («идите голосовать») и «поддающихся убеждению», а взамен получили информацию о том, сколько людей в каждой группе смотрят ту или иную телепередачу. Это позволило легко определить наилучшее эфирное время — то есть те телепрограммы, которые собирают у экранов больше всего GOTV и «поддающихся убеждению» в расчете на доллар рекламных расходов. Вагнер рассказывал: «Мы пришли к мысли покупать время поздних вечерних программ вроде тех, что крутят на TV Land, хотя это и казалось странным. Они считались в целом невыгодными и потому были дешевы. Но их смотрело множество избирателей, поддающихся убеждению, так что мы купили время».
После выборов Вагнер основал компанию под названием Civis Analytics, которая трансформировала этот подход к покупке эфирного времени в готовый продукт и стала предлагать его рекламодателям. По мнению Вагнера, сейчас самое время продавать такие услуги — в основном по той причине, что у многих компаний есть огромные списки отдельных людей: перспективных клиентов, активных клиентов, людей, возможно, склонных к дополнительным покупкам, и прочих. Он говорил нам: «Если вы продаете дорогие шины, то существует сколько-то людей, желающих потратить уйму денег на дорогие шины, и 90 процентов тех, кому на них наплевать, потому что они не водят машину или склонны экономить. У вас есть вполне пригодное представление о вашей целевой аудитории, но раньше вы не знали наверняка, какие телепередачи она смотрит. Что ж, теперь вам это известно». Для рекламодателей размещение роликов в телеэфире — важное решение, оно принимается на основе определенных данных, но на него также сильно влияют человеческие суждения. Компания Civis стремится изменить эту ситуацию и сделать покупку рекламного времени в меньшей степени интуитивной и в большей степени рациональной.
Разумеется, даже прекрасно отлаженная система, основанная на данных, далека от совершенства, особенно если она имеет дело с неточной информацией. В 2016 году во время кампании Хиллари Клинтон применялись аналогичные методы, но Клинтон проиграла выборы, в частности, потому, что данные опросов ошибочно показали, что у нее будет большой отрыв в трех штатах Среднего Запада, где она в итоге немного уступила.
Еще одна проблема состоит в том, что лица, принимающие решение, не всегда правильно ставят конечную цель; Ронни Кохави (один из авторов термина HiPPO) называет это явление критерием общей оценки. Даже если бы группа Вагнера смогла максимально точно выявить преимущество Клинтон в разных штатах, такая цель не была бы правильной. Президент США избирается коллегией выборщиков, а не прямым народным голосованием, следовательно, здесь требуется более тонкая стратегия, зависящая от штата. Аналогичным образом легко измерить количество просмотров страницы сайта или количество кликов, которые обеспечила сетевая рекламная кампания, однако бизнес больше интересуют долговременные продажи, которые обычно максимизируют иначе. Способность тщательно отбирать входные данные и определять правильные показатели работы — ключевой навык для лиц, принимающих решения на основе данных.
КОГДА АЛГОРИТМЫ ВЕДУТ СЕБЯ ПЛОХО
У передачи решений машинам есть вполне реальное неприятное следствие: ошибки и недочеты в алгоритмах могут закрепить или даже усилить некоторые из вредных предрассудков нашего общества. Например, Латания Суини, известный профессор из Гарварда, встревожилась, после того как ввела свое имя в Google. Вместе с результатами появилось объявление:
Латания Суини. Арестована? 1. Введите имя и штат. 2. Получите доступ ко всей информации. Мгновенные проверки —
Такое объявление предполагало, что у нее криминальное прошлое, хотя она никогда не подвергалась задержанию.
Решив исследовать это явление, Суини обнаружила, что поиск по именам, более распространенным среди афроамериканцев (например, Тревон, Лакиша или — да, Латания), с гораздо большей вероятностью приводил к появлению сообщения «Арестована?», чем по именам, чаще ассоциирующимся с белыми (например, Лори или Брендан). О причинах этого феномена нельзя сказать ничего точно, но Суини дала ему такое объяснение: алгоритм Google, обеспечивающий показ рекламы, заметил, что клики более вероятны, когда объявления связаны с именами, характерными для чернокожих. Это не отражение сознательных дискриминирующих действий людей, размещающих объявления или работающих в Google. Просто алгоритм отражает и усиливает распространенный в обществе расовый предрассудок, проявляющийся в решениях миллионов людей кликнуть по определенным объявлениям. Аналогичным образом по словам «ученый» и «бабушка», набранным в январе 2017 года в сервисе поиска изображений Google, выдавалось ошеломляющее количество фотографий белых людей.
В статье в Nature Кейт Кроуфорд и Райан Кало отмечали опасность того, «что в ряде контекстов недостатки систем искусственного интеллекта чрезвычайно влияют на группы, которые и без того находятся в невыгодном положении из-за таких факторов, как расовая принадлежность, пол или социально-экономические условия», и подчеркивали, насколько важно при проектировании таких систем учитывать социальные воздействия — как намеренные, так и непреднамеренные.
Мы разделяем эту озабоченность и видим в тенденции к алгоритмическому принятию решений как вероятные проблемы, так и благоприятные возможности. Проблемы состоят в том, что такой подход способен укоренить и закрепить несправедливые, опасные и нежелательные искажения. Хуже того, такие искажения могут возникать, несмотря на искреннее желание разработчиков создавать по-настоящему беспристрастные системы, и, вероятно, их будет трудно обнаружить без масштабного тестирования. Любой проект обязательно столкнется с такой проблемой.
Благоприятные возможности состоят в том, что компьютерные системы, как правило, легко поддаются тестированию и улучшению. И если какую-то ошибку однажды исправить, то маловероятно, что она проявится снова. Людям, напротив, крайне трудно разобраться в своих предрассудках (сколько явных расистов и сексистов вы знаете?), не говоря уже о том, сколько труда нужно для их преодоления. Если смотреть на ситуацию реалистично, то для систем, принимающих решение, идеальным не будет ни один стандарт — хоть на основе компьютера, хоть на основе человека, хоть на их сочетании. Любая система, скорее всего, будет содержать искажения и делать ошибки. Так что лучше поставить цель выработать такой подход, который сведет их к минимуму и позволит легко и быстро их исправлять.
ИСПОЛЬЗУЙТЕ РАЗУМ ДЛЯ ПРИНЯТИЯ РЕШЕНИЙ — НО ДЕЛАЙТЕ ЭТО РАЗУМНО
Какую роль в принятии решений должны играть люди (и должны ли вообще)? Мы уже знаем об искажениях и ошибках Системы 1, у нас есть океаны данных и растущие с каждым годом вычислительные мощности, так что можно сделать вывод, что «невидимая экономика» вот-вот вытеснит традиционную, а цифровые аналоги Системы 2 вскоре станут принимать большинство решений. Есть такая старая шутка: в будущем на каждом заводе останется всего два работника — человек и собака. Обязанностью человека будет кормить собаку, а обязанностью собаки — следить, чтобы человек не касался машин. А может, действительно компании завтрашнего станут такими?
Мы так не думаем. Да, у нас есть предрассудки, которых нет у компьютеров. Но у нас есть и сильные стороны, которых лишены машины. Начнем с того, что мы постоянно получаем от своих органов чувств невообразимое количество данных и при этом не занимаемся предварительным отбором — просто вбираем их целиком по мере поступления. Нам трудно слышать только некоторые звуки или видеть только некоторые вещи — даже в течение короткого времени. Компьютеры ведут себя наоборот: они испытывают огромные трудности в сборе разнородных данных или данных, отличных от тех, с которыми им позволили работать конструкторы и программисты.
Эта разница приводит к появлению важной работы для людей — Мил назвал ее «ролью сломанной ноги». Для иллюстрации своей идеи он придумал такой пример. Некий профессор каждый вторник в течение нескольких лет ходит в кино. Разумеется, компьютер спрогнозирует, что он снова пойдет туда и на следующей неделе. И вдруг в ближайший вторник утром профессор ломает ногу, и гипс на бедре не позволяет ему втиснуться в кресло кинотеатра (пример был придуман в 1954 году). Любой человек мгновенно поймет, что вечер у профессора не задался, но такую догадливость непросто включить в алгоритм компьютера. Существует слишком много различных непредвиденных факторов, влияющих на поведение профессора. Кто бы ни разрабатывал компьютерную систему, он не в силах собрать достаточно данных обо всех факторах, чтобы программа могла их учесть. Единственный способ сделать это — иметь всеобъемлющую модель мира, в отличие от той, что есть у компьютера.
Еще одно огромное преимущество человека — старый добрый здравый смысл. У одних его меньше, чем у других, но у любого из нас здравого смысла неизмеримо больше, чем у самых совершенных компьютеров. Как только мы рождаемся, мы начинаем изучать важные вещи о том, как устроен мир, и исследуем его уверенно и быстро. Однако, несмотря на десятилетия экспериментов, мы всё еще слишком мало знаем о том, как приобретается здравый смысл, и наши попытки привить его компьютерам до сих пор заканчивались грандиозными провалами (мы поговорим о них в следующей главе).
Таким образом, во многих случаях хорошо иметь под рукой человека, который будет проверять решения компьютера, чтобы убедиться, что они имеют смысл. Томас Дэвенпорт, специалист по аналитике и технологиям, называет такой надзор «взглядом из окна». Это не просто выразительная метафора. Эти слова произнес его знакомый пилот, который рассказывал, что вполне полагается на приборы самолета, но считает важным иногда самому взглянуть на линию горизонта. Такой подход может быть в высшей степени полезным не только для предотвращения ошибок, но и для сохранения репутации компании.
Сервис Uber познал это на горьком опыте в конце 2014 года. Тогда компания была хорошо известна тем, что временно повышала тарифы в часы интенсивного спроса, хотя многие пользователи считали подобную тактику неприемлемой. Руководство Uber полагало (и мы с ним согласны), что такое ценообразование полезно для баланса спроса и предложения. Алгоритмы компании подталкивали цены вверх, чтобы привлечь к участию больше водителей в те моменты, когда реальное или ожидаемое число свободных автомобилей не соответствовало спросу клиентов.
Практика привела к негативным отзывам о компании, когда в декабре 2014 года в Сиднее выходец из Ирана взял в заложники восемнадцать человек в кафе. Множество людей спешили покинуть опасное место, и некоторые пытались уехать на такси Uber. Компьютерные системы компании в ответ на внезапный рост спроса повысили цены. Многим людям это показалось совершенно неадекватной реакцией на ситуацию, и компанию стали активно критиковать.
Uber обнародовала заявление: «Мы не могли немедленно остановить повышение цен [во время инцидента в Сиднее]. Это наша ошибка». После того случая компания добавила в программу возможность заблокировать автоматическое повышение цен при некоторых обстоятельствах. Вечером 13 ноября 2015 года исламские террористы произвели серию терактов в Париже. В течение 30 минут после первого из них Uber отменила повышение цен в городе, предупредив об опасности всех своих пользователей.
Примеры наподобие описанного показывают действенность совместного использования человеческого разума и алгоритмов. Однако если бизнес решится на такое, ему придется быть внимательным. Поскольку мы, люди, так зависим от своих суждений, так уверены в них и столь самонадеянны, многие из нас (если не большинство) поспешат заблокировать принятое компьютером решение, даже если оно будет лучшим. Но Крис Снейдерс, который исследовал прогнозы о закупках (мы рассказывали о нем ), обнаружил, что «обычно по правильности решений эксперты, имеющие вспомогательные средства, находятся где-то между компьютерной моделью и экспертами без вспомогательных средств. Поэтому люди действуют эффективнее, если вы даете им модель. Но сама по себе модель все равно работает лучше».
Мы поддерживаем идею о том, что человек должен участвовать в принятии решений, по тем причинам, что описали Мил и Дэвенпорт, но также выступаем за то, чтобы компании «следили за счетом» везде, где возможно. Им следует все время сравнивать эффективность решений компьютера и людей. Если блокирующие действия человека правильнее, чем поведение алгоритма по умолчанию, все идет хорошо. Если же дела обстоят не так, значит, нужно что-то менять, и первым делом стоит уведомить людей об их низком коэффициенте эффективности.
Обратная связь крайне важна, поскольку именно так обучается и улучшается Система 1. Вот что пишут Канеман и психолог Гэри Кляйн: «Вам не следует верить своему чутью. Нужно рассматривать его как важный ориентир, но всегда осознанно и обдуманно оценивать эти предположения, чтобы понять, имеют ли они смысл в данном контексте». Лучший способ сделать Систему 1 точнее и свести к минимуму ее искажения — показывать ей много примеров и давать обратную связь настолько быстро и часто, насколько это возможно.
ПЕРЕВЕРНИТЕ СТАНДАРТНОЕ ПАРТНЕРСТВО ДЛЯ БОЛЬШЕЙ ЯСНОСТИ
Самый современный метод принятия решений (его только начинают использовать некоторые компании) заключается в переворачивании обычного порядка с ног на голову: не машины предоставляют данные, чтобы человек на их основании принял решение, а суждение человека используется в качестве данных для работы компьютера. Компания Google стала пионером в применении такого метода к найму сотрудников. Это была важнейшая область для компании, поскольку обычный подход там давал плохие результаты.
Когда Ласло Бок был главой отдела по работе с персоналом в Google, он понял, что большая часть методов, используемых для отбора новых сотрудников, бесполезна. Его команда стала думать, чем объясняется разница в фактической производительности людей, и обнаружила, что от предварительной проверки рекомендаций она зависит примерно на 7 процентов, от прошлого опыта — на 3 процента, а от результатов бессистемных собеседований, которые по-прежнему широко распространены и начинаются типичными вопросами «Каковы ваши сильные стороны?» и «Пройдемся по вашему резюме?» — всего на 14 процентов. Бок говорил, что проблема с этими собеседованиями состояла в следующем:
Сложилась ситуация, когда собеседования проводились для того, чтобы подтвердить наше мнение о людях, а не для их истинного оценивания. Психологи называют это предвзятостью подтверждения. На основании ничтожно малого взаимодействия мы неосознанно выносим скоропалительное суждение, на которое значительно влияют наши собственные предрассудки и убеждения. Не сознавая этого, мы переходим от оценивания кандидата к выискиванию подтверждений того, что он соответствует нашему первоначальному впечатлению.
В этом случае в действие снова вступает Система 1, которая вносит в принятие важного решения искажения и ошибки.
Итак, как лучше нанимать сотрудников? Компания Google стала в значительной степени опираться на структурированные, формализованные собеседования, которые объясняют более 25 процентов дальнейшей фактической производительности. Процедура состоит из набора заранее определенных вопросов, предназначенных для оценивания, например, общей когнитивной способности человека. Все люди, проводящие собеседования в Google, используют этот подход и в целом задают одни и те же вопросы. Как объяснял Бок, «в итоге мы получили собеседование с согласованными критериями… Интервьюер должен указывать, как действовал кандидат в том или ином случае, каждый уровень выполнения задания четко установлен… Такие четкие критерии… изменили прежде путаные, размытые и сложные процедуры, сведя их к ряду задач с измеримыми результатами».
При таком подходе суждения отдельных людей, проводящих собеседование, по-прежнему остаются ценными, однако они оцениваются количественно и используются для того, чтобы присвоить кандидатам какие-то численные оценки. Бок считает, что этот подход не обезличивает собеседование, не превращает его в формальность, а наоборот. Люди, устраивающиеся на работу в Google, ценят то, что с ними обращаются объективно и справедливо (80 процентов отвергнутых кандидатов, которые прошли собеседование по новой форме, сказали, что они рекомендовали бы друзьям подать заявление в Google), а решения о найме стали проще. Как заметил Бок: «Это позволяет увидеть четкую границу между превосходным и средним уровнем».
РЕШЕНИЯ — СЛИШКОМ СЕРЬЕЗНОЕ ДЕЛО, ЧТОБЫ ДОВЕРЯТЬ ЕГО ЛЮДЯМ, ПРИНИМАЮЩИМ РЕШЕНИЯ
Мысль о предстоящих изменениях в привычном взаимодействии разума и машины, в некоторых случаях даже переставляющих их местами, заставляет многих людей чувствовать себя неуютно. Большинство из нас верят в человеческую интуицию, в способность выносить суждения и принимать решения, особенно если речь идет не о ком-то постороннем, а именно о нас (мы обсуждали эту тему в разных аудиториях и практически не встречали человека, который бы признал, что его интуиция или рассудительность ниже среднего). Однако доказательства обратного настолько очевидны, что просто ошеломляют: в большинстве случаев, когда есть возможность сравнивать оба варианта, решения компьютерного аналога Системы 2 оказываются лучше, чем решения, принятые нами на основе обеих систем в нашем мозге. Но не стоит думать, что наши суждения бесполезны. Нет, просто их стоит улучшить. Это можно сделать с помощью рассмотренных нами подходов: позволить алгоритмам и компьютерным системам принимать решения, иногда используя в качестве входных данных человеческие суждения, а также разрешить людям в случае необходимости нажимать кнопку «стоп».
Кое-кто называет такой подход бесчеловечным. Некоторым кажется, что, если компьютеры станут играть главную роль в принятии решений, люди окажутся на обочине и будут выглядеть жалкими. Мы понимаем, что никого не радует мысль лишиться возможности принимать решения и чувствовать себя кем-то вроде слуги компьютера. Однако значит ли это, что нужно и дальше незаслуженно выпускать заключенных на свободу или по ошибке оставлять их в тюрьме, лишь бы только судьи и комитеты, занимающиеся досрочным освобождением, могли продолжать работать так, как для них привычно? Значит ли это, что число неверных медицинских диагнозов должно и дальше оставаться выше, чем могло бы быть, лишь бы только врачи и психологи продолжали работать так, как они привыкли? Что компании должны и дальше принимать на работу неподходящих людей, лишь бы только менеджеры, проводящие собеседования, продолжали считать себя умными?
Нам кажется, что ответ на все эти вопросы — нет. Правильные решения очень важны для нормального существования общества: они помогают делать так, чтобы нужные ресурсы (от поездок на работу до здравоохранения) попадали к нужным людям в нужном месте в нужное время. Стандартное партнерство в понимании Хаммера и Чампи, в котором компьютеры ведут документацию, а HiPPO выносят оценки и принимают решения, часто не самый лучший способ этого добиться.
Сейчас вы уже, вероятно, не особо удивитесь, если мы скажем, что люди весьма плохо предсказывают будущее. В конце концов, прогнозирование и принятие решений почти неразделимые действия. Чтобы принять хорошее решение, обычно нужен точный прогноз в отношении некоторых аспектов будущего — иначе говоря, мы должны знать, что произойдет, если мы поступим так или иначе. Соответственно, если мы плохи в чем-то одном, то, очевидно, также плохи и в другом. И правда, многие ошибки Системы 1 и ее попытки срезать углы мешают нам делать хорошие прогнозы.
В 1984 году политолог Филип Тетлок и его коллеги взялись за многолетний проект: они собирались оценить точность прогнозов во многих сферах, таких как политика, экономика и международные отношения. Результаты проведенного исследования, как и многих других, упомянутых в этой главе, поразительны и не допускают различных толкований. После проверки более 82 тысяч прогнозов Тетлок обнаружил, что по точности предсказаний «люди едва превосходят шимпанзе», бросающего дротики в мишень.
Это серьезная причина для беспокойства, поскольку мир бизнеса построен на предсказаниях. Многие из них вполне конкретны, например, как поведут себя определенные акции; какими окажутся направление и величина изменений будущих кредитных ставок; сколько смартфонов удастся продать в определенной стране в следующем году. Во многих других случаях прогнозы неявно заложены в предполагаемый план действий. Так, смена дизайна сайта строится на неявном предположении, что посетителям больше понравится новый вариант, и то же самое касается смены оформления в офисах филиалов банка. Яркий запуск какого-либо продукта строится на важном предположении, что клиенты отдадут ему предпочтение, а маркетинговая кампания подразумевает прогнозирование того, как их можно сформировать.
Что такое хорошо?
Разумеется, не все прогнозы оказываются неверными. Тетлок установил, что некоторые люди — он называет их суперпрогнозистами — действительно регулярно делают предсказания, более точные, чем просто случайный выбор варианта. Они берут информацию из многих источников и, что может быть более важным, демонстрируют способность рассматривать ситуации с разных точек зрения. Менее точные прогнозисты обычно имеют одну точку зрения во всех своих анализах (и упрямые консерваторы, и фанатичные либералы чаще дают плохие политические прогнозы). Тетлок называет первую из упомянутых групп (более успешных, разносторонних аналитиков) «лисами», а вторую — «ежами». Эти термины он взял у древнегреческого поэта Архилоха: «Многое знает лиса, еж — одно, но важное». Он рекомендует везде, где только можно, опираться на лис, а не на ежей. Лис легко узнать по многоаспектным и многоплановым рассуждениям и анализам. Их можно также выявить по достигнутым результатам. Люди, которые делали много точных прогнозов (причем проверяемых), с большой вероятностью являются лисами.
МЕНЬШЕ ПРЕДСКАЗЫВАТЬ, БОЛЬШЕ ЭКСПЕРИМЕНТИРОВАТЬ
Если не принимать во внимание суперпрогнозистов, то лучше меньше опираться на всяческие предсказания. Наш мир становится все более сложным, часто бывает непредсказуемым, а события быстро сменяют друг друга. Это делает прогнозирование чем-то средним между чрезвычайно трудным и фактически невозможным, причем чем дальше, тем оно оказывается ближе ко второму.
В работе самых успешных компаний происходит фундаментальный сдвиг от долговременных прогнозов, многолетних планов и крупных ставок к краткосрочным циклам, экспериментам и тестированию. Эти организации следуют отличному совету компьютерного специалиста Алана Кэя: лучший способ предсказать будущее — изобрести его. Они делают это небольшими шагами, постоянно получая обратную связь и при необходимости внося изменения в свои действия, вместо того чтобы работать втайне, двигаясь к некому отдаленному событию с уверенно прогнозируемым результатом.
Не так уж сложно реализовать такой принцип для какого-нибудь онлайн-сервиса. Сайты обычно собирают много информации о действиях пользователей, что легко позволяет увидеть, произошли ли улучшения вследствие определенного изменения. Владельцы некоторых коммерческих сайтов очень подозрительно относятся к переменам и проверяют целесообразность любого шага. Туристический онлайн-сервис Priceline появился на первой волне интереса к интернету в конце 1990-х годов. Как и многие другие лидеры того времени, он рухнул в начале 2000-х, главным образом из-за того, что пользователи разочаровались в первоначальном подходе «назовите свою цену».
В середине последнего десятилетия руководство компании переосмыслило подход к бизнесу и перешло к модели с несколькими более традиционными туристическими сайтами. Однако главным фактором, позволившим Priceline добиться успеха, было постоянное экспериментирование на основе данных. Как выразился репортер VentureBeat Мэтт Маршалл, «часто к скачкообразному росту приводят маленькие идеи вроде улучшения накопленного опыта через крохотные победы — иными словами, небольшие изменения, скажем, в цветах, формулировках или расположении данных на веб-странице немного повышают активность пользователей. Компания обнаружила, что, если заменить “парковку” на “бесплатную парковку”, это даст улучшение на 2 процента, хотя текст располагается на темном фоне и едва заметен для среднего читателя». Такие выгоды обнаруживаются повсюду. Проведя строгое A/B-тестирование (обычный сетевой эксперимент, когда половина посетителей видит вариант A, а другая половина — вариант B), компания Adore Me, специализирующаяся на женском нижнем белье, обнаружила, что продажи некоторых предметов удваиваются, когда модель позирует, запустив руку в волосы, а не держа ее на бедре. Вместо того чтобы тратить недели, дни и даже часы на экспертный анализ и споры о предлагаемых изменениях, обычно быстрее и точнее просто протестировать варианты в сети. Часто результаты оказываются удивительными.
Экспериментирование не ограничивается только интернетом. Продуктивным оно может быть и в реальном мире. Многие крупные компании являются тем, что профессор бизнес-школы Дэвид Гарвин называет «многоэлементными предприятиями» (МЭП). Такие организации имеют множество пунктов работы с клиентами, которые в целом выглядят и действуют одинаково. Банки, сети ресторанов, магазинов или центров оказания услуг являются МЭП. По одной оценке, 20 процентов компаний из списка Fortune 100 в той или иной степени многоэлементные предприятия.
Наличие у МЭП множества отдельных пунктов предоставляет отличные возможности для эксперимента. Специалист по инновациям Стефан Томке и исследователь Джим Манци описывают, как универмаг Kohl’s запустил эксперимент, где было задействовано 100 торговых точек, чтобы узнать, вредит ли продажам открытие магазинов на час позже по выходным. Такое сокращение времени работы уменьшило продажи незначительно, что стало хорошей новостью для компании. Менее приятными были результаты другого эксперимента, затронувшего 70 магазинов Kohl’s, в котором исследовалось внедрение продаж мебели. Мебель занимала много пространства и располагалась вдали от остальных продуктов, поэтому общие продажи магазинов и потоки покупателей уменьшились. Хотя многие топ-менеджеры с оптимизмом смотрели на новую идею, компания решила следовать полученным результатам и отказаться от продажи мебели. Иногда бывает нереально применить новый метод одновременно во всех точках МЭП, но частичное внедрение естественным образом создает пространство для эксперимента. При минимуме планирования можно узнать очень много нового, сравнивая места, действующие по новому методу, и те, где работа идет по-старому.
Прогнозы и эксперименты нельзя автоматизировать так же просто, как это делается с принятием решений. Однако в них применяются данные и хорошо работает строгий анализ. Это основные инструменты Системы 2, а также второй эры машин. Так что Системе 1 и ее компонентам, интуиции, суждениям и личному опыту нужно отстраниться от прогнозирования как минимум настолько же, насколько, как мы выяснили ранее, это оправдано в случае с принятием хороших решений. Иными словами, HiPPO должны стать вымирающим видом в организациях.
Резюме
• Двадцать лет стандартного партнерства разума и машин показали, что мы нередко слишком сильно полагаемся на человеческие суждения, интуицию и чутье.
• Почему человеческие суждения так часто оказываются ошибочными? Потому что работа нашей быстрой, не требующей усилий Системы 1 подвержена различного рода искажениям. И самое плохое, она не осознает, что совершает ошибку, и вынуждает рациональную Систему 2 придумывать убедительные оправдания тому, что на деле является импульсивным решением.
• Есть более чем убедительные подтверждения того, что использование только данных и работающих с ними алгоритмов обычно приводит к лучшим решениям и прогнозам, нежели использование суждений даже самых квалифицированных экспертов.
• Многие решения, оценки и прогнозы, за которые сегодня отвечают люди, следует передать компьютеру. В ряде случаев для проверки действий машины здравым смыслом следует оставить человека, в прочих же случаях его нужно полностью отстранить от принятия решений.
• Впрочем, есть ситуации, когда субъективные человеческие суждения по-прежнему могут быть полезны, если перевернуть стандартное партнерство с ног на голову. В этом случае суждения нужно перевести в числовую форму и включить в количественный анализ.
• Принятие решений не должно использоваться для того, чтобы тешить самолюбие высокопоставленных персон. Его основная задача — выдавать наилучшие варианты действий, основанные на правильных целях и четких критериях.
• Алгоритмы далеки от совершенства. Если они имеют дело с неточными или искаженными данными, они будут выдавать ошибочные или контрпродуктивные решения. Эти искажения могут быть малозаметными и непреднамеренными. Алгоритмы нужно оценивать не по отсутствию в них недостатков, а по тому, превосходят ли они существующие аналоги по ключевым критериям и можно ли их со временем улучшить.
• По мере развития технологий мы откажемся от стандартного партнерства с его чрезмерным доверием высокопоставленным лицам в пользу принятия решений, основанных исключительно на данных. Факты говорят, что компании, следующие по этому пути, обычно имеют значительные преимущества перед конкурентами старого типа.
• Лучше всего работают люди, способные смотреть на проблему с нескольких точек зрения, и компании, которые предпочитают краткосрочное планирование и эффективно экспериментируют.
Вопросы
1. Отслеживаете ли вы, и если да, то насколько систематически и строго, те решения, оценки и прогнозы, за которые в вашей организации отвечают люди и компьютеры? Знаете ли вы, кто из них лучше справляется с работой?
2. В какой области вашей организации решения обычно принимают люди с высокой зарплатой? Почему?
3. Есть ли у вас возможность в какой-нибудь части организации перевернуть стандартное партнерство, чтобы субъективные оценки людей использовались в анализе на основе данных, а не наоборот?
4. Как вы думаете, у кого в целом больше необъективности — у алгоритмов или у людей?
5. Кого вы считаете более убедительным — лис или ежей?
6. Ваша организация обычно выполняет небольшое количество долгосрочных важных проектов или большое количество краткосрочных?