Модели, всюду модели
Понимание того, что даже простые модели могут привести к удивительно точным решениям, уже давно носилось в воздухе. В 1954 году Пол Мил, психолог из Университета Миннесоты, сравнил прогнозы погоды, сделанные экспертами, с предсказаниями по простым статистическим моделям. Хотя в моделях использовалась только часть данных, имеющихся в распоряжении экспертов, они почти всегда были более точными. Ряд аналогичных исследований привел к тому же выводу. Даже, казалось бы, грубые модели часто давали очень хорошие результаты.
Модели точны отчасти потому, что в них отсутствуют распространенные мешающие ошибки. Люди, страдая предубеждением новизны, зачастую придают слишком большое значение свежей информации, умаляя ранее полученные данные и уделяя слишком много внимания легко доступным сведениям. Кроме того, мнения сильно зависят от контекста: если вы предоставите одну и ту же информацию в двух разных контекстах, велика вероятность, что человек примет разные решения. Ни одна из этих проблем не касается моделей. К тому же с их помощью можно надежно и точно обрабатывать большое количество данных.
Десятилетиями модели решений были важны в самых различных областях. Колледжи полагаются на модели для оценки заявлений абитуриентов. С помощью расчетов переменным (средний балл, результаты тестов, рекомендации и дополнительные занятия) присваивается относительный вес, и колледжи могут лучше предсказать академические успехи абитуриента, чем по школьной характеристике. Приемные комиссии не могут применить единый стандарт для большой группы абитуриентов, а с помощью модели это возможно. Банки используют модели для предоставления кредитов. В былые времена сотрудники банков опирались на три показателя: кредитную историю, возможности и характер. Они спрашивали, имеет ли заявитель хорошую кредитную историю? Остается ли у него после других расходов достаточно денег, чтобы вносить платежи? Производит ли он впечатление заслуживающего доверия? Это не плохие эмпирические правила, но сотрудники банков, как и все остальные, ошибаются. С помощью моделей можно выстроить более точный прогноз, будет ли погашен кредит, и с течением времени при постоянном добавлении текущей информации предсказания становятся все более точными.
В последние годы мы чаще стали использовать модели решений. Эта комбинация – накопление огромного количества данных, хранящихся в таких местах, как Центр обработки данных АНБ в Юте, со все более усложняющимися алгоритмами, – привела к успехам в различных областях. Некоторые модели используются для решения чрезвычайно важных задач. Palantir в Пало-Альто постоянно анализирует огромное количество финансовых операций в целях выявления отмывания денег и использования мошеннических кредитных карт. Он также служит американским военным, позволяя изучить в реальном времени фотографии подозрительных объектов, в которых могут быть придорожные бомбы – так называемые импровизированные взрывные устройства или СВУ. Находящаяся в Сан-Франциско Климатическая корпорация годами собирает данные о температуре и осадках по всей стране для прогнозирования погоды, чтобы помочь фермерам решить, что и когда сажать. В результате управление рисками становится более эффективным, и урожайность повышается.
Другие модели используются ради развлечения. Например, Гарт Сандем и Джон Тирни разработали модель, помогающую пролить свет на одну из величайших мировых тайн современности: как долго продлится текущий брак знаменитости? Собирая всевозможные факты и вводя их в компьютер, они придумали единую теорию знаменитостей Сандема/Тирни, по которой определяется продолжительность брака в зависимости от возраста супругов (старше – лучше), прошлых браков (неудачные браки считались неблагоприятным признаком), того, как долго пара встречалась (дольше – лучше), известности (измерялась путем поиска в Google) и сексапильности (для тех, кто выкладывал изображения в полураздетом виде). С небольшим количеством переменных модель хорошо работала для предсказания судьбы браков на ближайшие несколько лет.
Модели продемонстрировали замечательные возможности в областях, считающихся, как правило, вотчиной экспертов. Два политолога, Эндрю Мартин и Кевин Куинн, разработали модель прогнозирования решений Верховного суда (поддержат или отменят девять судей решение суда низшей инстанции) на основе всего шести переменных. Несмотря на длинные рассуждения, подробное обсуждение прецедента и мудреные правовые нормы, большинство решений принимается на основании нескольких ключевых факторов. Но модель использовали ретроспективно. Чтобы убедиться, что с ее помощью можно предсказывать решения, профессор права из Пенсильванского университета Тед Ругер применил ее к предстоящей сессии Верховного суда. Он по отдельности попросил 83 экспертов сделать прогнозы по одним и тем же случаям. В конце года он сравнил два набора прогнозов и обнаружил, что модель сработала в 75 % случаев, а мнение экспертов оправдалось в 59 %. Модель оказалась ближе к истине.
Модели могут хорошо работать даже в случаях, казалось бы, субъективных. Как вы думаете, в каком случае вернее прогноз качества вина: когда за дело берется знаток с хорошим вкусом и многолетним опытом или когда вводится статистическая модель, не различающая ни вкуса, ни запаха? Большинство из нас скажет, что знаток. Мы представляем себе элегантного человека; подняв бокал темно-красного вина, он медленно его поворачивают, вдыхая букет и смакуя тонкие оттенки – здесь ежевика, там корица. Мы считаем, что личный опыт, накопленный за много лет на виноградниках Бургундии и Напы, позволит точно оценить урожай. Факты говорят о другом. Использовав информацию о Бордо, главной винодельческой области Франции, принстонский экономист Орли Эшенфельтер разработал модель, позволявшую предсказать качества вина из определенного урожая на основе всего трех переменных: количество осадков зимой, во время сбора урожая и средняя температура во время вегетационного периода. К удивлению многих, модель предоставляет значительно более точные оценки.
Последние два примера приведены профессором права Йельского университета Яном Айресом в книге «Super Crunchers: Why Thinking-by-Numbers Is the New Way to Be Smart» («Суперсолдаты: Думай числами – будешь умным»). Айрес объяснил, что преимущество моделей состоит в отсутствии распространенных предубеждений. Неудивительно, что он упомянул самоуверенность, отметив, что люди «чертовски самоуверенны в своих прогнозах и медленно их меняют перед лицом новых доказательств» (в качестве доказательства Айрес привел исследование, не раз упомянутое мною, когда люди должны указать диапазон 90-процентной уверенности при ответе на вопросы на общую эрудицию. Они постоянно зауживают диапазон. Айрес прав: мы склонны к сверхточности, но знаем, что сверхточность не свидетельствует о переоценке или смещении). У моделей предубеждений нет: в них объективно взвешиваются все данные, так что не удивительно, что результат лучше.
Значит, модели решений – действительно «новый способ стать умным»? Безусловно. По крайней мере, в некоторых типах решений.
Но давайте вернемся к нашим примерам. В каждом случае мы ставили цель сделать прогноз того, на что не могли повлиять. С помощью модели можно оценить, будет ли погашен кредит, но нельзя изменить вероятность того, что данный кредит не будет погашен в срок. Она не поможет повысить платежеспособность заемщика или убедиться, что он не растратит деньги за неделю до платежа. С помощью модели можно предсказать количество осадков и солнечных дней на данной ферме в центральной Айове, но нельзя изменить погоду. Можно оценить, сколько времени продлится брак знаменитости, но нельзя сделать его ни короче, ни длиннее. Можно оценить качество вина определенного урожая, но не сделать его лучше. Нельзя уменьшить кислоту, улучшить баланс или добавить оттенок ванили или нотку черной смородины.
В ситуациях, когда нам требуется точная оценка того, на что мы не можем повлиять, модели могут быть чрезвычайно мощным средством. Но когда мы можем влиять на результаты, картина меняется. Давайте вернемся к примеру с велосипедистами из главы 2: доктор Кевин Томпсон использовал обманный аватар, чтобы побудить испытуемых ехать быстрее. Если Томпсон проведет один и тот же эксперимент много раз и накопит большой набор данных, то он, безусловно, сможет разработать модель, предсказывающую соотношение между величиной «тайного дополнения обратной связи» и производительностью велосипедиста. Он мог бы, например, показать, что большинство спортсменов может держаться вровень с аватаром, когда он ускоряется на 2 %, что некоторые не отстанут и при ускорении на 3 %, меньшее число не отстанет при ускорении на 4 % и почти все отстанут при ускорении более чем на 5 %. Эффективный подход для кабинетного ученого, вносящего результаты в таблицу или сравнивающего их с контрольными. Он использует данные, чтобы прогнозировать исход, на который не влияет. Но у велосипедиста совсем другая реальность. Для человека, крутящего педали, жизненно важно позитивное мышление. Предполагая, что вы можете достичь высокой производительности, даже если ваше убеждение выходит за рамки того, что делалось раньше, вы действительно можете ее достигнуть.
То же самое касается доктора Витт и ее исследования точности попадания в лунку. При наличии достаточного количества субъектов с помощью изменения размера кругов и расстояния она, безусловно, может построить модель, чтобы предсказать эффект иллюзии Эббингауза. Она может показать, что окружение более мелкими кругами приводит к некоторому повышению среднего с заданной дисперсией. Но для участника эксперимента, держащего клюшку в руках и целящегося в лунку, прогноз о среднем улучшении не играет никакой роли. Гольфист должен отвести клюшку назад, сделать мах вперед и ударить по мячу с правильной силой, чтобы отправить его в лунку. Модель не ударяет по мячу; ударяет игрок, держащий клюшку. Это отличие простое, но крайне важное; тем не менее его часто упускают из виду.