Книга: Просчитать будущее: Кто кликнет, купит, соврет или умрет
Назад: Введение. Эффект прогнозирования
Дальше: Глава 2. С властью приходит ответственность
ГЛАВА 1

Ракета прогнозной аналитики: три, два, один, старт!

Сколько смелости нужно для того, чтобы внедрить прогнозную аналитику в реальную практическую деятельность? И какое вознаграждение это сулит? Что происходит, когда человек ставит все сбережения на разработанную им лично предикативную модель для торговли на фондовом рынке? Внедрить прогнозную аналитику — значит не только составлять прогнозы, но и действовать на их основе, применяя на практике извлеченные из данных знания. Это решительный шаг — но вы не сможете выиграть, если не будете играть.

В середине 1990-х годов один амбициозный молодой исследователь понял, что он не может больше ждать. Посоветовавшись с женой, он поставил все семейные сбережения на торговую систему, основанную на хитроумной модели прогнозирования динамики фондового рынка, которую он разработал в свободное от основной работы время. Подобно доктору Генри Джекилу, смело выпившему намешанное им непроверенное зелье, доктор Джон Элдер решительно сказал: «Поехали!»

Всегда страшно пробовать что-то новое, а тем более испытывать новую технологию. Запуск космического корабля может быть символом технологического величия и предметом национальной гордости, но за кадром остается небольшая группа жен астронавтов, которые в этот момент испытывают сильнейший страх за своих мужей. Астронавты же, по сути, добровольно обрекают себя на роль подопытных кроликов в колоссальном по размаху и важности эксперименте; они готовы пожертвовать собой ради того, чтобы стать частью истории.

Великие задачи рождают великие достижения. Мы уже совершили прогулку по Луне, а недавно первой негосударственной организации была вручена премия в размере $10 млн за разработку пилотируемого космического корабля многоразового использования. Мы вступаем в эпоху беспилотных автомобилей с системами автоматического управления — «Мам, посмотри, я не держусь за руль!» Сжигая в своих двигателях миллионы долларов всевозможных грантов и премий, эти машины самостоятельно рулят по улицам кампусов Google и BMW.

Замените рев ракеты на ряды данных, и перед вами откроется не менее головокружительная перспектива, чем возможность проникнуть за пределы Земли в космическое пространство, — а именно возможность проникнуть за пределы настоящего и заглянуть в будущее. Преодоление границы между настоящим и будущим — занятие ничуть не менее захватывающее, чем выход в космос, но менее опасное (космос — это вакуум, а вакуум убивает). Миллионы призовых долларов выделяются на то, чтобы научиться избегать ненужной госпитализации каждого отдельно взятого пациента или точно прогнозировать уникальные предпочтения конкретного потребителя. Телевикторина Jeopardy! (российский аналог — «Своя игра») вручила приз в $1,5 млн создателям компьютера, победившего в поединке между человеком и машиной, что стало возможным благодаря значительному прогрессу в способности машины прогнозировать правильные ответы на вопросы. (Разумеется, IBM вложила гораздо больше денег для достижения этой победы, но более подробно об этом вы узнаете в главе 6.) Прибегая к помощи прогнозных аналитиков, организации удерживают детей в школах, обеспечивают приток новых клиентов и предотвращают совершение преступлений. Без преувеличения можно сказать, что благодаря прогнозной аналитике одерживаются победы на политических выборах, чемпионатах по бейсболу и… я еще не упоминал об управлении финансовым портфелем?

Биржевая торговля при помощи «черных ящиков», т.е. механических торговых систем, автоматически принимающих решения о проведении операций на рынке, — это cвятой Грааль принятия решений на основе данных. Черный ящик — это компьютерная программа, которая анализирует поступающие в нее потоки текущих финансовых данных и выдает приказы (или рекомендации) по покупке, продаже или удержанию бумаг. Он называется черным, поскольку до тех пор, пока он принимает правильные решения, вас не волнует, что происходит внутри него. Будучи работоспособным, он затмевает собой любой другой бизнес, возможный в этом мире: ваш компьютер становится устройством, превращающим электричество в деньги.

Для Джона Элдера запуск собственной торговой системы требовал немалого мужества. Даже если технология прогнозирования изменений на фондовом рынке будет огромным шагом вперед для человечества, для самого Джона этот шаг был совсем не маленьким. Для этого момента можно было подобрать множество метафор. Идя ва-банк и складывая все яйца в одну аналитическую корзину, Джон принимал большую дозу изобретенного им же лекарства.

Прежде чем продолжать рассказ о Джоне Элдере, давайте посмотрим, как происходит внедрение прогнозной аналитической системы не только для целей биржевой торговли, но и во множестве других сфер деятельности.

Внедрение ПА

Машинное обучение на основе данных находит применение практически повсеместно. Овладейте этим искусством, и вы будете востребованы почти повсюду!

Джон Элдер

Сегодня на нас буквально обрушивается поток головокружительных историй о все новых успехах, достигнутых благодаря ПА. Вот несколько ключевых факторов, которые привели к открытию этих шлюзов:

Причина такого прорыва по всем фронтам заключается в одном счастливом качестве, присущем прогнозной аналитике, — ее универсальности. Применение этой технологии можно найти практически повсюду. Хотите придумать свой собственный инновационный способ использования ПА? Для этого вам нужно знать всего две вещи.

Любое применение ПА определяется двумя факторами.

  1. Предмет прогнозирования: какое поведение, действие или событие должно быть спрогнозировано в отношении конкретного человека, акции или другого субъекта.
  2. Цель прогнозирования: какие решения будут приняты или какие действия предприняты организацией в ответ на каждый прогноз или под его влиянием.

Поскольку список потенциальных областей применения ПА неограничен, а перечень уже достигнутых успехов невероятно обширен, их адекватная презентация сама по себе представляет собой небольшую задачу управления данными! Поэтому я составил большую выборку (в общей сложности 147 примеров) и поместил ее в виде девяти таблиц в приложении D этой книги. Перелистайте сейчас страницы и ознакомьтесь с ними, чтобы ощутить, сколь потрясающие вещи здесь происходят. Эти таблицы — как фотографии девушек на развороте глянцевого журнала — самая возбуждающая часть книги. Они раскрывают все области применения прогнозной аналитики: цены акций, риск, правонарушения, несчастные случаи, продажи, пожертвования, клики, отмены, проблемы со здоровьем, госпитализация, мошенничество, уклонение от уплаты налогов, преступления, неисправности, дебит нефти, отключение подачи электричества, предоставление государственных пособий, мысли, намерения, ответы, мнения, ложь, оценки, отсев учащихся, дружба, романтические отношения, беременность, разводы, рабочие места, увольнения, победы, выборы и многое другое. ПА стремительно проникает во все новые сферы нашей жизни.

В бизнесе свое главное применение ПА находит в области массового маркетинга, о чем мы говорили во введении.

Применение ПА: нацеливание прямого маркетинга

  1. Предмет прогнозирования: какие клиенты положительно откликнутся на маркетинговый контакт.
  2. Цель прогнозирования: нацеливание маркетинговых усилий на клиентов с наибольшей вероятностью положительного отклика.

Как уже было сказано, такое использование ПА хорошо иллюстрирует эффект прогнозирования:

Эффект прогнозирования: малым достигается многое.

Позвольте мне показать, как просто рассчитать величину чистой выгоды, создаваемой благодаря действию эффекта прогнозирования. Представьте, что у вас есть компания с списком рассылки, включающим 1 млн потенциальных клиентов. Стоимость прямой почтовой рассылки в расчете на клиента составляет $2, и в прошлом только 1 из 100 человек покупал ваш продукт (т.е. вы получали 10 000 откликов). Предположим, что вы по-прежнему решаете охватить рассылкой весь список.

Если ваша прибыль составляет $220 в расчете на каждый (редкий!) положительный отклик, то вы заработаете в общей сложности:

Общая прибыль = Выручка – Затраты = ($220 × 10 000 откликов) – ($2 млн).

Можете не доставать ваш калькулятор — это $200 000 прибыли. Довольны ли вы таким результатом? Вряд ли.

Если вы новичок на арене прямого маркетинга (добро пожаловать!), вы заметите: это все равно как если бы вы заставили миллион обезьян кидать дротики в примерном направлении мишени — доля успешных попыток столь же невелика, зато масса дротиков (и денег) бросается на ветер. Как выразился один из пионеров маркетинга Джон Уонамейкер: «Половина денег, которые я трачу на рекламу, тратится впустую. Беда в том, что я не знаю, какая именно половина». Плохая новость в том, что на самом деле впустую тратится гораздо больше, чем половина; хорошая — ПА позволит вам существенно улучшить результаты.

Неточный прорицатель, к которому все прислушиваются

Первым шагом на пути прогнозирования будущего является признание того, что будущее нельзя спрогнозировать.

Стивен Дубнер, из передачи «Радио фрикономики» от 30 марта 2011 года

«Парадокс прогнозирования»: чем скептичнее мы относимся к нашей способности прогнозировать будущее, тем успешнее мы бываем в его планировании.

Нейт Сильвер, из книги «Сигнал и шум: почему не сбывается так много прогнозов — но некоторые все же сбываются»

Половина того, чему вы научитесь в медицинском институте, к моменту начала вашей врачебной практики окажется неверным.

Д-р. Мехмет Оз

Ваш корпоративный прорицатель, прогнозно-аналитическая система, говорит вам, какие клиенты вероятнее всего откликнутся на прямую рассылку. Он выделяет четверть списка и заявляет: «Эти люди дадут положительный отклик с вероятностью в три раза выше средней». Так что теперь у вас есть короткий список из 250 000 потенциальных клиентов, из которых 3%, т.е. 7500 человек, могут стать реальными покупателями.

Ну и прорицатель! При столь высокой степени неточности предсказаний мы по-прежнему не можем быть твердо уверены в результате по каждому потенциальному клиенту, учитывая ничтожную 3%-ную долю откликов. Однако общий IQ ваших метающих дротики обезьян повышается фантастически. Если вы ограничите рассылку только этим коротким списком, вы заработаете:

Общая прибыль = Выручка – Затраты = ($220 × 7500 откликов) – ($2 × 250 000).

Это $1 150 000 прибыли. Вы увеличили прибыль в 5,75 раза просто за счет того, что разослали рекламные брошюры меньшему числу людей (и при этом также спасли от вырубки несколько деревьев). Вы спрогнозировали, кто вряд ли откликнется на вашу рекламу, и просто оставили этих людей в покое. Таким образом, вы сократили затраты на три четверти в обмен на снижение продаж всего на одну четверть. Согласитесь, это выгодная сделка.

Определить реальную денежную отдачу от прогнозирования несложно. Как вы уже увидели, если составление самих прогнозов требует применения сложных математических методов, то для того, чтобы оценить совокупное влияние на итоговый результат (такой, как прибыль) любого прогноза, точного или не очень, достаточно простейшей арифметики. Прогнозная аналитика — не некая абстрактная наука. Это бизнес.

Предупрежден — значит вооружен

Таким образом, даже небольшое предиктивное знание, незначительный задаваемый им в правильном направлении импульс обладает существенной ценностью. Писатели-фантасты любят рассуждать о том, к чему может привести даже самая малая возможность заглянуть в будущее. Помните, как герой Николаса Кейджа в фильме «Пророк», снятого по рассказу Филипа Дика, разделывается с опаснейшими преступниками? Его оружие? Врожденная способность заглядывать в будущее — хотя и всего на несколько минут. Но этого достаточно для того, чтобы предотвратить преступления. В результате этот тихий, мягкосердечный человек оказывается в самом центре боевых действий в окружении отряда вооруженных до зубов агентов ФБР, которые подчиняются каждому его жесту. Он предвидит урон, который может нанести каждая ловушка, снайпер или рядовой боевик, поэтому может правильно направлять действия своей группы суперагентов, избегая одной опасности за другой.

В некотором смысле внедрение ПА превращает вашу организацию в такую же команду суперагентов, обладающих сверхъестественной способностью избегать риска. Каждое решение, которое принимает организация, каждый шаг, который она делает, сопряжены с риском. Представьте себе, что будет, если организация сможет предвидеть любую опасность и избегать ее — будь то преступное деяние, падение цены акций, госпитализация, безнадежный долг, транспортная пробка, высокий процент отсева учащихся… или попадание рекламной брошюры в мусорную корзину. Таким образом, отныне организационный риск-менеджмент, целью которого традиционно была защита от единичных макроуровневых инцидентов, таких как падение самолета или экономический крах, расширяется до борьбы с мириадами микроуровневых рисков.

Но в этом нет ничего особенно ужасного. Мы также можем спрогнозировать благоприятное поведение, что часто сигнализирует о наличии возможности. Эта игра называется «Спрогнозируй и действуй» — другими словами, используйте открывающуюся возможность, когда ваша ПА-система подсказывает, что клиент может совершить покупку, цена акций будет расти, избиратель колеблется и может склониться на вашу сторону или привлекательная собеседница на сайте знакомств, скорее всего, согласится на свидание с вами.

Даже небольшое умение предвидеть будущее наделяет вас почти магической силой. В некоторых случаях очевидным решением будет принятие превентивных мер, чтобы избежать негативных событий, таких как преступление, убыток или болезнь. В других, предвидя благоприятную возможность, вы будете действовать, чтобы использовать ее. В любом случае прогнозирование служит принятию более осведомленных и правильных решений.

Давайте рассмотрим пример из реальной жизни, который я называю «делом на миллион долларов».

Тихая революция стоимостью в миллион

Когда организация внедряет в свою деятельность прогнозную аналитику, она бросает в бой целую армию — но это армия муравьев. Эти муравьи выходят маршем на передний край организационного фронта, там, где происходит контакт с клиентами, студентами, пациентами и т.п. — т.е. с людьми, которых обслуживает организация. Руководствуясь прогнозами, армия муравьев улучшает миллионы мелких решений, принимаемых в рамках этих взаимодействий. Этот процесс, как правило, протекает незаметно… пока кто-то не решает оценить его совокупный эффект. Несмотря на то, что улучшение решений происходит на микроуровне — на муравьином уровне, если использовать нашу метафору, — общий результат может быть впечатляющим.

В 2005 году я рылся в огромном массиве данных по поручению одного клиента, который хотел увеличить количество кликов на своем сайте. Точнее говоря, он хотел увеличить частоту кликов по рекламным объявлениям своих спонсоров. Это был вопрос денег: больше кликов — больше денег. За многие годы сайт приобрел десятки миллионов пользователей, и тот массив данных всего за последние несколько месяцев, который они мне предоставили, содержал 50 млн строк данных — немалый по размерам рудник, в котором мне предстояло добыть золото знаний и научиться прогнозировать… клики.

Реклама является неотъемлемой частью средств массовой информации — печатных, телевизионных или виртуальных. Бенджамин Франклин забыл включить ее в свой список, когда красноречиво заявил: «В нашем мире есть всего две неизбежные вещи — смерть и налоги». Крупнейшая интернет-компания Google указывает рекламу как главнейший источник доходов. То же самое делает и Facebook.

Но на этом сайте ситуация с рекламой немного отличалась от обычной, что еще больше увеличивало потенциальный выигрыш от умения правильно спрогнозировать клики пользователей. Это был ведущий сервис по поиску студенческих грантов и стипендий, который использовал каждый третий учащийся старших классов, готовящийся получить высшее образование: узкий нишевой сервис, который был чрезвычайно популярен у некоторых университетов и военных учебных заведений. Один из университетов публиковал броское рекламное объявление, в котором именовал себя «лидером творческого образования в Америке», а мигающая в центре кнопка с надписью «Да, пусть со мной свяжется представитель приемной комиссии Института искусств» просто умоляла, чтобы ее нажали. Разумеется, на сайте размещали рекламу и кредитные организации, предлагая будущим студентам другой источник финансирования: кредиты на обучение. Спонсоры платили по $25 за каждого потенциального новобранца. Неплохое вознаграждение за один маленький щелчок мышью. Более того, поскольку реклама была весьма актуальна для пользователей, имея непосредственное отношение к цели их пребывания на сайте, доля откликов составляла необычайно высокие 5%. Другими словами, этот небольшой бизнес, принадлежащий одной известной интернет-компании, специализирующейся на онлайн-рекрутинге, приносил хорошую прибыль. И любое, даже небольшое улучшение означало весомое увеличение дохода.

Однако улучшение алгоритма выбора рекламных объявлений было непростой задачей. Через определенные промежутки времени пользователям сайта демонстрировалось полноэкранное рекламное объявление, которое выбиралось из 291 имеющегося варианта. Хитрость заключалась в том, чтобы выбрать наиболее подходящее объявление для каждого конкретного пользователя. До настоящего момента выбор рекламы осуществлялся по простому принципу — какой доход она в среднем приносила в прошлом — без учета потребностей конкретного пользователя. Более привлекательные рекламные объявления всегда демонстрировались первыми. Хотя такой подход исключал возможность повышения релевантности объявлений для индивидуальных пользователей, он приносил замечательные результаты. Некоторые рекламодатели платили столь щедрое вознаграждение за каждый клик, и некоторые объявления инициировали столько кликов, что идея показывать некоторым пользователям менее действенную рекламу казалась сумасшедшей, поскольку могла подорвать уже сформированную систему извлечения дохода.

Опасности персонализации

Доверяя прогнозам и персонализируя на их основе свое предложение, вы идете на риск. Прогнозно-аналитическая система смело провозглашает: «Даже если рекламное объявление А в целом является сильным, в отношении этого конкретного пользователя стоит рискнуть и показать ему объявление B». По этой причине большая часть интернет-рекламы не персонализируется под конкретных пользователей. Даже рекламный сервис Google Adwords, который позволяет размещать текстовые объявления рядом с результатами поиска и на других веб-страницах, определяет, какие объявления показать, на основе содержания данной веб-страницы, кликабельности рекламы и предложения рекламодателя (сколько он готов платить за клик). Он не определяет их на основе того, что известно или спрогнозировано об этом конкретном пользователе, который увидит рекламу.

Но готовность пойти на этот риск выводит нас на новый уровень отношений с клиентами. Для бизнеса это означает «персонализацию», «повышение релевантности» и «индивидуализированный маркетинг». В других сферах это означает индивидуальный подход к лечению больных или к вынесению приговоров в отношении подозреваемых в совершении преступлений. В своей речи, посвященной удовлетворению широкого разнообразия наших предпочтений в выборе соуса для спагетти — с кусочками, сладкий, пряный — Малькольм Гладуэлл сказал: «Люди… искали универсализмы. Они искали универсальный способ вылечить всех нас… Вся наука XIX и большой части XX века была одержима универсализмами. Психологи, врачи, экономисты — все старались вывести правила, управляющие поведением всех нас. Но всё изменилось, не так ли? В чем состоит великая научная революция, произошедшая за последние 10–15 лет? В переходе от поиска универсализмов к пониманию многообразия. В области медицины мы хотим знать не то, как действует рак, а чем ваш рак отличается от моего».

От медицинских проблем до потребительских предпочтений индивидуализация побеждает универсализацию. То же касается и рекламы в Интернете.

Применение ПА: нацеливание рекламы

  1. Предмет прогнозирования: какое рекламное объявление вероятнее всего спровоцирует клик у каждого конкретного пользователя.
  2. Цель прогнозирования: повышение эффективности отображения рекламных объявлений (на основе вероятности клика, а также вознаграждения, выплачиваемого рекламодателем).

Я разработал для своего клиента прогнозно-аналитическую систему для персонализации рекламы, и компания решила испытать ее в деле, сравнив результаты с результатами своей прежней системы. Проигравший в этом поединке должен был оказаться в мусорной корзине второсортных идей, которые просто-напросто приносят меньше денег. Чтобы подготовиться к этому бою, мы снабдили ПА-систему мощным вооружением. Прогнозы генерировались посредством процесса машинного обучения, опирающегося на 50 млн примеров, каждый из которых содержал микроурок из прошлого, такой как «Пользователю Мэри было показано объявление А, и она по нему кликнула» (положительный отклик) или «Пользователю Джону было показано объявление В, и он по нему не кликнул» (отрицательный отклик).

Для отбора рекламы использовалась технология обучения, известная как наивная байесовская модель. Эта модель названа по имени преподобного Томаса Байеса, известного математика, жившего в XVIII веке, а термин «наивная» означает, что мы берем идеи очень умного человека и перерабатываем их таким образом, чтобы упростить их, но в то же время сделать пригодными для применения на практике. В результате мы получаем практический метод, который хорошо показывает себя в решении многих предиктивных задач и может быть приспособлен под конкретную задачу. Я выбрал этот метод за его относительную простоту, поскольку на самом деле мне нужно было разработать 291 такую модель — по одной для каждого объявления. Все вместе эти модели должны были предсказать, по какому рекламному объявлению вероятнее всего кликнет конкретный пользователь.

Внедрение: трудности и отсрочки

Как и запуск космического корабля, внедрение ПА в теории выглядит превосходно. Вы разрабатываете и строите аппарат, ставите его на стартовую площадку и ждете разрешения. Но в тот самый момент, когда вы готовы нажать кнопку «Старт», запуск отменяется. Затем откладывается. Затем отменяется снова. Так, братья Райт, воодушевленные потрясающими возможностями изобретенной ими новой конструкции крыла, создающей подъемную силу, решились пойти неизведанным и тернистым путем, многократно спотыкаясь и падая, рискуя своей жизнью и здоровьем, пока не устранили все проблемы.

Когда ПА используется в режиме реального времени, как в случае персонализации рекламы, прогнозы должны генерироваться со скоростью света, чтобы иметь практическую ценность. Виртуальный мир не терпит промедлений, когда нужно срочно решить, какую рекламу показать пользователю, купить или нет акции, авторизовать ли платеж по кредитной карте, какой фильм порекомендовать, отсеять ли сообщение как спам или как ответить на вопрос в интеллектуальной телевикторине Jeopardy!. ПА-система реального времени должна быть интегрирована непосредственно в операционные системы, такие как веб-сайты или средства обработки платежей по кредитным картам. Если вы впервые внедряете ПА в организации, этот проект может потребовать значительных усилий со стороны ее программистов, которые зачастую и без того перегружены работой по обслуживанию корпоративных систем, чтобы обеспечить нормальное функционирование организации. Таким образом, этап внедрения в проекте ПА требует гораздо большего, чем просто разрешения со стороны высшего руководства: он требует большой реальной работы. К тому моменту, когда программисты интегрировали мою прогнозно-аналитическую систему, данным, на которых я ее отлаживал, уже было около 11 месяцев. Были ли результаты обучения по-прежнему релевантны почти год спустя или же они потеряли свою прогнозную силу?

В полете

Майор Том Центру управления полетами: —
Прием! Я шагнул за шлюз,
И поплыл я в непривычной пустоте…

Дэвид Боуи, из песни «Космическое путешествие»

После запуска ПА-системы начинается страшный период ожидания, словно вы плаваете в космическом пространстве и все вокруг вас застыло в полной неподвижности. Но на самом деле, когда вы дрейфуете на земной орбите, вы несетесь в космосе со скоростью более 22 400 км в час. В отличие от красочного зрелища запуска ракеты или строительства небоскреба, запуск ПА-системы происходит почти незаметно. Она начинает работать, но никаких немедленных видимых изменений в повседневных операциях не происходит. Например, если после установки системы персонализации рекламы вы зайдете на сайт, вам, как обычно, будут показывать рекламные объявления, так что вы можете даже усомниться в том, оказывает ли система какое-либо влияние на их выбор. Это то, что компьютеры умеют делать лучше всего. Они обладают способностью инициировать масштабные процедурные изменения, которые часто остаются незамеченными, поскольку не могут непосредственно наблюдаться ни одним человеком.

Но под поверхностью происходят глобальные перемены, словно весь океан подвергается радикальной реконфигурации. На самом деле эффект становится очевиден только тогда, когда составляется общий отчет.

В случае, о котором я рассказываю, прогнозный подход восторжествовал. Организация провела прямое сравнение: для одной половины пользователей реклама продолжала выбираться при помощи существующей системы, а для другой использовался новый предиктивный алгоритм. Новая система увеличила доходы по крайней мере на 3,6%, что означало дополнительный $1 млн каждые 19 месяцев (из расчета на основании текущих поступлений). Причем эта система затрагивала только полностраничную рекламу; гораздо больше меньших по размеру объявлений размещалось на каждой странице сайта, и их эффективность также могла быть повышена через внедрение аналогичной ПА-системы.

Нам не потребовалось ни новых клиентов, ни новых рекламодателей, ни изменения действующих контрактов, ни нового компьютерного оборудования, ни новых сотрудников, ни нового рабочего подхода — для того, чтобы сгенерировать дополнительный денежный поток, потребовалось только улучшить процесс принятия решений. В хорошо отлаженной, работоспособной системе, подобной той, что была у моего клиента, даже небольшое улучшение на 3,6% приносит существенную отдачу. Иногда выигрыш может быть еще значительнее: одна страховая компания сообщает, что благодаря использованию технологии прогнозной аналитики она экономит почти $50 млн в год за счет снижения убыточности на половину процентного пункта.

Так как же эти модели предсказывают каждый клик?

Элементарно, Ватсон: сила наблюдательности

Аналогично тому, как Шерлок Холмс делал проницательные выводы, опираясь на свое суждение о характере подозреваемого, прогнозирование основано на одном правиле: то, что известно о каждом конкретном человеке, дает набор подсказок о том, как он может поступить в той или иной ситуации. Вероятность того, что пользователь кликнет мышкой по определенному рекламному объявлению, зависит от разнообразных факторов, включая пол, год обучения, домен электронной почты (Hotmail, Yahoo!, Gmail и т.д.), результаты предлагаемых на сайте опросов и тестов (имеет ли пользователь больше гуманитарный или математический склад ума?) и т.д.

На самом деле этот сайт собирал огромное количество информации о своих пользователях. Чтобы выяснить, на какие гранты или стипендии они могут претендовать, пользователи отвечали на десятки вопросов о своей успеваемости в школе, сфере интересов, внеклассных увлечениях, профессии, которую они хотят получить, образовании родителей и многом другом. Таким образом, таблица данных была не только очень длинной (50 млн примеров), но и широкой: каждая строка содержала всю информацию, известную о пользователе на тот момент, когда ему показывалось рекламное объявление.

На первый взгляд это кажется непосильной задачей: переработать миллионы примеров, чтобы узнать, каким образом использовать различные факты, известные о конкретном человеке, чтобы научиться составлять более-менее обоснованные прогнозы. Но эту задачу можно разбить на несколько частей, что намного упростит ее. Давайте начнем с хитроумного инструмента, который непосредственно занимается выработкой прогнозов, — электронного Шерлока Холмса, знающего, как учесть все эти факторы и на их основе сделать прогноз в отношении конкретного человека.

Прогнозная модель — это механизм, который предсказывает поведение индивида, такое как щелчок мышью, покупка, ложь или смерть. Она использует в качестве входных данных характеристики конкретного индивида и на выходе выдает прогнозную скоринговую оценку. Чем выше оценка, тем больше вероятность того, что индивид проявит прогнозируемое поведение.

Прогнозная модель (представленная в этой книге в виде «золотого» яйца, пусть и в черно-белом цвете) ставит каждому индивиду скоринговую оценку:

picture

Другими словами, прогнозная модель учитывает все известные характеристики индивида и на их основе вырабатывает прогноз. Существует много способов это сделать. Один из них состоит в том, чтобы оценить влияние каждой характеристики и затем суммировать эти влияния — например, для женщин скоринговая оценка повышается на 33,4 балла, для пользователей Hotmail уменьшается на 15,7 балла и т.д. Каждый признак увеличивает или уменьшает итоговую скоринговую оценку для конкретного человека. Такая модель называется линейной; она считается достаточно простой и ограниченной в своих возможностях, хотя, как правило, это гораздо лучше, чем ничего.

Другие модели основаны на правилах, таких как в рассматриваемом нами примере:

picture

Это правило является ценной находкой, так как средняя вероятность отклика на рекламное объявление института искусств составляет всего 2,7%. Условно говоря, мы выделили группу потенциально активных «кликеров».

Интересно, что пользователи, заявившие об интересе к военной службе, чаще проявляют интерес и к рекламе института искусств. Хотя можно строить догадки, важно не предполагать существование прямой причинно-следственной связи. Например, может оказаться, что пользователи, которые более тщательно заполняют свой профиль на сайте, в целом склонны кликать по всем видам объявлений.

Различные типы моделей состязаются между собой в точности прогнозирования. Модели, основанные на наборах правил, подобных только что рассмотренным нами, считаются относительно простыми. Другие модели могут опираться на сложнейшие математические формулы, позволяющие вырабатывать более точные прогнозы, хотя их логика может быть во многом непонятной для человеческого разума.

Но все прогнозные модели имеют общую цель — учесть все разнообразные факторы, касающиеся конкретного индивида, чтобы составить единую прогнозную скоринговую оценку. Затем эта оценка используется для принятия организацией решения о том, какие действия следует предпринять.

Но прежде чем использовать модель, ее нужно создать. И такая модель создается посредством машинного обучения:

picture

Машинное обучение перемалывает данные, чтобы построить модель — новую машину прогнозирования. Таким образом, модель сама по себе является продуктом машинного обучения. Поэтому машинное обучение также называют прогнозным моделированием — обычно в коммерческой сфере употребляется этот термин. Если взять ранее упомянутый нами метафорический термин data mining («извлечение знаний из данных»), то прогнозная модель и есть тот самый добытый бриллиант.

Прогнозное моделирование полностью создает модель с нуля. Все формулы, удельные веса или правила вырабатываются автоматически с помощью компьютера. Для этого и предназначен процесс машинного обучения — механически приобретать новые знания и развивать новые способности, опираясь на анализ данных. Другими словами, присущий ПА «дар предвидения» вырастает из автоматизации.

Как охотник по возвращении в племя гордо демонстрирует свою добычу, так и прогнозный аналитик вывешивает свою модель на доске объявлений в корпоративной штаб-квартире. Как охотник передает добычу повару для дальнейшего приготовления, так и исследователь отлаживает свою модель, переводит ее на стандартный компьютерный язык и отправляет по электронной почте программистам для интеграции. Сытое племя одаривает охотника хвалебными песнопениями, довольный результатами руководитель компании одаривает аналитика премиями. Племя пережевывает мясо, аналитик перемалывает данные.

Принять решение — значит действовать

Недостаточно знать — надо применять знания на деле.

Иоганн Вольфганг фон Гёте

Картофель или рис? Что мне делать со своей жизнью? Я не могу решить.

Из песни «Я не умею решать» группы Muffin (1996)

Когда модель разработана, не спешите самодовольно почивать на лаврах. Даже самые точные прогнозы бесполезны, если они не применяются на деле. Это просто идеи, нематериальные сущности. Они могут поражать своей проницательностью, но, будучи повешены в рамочке на стену, смогут свидетельствовать разве что о вашем нарциссизме. Ни пользы, ни денег, ни каких-либо других осязаемых результатов они не принесут.

В отличие от отчетов, спокойно лежащих на столе, ПА выходит за стены лабораторий и начинает действовать в реальной жизни. И в этом отношении прогнозная аналитика стоит выше других форм интеллектуального анализа данных. ПА обожает внедрения и запуски, поскольку создаваемый ею продукт — прогнозы — требует конкретных действий.

Индивидуальная прогнозная скоринговая оценка напрямую влияет на решение о том, какое действие следует предпринять в отношении каждого конкретного человека. Врач проводит более пристальное обследование пациента, для которого спрогнозирован повышенный риск повторной госпитализации; представитель сервисной службы связывается с покупателем, для которого предсказана высокая вероятность отказа от товара или услуги. Прогнозная оценка требует действия — позвонить, написать, предложить скидку, порекомендовать продукт, показать объявление, провести проверку, расследовать, проверить на наличие дефектов, одобрить кредит или купить акции. Действуя на основе прогнозов, вырабатываемых посредством машинного обучения, организация в буквальном смысле слова учится на собственном опыте, улучшая свои повседневные операции.

Чтобы подчеркнуть этот момент, мы подвергли небольшой манипуляции английский язык. Сторонники ПА любят говорить о таком ключевом качестве прогнозной аналитики, как actionability, подразумевая ее непосредственную применимость на практике. ПА буквально диктует организации, что нужно делать. Но этот термин был украден нами из юридической сферы, где он означает «наличие исковой силы» (т.е. наличие оснований для возбуждения дела), и был наделен новым значением. Причина выбора столь агрессивной терминологии в том, что люди устали от впечатляющих на первый взгляд отчетов, которые в реальности дают лишь смутное чувство направления.

Таким образом, фраза «У вас расстегнулась молния на ширинке» побуждает к действию и, следовательно, обладает качеством actionability (она четко дает понять, что делать, — и вы можете и должны принять меры, чтобы исправить ситуацию), тогда как фраза «Вы лысеете» — нет (облысение не лечится, поэтому в этой ситуации ничего поделать нельзя). А для продавца одежды чрезвычайной actionability — непосредственной применимостью на практике — обладает прогноз «Этот человек с большой вероятностью может купить джинсы с ширинкой на пуговицах и эту модную кепку».

Запуск в действие ПА создает критически важное преимущество в высококонкурентном мире бизнеса. Сегодня мы видим тенденцию к массовому обезличиванию, когда все компании кажутся похожими друг на друга. Такое чувство, что все они продают практически одинаковые товары и услуги и действуют почти одинаковыми способами. Если компания сумеет выделиться из толпы, вы представляете себе ее перспективы?

«Во времена, когда компании во многих отраслях предлагают схожие товары и применяют схожие технологии, одной из последних оставшихся точек дифференциации являются высокоэффективные бизнес-процессы», — написали в книге «Аналитика как конкурентное преимущество: Новая наука побеждать» Томас Дэвенпорт и Джоан Харрис. Тут-то и пригодится прогнозная аналитика. Как показывают исследования, ужесточение конкуренции — главная на сегодняшний день причина, почему организации внедряют эту технологию.

Одно предостережение: внедрение ПА может повлечь за собой не только благоприятные изменения, но и новые риски. Помня об этом, мы вернемся к истории Джона.

Рискованный шаг

Дамы и господа… позвольте представить вам этого образованного и утонченного молодого человека, который совсем недавно был массой неразумной безжизненной материи.

Д-р Фредерик Франкенштейн (в исполнении Дж. Уайлдера) в фильме «Молодой Франкенштейн» Мела Брукса

Д-р Джон Элдер поставил все деньги на свою прогнозную модель. Он состряпал ее в лаборатории, упаковал в черный ящик и запустил в работу на фондовом рынке. Некоторые люди собственноручно изготавливают себе удобную кровать, чтобы затем предаваться на ней спокойным снам. Но Джон вскарабкался на гору, чтобы совершить прыжок веры. Прыгая вниз с экспериментальными крыльями собственной конструкции, Джон хотел знать, сколько времени пройдет, прежде чем он сможет с уверенностью сказать, что летит, а не просто падает вниз.

Думая о рисках, Джон словно смотрелся в треснувшее зеркало, отражающее его собственную уязвимость. Все их с женой пенсионные накопления были загружены в экспериментальный аппарат, который был запущен в неизвестность и который ожидала одна из двух участей обычной ракеты: успешный полет или падение. Десятки тысяч трейдеров в условиях жесточайшей конкуренции каждодневно занимаются тем, что ищут устойчивые рыночные закономерности, способные приносить прибыль; научиться делать это автоматически посредством машинного обучения — невероятного честолюбия замысел, многим представляющийся нереализуемым. Фактически Джон действовал как первопроходец, поскольку любая работа в этой области покрыта завесой тайны, что не дает возможности учиться на успехах и неудачах других. Несмотря на то что ученые активно публикуют свои теоретические разработки, а трейдеры охотно обсуждают открывающиеся возможности, реальная механика алгоритмических торговых стратегий скрыта за семью печатями. То, что отлично выглядит на бумаге, может таить в себе дефект или ошибку, способные подорвать торговую систему и привести к банкротству. Джон говорит: «Уолл-стрит — вот самый крепкий орешек в деле анализа данных».

Риск был очевиден. Ведь незадолго до этого Джон обнаружил критический изъян в одной прогнозной торговой системе и собственноручно вырыл ей могилу. Небольшой финансовой компании Delta Financial была предложена механическая торговая система, так называемый черный ящик, который предположительно должен был прогнозировать движения индекса S&P 500 с 70%-ной точностью. Разработанная именитым ученым, эта торговая система обещала принести миллионы, и заинтересованные лица активно подыскивали инвесторов, готовых сделать крупные ставки. Поскольку Delta была известна своим пристрастием к исследованию и продвижению инновационных подходов, а также готовностью идти на сопряженные с этим риски, ей было предложено взять на себя роль первоиспытателя и проложить путь для других ранних инвесторов. В качестве необходимой меры предосторожности Delta хотела протестировать предложенную ей систему на практике, поэтому обратилась к Джону, который оказывал ей консультационные услуги, параллельно работая над докторской диссертацией в Университете Шарлоттсвилля, штат Вирджиния. Работа Джона для Delta часто заключалась в проверке, а иногда и «рытье могил» для механических торговых систем.

Как доказать, что машина сломана, если вам не разрешают заглянуть внутрь? Джон был настроен скептически: заявленная 70%-ная точность прогнозов давала ему повод для сомнений. Это было слишком хорошо, чтобы быть правдой. Но у него не было доступа к самой прогнозной модели. В целях обеспечения строжайшей секретности протокол такого рода проверки предусматривал предоставление Джону только численных выходных данных, а информация о самой системе ограничивалась несколькими восторженными прилагательными, такими как инновационная, уникальная, эффективная! И вот, имея на руках столь скудные доказательства, Джон пытался доказать факт преступления, в совершении которого он сам не был полностью уверен.

Прежде чем запустить ПА-систему в действие, организации проверяют ее работоспособность посредством «прогнозирования прошлого» (так называемого бэктестинга). Модель должна доказать свою прогнозную точность на исторических данных. Она может тестироваться на данных за прошлую неделю, прошлый месяц или прошлый год. В модель загружаются входные данные, которые были известны в некий исходный момент времени, и она выдает прогноз, который сопоставляется с тем, что фактически произошло в дальнейшем. Например, модель должна спрогнозировать, упадет или вырастет индекс S&P 500 21 марта 1991 года. Если она дает правильный ответ на этот ретроспективный вопрос, опираясь только на данные, доступные 20 марта 1991 года (т.е. за день до этого), мы получаем доказательство работоспособности модели. Вот такие-то ретроспективные прогнозы — без единого намека на то, каким образом они были получены, — были единственной информацией, с которой предстояло работать Джону.

Хьюстон, у нас проблема

Даже самые гениальные инженеры совершают самые прозаичные и дорогостоящие ошибки. В конце 1998 года НАСА запустило космический аппарат Mars Climate Orbiter, который должен был совершить сложнейший девятимесячный полет до Марса и обосноваться на его орбите. Нужно сказать, что эту миссию удалось успешно выполнить менее чем половине всех запущенных в мире космических аппаратов. Этот же аппарат стоимостью $327,6 млн также постигла печальная участь — но вовсе не по воле злого рока, а из-за глупой ошибки. Он прошел над поверхностью Марса на высоте всего 57 км вместо расчетных 140 км и попросту сгорел в атмосфере. В чем же причина такого отклонения? Дело в том, что в программном обеспечении Mars Climate Orbiter использовалась международная единица измерения силы ньютон, в то время как программное обеспечение на Земле использовало британскую единицу измерения фунт-сила. Ой…

Джон смотрел на испещренный числами монитор и размышлял, не скрывается ли здесь какой-нибудь изъян, и если да, то как его обнаружить. Глядя на длинный список впечатляющих — пусть и ретроспективных пока — прогнозов, он ясно видел обещание огромных прибылей, которое так будоражило остальных. Если бы ему удалось найти дефект в системе, приговор был бы очевиден; если нет, он обрекал всех на затяжную неопределенность. Эту задачу можно было решить только при помощи обратного инжиниринга, или декомпиляции: исходя из сгенерированных системой прогнозов, может ли он догадаться о том, как она работает под капотом, — т.е. по сути раскрыть тайную механику этого черного ящика? Ирония заключалась в том, что прогнозное моделирование само по себе построено на обратном инжиниринге. Машинное обучение начинается с того, что берутся эмпирические данные, описывающие уже свершившиеся события и факты, и в них ищутся закономерности, которые могли сгенерировать имеющиеся данные или же могут объяснить их. Джон пытался вывести закономерности, которые вывела до него другая команда. Каким образом он действовал? Опирался на интуитивные догадки и плохо информированные умозаключения, которые можно было проверить только методом проб и ошибок, и тестировал каждую созданную им замысловатую гипотетическую конструкцию, программируя ее вручную и сравнивая ее результаты с предоставленными ему ретроспективными прогнозами.

Его настойчивость наконец-то принесла свои плоды: Джон обнаружил изъян в прогнозной модели, тем самым разоблачив неприглядную тайну Волшебника из Страны Оз. Оказалось, что прогнозная система была построена на кощунственном обмане: она опиралась на данные, на которые ни в коем случае не должна была опираться, — на данные из будущего. Ее впечатляющие ретроспективные прогнозы вообще не были прогнозами как таковыми. Они были частично основаны на трехдневных средних значениях, рассчитанных по вчерашней, сегодняшней и… завтрашней цене. Возможно, разработчики намеревались включить параметр трехдневного среднего, ограничив его расчет сегодняшним днем, но нечаянно сдвинули диапазон на день вперед. Ой… Наличие такой серьезной ошибки позволяло спрогнозировать со 100%-ной точностью, что модель вряд ли вообще будет работать на практике. Дело в том, что, работая в реальных условиях, она лишится возможности включать в свои прогнозы те самые ключевые данные, которые, собственно говоря, и предназначена была прогнозировать — завтрашнюю цену акций, — просто потому, что та пока не известна. Если бы система была внедрена, она никогда не смогла бы обеспечить такую же сверхточность прогнозов, которую она продемонстрировала обманным путем на исторических данных. Действуя интуитивно, при помощи обратного инжиниринга, Джон сумел разработать метод, содержащий такую же ошибку, и показал, что его прогнозы полностью совпадают с прогнозами этой «гениальной» торговой системы.

Прогнозная модель пойдет ко дну быстрее, чем «Титаник», если не устранить все подобные «утечки», прежде чем спускать ее на воду. Но такого рода «утечки из будущего» — распространенная проблема. Хотя такая ошибка нарушает фундаментальную целостность прогнозирования, ее легко совершить, поскольку каждая модель тестируется на исторических данных, для которых прогнозирование, строго говоря, невозможно. Относительное будущее всегда легкодоступно в экспериментальных данных, и его легко непреднамеренно включить в ту самую модель, которая пытается его предсказать. Такие утечки из будущего буквально стали притчей во языцех среди специалистов по прогнозной аналитике. Если бы это был эпизод из «Звездного пути», то наш любимый инженер-маньяк Скотти воскликнул бы: «Капитан, мы теряем нашу временную целостность!»

Джон не без удовольствия сообщил Delta Financial эту неприятную новость: он развенчал систему, по сути разоблачив ее как непреднамеренное мошенничество. Большие надежды были разбиты, но благодарность последовала незамедлительно, поскольку потенциальные инвесторы осознали, что были на волосок от огромных убытков. Честолюбивый изобретатель системы был удручен, но признал, что ему пришлось бы гораздо хуже, если бы ошибка вскрылась после запуска системы. Вполне вероятно, его могло ожидать уголовное преследование за мошенничество, пусть и неумышленное. Проект был закрыт.

Маленькая модель, которая сделала это

Все новое зарождается там, где заканчивается старое.

Из песни «Closing Time» группы Semisonic

Несмотря на молодой возраст, Джон был компетентным специалистом в области анализа данных, к которому часто обращались за советом инвесторы-предприниматели, хотевшие внедрить механическую торговую систему. Один из таких инвесторов переехал в Шарлоттсвилль как раз после того, как Джон Элдер, получив докторскую степень, переехал в Хьюстон: ученому предстояло пройти очередной этап своего академического пути ― его ждало место научного сотрудника в постдокторантуре Университета Райса. Но в Шарлоттсвилле он оставил после себя глубокий след, поэтому и в академических, и в коммерческих кругах инвестору посоветовали обратиться к Джону. Несмотря на расстояние, тот нанял Джона, чтобы подготовить и запустить новую механическую торговую систему и затем следить за ее работой дистанционно, из Хьюстона.

Так для Джона настало время оставить безопасную роль консультанта, ограничивающегося оценкой прогнозных систем, разработанных другими, и создать свою собственную. Он собрал небольшую группу коллег, и за несколько месяцев, опираясь на ключевые идеи, предоставленные им инвестором, они разработали новую многообещающую прогнозную модель и на ее основе создали механическую торговую систему. Джону не терпелось испытать ее в действии. Все было готово для запуска, кроме одного: люди не были готовы поставить на систему свои деньги.

Верить Джону были веские основания. Он был талантливым ученым, обладающим глубокими научными знаниями, но вместе с тем имел впечатляющий опыт в решении широкого спектра практических задач в области интеллектуального анализа данных. В докторской диссертации он предложил наиболее эффективный, по признанию коллег, метод оптимизации для определенного широкого класса задач системной инженерии (машинное обучение также представляет собой своего рода задачу оптимизации). Помимо прочего, он разработал прогнозную систему для определения вида летучих мышей по издаваемым им эхолокационным сигналам. Прежде чем уйти в науку, Джон занимался непосредственно практическими аспектами применения машинного обучения, в том числе системами управления космическими полетами, системами для обнаружения трещин в трубах системы охлаждения ядерных реакторов, не говоря уже о проектах по проверке черных ящиков для Delta Financial.

И вот теперь последнее творение Джона было полностью готово к старту. Результаты тестирования на исторических данных вселяли уверенность в работоспособности системы, обещая радужные перспективы. Вот как сказал об этом Джон: «Из всепоглощающего рыночного шума вырисовался небольшой шаблон. Мы наткнулись на устойчивую неэффективность ценообразования в одной из частей рынка, что давало нам небольшое преимущество над средним инвестором, которое казалось повторяемым». Неэффективность ценообразования — именно за счет этого и живут биржевые трейдеры. На абсолютно эффективном рынке такое было бы невозможным, но реальный рынок далек от идеала, поэтому тот, кто умеет обнаружить точки неэффективности, может сорвать большой куш.

Применение ПА: механические торговые системы

  1. Предмет прогнозирования: будет ли цена акции расти или падать.
  2. Цель прогнозирования: использовать прогнозы для покупки акций, которые будут расти в цене, и продажи акций, цены которых будут падать.

Джон не мог получить зеленый свет. Он пытался убедить инвесторов, но натыкался на опасливые отказы. Казалось, это был замкнутый круг. Инвесторы не могли преодолеть свой страх, пока не увидят успешной работы системы, но система не могла быть запущена в работу, поскольку у нее не было топлива — денег. Нужно было действовать сейчас, так как каждый день означал упущенную возможность.

После очередной встречи, которая также закончилась ничем, Джон вернулся домой и поговорил с женой Элизабет. Могла ли супруга устоять перед горячим энтузиазмом любимого мужа и его верой в собственные силы? Она дала разрешение рискнуть всем, что у них было, — шаг, который мог поставить под угрозу даже дом, в котором они жили.

Но Джону требовалось одобрение еще одной стороны. Он изложил свой план инвестору-клиенту, что вызвало вопросы, удивление и опасения. Джон хотел начать на свои личные средства, что устраняло всякий риск для клиента и позволяло разрешить любые сомнения благодаря испытанию модели в реальных условиях. Но этот неортодоксальный шаг был сродни сомнительному решению быть своим собственным адвокатом. Когда человек рискует всеми своими деньгами, на такое часто смотрят неодобрительно. Это говорит о его чрезмерной самоуверенности, если не о глупой браваде. Даже если сам клиент верил Джону, другие инвесторы не знали его и не доверяли ему. Но Джон сам устанавливал правила игры, в которую решил сыграть.

Он получил от инвестора ответ: «Действуйте!» Это означало, что теперь ничто не стояло у него на пути. Но это также могло означать, что инвестор был готов списать проект со счетов, понимая, что ему нечего больше терять.

Хьюстон, мы взлетели

Прогнозные аналитики часто в некоторой мере ставят на кон свою профессиональную жизнь, чтобы двигаться вперед, но этот случай был экстремальным. Как и легендарный бейсбольный тренер Билли Бин из OakLand A’s, который рисковал своей карьерой, разрабатывая и тестируя новый аналитический подход к управлению командой, Джон рисковал всем, что имел. В начале 1994 года на его индивидуальном пенсионном счету накопилось чуть больше $40 000. И все эти деньги он поставил на свою торговую систему.

«Запускать в действие черный ящик по-настоящему захватывающе и страшно, — говорит Джон. — Это американские горки, где невозможно остановиться. Ваша тележка преодолевает головокружительные подъемы и спуски, и при этом существует вполне реальная вероятность того, что она может сойти с рельсов».

Как и в бейсболе, отмечает он, эти спады не являются спадами как таковыми. Это неизбежные статистические реалии. Всякий раз вы задаете себе вопрос: «Это чувство падения — нормальная часть безопасной езды или признак того, что что-то сломалось?» Ключевым компонентом его системы был тщательно продуманный механизм оценки реального качества — показателя целостности системы, учитывающего, был ли последний успех действительно заслуженным или же всего лишь результатом слепой удачи.

Сразу после старта предиктивная ракета Джона принялась уверенно набирать высоту. Она увеличивала его активы со скоростью примерно на 40% в год, что означало удвоение его первоначальной инвестиции всего за два года.

Клиент был впечатлен и вскоре вложил пару миллионов долларов из своего кармана. Через год прогнозная модель управляла фондом в $20 млн, сформированным группой инвесторов, и в конечном итоге активы под ее управлением выросли до нескольких сотен миллионов долларов. При таком размахе каждый небольшой успешный прогноз, сделанный системой, приносил многократную отдачу.

Все участники этого пиршества получали щедрый кусок пирога, и торговая система Джона продолжала свое триумфальное шествие почти девять лет, все это время стабильно опережая рынок. Она автономно торговала в десятках рыночных секторов, таких как технологии, транспорт и здравоохранение. По словам Джона, «система обыгрывала рынок каждый год, демонстрируя лишь две трети среднего отклонения, — это был потрясающий результат с точки зрения доходности, скорректированной с учетом риска».

Но все хорошее однажды заканчивается, и точно так же, как когда-то Джон уговорил своего клиента начать проект, теперь он убедил его закрыть. После почти десяти лет успешной работы ключевой показатель целостности системы начал снижаться. Джон был уверен, что система работает на последних парах, поэтому без лишних церемоний фонд был закрыт, а деньги — розданы. Система была остановлена вовремя, пока не произошла катастрофа, и все инвесторы вышли из этого предприятия с щедрой прибылью.

Настоящий ученый

Впечатляющий успех его детища кардинально изменил жизнь Джона. Когда проект вышел на крейсерский режим, он начал с легкостью обеспечивать средствами к существованию свою быстро растущую семью. На управление проектом у Джона уходило не больше двух часов в день, которые он посвящал мониторингу, настройке и обновлению фундаментально стабильного и работоспособного метода, лежащего в основе черного ящика. Чем заниматься в остальное время? Сидеть в мягком кресле и потягивать вино, время от времени прерывая безделье семейными поездками в «Диснейленд»? Но Джон не привык к такому образу жизни. Раньше ему всегда приходилось «жечь свечу с двух концов», чтобы заработать на жизнь: в колледже он всегда подрабатывал в летние каникулы, параллельно с учебой в аспирантуре занимался консультированием, и даже этот проект по разработке черного ящика начался как работа по совместительству. Или же ему следует, как диктует традиционная логика бизнеса, заняться расширением своей деятельности, делая больше того же самого, в чем он преуспел?

Но страсть Джона к своему ремеслу перевесила своекорыстные реакции на свалившееся на него богатство. Другим словами, ему был присущ дух настоящего ученого. Он шутит по поводу своей ненасытной потребности искать и находить свежие и стимулирующие научные задачи. Он испытывает непреодолимую тягу к тому, чтобы постоянно пробовать что-то новое. От этой болезни есть только одно лекарство — растущий список разнообразных проектов. Поэтому через два года после запуска механической торговой системы он уволился из Университета Райса, упаковал вещи и вернулся с семьей в Шарлоттсвилль, чтобы открыть собственную компанию, специализирующуюся на интеллектуальном анализе данных.

Сегодня созданная Джоном компания Elder Research — крупнейшая фирма в Северной Америке по оказанию услуг в области прогнозного анализа. Тогда как для многих компаний ключом к успеху является узкая специализация, преимущество Elder Research заключается в прямо противоположном — в разнообразии. Деятельность компании выходит далеко за рамки мира финансов и охватывает все ведущие коммерческие сектора и многие правительственные сферы. Джон стал признанным авторитетом в своей области. Он председательствует на крупных конференциях, выступает соавтором новейших учебников, читает лекции в университетах и пять лет по поручению президента работал в комиссии по вопросам технологий в Совете национальной безопасности.

Прогнозирование для внутренних нужд

Чем больше становится известно историй, подобных истории Джона, тем больше организаций присоединяются к победному маршу прогнозной аналитики. Так, одна крупнейшая международная компания сосредотачивает всю силу прогнозирования на самой себе, окидывая зорким взглядом ПА собственных сотрудников. Читайте дальше, чтобы узнать о том, какие могут возникать положительные и отрицательные последствия, когда ученые осмеливаются обратить свой взор на людей. Нравится ли людям, когда их поведение прогнозируют?

picture
Назад: Введение. Эффект прогнозирования
Дальше: Глава 2. С властью приходит ответственность