Книга: Голая статистика. Самая интересная книга о самой скучной науке
Назад: С помощью каких инструментов лучше всего бороться с глобальной бедностью?
Дальше: Приложение Статистическое программное обеспечение

Кто и что знает о вас?

Прошлым летом я нанял для своих детей новую няню. Когда она к нам пришла, я решил рассказать ей немного о нашей семье: «Я – профессор, моя жена – преподаватель…»
«Спасибо, мне уже все известно, – махнула няня рукой. – Я вас прогуглила».
С одной стороны, я испытал некоторое облегчение, поскольку мне не нужно было произносить заранее заготовленную речь. С другой – меня несколько насторожило то, как много можно обо мне узнать, пошарив часок-другой в сети. Наша нынешняя способность собирать и анализировать огромные объемы данных, появившаяся в результате объединения цифровой информации с дешевой вычислительной мощностью и интернетом, представляет собой поистине уникальное явление в истории человечества. Для этой новой эпохи необходим ряд новых правил.
Чтобы сегодня оценить потенциал имеющихся у нас данных, достаточно рассмотреть пример сети розничной торговли Target. Подобно большинству компаний, Target стремится повысить прибыль за счет лучшего понимания своих клиентов. Для этого она нанимает специалистов по статистике, перед которыми ставится задача выполнить своего рода «упреждающий анализ» (о нем уже упоминалось в этой книге); они используют данные продаж в сочетании с другой информацией о потребителях, чтобы выяснить, кто, что и почему покупает. Ничего изначально плохого во всем этом нет: просто это означает, что ближайший к вам магазин Target хочет знать, что вам как потребителю может понадобиться.
Но давайте рассмотрим хотя бы один пример того, что могут «вычислить» специалисты по статистике, обосновавшиеся в плотно зашторенных комнатах цокольного этажа корпоративной штаб-квартиры. Target выяснила, что беременность – особенно важное время с точки зрения построения моделей покупательского поведения. У беременных женщин вырабатываются определенные «отношения с розничной торговлей», которые могут длиться десятилетиями. В результате Target хочет выявить беременных женщин – особенно тех, кто на четвертом – шестом месяцах, – и заманить их в свои магазины, чтобы они посещали их как можно чаще. Один из журналистов The New York Times Magazine наблюдал за тем, как бригада специалистов по упреждающему анализу компании Target пыталась это сделать.
Первая часть задачи решалась достаточно просто. У Target есть специальный реестр, в котором беременные женщины регистрируются, чтобы еще до рождения ребенка приобрести все товары, необходимые для новорожденного. Эти женщины уже являются клиентками Target, и они, по сути, сами сообщают магазину о своей беременности. Но здесь есть одна статистическая уловка: компания «вычислила», что другие женщины, которые демонстрируют аналогичное покупательское поведение, также, вероятно, беременны. Например, беременные женщины зачастую переходят на использование неароматизированных лосьонов, начинают покупать витаминные добавки, огромные упаковки ватных тампонов. Специалисты по упреждающему анализу компании Target выявили двадцать пять наименований товаров, которые в совокупности составляют «признак, позволяющий предсказать беременность». Цель этого анализа заключалась в том, чтобы послать беременным женщинам соответствующие купоны в надежде сделать их постоянными покупательницами Target.
Насколько эффективной оказалась данная стратегия? The New York Times Magazine поведал своим читателям историю о мужчине из Миннеаполиса, который зашел в один из магазинов Target, чтобы поговорить с менеджером. Мужчина был разгневан тем, что Target буквально бомбардировал его дочь-старшеклассницу купонами для беременных женщин. «Она еще учится в школе, а вы присылаете ей купоны на детские кроватки и одежду для новорожденного! Может быть, вы предлагаете ей побыстрее забеременеть?!» – возмущался мужчина.
Менеджер извинялся и заверял мужчину, что это не более чем досадная ошибка. Через несколько дней менеджер еще раз позвонил этому мужчине, чтобы извиниться. На сей раз мужчина вел себя гораздо спокойнее и в свою очередь тоже посчитал нужным извиниться. «Понимаете, у меня в доме небольшой переполох, – сказал он. – Одним словом, она должна родить в августе».
Статистики Target узнали, что его дочь беременна, раньше, чем он!
Может быть, они суют нос не в свои дела – или все-таки это их дела? Иногда складывается впечатление, что их внимание к нам чрезмерно. Именно поэтому некоторые компании пытаются делать вид, что знают о нас гораздо меньше, чем им известно на самом деле. Если, например, вы – женщина и находитесь на четвертом – шестом месяце беременности, то в вашем почтовом ящике могут появиться купоны на детскую кроватку и бумажные полотенца – вместе с предложением скидки на газонокосилку и купоном на бесплатные носки для боулинга (при условии покупки любой пары обуви для боулинга). Появление в вашем почтовом ящике купонов для беременных в сочетании с рекламой других товаров, не имеющих никакого отношения к беременности, может показаться вам чистой случайностью. В действительности компания знает, что вы не увлекаетесь боулингом и не стрижете лужайку перед домом. Просто она пытается «замести следы», делая вид, что знает о вас гораздо меньше, чем ей известно на самом деле.
Facebook, компания, у которой практически нет физических активов, стала одной из самых дорогих в мире. С точки зрения инвесторов (в отличие от пользователей), Facebook располагает одним колоссальным активом – данными. Инвесторам не нравится Facebook, поскольку из-за этой компании они иногда наталкиваются в сети на своих бывших одноклассниц. Инвесторам нравится Facebook, так как каждый щелчок мышью приносит им данные о месте проживания пользователей, о магазинах, где они обычно совершают покупки, о том, какие покупки они делают, и о том, кого они знают и как проводят свободное время.
Крис Кокс, производственный вице-президент Facebook, сказал в интервью The New York Times: «Проблема информационной эпохи заключается в том, как распорядиться информацией».
Вот так-то.
Что же касается публичной сферы, то слияние данных и технологий порождает еще большие проблемы. Во многих крупных городах мира в общественных местах установлены тысячи камер видеонаблюдения, многие из которых вскоре будут обладать способностью распознавать лица людей. Правоохранительные органы могут отслеживать маршрут движения любого автомобиля, куда бы он ни направлялся (и сохранять соответствующую информацию в архивной памяти), прикрепляя к автомобилю то или иное устройство глобального позиционирования, а затем отслеживая его перемещения с помощью спутника. Является ли это достаточно дешевым и эффективным способом слежения за действиями преступных элементов? А может быть, это не что иное, как использование государством современных технологий для ограничения нашей личной свободы? В 2012 году Верховный суд США единогласно постановил, что это действительно посягательство на нашу свободу, и запретил правоохранительным органам прикреплять устройства слежения на личные транспортные средства без соответствующего ордера.
Между тем, многие государства обзавелись огромными базами данных ДНК, которые являются мощным инструментом, позволяющим раскрывать уголовные преступления. Чьи ДНК должны храниться в таких базах данных? Всех осужденных преступников? Каждого, кто подвергался аресту (даже если впоследствии был признан невиновным)? Или всех граждан без исключения?
Мы лишь приступаем к решению проблем, которые находятся на пересечении технологий и персональных данных. Ни одна из них не была настолько актуальна, когда соответствующая информация хранилась на пыльных стеллажах в подвалах серьезных государственных учреждений, а не в цифровых базах данных, в которые в принципе может забраться любой желающий. Статистика в наши дни играет даже более важную роль, чем когда-либо прежде, поскольку сейчас у нас появилось больше возможностей для эффективного использования данных. Однако сами по себе формулы не подскажут нам наилучшие способы их использования. Иными словами, математика не может заменить суждение.
Учитывая вышесказанное, давайте завершим эту книгу, попытавшись найти связь между следующими словами: огонь, ножи, автомобили, крем для удаления волос. Каждая из этих вещей служит важной цели. Каждая делает нашу жизнь лучше. И каждая может создать серьезные проблемы в случае неосторожного с ней обращения.
Теперь вы можете добавить статистику в этот список. Она наверняка поможет вам лучше понять многие явления нашей жизни при условии, что вы будете пользоваться статистическими инструментами разумно и по назначению!
Назад: С помощью каких инструментов лучше всего бороться с глобальной бедностью?
Дальше: Приложение Статистическое программное обеспечение