«Поступки говорят громче, чем слова, но не так часто», – сетовал Марк Твен. Что если действия могут говорить чаще?
Было много дискуссий об огромных объемах информации – больших данных, – которые содержали гравитационные гиганты, такие как Facebook, Twitter, LinkedIn и другие социальные сети. Большая их часть – это то, что мы решили представить миру. Это фотографии, которыми мы хотим поделиться, обновления статуса, которые нас олицетворяют. Другими словами, это запись того, что мы говорим, а не того, что мы делаем.
Как мы все знаем, между словами и действиями часто существует большая разница. В отличной книге «Фрикономика», – которую я бы рекомендовал всем, кто считает мою книгу интересной, – авторы, Стивен Д. Левитт и Стивен Дж. Дабнер, показывают, как то, что люди говорят и что делают на сайтах онлайн-знакомств, не имеет между собой ничего общего. На одном сайте знакомств, который они изучили, половина белых женщин и восемь из десяти белых мужчин указали в своем профиле, что раса потенциальной пары не имеет для них значения. Несмотря на свои заявленные позиции, белые мужчины, которые сказали, что раса не имеет значения, отправили 90 процентов ответов на электронную почту белых женщин, а белые женщины, которые сказали, что раса не имеет значения, в 97 процентах случаев отвечали белым мужчинам.
Однако сейчас есть много записей не только о том, что мы говорим на Facebook, Twitter и LinkedIn, но и о том, что мы делаем. Это еще одна категория больших данных: большие данные о действиях. Каждый раз, когда вы включаете свой смартфон, он записывает, в какой точке Земли вы находитесь. Если у вас есть iPhone, и вы включили GPS (большинство людей так делают, так как это очень удобно), перейдите в раздел «Конфиденциальность / службы геолокации / системные настройки / частые геолокации», и вы, скорее всего, увидите список всех мест, где вы (и ваш телефон) в последнее время побывали.
Все, что вы покупаете по кредитной карте, регистрируется эмитентом или банком, и даже в супермаркетах и универмагах при покупке наличными ведется запись того, что люди покупают вместе в одной корзине.
Эксперты долгое время изучали, как это работает в супермаркетах. Есть много одинаковых рассказов о том, как маркетологи выяснили, что подгузники для новорожденных часто оказываются в той же корзине, что и пиво. Оказывается, новоиспеченные отцы любят вознаграждать себя за свою заботливость, так как не забыли купить подгузники для своего новорожденного ребенка. Одна сеть супермаркетов в Великобритании обнаружила, что, если поставить пиво рядом с подгузниками, продажи обоих товаров увеличатся.
Оказывается, мы демонстрируем групповое поведение в наших покупательских привычках, даже если мы делаем это в одиночку. Так же мы выбираем бренды на уровне наших социальных групп. И мы услышим еще много таких историй, связанных с наблюдениями за большими данными в ближайшие годы. Австралийский министр связи Малкольм Тернбулл назвал их довольно поэтически – «Анекданные», то есть истории из больших данных.
Нам нужно быть осторожными, когда мы смотрим и думаем об этих типах связей. Просто потому, что, если две вещи кажутся связанными или происходят в одно и то же время и в одном месте, это не означает, что одно из них вызывает другое. Причиной обоих явлений может быть третья вещь. Если бы мы смотрели только на первичные данные, мы бы обнаружили, что люди, страдающие головными болями, принимают аспирин, но это явно не означает, что аспирин вызывает головные боли. Но все же впереди нас ждет еще много всего интересного. И это только начало.
Поведенческие данные тысяч людей в сочетании с машинным обучением (как показано в предыдущей главе) обладают огромным потенциалом и иллюстрируют разницу между сетевыми и племенными характеристиками офлайн-брендов. В то время как традиционные производители автомобилей, кажется, создают бренды и рекламу, чтобы угодить стремлениям своих целевых групп, производитель автомобилей под влиянием Онлайн-гравитации, такой как Tesla, может предложить индивидуальные отзывы о вождении владельца машины по сравнению с его сверстниками и предложить советы по улучшению его навыков. На горизонте скоро появятся автомобили-беспилотники, Google уже над ними работает, и это всего лишь вопрос времени, прежде чем они представят их миру.
Опять же, с появлением этого поколения новых автомобилей, сеть неизбежно станет ключевой точкой расхождения, и первая компания, которая приобретет популярность на этом рынке, несомненно, станет огромным предприятием – возможно, первым гигантом среди онлайн-автопроизводителей. Предвестником может стать текущая конкуренция в сфере поиска и вызова такси онлайн (между Uber, Lyft и другими).
В более широком смысле, помимо продуктов, основанных на данных о действиях и машинном обучении, здесь также есть потенциал для новой дисциплины – своего рода социальной химии Онлайн-гравитации. Химия – это наука о материи. Она показывает, что вся материя состоит из 118 различных типов атомов, и каждый из них в чистом виде является элементом. Элементы включают золото, серебро, медь и газы, такие как кислород, водород и азот. Эти элементы можно поместить на структурированной сетке или таблице, известной как периодическая таблица, в которой каждая строка представляет количество колец электронов, которое имеет каждый атом.
Из этой структуры химики разработали очень хорошее представление о возможных способах объединения этих элементов для производства других форм материи, которые представляют собой смесь таких элементов, как вода, смесь водорода и кислорода или латуни, смесь меди и цинка.
Возможно, существует эквивалент – «периодическая таблица социальных взаимодействий», включающая фундаментальные элементы и структуру, которая объясняет, как они могут сочетаться между собой, как в химии. Это может быть расширением и углублением увлекательной работы, уже проделанной за последние два десятилетия, в изучении того, как мы формируем и принимаем наши решения (как в примере, приведенном ранее, когда люди в супермаркете ничего не покупали, когда перед ними был слишком большой выбор варенья) в области исследований, известной как поведенческая экономика.
Прекрасным примером является увлекательное исследование Навнита Капура из LinkedIn, он составил рейтинг университетов на основе базы данных сайта, на котором зарегистрировано 300 миллионов кандидатов со всего мира. Вы когда-нибудь задумывались над тем, как вы или ваши дети могли бы устроиться на работу у легендарного работодателя, который является лидером в своей области? Исследования Капура показывают, что университет, в котором вы учитесь, может улучшить ваши шансы найти работу в этих компаниях.
Предположим, вы занимаетесь дизайном и хотели бы работать в Apple – кто бы этого не хотел? Основываясь на данных за последние восемь лет, возможно, вам следует присмотреться к Университету Академии искусств в Калифорнии. Хотя он явно не является гарантией, компания Apple наняла больше всего дизайнеров, которые являются выпускниками именно этого университета. Возможно, вы хотели бы работать в известном международном рекламном агентстве R/GA. Тогда обучение в Школе визуальных искусств в Нью-Йорке, вероятно, будет вашим лучшим выбором. Если вы мечтаете попасть в Walt Disney Company, то хуже не будет, если вы поступите в Колледж дизайна в Калифорнии.
Если инвестиционно-банковская деятельность – это ваша стезя, и вы хотите работать в одной из самых востребованных фирм в бизнесе, таких как Citi, JPMorgan и Goldman Sachs, тогда вам, возможно, захочется рассмотреть сначала Джорджтаунский университет и только потом подумать о Гарварде.
Во-первых, Капур и его команда в LinkedIn определили наиболее «желанные» компании для работы в каждой отрасли, посмотрев на фактические движения по работе, используя аналитику данных. Так, например, если разработчики программного обеспечения уходят из Google работать в Facebook, тогда Facebook более желанная компания и наоборот. Они также рассмотрели текучесть кадров и ее оборотные стороны, а также процент удержания сотрудников.
Затем они оценивали университеты, основываясь на том, выпускники каких учебных заведений получали рабочие места в этих наиболее желанных компаниях по каждой профессии.
Потрясающе. Первоначальный рейтинг США охватывает восемь профессий: бухгалтерский учет, дизайн, финансы, инвестиционный банкинг, маркетинг, средства массовой информации, программное обеспечение и программное обеспечение в стартапах. И есть также версия для Великобритании и Канады, каждая из которых содержит по пять профессий из вышеперечисленных.
Вы можете также изучить результаты с разных точек зрения. Вы можете посмотреть на профессии, а также на отдельные компании в каждой из этих профессий, чтобы определить, какие университеты и колледжи большинство сотрудников посещали. Вы также можете посмотреть на карьерный путь выпускников каждого университета и посмотреть, в каких компаниях они в конечном итоге работают, а затем отфильтровать информацию по типу работы или области обучения.
Наконец, вы можете рассмотреть примеры отдельных людей. Там также есть список известных выпускников каждого университета. Это отличные данные. И это только начало нового мира информации, которую можно найти в сокровищнице данных на LinkedIn.
Другой, но столь же инновационный источник данных динамической социальной химии – это стартап из Сиэтла под названием Polis. Он разработал открытый онлайн-опрос, который позволяет группам, например читателям газет или студентам, взаимодействовать в режиме реального времени в администрации или в классе, основываясь на серии вопросов в свободной форме. Аудитория может голосовать за вопросы, а также добавлять свои собственные комментарии и отзывы с помощью смартфонов. Результаты суммируются и отображаются в интернете, что позволяет быстро понять точки согласия и разногласия всей группы.
Это новая сетевая форма взаимодействия. И по факту она предлагает своеобразное теле-видение с поддержкой данных, используя цифровые следы данных, чтобы отличать и визуально представлять взгляды и предпочтения участников.
Интересно то, как она динамично представляет людей на основе их ответов на каждый из поставленных вопросов, позволяя как участникам, так и организаторам собирать информацию о том, какие вопросы являются наиболее важными и какие вопросы являются наиболее противоречивыми.
Со временем такие системы могут быть использованы для лучшего информирования о выработке государственной политики на низшем уровне или в более широких масштабах на государственном или национальном уровне.