Наши взаимодействия с компьютерами и другими машинами растут ежедневно. Посчитайте сколько раз вы взаимодействуете с вашим телефоном. В одном исследовании было сказано, что люди проверяют свой смартфон в среднем каждые шесть минут или около 150 раз в день.
Многие онлайн-взаимодействия, такие как поиск в Google, имеют ясную и непосредственную выгоду для пользователя – вы получаете то, что ищете, но следы, оставленные самим взаимодействием, также очень важны. Сохраняя все поисковые запросы, введенные в Google, мы можем получить удивительную информацию о том, что ищут люди во всем мире, и где и когда они это ищут. Изучая данные LinkedIn в совокупности, мы можем узнать то, что мы никогда бы не смогли узнать раньше в таком масштабе – например, из каких компаний люди уходят и куда они собираются переходить.
Одно или два поколения назад наличие весов, работающих от монет, на платформах вокзалов или на входе в аптеки, было обычным делом. За небольшую сумму денег вы могли точно взвесить себя – чего не могли сделать многие люди, у которых не было весов в собственном доме.
Теперь, имея цифровые весы, которые подключаются к Сети, в ванной комнате, вы можете не только точно измерить вес вашего тела, но и следить за своими показаниями с течением времени и анонимно отправлять их производителю онлайн-весов, что позволяет ему отслеживать вес нации.
В дополнение к весу, конечно, есть множество других вещей, которые можно измерить в цифровом виде касательно вашего тела и вашего здоровья. Philips в Нидерландах создал простое, но очень продвинутое приложение под названием Vital Signs, которое использует камеру на вашем iPad или iPhone для измерения частоты сердцебиения.
Как это возможно? Камера на этих устройствах очень чувствительна – и может видеть некоторые вещи лучше, чем наши глаза. Оказывается, каждый раз, когда наше сердце бьется, мы немного краснеем («микрорумянец»), и камера может обнаружить эти изменения. Такое умное программное обеспечение было создано Винсеном Жеанном, старшим научным сотрудником Philips Group Innovation, вместе с его коллегами. В качестве забавного дополнения команда также создала версию «День святого Валентина», которая позволяет одновременно контролировать сердечные ритмы двух человек.
Опять же, с соответствующими разрешениями и конфиденциальностью, данные из домашних приложений мониторинга сердца, подобные этим, могли бы загружаться вместе с данными о местоположении и другими демографическими данными, чтобы дать глобальную картину о сердцебиении людей в разных странах. Такие данные могут в конечном счете оказаться неоценимыми для ученых-медиков или исследователей в области общественного здравоохранения.
Подобным же образом многие люди во всем мире теперь публикуют данные своих тренировок с помощью множества устройств и аксессуаров от Nike, Fitbit и Jawbone. Эти цифровые шагомеры измеряют движение целого поколения.
Также на этом рынке есть Moves – приложение для мониторинга движений общего назначения для смартфонов, разработанное стартапом ProtoGeo в Хельсинки. Оно стало неожиданным хитом в iTunes Store и было приобретено Facebook в 2014 году. Moves собирает и регистрирует данные о ваших действиях, когда вы ходите, едете на велосипеде или бегаете, а также вычисляет калории, которые вы сжигаете, запоминает маршруты и подсчитывает ваши шаги.
Если взять эти цифровые данные о здоровье в качестве основы, можно научить компьютеры искать алгоритмы, используя процесс, известный как машинное обучение, а затем предсказывать, когда люди находятся в состоянии физического стресса или могут заболеть, прежде чем это случится, чтобы вы могли предпринять профилактические меры. Уже сейчас топовые спортивные команды, например, самая успешная профессиональная команда регби в Соединенном Королевстве Leicester Tigers, используют эту технологию для прогнозирования мышечной усталости. Таким образом, им удается избегать травм, так как они просто производят замены игроков.
Машинное обучение – это мощная компьютерная технология общего назначения, которая является одним из краеугольных камней революции данных и помогает нам понять массу онлайн-данных.
В дополнение к прогнозированию, как, например, в области здравоохранения, еще одно ключевое применение машинного обучения – это возможность точно распознавать и классифицировать вещи: как простые вещи, которые мы можем видеть, так и другие, вне нашей компетенции. Далее мы рассмотрим это более подробно.
Помимо того, что мы загружаем наши сердцебиение и шаги в облако, мы теперь обучаем онлайн-сервисы делать простые вещи, которые мы считаем само собой разумеющимися, например, распознавать песни, которые мы слышим по радио.
Shazam – это простое приложение, которое знакомо многим читателям. Оно может определять, какая песня играет в кафе или ресторане, с помощью микрофона на вашем смартфоне и сравнивать ее с онлайн-базой из более чем десяти миллионов песен.
SoundHound предлагает аналогичную услугу, но также будет распознавать песни, которые вы напеваете. Итак, когда вы не можете выкинуть таинственную мелодию из головы, вы хотя бы можете узнать, что это за песня. Существуют даже приложения для распознавания пения птиц (Merlin) и кваканья лягушек (Whatfrog).
Разумеется, блестящее использование распознавания – это распознавание речи, которое становится лучше и лучше от года в год. Я только что транскрибировал это предложение на моем iPhone с помощью Dragon Dictation: «Шах и мат – это когда компьютер может распознавать голос людей и транскрибировать его довольно точно».
Одной из главных задач информатики является создание приложения, которое сможет переводить телефонные разговоры в режиме реального времени с одного языка на другой. Приложения для распознавания речи находятся на полпути к достижению этой цели. Skype недавно выпустил бета-версию такого онлайн-переводчика, начав с английского и испанского языков. Так что осталось не так долго ждать.
В то время, как приложения Shazam, SoundHound и Dragon Dictation все лучше и лучше определяют мелодии и слова по звукозаписям, растет число приложений, способных автоматически обнаруживать многое в цифровых видео и фотографиях. Например, теперь есть приложения для того, чтобы узнать:
• какой породы является конкретная собака (Dogsnap);
тип растений в вашем саду по листьям (Leafsnap) и каких птиц вы видите в походе (Birdsnap);
• кто из друзей и родственников находится на ваших фотографиях (встроенная функция на Facebook и инструменты Picassa и iPhoto);
• какие шрифты используются на упаковках, уличных знаках или обложках книг (WhatTheFont).
Технология в мобильном приложении Amazon, известная как «Flow», указывает на будущее направление в этой области «идентификации предметов», поскольку она автоматически распознает всевозможные вещи, если просто навести на них камеру своего смартфона – книги, DVD, фильмы, плакаты и даже продукты – и затем добавляет их в список покупок, если в наличии есть идентифицированный товар.
Исследователи из SRI International, которые разрабатывали технологию распознавания голоса Siri для Apple, в настоящее время работают над приложением, которое сможет автоматически идентифицировать, записывать и анализировать продукты, которые вы едите, на основе фотографий ваших тарелок, которые вы делаете на смартфон.
В совокупности эти приложения и многие другие, подобные им, имеют огромный потенциал для создания геокодированных архивов того, что делают люди, где они это делают, во всем мире. Последствия (как хорошие, так и плохие) ошеломляют. В следующем десятилетии мы будем знать о привычках и поведении населения в масштабах, которые раньше были невозможны.
Помимо того, что вы можете записывать, а затем классифицировать и анализировать движения и поведение людей, вы также можете видеть, о чем они думают.
Google и другие поисковые системы сохраняют каждый введенный в них запрос. Это приводит к феноменальному сбору данных, о чем думают люди (в частности, о том, каковы их желания и что они ищут), в какое время суток, где и как часто. И самое главное, что эти данные открыты и доступны для вас.
Помимо предоставления целевых возможностей для рекламы людям, которые ищут цветы, стоматологов и сумки, данные могут стать кладезем для маркетологов, которые хотят лучше понять спрос на свои продукты и услуги в более общем плане. И они могут даже получить представление о том, что у всех на уме и что не дает им спать по ночам.
Практическое применение этому можно найти в измерении потребительского спроса. Одной из серьезных проблем любого традиционного розничного бизнеса является управление запасами товаров. Ключевым фактором успеха является иметь в наличии подходящее количество товаров, которые пользуются спросом среди покупателей, и не слишком много товаров, которые им не пользуются. Ведущий интернет-магазин в Австралии, Kogan, имеет новый подход к этой проблеме. Они просто подсчитывают, какое количество раз люди набирают «24-дюймовый телевизор», «32-дюймовый телевизор», «40-дюймовый телевизор», «42-дюймовый телевизор» и так далее в поиск Google, чтобы узнать, сколько телевизоров каждого размера заказывать. Учредитель магазина, Руслан Коган, говорит, что это очень эффективная модель, которая позволяет иметь подходящее количество товаров в наличии.
Существует множество примеров использования данных по поисковым запросам, которые применяются для любых других целей, включая точное прогнозирование глобального распространения гриппа. Google Flu Trends – это онлайн-инструмент, который пытается предсказать тенденции гриппа в 25 странах. Он работает, комбинируя исторические данные со словами (их они держат в секрете), которые люди в настоящее время набирают в Google, когда проявляются симптомы. Он блестяще работал в течение пяти лет с момента его запуска в 2008 году, но его точность начала колебаться в 2013 году, когда он начал переоценивать число людей с гриппом. Возможной причиной ошибок в предсказаниях могло стать введение «автозаполнения», когда Google пытается предвидеть, что вы пытаетесь ввести, и дает вам несколько заранее заготовленных вероятных альтернатив. Но учитывая предыдущий успех этого онлайн-инструмента, вероятно, он просто нуждается в хорошей настройке.