Книга: Наука о данных: Базовый курс
Назад: Глава 6. КОНФИДЕНЦИАЛЬНОСТЬ И ЭТИКА
Дальше: Глоссарий
Глава 7

Будущие тенденции и принципы успешности

Очевидная тенденция современных обществ — распространение систем, способных воспринимать мир и реагировать на него: смартфоны, умные дома и города, беспилотные автомобили и прочее. Такое засилье интеллектуальных устройств и датчиков ставит под угрозу нашу конфиденциальность. Но также оно способствует росту объема данных и разработке новых технологических концепций, таких как интернет вещей. В этом контексте наука о данных будет оказывать все большее влияние на разные сферы нашей жизни. Однако есть две области, в которых она приведет к значительным переменам уже в ближайшее десятилетие, — это персонализированная медицина и развитие умных городов.

Наука о данных и медицина

В последние годы медицина изучает и внедряет науку о данных и прогнозную аналитику в целый ряд областей. Традиционно, диагностируя состояние пациента или принимая решение о последующем лечении, врачи полагались на свой опыт и интуицию. Такие направления, как доказательная медицина и точная медицина, утверждают, что врачебные решения должны основываться на данных, в идеале связывая наилучшие из имеющихся данных с ситуацией и предпочтениями отдельного пациента. Например, в случае точной медицины технология быстрого секвенирования генома позволяет анализировать геномы пациентов с редкими заболеваниями, чтобы выявить мутации, которые их вызывают, и выбрать подходящие именно для этого пациента методы лечения. Еще одним фактором, стимулирующим науку о данных в медицине, является стоимость медицинского обслуживания. Наука о данных и, в частности, прогнозная аналитика могут быть использованы для автоматизации некоторых процессов здравоохранения. Существует множество примеров использования прогностической аналитики для определения момента, когда следует начинать вводить антибиотики и другие лекарства детям и взрослым, и уже имеется много сообщений о спасенных жизнях.

Разрабатываются медицинские датчики, которые пациенты могут носить на себе или которые можно проглатывать либо имплантировать. Эти датчики непрерывно контролируют жизненные показатели и реакции пациентов, а также работу их органов в течение дня. Непрерывно собираемые данные передаются обратно на централизованный сервер мониторинга. Здесь, на сервере мониторинга, медицинские работники получают доступ к данным пациентов, оценивают их состояние, определяют, какое влияние оказывает лечение, и сравнивают результаты с результатами других аналогичных пациентов, чтобы наметить следующие шаги лечения. Данные с датчиков интегрируются с другими данными из разных областей медицины и фармацевтической промышленности для изучения действия существующих и новых лекарств. Наука о данных используется при разработке персонализированных программ лечения с учетом типа пациента, его состояния и того, как его организм реагирует на различные лекарства. Кроме того, специалисты по данным в области медицины проводят исследования лекарственных средств и их взаимодействий, разрабатывают более эффективные и подробные системы мониторинга и помогают глубже понять результаты клинических испытаний.

Умные города

Города по всему миру внедряют новые технологии, чтобы иметь возможность собирать и использовать данные, сгенерированные их жителями, и улучшить управление городскими организациями, коммунальными службами и сервисами. Существует три основных фактора этой тенденции: наука о данных, сами большие данные и интернет вещей. Интернет вещей основан на взаимодействии физических устройств и датчиков таким образом, чтобы эти устройства могли обмениваться информацией. Это может показаться тривиальным, если бы не одно преимущество — теперь мы можем удаленно управлять интеллектуальными устройствами (например, нашим домом, если он оснащен должным образом). Наряду с этим интернет вещей на основе сетевого взаимодействия между компьютерами открывает возможность интеллектуальным средам автономно прогнозировать наши потребности и реагировать на них. Вы уже можете купить интеллектуальный холодильник, который предупредит вас об истечении срока годности продуктов или закажет свежее молоко через смартфон.

Проекты умных городов объединяют данные в режиме реального времени из множества различных источников в единый хаб, где их анализируют и используют для планирования и принятия управленческих решений. Некоторые проекты предполагают создание абсолютно новых умных городов с нуля. Масдар в Объединенных Арабских Эмиратах и Сонгдо в Южной Корее — это совершенно новые города, построенные с использованием интеллектуальных технологий и ориентированные на экологичность и энергоэффективность. Однако наиболее умные проекты предусматривают модернизацию существующих городов с использованием новых сенсорных сетей и центров обработки данных. Например, в рамках проекта SmartSantander в Испании было установлено более 12 000 сетевых датчиков по всему городу для измерения температуры, уровней шума, освещения, угарного газа и наличия парковочных мест. Часто проекты умного города затрагивают энергоэффективность, дорожное движение и маршрутизацию, а также планирование коммунальных услуг в соответствии с потребностями растущего населения.

Япония приняла концепцию умного города, сделав особый акцент на сокращении потребления энергии. Токийская электроэнергетическая компания (TEPC) установила более 10 млн интеллектуальных счетчиков в домах, находящихся в зоне обслуживания. В то же время она разрабатывает и внедряет приложения для смартфонов, которые позволяют клиентам отслеживать расход электроэнергии в их домах в режиме реального времени и вносить изменения в контракт на поставку электроэнергии. Эти приложения для смартфонов также позволяют TEPC отправлять клиентам индивидуальные рекомендации по энергосбережению. Вне дома технологии умного города могут быть использованы для снижения потребления электроэнергии интеллектуальным уличным освещением. Модель, демонстрирующая возможности городов будущего, установленная в Глазго, управляет уличным освещением, включая и выключая его в зависимости от присутствия людей. Энергоэффективность также является главным приоритетом для всех новых зданий, особенно административных и офисных. Она может быть оптимизирована за счет автоматического управления климат-­контролем зданий с помощью комбинации сенсорной технологии, больших данных и науки о данных. Дополнительным преимуществом этих интеллектуальных систем мониторинга является то, что они могут отслеживать уровни загрязнения и качество воздуха и при необходимости активировать необходимые средства контроля и предупреждения в режиме реального времени.

Транспорт — еще одна область, где используется наука о данных. Во многих городах внедрены системы мониторинга и управления движением. Эти системы используют данные в реальном времени для управления потоком городского трафика. К примеру, они могут управлять переключением светофоров, отдавая приоритет общественному транспорту. Данные об использовании городских транспортных сетей полезны для их дальнейшего планирования. Изучая маршруты, расписания и движение транспортных средств, администрация добивается того, чтобы обслуживать максимальное количество людей, одновременно снижая затраты на предоставление транспортных услуг. Помимо моделирования сети общего пользования, наука о данных также применяется для мониторинга принадлежащих городу транспортных средств и обеспечения их оптимального использования. Датчики, установленные вдоль дорог, на светофорах и в других местах, собирают данные об условиях дорожного движения для оптимизации планирования и динамических корректировок маршрута, которые поступают на транспортные средства в режиме реального времени.

Помимо энергетики и транспорта, наука о данных используется в коммунальном хозяйстве и для долгосрочного планирования инфраструктурных проектов. Эффективность предоставляемых коммунальных услуг контролируется путем мониторинга их текущего, прогнозирования ожидаемого и изучения предыдущего потребления при аналогичных условиях. Коммунальные службы используют науку о данных по-разному. Например, для управления сетью коммунального снабжения, включая контроль поставок для коммунальных предприятий, их качества, оценку возникающих проблем, выявление областей, требующих более интенсивного снабжения, автоматическое изменение маршрутов доставки и мониторинг любых аномалий в сети. Другой пример использования науки о данных коммунальными службами — мониторинг клиентов. Отклонения параметров потребления могут указывать на криминальную активность (например, наличие домашней плантации конопли), на нелегальную перенастройку измерительного оборудования, а также на клиентов, которые с большой вероятностью не будут платить по счетам. Науку о данных применяют и в городском планировании для поиска оптимального варианта застройки и сопутствующих ей услуг. Симуляции, основанные на моделях прогнозирования прироста населения, позволяют планировщикам оценить, когда и где понадобятся те или иные услуги, например обще­образовательные школы.

Проектные принципы науки о данных: почему одни проекты успешны, а другие нет

Порой проекты науки о данных терпят неудачу, поскольку не оправдывают ожиданий, увязают в технических или политических вопросах, не приносят полезных результатов и, как правило, после этого больше не запускаются. Подобно утверждению о счастливых семьях Льва Толстого, успех проекта науки о данных зависит от ряда факторов. Успешные проекты требуют целенаправленности, хорошего качества данных, нужных людей, готовности экспериментировать с несколькими моделями, интеграции в архитектуру и процессы ИТ-бизнеса, поддержки со стороны высшего руководства и признания организацией необходимости регулярного пересмотра моделей в силу меняющегося мира. Сбой в любом из этих аспектов может привести к провалу всего проекта. Далее мы подробно опишем общие факторы, влияющие на успешность проектов науки о данных, а также типичные причины, которые приводят к их провалу.

Фокусировка. Каждый успешный проект науки о данных начинается с четкого определения проблемы, которую он должен помочь решить. Этот шаг подсказывает обычный здравый смысл — проекту сложно достичь успеха, если у него нет четкой цели. Наличие четкой цели определяет решения относительно того, какие данные и алгоритмы машинного обучения использовать, как оценивать результаты, как будут применяться анализ и развертываться модели и когда может потребоваться повторный процесс для обновления моделей.

Данные. Точно сформулированная задача позволяет определить, какие данные необходимы для проекта. Ясность в этом вопросе помогает направить проект туда, где эти данные находятся. Если какие-то данные в настоящее время недоступны, следует запустить вспомогательные проекты, которые изучат возможность сбора и доступность этих данных. При этом крайне важно обеспечить их высокое качество. Потеря качества данных может произойти в силу плохо спроектированных приложений или плохих моделей, имеющихся у организации, персонала, не обученного правильно вводить данные, или по иным причинам. На самом деле существует масса факторов, которые снижают качество данных в системах, а потребность в данных хорошего качества настолько важна, что некоторые организации нанимают специалистов, которые постоянно проверяют данные, оценивая их качество и внося предложения о его улучшении. Без качественных данных добиться успеха трудно.

Назад: Глава 6. КОНФИДЕНЦИАЛЬНОСТЬ И ЭТИКА
Дальше: Глоссарий