Ступень 2. Получить
Получение данных, вероятно, не самая… возбуждающая часть процесса. Однако без нее не обойтись: как принять решение, подкрепленное данными, не имея данных?
Для начала давайте проясним, что мы имеем в виду под получением данных. Нам не нужны любые доступные данные, иначе это затруднит поиск ответов. Для нашей схемы принятия решений, подкрепленных данными, требуются данные, которые помогут найти конкретные ответы на вопросы, которые мы задали на первой ступени.
Предположим, нам интересно, хорошо ли сыграла наша команда против конкретного противника в матче, состоявшемся несколько месяцев назад, поскольку вскоре ей предстоит очередная встреча с этим соперником. В предыдущем матче нашу команду разгромили, она провалилась по всем показателям, поэтому мы задаем конкретный вопрос: в каких аспектах игры мы оказались слабее и что привело к поражению? Налицо как дескриптивный анализ (в каких аспектах мы были слабее), так и диагностический (почему это произошло).
Теперь, когда у нас есть вопрос, нам проще выбрать из множества данных те, которые нужны для ответа, – если, конечно, мы обладаем дата-грамотностью. А если не фильтровать данные, то у нас на руках окажется масса информационного мусора, не имеющего никакого отношения к искомым ответам. В последний раз мы играли с этим соперником три месяца назад. Нужны ли нам данные о матче с той же командой, состоявшемся пять лет назад, когда у нас были другие игроки в составе и другой тренер? А данные о матчах с другими противниками? (Последний вопрос сам по себе вполне осмысленный, поскольку благодаря этим данным можно что-то сказать о текущей форме команды, но мы ищем другой ответ.) На первой ступени схемы мы сформулировали конкретный вопрос, так что теперь можно точно указать, какими должны быть данные, соответствующие нашей цели.
При получении данных для нас особенно важны две характеристики из определения дата-грамотности: работа с данными и общение на языке данных. Именно они помогают выбрать правильные данные.
Работа с данными
Для тех, кто работает с данными, получение данных нередко напрямую связано с профессиональными обязанностями. Если ваша работа состоит в поиске источников и получении данных или в построении визуализаций, значит, вы непосредственно работаете с данными. Это и есть главная характеристика. Вы можете быть архитектором данных, который ищет их источники и строит модели. Но если ваша текущая задача – поставить правильные вопросы и получить конкретные данные, необходимые для ответов, значит, вы тоже работаете с данными и читаете их в рамках нашей схемы.
Общение на языке данных
Помимо работы с данными, на второй ступени схемы очень важен четвертый элемент дата-грамотности. Предположим, вы определились, на какой вопрос вам нужен ответ, и запрашиваете данные: сумеете ли вы попросить именно то, что вам нужно? Для этого необходимы навыки общения на языке данных и свободное владение ими. Если вы знаете (или думаете, что знаете), какие именно данные вам для этого нужны, то способность донести это до команды, снабжающей вас данными, жизненно необходима. Конкретизируйте запрос и сформулируйте его как можно более однозначно. Неопределенность запросов не только препятствует получению нужных данных, но и мешает всему процессу успешного принятия решений.
Четыре уровня аналитики
При получении данных четыре аналитических уровня вступают в игру точно так же, как и обычно. Если мы хотим сделать дескриптивный, диагностический, предиктивный или прескриптивный анализ, чтобы получить ответы на вопросы, нам нужны правильные данные. Нам часто приходится делиться результатами анализа с самыми разными коллегами. И если изначально мы получили некорректные данные, это может обернуться катастрофой, когда на основании этих данных будут приниматься решения. А если получение данных организовано как следует, мы можем строить полезные визуализации, уверенно диагностировать причины случившегося, делать безошибочные прогнозы и удачно формулировать предписания.