Книга: Как вытащить из данных максимум. Навыки аналитики для неспециалистов
Назад: Свободное владение данными
Дальше: Стратегия чтения данных и свободного владения данными

Словарь данных

При внедрении общего языка данных большим подспорьем оказывается словарь. Приведу одно из определений.
Словари данных используются для предоставления подробной информации о содержимом набора данных или базы данных (например, имена измеряемых переменных, типы или форматы данных, а также текстовые описания). Словарь данных служит исчерпывающим руководством к пониманию и использованию данных.
Это определение – вернее, описание назначения – очень хорошо объясняет, что такое словарь данных и для чего он нужен. Позвольте рассказать вам случай из моей собственной практики: герой моего примера не использовал словарь данных и не практиковал свободное владение данными.
Я руководил большой группой бизнес-аналитиков в компании, предоставляющей финансовые услуги. Наша команда строила специальные сводки для пользователей, составляли словарь данных и обеспечивали систему постоянного хранения данных (SSoR). Обратите особое внимание на последний пункт – SSoR, в этом примере он важнее всего. При построении сводок мы использовали множество разнообразных показателей.
Однажды мне написала (или позвонила, точно не помню) помощница президента одной американской группы защиты потребителей. Она спросила меня о каком-то показателе – ей хотелось разобраться, почему наше значение не совпадает с тем, которое получили ее сотрудники. Иными словами, наименование показателя было таким же, но цифры – совершенно другими, их взяли где-то в другом месте. Возможно, сотрудники у кого-то спросили в надежде на быстрый ответ – или, может быть, рассчитали величину сами, если кое-что смыслили в программировании. Вроде бы ничего плохого, да? Но проблема в том, что они пользовались не нашим собственным, а каким-то иным определением показателя, поэтому рассчитали его неправильно. Хуже всего, что эти некорректные цифры уже пошли «в народ», то есть стали достоянием общественности. И теперь нам нужно было придумать, как справиться с последствиями этой проблемы.
Почему я связываю эту проблему со свободным владением данными? Во-первых, тот, кто работал с показателем, не сверился с нашим словарем данных, чтобы уточнить определение. И это помешало получить правильный результат: специалист воспользовался не теми данными, которых требовало верное определение. Во-вторых, он не смог донести до других, как значение этого показателя может повлиять на остальные показатели, да и сам этого не понял, поскольку подсчитал неверно.
Итак, словарь данных служит для людей и организаций основой для получения нужных данных. Хочется верить, что в будущем организации все реже будут сталкиваться с проблемами, как в примере выше. Использование словаря данных для снижения риска или обеспечения прозрачности данных способствует внедрению и распространению общего для всех языка.
Назад: Свободное владение данными
Дальше: Стратегия чтения данных и свободного владения данными