Книга: Аналитическая культура
Назад: Глава 6. Разработка показателей
Дальше: Глава 8. A/B-тестирование

ГЛАВА 7

Сторителлинг на основе данных

Когда вам удается удачно визуализировать свою мысль, собеседник моментально ее ухватывает, и диалог продолжается. Вы получаете ответную реакцию. Это повышает продуктивность. Это гораздо эффективнее, чем разговор по телефону или письмо по электронной почте. Вы сразу же доносите свою идею до многих людей.

Офер Менделевитч

В предыдущих двух главах мы обсудили виды анализа, от описательного до каузального, а также вопросы разработки показателей, включая особенно важные — KPI. В этой главе мы продвинемся дальше по аналитической цепочке ценности — перейдем к обсуждению того, как «упаковывать» сделанные выводы и рекомендации и презентовать их руководству и другим заинтересованным лицам, чтобы это способствовало повышению качества дискуссии и процесса принятия решений на всех уровнях.

В этой главе приводится общий обзор процесса и целей передачи и распространения аналитических выводов в компании с управлением на основе данных: мы рассмотрим, почему и что может составлять аналитическую коммуникацию, но не будем останавливаться на том, как ее осуществлять. Я расскажу о подготовительном этапе, о чем вам стоит задуматься перед тем, как приступить к подготовке презентации или визуализации. Чтобы внести конкретику, я остановлюсь на инструменте, позволяющем подбирать графики и диаграммы, и на контрольном списке относительно визуализации данных. Надеюсь, они, а также ссылки на источники, скажут сами за себя. После этого нам останется кратко коснуться некоторых вопросов подготовки презентации, таких как общая структура и основное сообщение.

Сторителлинг

«Каждый набор, каждая база данных, каждая таблица способны рассказать целую историю», — уверен Стюарт Франкел, CEO компании Narrative Science. Работа специалиста по анализу данных заключается в том, чтобы увидеть эту историю или хотя бы историю, интересную для компании, сформулировать ее и донести до аудитории. Более того, аналитикам следует позаботиться о точности истории, которая должна быть подтверждена практикой. В противном случае люди придумают свою историю, опираясь на сомнительные данные. В книге Дэвенпорта и др. Analytics at Work (с. 138–139) приводится в качестве примера случай, когда один из руководителей больницы был уверен, что главный фактор, влияющий на удовлетворенность пациентов качеством обслуживания, — качество еды. Когда аналитики взялись проверить это утверждение, оказалось, что это был один из наименее значимых факторов в наборе из еще 30. Убеждение руководителя было очень далеко от реальности. Чем объяснялось это несоответствие? Руководитель поговорил с двумя пациентами, которые пожаловались на качество еды. Он сделал вывод на основе случайных эпизодов, в то время как выводы аналитиков строились на основе репрезентативной выборки данных и объективного статистического анализа.

Учитывая сказанное, на бытовом уровне под историей может подразумеваться эпизод из жизни, однако что я вкладываю в этот термин в нашем контексте, то есть в рамках презентации в компании с управлением на основе данных?

Взгляните на рис. 7.1. Вам ничего не кажется необычным или инте­ресным?

Рис. 7.1. Регистрация новых пользователей из Австралии в Twitter на протяжении времени

Источник:

Очевидно, 2009 год для Twitter напоминал аттракцион «американские горки»: беспрецедентный рост числа подписчиков и не менее грандиозное падение (при этом все-таки наблюдалась положительная динамика и рост количества пользователей). За этой одной кривой стоит насыщенная событиями история. Первый подъем (примерно в марте 2007 года) объяснялся шумихой вокруг Twitter на ежегодной конференции South by Southwest Interactive Conference, когда на сервис впервые обратили внимание и количество его пользователей сразу утроилось. Замедление роста после второго подъема (примерно в марте 2008-го) объясняется тем, что тогда Twitter начал активно вносить в черный список спамеров. В 2009 году сервис получил уже широкую известность, в апреле на пике популярности, как раз перед падением, Эштон Кутчер поспорил с телеканалом CNN, у кого из них первым будет один миллион подписчиков (Эштон выиграл буквально через полчаса), а Опра Уинфри первый раз отправила сообщение в Twitter и сделала это в прямом эфире. Аналогичная кривая, построенная на данных пользователей из Австралии, в чем-то похожая на кривую по США, но имеет свои отличия. Так, например, последний рост количества пользователей Twitter в Австралии в 2013 году совпал с проведением выборов на федеральном уровне.

Таким образом, история должна содержать основные выводы, особенности данных или присущие им закономерности, чтобы по возможности раскрывать причины происходящего, а также смотреть в будущее, делать прогнозы и формулировать рекомендации для компании. По Стивену Фью, «визуализация данных — это применение средств визуального представления для изучения, анализа и презентации количественных данных». В данной книге я рассматриваю сторителлинг как дополнительный интерпретативный слой, повествовательную структуру на вершине визуализации данных. Рис. 7.1, дополненный описательной частью, более полезен, чем просто рис. 7.1. График и описание дополняют друг друга. Требуется качественная визуализация, чтобы обнаружить закономерности в данных в ходе проведения анализа, а затем продемонстрировать их аудитории. И помимо этого требуется знание точной и достоверной истории для интерпретации данных и построения возможных прогнозов.

В идеале в данном случае можно включить информацию о переломных моментах в график и таким образом усилить историю и сделать более самодостаточной (рис. 7.2).

Рис. 7.2. Аннотированная версия 

Поиск истории и ее интерпретация включают использование ряда аналитических техник, в которые обычно входит разведочный анализ, то есть, условно говоря, визуализация данных с помощью таблиц и диаграмм (). Эта глава посвящена визуализации данных, но это не введение в тему: я бы не смог сделать это на должном уровне, кроме того, есть немало отличных книг специально по теме. Начинать я рекомендую с золотого стандарта: книг Эдварда Тафти Envisioning Information («Представление информации»), Visual Explanations («Визуальные объяснения») и The Visual Display of Quantitative Information (Graphics Press) («Визуальное отображение количественной информации»). Третья книга особенно хорошо поможет вам понять, как мыслит дизайнер и критик. В этой книге Тафти представил важные концепции «графического мусора» и соотношение данных и чернил (Data-to-ink ratio), то есть элементов, несущих информационную нагрузку. Обе эти концепции я объясню далее.

Если вы хотите почитать что-то более практически направленное, рекомендую книги Стивена Фью Now You See It (Analytics Press), которая в большей степени сосредоточена на визуализации данных для изучения и анализа количественных данных, а также Show Me The Numbers (Analytics Press), посвященную процессу презентации. Для ознакомления с вопросами визуализации данных в виртуальном пространстве начните с книги Скотта Мюррея Interactive Data Visualization (O’Reilly). Кроме того, эту главу не стоит рассматривать как руководство по стилю. Для этих целей настоятельно рекомендую книгу Доны Вонг The Wall Street Journal Guide to Information Graphics (W. W. Norton & Company).

Первые шаги

Прежде чем размышлять над тем, как лучше всего представить данные, информацию, результаты анализа, следует ответить на три вопроса:

Это основные факторы, которые сузят выбор типа презентации, стиля, уровня технических средств, способных донести ваше сообщение максимально эффективно. Только после того, как вы определитесь с этими тремя вопросами, можно будет перейти к более практическим аспектам — как вы собираетесь структурировать содержание и оформлять его визуально.

ЧЕГО ВЫ ХОТИТЕ ДОБИТЬСЯ?

Какова ваша цель? Зачем вы делаете эту презентацию или отчет? Какого результата вы надеетесь достигнуть? Предположительно, эту цель следует определить еще до начала самого анализа, но у вас должно сложиться четкое понимание, зачем вы представляете эти данные или результаты анализа, к каким выводам вы пришли и что, по вашему мнению, произойдет дальше.

Например, если вы проводите только описательный анализ, его цель может состоять в том, чтобы читатели получили более ясное понимание системы, уловили взаимосвязи, величину и возможность изменений основных компонентов, то есть цель — поделиться знаниями. Если вы проводите анализ результатов А/В-тестирования, то его цель может заключаться в том, чтобы оценить, насколько эффективны разные варианты решения задачи по сравнению с контрольными показателями, а также уверенность в результатах и потенциальное увеличение выручки, подтверждающее реальность решения. В этом случае цель может быть в том, чтобы принять решение и обеспечить, чтобы новая характеристика или функция стала доступна всем пользователям. Эти два вида анализа отличаются методами проведения, преследуют разные цели и требуют разных стилей презентации.

Рассмотрим подробнее пример с результатами анализа А/В-тестирования. В этом случае специалист по анализу данных должен провести собственно анализ, прийти к выводу относительно значения и достоверности результатов и предложить свои рекомендации: надо ли внедрять эту характеристику в массовое производство. В своей презентации он должен отразить рекомендации и привести подтверждения: так мы проводили тестирование, это показатели, вызывающие интерес, вот что мы обнаружили, это небольшая неясность, с которой мы столкнулись, а вот почему мы пришли к финальному заключению.

КТО ВАША АУДИТОРИЯ?

Следующий вопрос, на который нужно ответить, касается аудитории, для которой готовится презентация. Насколько хорошо эти люди подкованы технически, умеют ли они оперировать данными? Каковы их ожидания? Каковы их уровни заинтересованности и мотивации? Насколько они заняты? В некотором смысле аналитик должен уметь добиваться своих целей вопреки аудитории. Тема презентации — это, возможно, главная задача, на которой он сосредоточен в последние дни или недели. Но для слушателей презентации это может быть лишь одним из десяти решений, которые они приняли сегодня, особенно когда речь идет о топ-менеджменте компании. У аналитика должно быть четкое понимание статистических техник, которые он применял в работе, в то время как аудитория, скорее всего, не имеет об этом представления. Аналитик поглощен цифрами, кодами, статистикой, тогда как слушателей волнует только необходимость принятия бизнес-решений и последующий эффект. При подготовке презентации аналитик должен принять во внимание все перечисленные факторы и структурировать материал так, чтобы добиться максимальной результативности.

Например, если вы понимаете, что на разговор с большим боссом вам отведут всего несколько минут, будьте лаконичны и конкретны: «Я рекомендую предпринять следующие меры, так как они позволят нам получить миллион дополнительного дохода в течение следующего года». В других случаях, например в часовой презентации для других специалистов по статистике, можно максимально углубиться в технические детали. Возможно, их заинтересуют степени свободы, доверительные интервалы, графики плотности распределения и другие аспекты.

Финансовые директора обычно чувствуют себя комфортно при работе с большими таблицами финансовых показателей (можно ли утверждать, что эта форма получения информации для них предпочтительна — уже другой вопрос). Для более широкой аудитории, например во время общего собрания, лучше облегчить информацию и представить общие выводы без технических подробностей. Решите, какой способ представления данных подходит вам больше всего, и структурируйте материал соответственно.

КАКИМ СРЕДСТВОМ ВЫ ВОСПОЛЬЗУЕТЕСЬ?

Наконец, определитесь со средством: будет ли это доклад в письменной форме, графическая презентация, например в PowerPoint, дашборд или инфографика.

Частично этот вопрос связан с предыдущим. Например, если вы выступаете на общем собрании, у вас есть выбор между графической презентацией или устным докладом. Для финансового директора лучше подготовить письменный отчет и включить в него необходимые таблицы и графики по тем направлениям, которые ему нужны и которые он ожидает увидеть. Для выступления перед руководителями нескольких направлений, возможно, вам понадобится подготовить презентацию в PowerPoint.

Решение относительно средства презентации в совокупности с пониманием общего уровня заинтересованности аудитории и объема времени, которое будет отводиться на презентацию, поможет определить, насколько глубокой она должна быть. Если у вас только три минуты, чтобы выступить перед топ-менеджером, то презентация в PowerPoint на 37 слайдов с кучей технических деталей точно не понадобится. Конечно, можно остановить свой выбор на презентации в PowerPoint, но тогда это будут два-три слайда. Еще один важный момент: не стоит копировать визуальную информацию из одного средства и использовать ее для другого. Например, копирование большой таблицы из письменного отчета и размещение ее на слайде в PowerPoint, который вы собрались демонстрировать на общем собрании, будет малоэффективным. Нужно подогнать каждый слайд, график или таблицу под то средство, которым вы хотите воспользоваться.

ПРОДАВАЙТЕ!

Качественно спланированный эксперимент, тщательно отобранные показатели и, самое важное, четко заданный вопрос обеспечивают наибольшую вероятность обнаружить доминирующие закономерности в данных и найти ответы на поставленные вопросы. Работа аналитика состоит в том, чтобы найти и проиллюстрировать самые очевидные и наиболее подходящие закономерности, интерпретировать их и транслировать с точки зрения влияния на бизнес. Однако это все-таки будет лишь одной интерпретацией данных из возможных. На основе этих же данных другие сотрудники могут прийти к другим заключениям. Именно поэтому эксперт в области визуализации данных Себастьян Гутьеррес сравнивает аналитика, презентующего данные с помощью визуализации, с продавцом: «Вы пытаетесь продать какую-то идею: мы должны увеличить бюджет, мы должны изменить базу данных, мы должны привлечь больше пользователей… У вас есть сообщение, которое вы стремитесь донести. Когда я представляю данные неспециалистам в этой области, то отношусь к этому как к упражнению по маркетингу».

Что вы продаете? По крайней мере, две вещи. Во-первых, если есть несколько интерпретаций, задача аналитика— выбрать и продвинуть наиболее объективную, логичную и экономичную (простую) из них, а также суметь обосновать свою позицию. Во-вторых, если аналитик затратил столько усилий на сбор данных, их обработку, анализ, возможно, построение модели и в итоге обнаружил нечто действительно важное, что способно оказать влияние на развитие бизнеса, он изо всех сил будет стремиться к тому, чтобы результаты его работы были применены на практике. Аналитик старается продать действие (что следует сделать) и результат (что получится в итоге этого действия). Мы еще вернемся к этому моменту в . Иными словами, специалист по анализу данных не пассивный транслятор данных, информации, выводов — он должен активно продавать эти идеи.

Более того, Себастьян отмечает, что, когда аналитик подходит к этому процессу с позиции маркетинга и у него есть идея, которую он должен продвинуть, это стимулирует его искать больше данных, чтобы получить более убедительную и подтвержденную фактами историю. Важно, что корпоративная культура организации должна стимулировать аналитика, чтобы он стремился оказать максимальное влияние на деятельность компании. Кен Рудин, руководитель аналитического направления в Facebook, а до этого в компании Zynga, подтверждает это примером:

Смысл аналитики в оказании влияния… В нашей компании [Zynga], если вы провели блестящее исследование и сделали потрясающие выводы, но ничего не изменилось, результативность вашей работы равна нулю.

Визуализация данных

Теперь, когда мы имеем более ясное представление о том, что такое сторителлинг, а также о роли аналитика и его мотивации, давайте обсудим некоторые технические аспекты визуализации данных. Как уже упоминалось в начале этой главы, наше обсуждение не будет полноценным руководством по этой теме. Я остановлюсь на нескольких ключевых моментах и свяжу их с общими комментариями, типичными ошибками и да, с тем, что больше всего раздражает лично меня.

Итак, предположим, что аналитик выбрал правильные метрики, правильные измерения (например, систематизировал данные по месяцам или по каналам продаж), обнаружил интересные и значимые закономерности в этих данных, Следующий шаг, который он должен предпринять, — выбрать форму презентации этих данных. В некоторых случаях это может быть таблица, но чаще всего останавливаются на диаграмме.

ВЫБОР ДИАГРАММЫ

У аналитика большой выбор разных типов диаграмм. Подходящий тип диаграммы или визуализации зависит от типа переменных (непрерывные, дискретные, категориальные или порядковые), от того, сколько переменных или факторов требуется включить в диаграмму, и даже от значений переменных. Например, составная столбиковая диаграмма способна справиться с двумя категориями данных, но не с большим числом (рис. 7.3).

Рис. 7.3. Пример составной столбиковой диаграммы (показывающей, как пользователи инструментов бизнес-аналитики используют эти продукты) с относительно большим числом категорий (восемь). Легче всего между платформами сравнить крайнюю левую категорию, так как она выровнена по оси y. Однако интерпретировать результаты по другим категориям не так просто, поскольку они отличаются по ширине и расположению. Например, как сравнить между платформами крайнюю правую категорию?

Источник: Джон Пелтир ()

Для сравнения: рис. 7.4 содержит те же самые данные, но их легче сравнить между платформами, хотя и за счет потери понимания суммарной доли респондентов в процентах (то есть полной ширины столбца на рис. 7.3).

Рис. 7.4. Те же самые данные, что и на рис. 7.3, представлены в виде панельной диаграммы. В этом случае гораздо проще интерпретировать сравнение между категориями.

Источник: Джон Пелтир ()

Выбор типа диаграммы — основной фактор с точки зрения способности сделать презентацию данных понятной для пользователей. Так на чем же остановить свой выбор в условиях такого разнообразия? Один из способов — сосредоточиться на одной из четырех причин, по которым мы вообще строим диаграмму.

Сравнение

Например, сравнение групп или сравнение изменений во вре­мени.

Распределение

Необходимость показать изменчивость набора данных.

Взаимосвязи

Необходимость отразить корреляцию или взаимосвязь между переменными.

Сравнение

Необходимость показать, как распределяются данные между двумя или более категориями.

На рис. 7.5 приведены примеры разных типов диаграмм и то, как они соотносятся с выделенными нами четырьмя целями. Мы выбрали наиболее распространенные типы диаграмм, хотя существует еще множество других. Например, здесь никак не охвачены данные из социальных сетей или геопространственные данные.

Рис. 7.5. Существует много разных типов диаграмм, каждый из которых отвечает определенной задаче. Выберите тот тип, который оптимально подходит для решения вашей задачи

Источник: Эндрю Абела (). Воспроизводится с разрешения

Более полное представление типов диаграмм можно найти в виде инфо­графического постера Graphic Continuum, но, к сожалению, он слишком масштабный и детальный, и его невозможно без потери качества разместить на одной книжной странице. Кроме того, я рекомендовал бы изучить галерею визуализации D3. D3 — это популярная библиотека JavaScript, которой можно воспользоваться для выполнения более интересной, интерактивной или специализированной визуализации данных.

Как вы сами видите, для работы с конкретным набором данных можно использовать разные типы диаграмм, в каждой из которых будет делаться акцент на разных характеристиках данных. Главное — пробовать разные варианты. Исследуйте «дизайнерское пространство» в поисках средств, которые помогут лучше всего рассказать вашу историю, но при этом не лишат ее достоверности и объективности (например, не усекайте ось y, чтобы исказить угол наклона в линейном графике).

ВЫБОР ЭЛЕМЕНТОВ ДИАГРАММЫ

Выбор типа диаграммы — относительно простая задача, так как он ограничен (хотя даже это не мешает некоторым выбирать неподходящие варианты). Но это только начало. Далее приводится контрольный список тех элементов, на которые стоит обратить внимание при построении диаграммы. Мы не будем подробно разбирать каждый из указанных пунктов, так как это не входит в задачи этой книги. Скорее, это подсказка для вас, с чего можно начать. Если вы хотите получить более глубокие знания, я вновь рекомендую обратиться к тем книгам, которые я перечислял в начале главы. Многие из элементов этого контрольного списка могут показаться очевидными; тем удивительнее, сколько встречается диаграмм, построенных с нарушением одного или нескольких из этих критериев, что не может не сказаться на их эффективности.

КОНТРОЛЬНЫЙ СПИСОК ДЛЯ ВИЗУАЛИЗАЦИИ ДАННЫХ

Визуализация данных включает множество элементов, каждый из которых требует пристального внимания. Один неверный выбор, например цвета с малым контрастом, мелкий шрифт, неподходящий тип диаграммы — и все визуальное представление испорчено. Далее приводятся элементы полезного контрольного списка Стефани Эвергрин. В полной версии списка можно найти подробное описание каждого пункта.

Текст

Описательный заголовок из 6–12 слов в левом верхнем углу с выравниванием по левому краю.

Подзаголовок и/или примечания с дополнительной информацией.

Размер текста многоуровневый и читаемый.

Расположение текста горизонтальное.

Данные с ярлыками.

Ярлыки применяются умеренно.

Вы­рав­ни­ва­ние

Пропорции соблюдены.

Данные выровнены.

Расстояния между осями равноудаленные.

График двухмерный.

Минимум украшательств.

Цвет

Выбор цвета преднамеренный.

Цвет применяется для выделения основных закономерностей.

Цвет понятен при распечатке в черно-белом варианте.

Цвет понятен для людей с проблемами с цветовосприятием.

Текст достаточно контрастирует с фоном.

Ли­нии

Линии сетки (если есть) скрыты.

У графика нет рамки.

На осях нет ненужных отметок.

На графике одна горизонтальная и одна вертикальная ось.

Об­щие ком­мен­та­рии

График подчеркивает значимые результаты или выводы.

Тип графика соответствует данным.

Присутствуют данные для сравнения или обеспечения контекста.

Отдельные элементы диаграммы работают вместе для усиления основного сообщения.

Фокусировка сообщения

Цель создания презентации — четко донести свое сообщение до аудитории. Для этого в вашем арсенале имеется целый ряд средств: шрифты, линии сетки, ориентация страницы. Еще одно средство — выделение цветом. Один из способов сделать сообщение сфокусированным — показывать только данные, представляющие интерес. К сожалению, иногда это может привести к отрыву от контекста. Например, предположим, что, согласно графику, Япония производила 260 тераватт-час энергии в 2009 году. Этого много или мало? Я понятия не имею. Зато все сразу становится ясно, если оставить эти данные в контексте, но выделить цветом (рис. 7.6). Мы сразу же увидим показатели, касающиеся Японии, благодаря выделению названия жирным шрифтом и более светлому цвету столбца диаграммы. А благодаря дополнительным данным относительно других стран можно интерпретировать данные о Японии: ее уровень производства электроэнергии был высоким, но составил 1/3 от уровня производства США.

Рис. 7.6. Пример эффективного использования выделения цветом. При представлении данных о Японии название страны выделено жирным шрифтом, а столбец диаграммы обозначен более светлым цветом. Это позволяет сфокусироваться на данных относительно Японии, которые, тем не менее, остаются в контексте

Источник:

Это удачный пример, как при помощи цветового выделения можно усилить сообщение. Рассмотрим противоположный случай. Следует избегать того, что Стефани Эвергрин назвала «синдром Марты Стюарт», то есть чрезмерного украшательства диаграммы. Все должно быть просто. Исключите «графический мусор» и излишества и сконцентрируйтесь на данных и сообщении.

Термин «графический мусор» ввел в употребление Эдвард Тафти для обозначения элементов, отвлекающих внимание. «Графический мусор» — все визуальные элементы диаграмм и графиков, в которых нет необходимости для понимания представленной информации или которые отвлекают от нее. Минималистский подход Тафти отличается категоричностью. Я предпочитаю более умеренное и прагматичное определение Роберта Косары — «любой элемент диаграммы, который не способствует прояснению сообщения». Косара признает, что в некоторых случаях может быть необходимо внести дополнительные элементы в диаграмму для выделения специфических компонентов, чтобы усилить основное сообщение или историю.

На этом этапе во многих книгах по визуализации данных (в том числе и Эдварда Тафти) для иллюстрации «графического мусора» приведены диаграммы и графики, взятые из USA Today. Я не буду этого делать, а остановлюсь на новом золотом стандарте — слайды программы PRISM Агентства национальной безопасности США (рис. 7.7).

Рис. 7.7. Слайд программы PRISM АНБ США, переполненный «графическим мусором»

Источник:

На рис. 7.7 представлена хронологическая шкала, когда разные технологические компании присоединились к программе АНБ по массовому негласному сбору информации. Это основное сообщение, но из-за множества дополнительных графических элементов внимание от него отвлечено. В верхней части слайда беспорядочно размещены 11 логотипов. Они соотносятся с желтыми овалами, но не в пропорции 1 : 1 (желтых овалов всего девять). Они только отвлекают внимание пользователя. Кроме того, на слайде размещены логотип самой программы и подразделения АНБ. Более того, на нем есть еще и зеленая стрелка. Какова ее роль? Почему данные расположены по возрастающей? Это все «графический мусор».

Подобные украшательства отвлекают внимание от основного сообщения по двум причинам:

На рис. 7.8 приведен один из возможных вариантов исправления этого слайда. Автор слайда — Эмилэнд де Куббер. На слайде условно выделены два важных блока данных: компании и время их присоединения к программе. Девять компаний — девять логотипов.

Рис. 7.8. Вариант слайда, предложенный Эмилэндом де Куббером

Источник:

Можно почти моментально уловить общую картину и посчитать количество компаний за каждый из указанных периодов времени (1, 1, 3, 1, 2, 1). А бросив второй взгляд на слайд, можно сосредоточиться на логотипах и понять, о каких именно компаниях идет речь. Этот вариант не идеален, но визуально информация представлена на нем более эффективно, чем на оригинальном слайде.

Организация данных

То, как будет организовано представление информации на диаграмме, зависит от выбора диаграммы, и наоборот. В рамках ограничений, которые накладывает выбор диаграммы, по-прежнему остается важным структурный выбор, например, как расположить столбцы диаграммы — горизонтально или вертикально. Самое удивительное, что даже на этом уровне есть небольшие вариации в том, как можно представить данные, так что это существенно повлияет на сообщение.

На рис. 7.9 показан среднегодовой размер оплаты труда госслужащих в Великобритании по тарифным разрядам и с делением по гендерному признаку.

Рис. 7.9. Среднегодовая заработная плата (в тыс. фунтов стерлингов) госслужащих в Великобритании по тарифным разрядам (более низкая цифра разряда означает более высокую должность) и с делением по гендерному признаку

Источник:

С диаграммой все в порядке. У нее понятное название и обозначения осей. По оси х представлены тарифные разряды по возрастающей слева направо, как и следовало ожидать, учитывая, что в западной традиции принято направление чтения слева направо (хотя несколько вводит в заблуждение, что номера тарифных разрядов, наоборот, уменьшаются в порядке значимости). Ось y тоже нареканий не вызывает. Нет усечения по вертикальной оси. Интервал в 25 тыс. фунтов стерлингов кажется оправданным. При составлении диаграммы был богатый выбор цветовой палитры.

В итоге выбрали основной голубой цвет (который обычно ассоциируется с мужским полом) и дополнительный оранжевый для обозначения женского пола. Выбор вполне обоснован. В этой диаграмме нет грубых ошибок.

А теперь посмотрите, что получится, если во всех тарифных разрядах поменять местами столбцы, обозначающие пол (рис. 7.10).

Рис. 7.10. Та же самая диаграмма, что и на рис. 7.9, за исключением того, что во всех тарифных разрядах поменяли местами столбцы, обозначающие пол. Вам не кажется, что неравенство в заработной плате по гендерному признаку бросается в глаза сильнее?

Удивительная разница. Те же самые данные, те же самые оси, те же самые интервалы и цветовая схема. Всего одно небольшое изменение кардинальным образом меняет восприятие неравенства в оплате труда у мужчин и женщин. Основное сообщение, о неравенстве оплаты труда, становится гораздо более наглядным. Первая диаграмма построена правильно, просто вторая — более наглядная.

Думаю, из этого примера очевидно, что каждая диаграмма, которую вы строите, требует индивидуального подхода. К тому же необходимо развивать в себе критическое восприятие. Этот навык приходит с практикой, в процессе работы со случаями, подобными этому. Поэтому всем специалистам по работе с данными я настоятельно рекомендую ознакомиться с книгами, которые я упоминал в начале этой главы, изучить метод trifecta checkup Кайзера Фанга — метод проверки диаграмм на наличие «графического мусора», а также посещать семинары по визуализации данных и, самое главное, практиковаться. Изучайте диаграммы из Wall Street Journal, New York Times и The Economist — все они задают очень высокую планку качества. Что делает их такими эффективными и где у них бывают проколы? (Да, такое тоже случается.) Сравните диаграммы в /r/dataisbeautiful/ и r/dataisugly. Почему первые такие ясные, а вторые такие бестолковые? Спросите себя, что бы вы сделали иначе.

Подача данных

В этом разделе мы поговорим о способах подачи сделанных выводов. Во-первых, кратко остановимся на инфографике, которая в последнее время пользуется особенной популярностью у специалистов по маркетингу. Во-вторых, изучим гораздо более важную тему дашбордов. Как уже говорилось в начале книги, многие компании считают, что у них развито управление на основе данных, просто потому что их сотрудники пользуются множеством дашбордов. Дашборды и отчеты о состоянии работ, несомненно, стали полезным и одним из наиболее распространенных инструментов. Мы рассмотрим несколько типов даш­бордов и обсудим их пользу (или отсутствие таковой) для процесса принятия решений.

ИНФОГРАФИКА

В контексте управления на основе данных я не большой поклонник инфографики: сегодня инфографика превратилась в «веселые картинки», приправленные парой фактов, которые обычно создают дизайнеры, а не аналитики. По моему мнению, у подобной инфографики слишком низкое соотношение данных и чернил (data-to-ink ratio), как его определил Эдвард Тафти. Фактически в большинстве случаев инфографика страдает от «графического мусора» и от недостатка данных. Например, на рис. 7.11 в забавной и визуально привлекательной форме представлен размер мозга у животных с разной массой тела.

Рис. 7.11. Инфографика Big Thinkers из книги Роджерса и Блечмана (2014) Information Graphics: Animal Kingdom. Big Picture Press

При этом более лаконичной и эффективной формой для представления этих данных могла бы стать столбиковая диаграмма или таблица:

Животное

Масса мозга в граммах (фунтах)

Кашалот

7800 (17,2)

Дельфин

1600 (3,5)

Человек (взрослый)

1400 (3)

Лягушка

0,24 (0,008 унции)

На самом деле интересно здесь другое — отношение массы мозга к общей массе тела. Диаграмма, отражающая это соотношение, содержит одно из удивительнейших открытий сравнительной биологии — закон масштаба. На рис. 7.12 показано, что масса мозга относительно общей массы тела уменьшается с увеличением массы тела.

Рис. 7.12. Соотношение массы мозга и общей массы тела. (Обратите внимание: обе оси логарифмические, но интервал по оси х составляет 100х, а интервал по оси y — только 10х).

Источник: Dongen P. A. M. 1998. Brain Size in Vertebrates. Из книги The Central Nervous System of Vertebrates, Vol 3. Ed. by R. Nieuwenhuys et al., Springer

Я намеренно выбрал такой пример для иллюстрации своей мысли. Это инфографика из книги для детей, поэтому ее задача — быть увле­кательной, информативной и запоминающейся. Она отлично с этим справилась. Однако когда речь заходит о компании с управлением на основе данных, такая инфографика будет бесполезна для внутреннего использования и для процесса принятия решений. Я не отрицаю, что в некоторых случаях выбор инфографики может оказаться оправданным. Недавно моя команда представила в виде инфографики наши результаты за год. Мы показывали ее на общем собрании сотрудников. Аудитория была разнообразной и преимущественно не технической, а наша цель состояла в том, чтобы быстро пройтись по наиболее важным событиям года. Так что в этой ситуации формат инфографики был уместен. Также уместен он может быть для внешней коммуникации с широкой публикой.

Интересно, что, согласно результатам последних исследований, «графический мусор», пиктограммы, цвет и контраст делают диаграммы запоминающимися. И всеми этими элементами изобилует инфо­графика. Тем не менее еще раз повторю свою основную мысль: цель визуализации данных — стимулировать коммуникацию, ведущую к конкретным действиям. Руководителям требуется информация высокого качества, чтобы они могли не только запомнить основную мысль, но и оценить ее и убедиться, что решение, которое они собираются принять, правильное.

Пользователь должен быстро и без усилий увидеть те центральные пункты, которые отражают представленные данные, а «графический мусор» этому препятствует.

ДАШБОРДЫ

Многие компании ошибочно измеряют степень управления на основе данных количеством производимых ими отчетов и числом дашбордов, которыми они пользуются. Дашборды очень полезны и могут поддержать ряд видов деятельности, например обеспечить интерфейс для сбора данных, составления специализированных отчетов, оповещений, а также отобразить в удобном виде прогнозы и прогнозные модели. Дашборды можно условно разбить на три категории:

Стратегические дашборды (рис. 7.13) обеспечивают общий обзор деятельности компании и, как правило, концентрируются на системе показателей (например, KPI и их цели). Дашборд должен просто и быстро помочь увидеть, достигает ли компания поставленных целей и есть ли у руководства поводы для беспокойства. Иными словами, она должна держать руку на пульсе компании и показывать обзорную картинку с высоты 15 км. В основном стратегическими дашбордами пользуется высшее руководство компании, но в компании с управлением на основе данных доступ к этим инструментам есть у более широкой ауди­тории.

Рис. 7.13. Дашборд для топ-менеджмента компании на платформе QlikView () показывает KPI по продажам в региональном разрезе

Аналитические дашборды (рис. 7.14) отражают основные тенденции развития и показатели в рамках одного подразделения компании или направления деятельности, например цепочку продаж, маркетинг или цепочку поставок. Обычно они имеют интерактивный характер и дают пользователю возможность тщательного изучения необычного тренда или резко отличающихся показателей, а также позволяют находить данные.

Рис. 7.14. Пример аналитического дашборда о посетителях сайта от Google Analytics

В основном аналитические дашборды используют в своей работе аналитики и руководители подразделений.

Наконец, операционные дашборды (рис. 7.15) дают подробное пред­ставление об отдельных аспектах ведения бизнеса, таких как, например, объем продаж в режиме реального времени, интернет-трафик, практические случаи при работе с клиентами или время ожидания, когда вы пытаетесь дозвониться клиенту. Обычно они используются для оповещения, а также в работе сотрудников, которые могут предпринять немедленные действия, например подключить дополнительные серверы, переключить коллег с выполнения одной задачи на другую, чтобы сократить количество необработанных заказов.

Рис. 7.15. Пример операционного дашборда. Он также сформирован при помощи Google Analytics, но представляет информацию более детально, чем на рис. 7.14. Здесь отражается активность посетителей сайта почти в режиме реального времени: откуда они пришли, на какие страницы направляются, общее число пользователей

Источник:

С учетом перечисленных типов дашборды должны использоваться целевым образом. Необходимо четкое понимание, кто ими пользуется и какая информация требуется. Как и в предыдущем разделе, здесь применяется принцип KISS (Keep it simple, Stupid! — Чем проще, тем лучше!): каждая диаграмма и каждый показатель, которые появляются в дашборде, должны быть обоснованы. Иными словами, не поддавайтесь соблазну добавить туда как можно больше всего. Если дашборд будет перенасыщен данными, интерпретировать эти данные станет сложнее, и он будет менее эффективным. Лучше меньше, да лучше.

Ди Джей Патиль и Хилари Мейсон полагают, что имеет смысл использовать несколько дашбордов, отражающих данные в одной области, но для разных категорий пользователей и разных временных шкал. Например, в компании One Kings Lane сотрудники службы по работе с клиентами, отвечая на телефонные звонки, могут наблюдать за данными на операционном дашборде, который расположен на настенном мониторе и отражает основные показатели, например число вызовов в режиме реального времени, время ответа и количество решенных проблем клиента. Их руководитель имеет доступ к более детальному аналитическому дашборду, в котором он может систематизировать данные по группе, отдельному заказчику и типу заказа. В дополнение к этому показатели более высокого уровня включены в дашборд для топ-менеджмента, и руководители могут наблюдать за ними в течение дня. В каждом из этих случаев дашборд отвечает целям и задачам тех людей, которые им пользуются.

В контексте этой книги полезно проанализировать, действительно ли дашборды используются для процесса принятия решений. Как уже упоминалось, операционные дашборды отражают изменения (почти) в режиме реального времени и часто настроены таким образом, чтобы оповещать конечных пользователей о ситуациях, в которых они могут предпринять немедленные действия. Например, если интенсивность телефонных звонков, поступающих в кол-центр компании, увеличивается, руководитель может перенаправить ресурсы из других подразделений, чтобы справиться с наплывом. При этом аналитические и стратегические дашборды практически никогда не бывают единственным источником информации при принятии важных бизнес-решений. Ниже приведены выводы одного из недавних отчетов.

Довольно редко один отчет или дашборд, содержащие аналитическую информацию, служат основой для принятия важного решения. Гораздо чаще пользователи задаются вопросом: почему? Почему в северо-восточном регионе продажи упали на 30%? Почему розничные продажи продукта взлетели в IV квартале? С помощью интерактивных возможностей проведения анализа, которыми располагают опытные пользователи инструментов бизнес-аналитики, можно вовремя задавать эти важные вопросы и так же своевременно получать на них ответы.

Подробнее о процессе принятия решений мы поговорим в .

Отслеживание использования

Возможно, дашборд бесполезен сам по себе, но он точно будет таковым, если его никто не использует (хотя он может быть бесполезен, и если его используют, но при этом не происходит никаких изменений). В интервью с Кевином Роузом в 2001 году Джек Дорси, сооснователь Twitter и CEO компании Square, высказал интересную мысль:

У нас в Square есть дашборд и есть показатель «сколько раз сотрудники взглянули на эту панель, чтобы узнать, как обстоят дела в компании». Это говорит о том, насколько сотрудников волнует, как дела у компании.

Конечно, компания с управлением на основе данных может пользоваться не только дашбордами. Если отчеты отправляются заинтересованным лицам с сервера, можно настроить показатель, отражающий «уровень открытия» сообщений получателями. Авинаш Кошик идет еще дальше и предлагает «отключать ежеквартально все автоматические отчеты в случайный день/неделю/месяц, чтобы оценить их использование/ценность».

Основные выводы

Мы провели лишь поверхностный обзор сторителлинга и визуализации данных. И вновь я рекомендую обратиться к экспертам. Моя цель была лишь в том, чтобы убедить вас в важности этих вопросов для компании с управлением на основе данных. Проведение аналитической работы и формирование выводов на ее основе — огромный труд. К сожалению, слишком часто кустарно подготовленные презентации не оставляют интересным и важным историям ни малейшего шанса. Навыками визуализации и презентации данных в состоянии овладеть любой, и это станет по-настоящему ценной инвестицией в развитие аналитического направления в компании.

В 1657 году известный французский математик и физик Блез Паскаль в своем сборнике «Письма к провинциалу» отмечал: «Я написал несколько длиннее обычного, потому что у меня не было времени сделать это короче». Его идея, без сомнения, состояла в том, что требуется потратить время и приложить усилия, чтобы отредактировать написанное, выделить основную мысль, убрать все лишнее и оставить только суть. То же самое верно в отношении визуализации данных и сторителлинга.

Стефани Эвергрин выделяет следующие цели презентации данных:

Для достижения любой из этих целей необходимо избавиться от всего «графического мусора» и показать пользователю, на чем ему следует сфокусировать внимание. При этом вы не должны заставлять его думать. Важно, что это не означает чрезмерного упрощения содер­жания.

Во-первых, начните с четкого понимания вопроса, на который вы пытаетесь ответить, а также с четко сформулированных ожиданий аудитории.

Во-вторых, тщательно подойдите к выбору средств презентации, чтобы они отвечали характеру данных и максимально эффективно могли донести ее посыл.

В-третьих, выделите одно основное сообщение для каждого визуального средства, таблицы или слайда. Предлагайте слушателям информацию по кусочкам, которые они в состоянии «проглотить». Когда де Куббер переделывал слайды программы PRISM, он поместил хронологическую последовательность присоединения разных компаний к программе на одном слайде, а информацию о стоимости программы, которая составила 20 млн долл., — на другом. Таким образом, оба этих информационных блока легко усваиваются. Мне часто приходится сталкиваться с огромными таблицами, содержащими финансовые данные. Обычно они буквально ими набиты: набор финансовых показателей по каждому месяцу за последний год с фактическими параметрами и бюджетами, сравнением месяц к месяцу и год к году и так далее. К сожалению, множество историй, которые могут рассказать эти данные, буквально погребены под грузом самих данных. Возможно, пара ячеек каким-то образом выделены, но приходится просмотреть океан информации, прежде чем добраться до заголовков рядов и столбцов, чтобы получить контекст. Я рекомендовал бы, чтобы аналитик определил историю, которую он хочет донести до остальных, и вынес самую важную информацию — «лакомые кусочки» — на отдельные слайды. Уберите всю «воду» и оставьте только ключевую информацию и ее интерпретацию. Пусть слушатели презентации испытают информационные ощущения, сравнимые с гастрономическим удовольствием от еды из мишленовского ресторана.

В-четвертых, добавьте полезные указатели, такие как название слайда, названия осей, используйте выделение цветом (см. , приведенный ранее) для обеспечения нужного контекста. Затем отформатируйте эти указатели так, чтобы они легко воспринимались. Например, не заставляйте зрителей презентации сворачивать шеи, чтобы прочитать вертикально размещенный текст, или напрягать зрение в попытках разглядеть мелкий шрифт.

В-пятых, исключите любые умственные упражнения или вычисления, которые должен произвести слушатель презентации, чтобы связать разрозненные выводы или получить скрытое в данных послание. Один из примеров — неудобное размещение легенды на столбиковой диаграмме, в результате чего слушатель презентации вынужден, как выразилась Стефани Эвергрин, заниматься «ментальной гимнастикой», чтобы соотнести названия, а следовательно, и смысл столбцов, с их значениями. Еще один пример — сравнение столбцов, на этот раз от Стивена Фью, которое он называет анализом отклонения. Представьте столбиковую диаграмму, которая отображает реальные показатели и запланированные для ряда подразделений компании. Если цель в том, чтобы показать дельту между каждой парой значений, то фактически вы предлагаете слушателям презентации самостоятельно вычислить эту разницу. Подход, который позволит быстрее и легче воспринять эту информацию, заключается в том, чтобы провести все вычисления и представить уже определенные дельты, а не первоначальные пары столбцов. Сконцентрируйтесь на том, что вы хотите показать, что вы хотите, чтобы пользователи вынесли после этой презентации, а затем поставьте себя на их место: что им нужно сделать, чтобы получить это сообщение? Исключите любые задачи, требующие усилий с их стороны.

Если вы выполните все это — проведете зрителя/читателя через один или несколько простых информационных блоков и выводов, — получится более простая и убедительная презентация, способная донести ваше основное сообщение эффективно и без искажения смысла.

Это была заключительная глава из трех, посвященных показателям, типам анализа и презентации результатов, которые составляют суть работы аналитика. В следующей главе мы обсудим важный аспект корпоративной культуры компании с управлением на основе данных — тестирование. То есть мы сосредоточимся на развитии корпоративной культуры под девизом «Докажи это!», в которой идеи тестируются в реальных обстоятельствах на реальных клиентах, и это обеспечивает самые прямые доказательства влияния предложенного изменения или новой характеристики продукта.

Назад: Глава 6. Разработка показателей
Дальше: Глава 8. A/B-тестирование