Книга: Графики, которые убеждают всех
Назад: Как образуется визуализация данных
Дальше: Какие графики лучше

Типы сравнения

Как вы помните, в третьей главе «Формулируем сообщение» мы говорили о том, что ваши находки по результатам анализа данных формулируются в терминах повышения, снижения, влияния одних переменных на другие, характера распределения значений, описания тренда или значений, которые выбиваются.
Можно выделить несколько основных видов взаимоотношений между данными, соответствующих возможным видам сообщений:
1. В основе почти всех взаимоотношений между данными, которые мы можем визуализировать, лежит сравнение. Чаще всего с помощью визуализации данных мы пытаемся понять, какие из значений больше или меньше других и в какой степени.
Понятно, что почти все виды визуализации данных (кроме, может быть, связей) позволяют сравнивать: наглядно видеть, какие числовые значения больше, а какие меньше. Однако первый тип фокусируется именно на сравнении.
Если при этом отсортировать значения, чаще всего от большего к меньшему, то к сравнению добавляется функция ранжирования. Мы получаем возможность ответить на вопрос «на каком месте?».
Основные слова в сообщении для этого типа визуализации – «больше, чем», «меньше, чем», «равно», а также указание на место (при ранжировании).

 

Примеры сообщений:
Больше всего в 2018 году подорожало пшено – на 38 %.
АФК «Система» занимает третье место по выручке среди системных интеграторов России.
Больше всего пожаров, приведших к человеческим жертвам, было в Смоленской области.
НТВ получило в два раза меньше финансирования, чем Первый канал.

 

Основной вид визуализации здесь – столбиковая диаграмма:

 

 

 

Второй график – сгруппированная столбиковая диаграмма. Она позволяет сравнивать ряды данных по нескольким категориям (обычно 2–3).

 

2. Сравнение части с целым. Здесь появляется новое измерение для сравнения: мы можем сравнивать значения, но при этом визуально воспринимать их еще и как отношение доли к целому.
Сообщение формулируется в терминах доли, процентов от целого. Основные слова в сообщении для этого типа визуализации – «доля», «проценты от целого».

 

Примеры сообщений:
Нелегальные эмигранты составляют четверть всех граждан США, родившихся за границей.
Больше 80 % всей выручки в ритейле уходит пяти компаниям.
Жители Москвы составляют половину всех активных пользователей Facebook в России.

 

Основной вид визуализации – круговая диаграмма или столбиковая с накоплением:

 

 

 

3. Временное сравнение наглядно фокусируется не на значениях отдельных точек, а на характере изменения показателя во времени.
Сообщение формулируется в терминах, описывающих характер изменения показателя: «растет/падает», «плавно/резко». Также сообщение может фокусироваться на пиках или провалах в динамике.

 

Примеры сообщений:
Уровень безработицы остается выше на Кавказе в сравнении с другими федеральными округами.
За последние три года в России на 10 % выросла средняя ожидаемая продолжительность жизни.
Количество инвестиций в сельское хозяйство резко снизилось.

 

Пожалуй, ни один другой тип визуализации, кроме линейного графика, не может показать изменения во времени нагляднее:

 

 

Эти три основных вида взаимоотношений между данными закрывают 80–90 % ситуаций, в которых требуется визуализация данных в презентациях.
Реже встречаются следующие типы сравнений:
4. Частотное сравнение или распределение показывает, сколько единиц данных попадает в определенные последовательные интервалы.
Сообщение формулируется в терминах структуры, концентрации, диапазонов.

 

Примеры сообщений:
Большинство покупок в августе попадало в диапазон от 1000 до 2000 рублей.
В структуре подписчиков канала преобладают люди 25–30 лет.

 

Основной вид визуализации – гистограмма.

 

 

5. Связь (корреляция) между количественными переменными показывает, есть ли зависимость между переменными или ее нет.
Обычно описывается как «при росте X отмечается снижение Y», «чем больше X, тем больше/меньше Y».

 

Примеры сообщений:
При увеличении площади торговых залов размер средней покупки снижается.
Стаж специалиста не влияет на уровень его заработной платы в компании.

 

Для двух числовых переменных (ось X, ось Y) классическим способом визуализации зависимости между ними является график рассеивания:

 

 

Я предлагаю вам иллюстрированный список с типами визуализаций по группам. Первый график в каждой группе – тот, который в большинстве случаев будет эффективен, если нужно использовать визуализации из этой группы. К уже упомянутым основным типам взаимоотношений между данными добавлено еще четыре, с которыми вы можете встретиться в своей практике.

 

 

 

 

 

 

 

 

 

 

6. Сравнение отклонения/разницы. Акцентирует внимание на разнице значений с какой-либо фиксированной точкой. Точкой может быть ноль, некий пороговый уровень или запланированное для показателя значение. Можно использовать для наглядной визуализации переменных с полярными порядковыми шкалами типа позитив/негатив. Например, для визуализации результатов опросов.
Является разновидностью сравнения.
7. Иерархия – когда состав значений имеет вложенный характер. Это одна из разновидностей сравнения части и целого.
8. Этапы/процесс/поток. Специфический вид визуализации. Основной из них – потоковая диаграмма, или диаграмма Санкея (по имени инженера Мэтью Санкея). Она показывает, как меняется характер распределения значений во времени или по этапам.
9. Составление профилей/мультивариантное сравнение – сравнение нескольких категорий по нескольким переменным. Часто для этого используется радарная диаграмма типа «паук», однако это крайне неудачный способ визуализации, поэтому он не включен в список.
Как можно видеть из списка, один и тот же тип визуализации может входить в разные группы. Это говорит о том, что он наглядно показывает разные типы взаимоотношений между данными и может эффективно передавать сообщения разного рода.
Такой пример – наклонный график, который сейчас используется недостаточно широко. Наиболее наглядно он показывает характер изменения показателя по двум точкам во времени (вырос/снизился и в какой степени), причем сразу по многим категориям.

 

 

Но также наклонный график хорошо показывает и динамику изменений, и ранжирование, и даже распределение. Именно его мы использовали в первой главе, чтобы показать изменения на рынке сыров.
Разумеется, это не все виды графиков, которые вы могли видеть. Как говорилось выше, возможно бесконечное количество комбинаций геометрических объектов и их характеристик.
Когда кажется, что ваши данные очень сложные и ни один тип визуализации не подходит, проблема в другом. Чаще всего – в перегруженности графика лишними данными. Представленных в списке вариантов более чем достаточно для наглядной визуализации и передачи самых разнообразных сообщений.
Важно понимать: для использования в презентациях, о которых мы в первую очередь говорим, самое важное качество графика – способность ясно доносить сообщение до вашей аудитории. С этой точки зрения чем проще и привычнее будет вид графика, тем лучше.
Я не предлагаю полностью отказываться от более сложных и менее знакомых аудитории графиков. Просто их использование должно быть уместным. Например, когда вы лично можете объяснить устройство графика и уверены, что здесь не справится более простой аналог.
Иконка Excel обозначает, что график есть в стандартном наборе диаграмм Excel. Почти все остальные представленные диаграммы относительно несложно реализуются в Excel. Исключение составляют диаграмма Санкея, потоковый график, уложенная пузырьковая и гантельная диаграммы.
Назад: Как образуется визуализация данных
Дальше: Какие графики лучше