Книга: Графики, которые убеждают всех
Назад: Приблизительность недопустима
Дальше: Ошибки в круговой диаграмме

Столбиковые диаграммы всегда от нуля

Столбиковые диаграммы всегда строятся от нуля. Тем, кто не сталкивается плотно с визуализацией данных, часто кажется, что в этом нет ничего плохого. Поэтому мы повсеместно с этим встречаемся: во многих презентациях и даже на ТВ.

 

 

Однако это достаточно серьезная ошибка, и ее следует избегать.
Дело в том, что в столбиковой диаграмме значение кодируется всей длиной столбика. Когда рядом находятся два столбика, для сравнения мы оцениваем именно их длину. В примере выше создается впечатление двукратной разницы возраста выхода на пенсию у мужчин и женщин.
Это было бы особенно заметно, если бы со столбиков убрали подписи.
Обрезая часть столбика, мы уменьшаем и само значение, которое он кодирует. Это делает визуализацию бессмысленной. Если на приведенном скриншоте убрать подписи, можно подумать, что у мужчин возраст выхода на пенсию в два раза больше, чем у женщин.
Сейчас длина столбика кодирует не возраст выхода на пенсию. Она показывает, сколько лет спустя после наступления 50 лет выходят на пенсию мужчины и женщины. Это бессмыслица.
Конечно, так делать не стоит. Столбиковая диаграмма всегда строится от нуля.
Но как же быть в ситуации, когда разница между значениями так мала, что при показе столбиков может быть не видна вовсе?
В этом случае столбики можно заменять точками или отсечками/отрезками. Значение в них кодируется не длиной, а положением относительно оси с подписанными метками.

 

 

Есть еще один вариант для визуализации значений в узком диапазоне. Например, нам нужно показать вес, меняющийся от 60 до 66 кг. В этом случае можно визуализировать рассчитанную между значениями разницу: плюс 5 кг, минус 1,5 кг и так далее.
Иногда, чтобы нивелировать разницу между значениями, используют так называемый разрыв:

 

 

 

Это совершенно недопустимо. Как вы помните, именно длина столбика кодирует значение, для читателя это эквивалент данных. При использовании разрыва столбики сильно искажаются, и визуализация просто теряет смысл.
Система с полосками, где одна полоска – небольшой разрыв, две – средний, а три – большой, лишь усугубляет ситуацию. На самом деле большой разрыв между значениями – это очень хорошо! В данных есть контраст, за ним стоит какая-то история. Ее мы и можем наглядно показать, визуализируя данные.
Если вам необходимо оставить различимыми графические фигуры, показывающие более мелкие значения, есть различные приемы для этого. В частности, можно использовать площадные фигуры, так как они более компактны:

 

 

Однако площадные фигуры позволяют считывать значения далеко не так точно, как длина линии. Вот пример для сравнения:

 

* * *
Использование площадных фигур может быть удачным, когда одно значение гораздо больше другого.

 

Другой прием – показать общую картину, а затем сделать зум на интересующей области. Вот пример переделывания графика бразильского издания Эштадао:

 

 

Степень «подвернутости» графика не позволяет визуально понять, насколько большое значение в первой категории. Проблему можно решить так:

 

 

Чтобы вовремя отследить зрительную манипуляцию на столбиковой диаграмме, всегда обращайте внимание на ось и подписи на ней.
Назад: Приблизительность недопустима
Дальше: Ошибки в круговой диаграмме