Мультикатегориальное сравнение
Много сложностей и непонимания вызывает необходимость сравнения нескольких категорий по нескольким критериям – составление профилей или мультикатегориальное сравнение.
Хотелось бы сразу предостеречь от использования лепестковой (радарной) диаграммы. Она очень популярна. Однако считывание данных в виде круга происходит гораздо хуже, чем в обычной системе декартовых координат.
Однако основная проблема лепестковой диаграммы даже не в плохом считывании. Дело в том, что этот график акцентирует внимание на фигурах, образованных линиями. Но эти фигуры не несут в себе никакого посыла. В отличие от линейного графика здесь нет непрерывной шкалы времени, порядок категорий обычно случаен. Если поменять этот порядок, формы фигур полностью изменятся.
Это приводит нас к выводу: соединять линиями значения категориальных переменных не стоит. Лучше соединять линиями только значения непрерывных числовых шкал.
Возьмем для примера датасет с рейтингом городов:
Попробуем сделать лепестковую диаграмму:
Скорее всего, мы сможем считать какой-то основной паттерн, но более тонкие различия – нет. Особенно сложно становится читать лепестковую диаграмму, когда на ней представлено больше одного ряда данных. Некоторые пытаются сделать лепестковую диаграмму для каждой категории. Это крайне неэкономно в плане использования пространства, хотя и лучше предыдущего варианта. Но по-прежнему ненаглядно:
Лепестковую диаграмму лучше всего заменить либо тепловой картой, либо рядами линейчатых диаграмм. На примере тепловая карта. Города ранжированы по суммарному рейтингу, от большего к меньшему:
Визуализация, составленная из рядов линейчатых диаграмм:
Для каждого критерия добавлена линия, соответствующая среднему значению по каждому критерию. Столбики раскрашены по принципу больше среднего/меньше среднего по каждому критерию. Это позволяет быстро просматривать каждый город и понимать, в чем он лучше и хуже других и в какой степени.
При использовании подобных диаграмм в презентациях будет требоваться акцентное выделение. Оно поможет донести ваше сообщение. Дело в том, что эти графики предназначены скорее для самостоятельного изучения, чем для представления результатов.