Книга: Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе
Назад: 9. Устанавливайте закономерности
Дальше: Часть 3 В какой точке вы сейчас находитесь?

10. Ищите среднее

Усреднение может сделать информацию яснее. Однако существует больше чем одно среднее значение, и выбор неверного может скрыть от вас то, что вам действительно стоит знать.
В 1918 году Джон Меклин ввел в употребление фразу, которую то и дело применяют специалисты по статистике. Он впервые использовал ее в названии своей научной работы «Тирания обычного человека», опубликованной в журнале International Journal of Ethics.
О какой тирании идет речь? Меклин объясняет. «Очарование острова Капри полностью покоряет путешественников даже без колких фраз Тацита, напоминающих им о…» Постойте, это не тот отрывок. «Наш современный тиран – с головой гидры, с бесчисленным количеством рук…» И это не то! В конце концов автор сообщит нам, что он против «кричащей и банальной сентиментальности дешевого романа, глупого остроумия воскресного приложения к газете, абсолютно пустых песен популярных эстрадных шоу».
Претензия Меклина, высказанная в столь резкой форме, тем не менее обоснованна и заключается в том, что мы уделяем слишком много внимания вкусам большинства и игнорируем тех, кто выделяется из общей массы. Меклин работает в Университете Питтсбурга, издалека наблюдает за процессом зарождения массового социализма и распространением демократических идей, и его одновременно интересуют и пугают привычки обычных людей, от которых, по его словам, будет зависеть процесс принятия решений.
Здесь необходимо сделать пояснение, что это эссе отражает исключительно субъективное мнение автора, который не приводит примеров «обычного» вкуса, не показывает, чем он отличается от вкусов богатых и успешных людей, которыми он так восхищается, и не обосновывает, действительно ли выбор большинства объективно хуже любого другого.
Кроме того, это мнение далеко не всегда справедливо. Мы живем в мире, где слушают музыку и Адель, и Rage Against The Machine, где играют в футбол или в 3D-шахматы. Тем не менее для целей нашей книги у Меклина можно почерпнуть важную мысль. Среднее значение часто отвлекает от более полезной информации.
Есть три средних значения, которые обычно применяются, и все они в определенных ситуациях бывают полезны.
• Среднее арифметическое. Именно это значение большинство людей понимают под средним. Это сумма всех статистических элементов, деленная на их количество. Среднее арифметическое последовательности 1, 3, 3, 4, 4, 6 – это 21/6, или 3,5. Если мы хотим, например, узнать уровень рождаемости, среднее арифметическое будет наиболее полезным статистическим показателем. В Великобритании в 1964 году, по данным Всемирного банка, уровень рождаемости составил 18,8 на 1000 человек. В 2013 году этот показатель был 12,2. Интересно.
• Медианное значение. Проблема со средним арифметическим показателем состоит в том, что при наличии резко отклоняющихся значений – как в большую, так и в меньшую сторону – результат получается искаженным. Например, если покупатели тратят 1, 3, 3, 4, 4, 6 и 28, то получается, что в среднем каждый из них тратит 49/7, или 7. Медиана – это уровень показателя, который делит некоторый набор данных на две равные половины. В данном случае это четвертый элемент из семи, то есть 4. Это более адекватное среднее значение при наличии чрезвычайно высоких показателей.
• Мода. В статистике мода – это значение во множестве наблюдений, которое встречается наиболее часто. Это то, что делает самая большая группа (или каким признаком она обладает), так что по этому показателю можно выстраивать приоритеты. Если среднее арифметическое товаров, которые покупают пользователи вашего сайта, равно 7, но при этом 8 из 10 пользователей не покупают ничего, то мода уровня покупок равна 0. И, возможно, с этого и стоит начинать, если вы хотите что-то менять.

 

К сожалению, средние значения могут затуманивать информацию. Например, с точки зрения правительства, среднее значение имеет смысл высчитывать, принимая за целое все население. С точки зрения компании по организации праздников, логичнее сначала разбить информацию по сегментам. Среднее число детей у одной женщины снижается, но нередко бывает полезным узнать среднее значение по отдельным группам. Например, для компании по организации праздников важнее информация о том, что у женщин, рожденных после 1981 года, в возрасте 30 лет медиана и мода по рождению детей равны нулю: половина из них в эти годы еще даже не вышли замуж, по данным Бюро национальной статистики Великобритании. Эта информация может повлиять на решения компании относительно того, какие праздники ей выгоднее организовывать для своих клиентов.
Среднее значение также способно подвести, если вы стремитесь определить, что может произойти, а не что уже произошло. В каждой области есть так называемые опережающие индикаторы, которые можно назвать законодателями мод, или трендсеттерами. Возьмем, например, индустрию моды и стиля: к тому времени, когда изменится среднее значение, которое вы пытаетесь измерить, будет уже слишком поздно. В этом случае лучше определить 100 человек, на стиль которых ориентируется массовый рынок, и анализировать информацию по ним – тогда, возможно, прогноз будет отличаться большей точностью.
Еще один наглядный пример – данные по уровню удовлетворенности ваших покупателей. Среднее значение может не сильно меняться, при этом оно состоит из небольшого числа очень довольных покупателей (возможно, именно на них вам и стоит сделать акцент, предлагая свои товары), группы чрезвычайно недовольных покупателей (которые, вероятно, от вас уйдут) и всех остальных (которым, скорее всего, все равно).
Если относиться ко всем покупателям как к «среднему», это может разочаровать ваших преданных поклонников, покажется «слишком мало и слишком поздно» для тех, кто вами недоволен, и может быть не вполне адекватно для всех остальных. Приведу реальный пример из жизни, когда британская телекоммуникационная компания О2 перестала ориентироваться на «среднего» клиента при определении уровня удовлетворенности ее услугами и предложила бонусы, чтобы сделать довольных клиентов еще счастливее, и при этом снизила риск игнорирования недовольных клиентов. Выяснилось, что на прибыли компании гораздо лучше отражается повышение лояльности клиентов из числа недовольных, чем равное распределение бонусов по всем или награждение довольных. В терминах маркетинга это называется сегментированием. И вам лучше опираться на сегментирование аудитории по принципу пола, возраста, покупательной способности или привычек (названия этих категорий могут быть, например, «опытные мамочки» или «индивидуальный городской тренд»), а не на политику, ориентированную на среднее арифметическое, медиану или моду.
Тиранию средних значений можно победить с помощью вопроса: что на самом деле означает это среднее, насколько оно помогает вам принять решение? Средние показатели по всему населению могут быть полезны, но помните, что данные, на основе которых вы можете действовать, обычно включают в себя анализ того, из чего складывается это среднее.
Назад: 9. Устанавливайте закономерности
Дальше: Часть 3 В какой точке вы сейчас находитесь?

Tattuububu
мне нужна эта книга