Книга: Soft skills для IT-специалистов. Прокачай карьеру и получи работу мечты
Назад: 20.2 Изучаем отчет о прибыли и убытках
Дальше: 20.4 OPEX и CAPEX

20.3 Средние значения

Средние показатели полезны во многих сферах деятельности – и бизнес, безусловно, в том числе. Но люди часто неправильно их понимают. Однажды я прочитал статью о лезвиях для мужской бритвы. Репортер спросил представителя Gillette, как долго в среднем служит лезвие. Его ответ был примерно таким: «Ну, они все настолько разные, что среднее значение не имеет смысла». Эта фраза – огромный сюрприз для каждого статистика, потому что в этом-то и есть весь смысл средних значений.
На самом деле существуют три вида средних значений. Каждый из них стремится взять набор чисел и найти «золотую середину», которая представляет всю группу. Среднее значение делает это путем сложения всех чисел и деления на их количество. Этот вид также называют средним арифметическим – именно это большинство людей имеют в виду, когда говорят «среднее значение». Его недостаток в том, что он может быть искусственно перетянут в ту или иную сторону из-за более высоких значений. Например, у вас может быть 99 значений при 50 и 1 при 7 000 000. Среднее значение более 70 000, но 70 000 никоим образом не являются репрезентативными для группы чисел, которые в основном равны 50. Таким образом, при рассмотрении средних значений необходимо изучать базовые данные, чтобы понять, сколько значений на самом деле сгруппировано вокруг среднего показателя.
Медиана – это средняя точка выборки, где одна половина ваших значений находится выше середины, а другая – ниже. Она позволяет найти буквальную «золотую середину». Для многих бизнес-расчетов этот вид значения лучше, чем среднее, потому что автоматически учитывает резко отличающиеся значения. Тем не менее медиана их уменьшает, потому что слишком большое значение не «сдвинет» медиану сильнее, чем на «более подходящее» значение. Модус – это наиболее распространенное число в наборе чисел. Например, в последовательности чисел 1, 2, 2, 3, 4, 5, 6 и 7 модус равен 2, потому что это наиболее распространенное значение выборки. Итак, давайте посмотрим, когда с точки зрения бизнеса могут понадобиться средние значения.

 

Изучая производительность разработчика, вы можете посмотреть на такие показатели, как количество коммитов кода, в которых прошли все модульные тесты. Очевидно, что разные разработчики будут иметь разный уровень производительности – отчасти в зависимости от типа проекта, над которым они работают. Медиана может быть полезна для получения представления о том, какова производительность компании в целом. Затем вы можете посмотреть на значения выше и ниже медианы, чтобы понять, откуда эти значения взялись.
Чтобы узнать время безотказной работы сервера, вы можете посмотреть на модус количества дней, в течение которых он работает или не работает за определенный период – например, за месяц. Если наиболее распространенное количество дней простоя в месяц равно 28, вы можете с помощью серверов с меньшим временем простоя узнать, почему время отличается.
Если вы хотите измерить среднее количество оплачиваемого отпуска в целом по организации, вы можете взять среднее арифметическое. В большинстве организаций оплачиваемый отпуск не будет иметь большого количества резко отличающихся значений, и поэтому среднее значение и медиана могут оказаться одинаковы. Конечно, можно сравнить среднее значение и медиану, и, если они сильно отличаются, вы увидите отклонения, которые следует учитывать.

 

Есть забавная книга под названием «Как лгать при помощи статистики» Дарелла Хаффа (Альпина Паблишер, 2015), которую я рекомендую. Книга отлично отображает то, как люди искажают цифры и психологию, и поможет лучше понять бизнес-математику.
Назад: 20.2 Изучаем отчет о прибыли и убытках
Дальше: 20.4 OPEX и CAPEX