8. Прогнозирование: дышите ровно, выиграть невозможно
Как вы уже наверняка отметили при знакомстве с главами 3, 6 и 7, контролируемое машинное обучение заключается в предсказании значения либо классификации наблюдений с помощью модели, обученной на данных из прошлого. Прогнозирование занимается ровно тем же. Конечно, если вы астролог, то можете «прозревать грядущее» и без данных, но в количественном прогнозировании для предсказания событий в будущем всегда используются данные из прошлого. Некоторые техники, например, множественная регрессия (упомянутая в главе 6), применяются в обоих случаях.
А вот где они действительно различаются – так это в вопросе канонических задач. Типичные задачи прогнозирования построены на изменении неких данных во времени (продаж, спроса, поставок, ВВП, выбросов углерода или численности населения, к примеру) и проецировании этих изменений на будущее. А с учетом трендов, циклов и периодических вмешательств божьей воли данные в будущем могут существенно отличаться от произошедшего в обозримом прошлом.
В этом и состоит проблема прогнозирования: в отличие от глав 6 и 7, где беременные женщины более или менее стабильно продолжают покупать одни и те же товары, прогнозирование частенько используется в таких областях, где будущее совершенно не похоже на прошлое.
Едва вы приходите к выводу, что у вас отличный прогноз спроса на жилье, пузырь недвижимости лопается и ваш прогноз отправляется в унитаз. Наш MailChimp.com может продолжать расти, как на дрожжах, а может улететь во внезапно разверзшуюся под Атлантой дыру. Тем не менее ни одно бизнес-планирование не обходится без прогноза. Мы делаем попытку спрогнозировать рост наилучшим образом, чтобы иметь возможность спланировать инфраструктуру и кадровое обеспечение. Не собираетесь же вы все время играть в догонялки!
Как вы убедитесь на примере этой главы, можно не только попытаться предсказать будущее, но и выразить численно неопределенность всего, что связано с прогнозом. Численное выражение неопределенности с помощью создания интервалов прогнозирования поистине неоценимо, но часто игнорируется в прогностическом мире.
Как сказал один гуру по прогнозированию, «хороший специалист не умнее остальных, просто его невежество лучше организовано».
Так что давайте без лишних вступлений «организуем немного невежества»!