10. Переходим от таблиц к программированию
После того, как на протяжении всех девяти предыдущих глав я «внутривенно» вводил вам Excel, пришло время сказать: бросаем! Ну, не совсем, но будем честны: Excel идеален не для всех статистических задач.
Excel прекрасен для изучения аналитики, потому что в нем можно посмотреть и «потрогать» данные на любом этапе превращения их алгоритмом из вводных в результат. Но вы пришли, посмотрели, научились – и наверняка задались вопросом: неужели обязательно каждый раз делать все эти шаги вручную? К примеру, действительно ли нужно настраивать оптимизацию под каждую свою логистическую регрессию? Или самостоятельно вводить определения вроде близости косинусов?
Теперь, когда вы изучили все это, вам разрешается немного схитрить… и заставить кого-то другого сделать нудную работу за вас! Думайте о себе как Вольфганг Пак. Готовит ли он сам во всех своих ресторанах? Я очень надеюсь, что нет. После изучения вам тоже должно быть доступно использование написанного другими с помощью этих алгоритмов.
Вышесказанное – одна из многих причин, (как и ссылки из одного слова на всю таблицу с данными), по которым настало время перейти от Excel к языку программирования R, ориентированному на статистику и аналитику.
В этой последней главе мы снова решим некоторые задачи из других глав, но уже не в Excel, а в R – с теми же данными, теми алгоритмами, но в другой среде. Вы увидите, насколько все просто!
Сразу предупрежу: эта глава – не учебник R. Мы будем двигаться со скоростью тысяча миль в час, чтобы изловчиться вместить все требуемые алгоритмы в одну главу. Если вы чувствуете необходимость более обстоятельного введения, обратитесь к списку книг в конце главы.
Также вынужден предупредить: если вы не прочитали до конца какую-то из предыдущих глав, то эту можете и не начинать. В ней я исхожу из того, что вы знакомы с данными, задачами и методами из предыдущих глав. Моя книга – не из разряда «выбери себе приключение». Дочитывайте то, что не дочитали, и возвращайтесь!