Книга: Голая статистика. Самая интересная книга о самой скучной науке
Назад: Кто и что знает о вас?
Дальше: От автора

Приложение
Статистическое программное обеспечение

Подозреваю, что вы не будете выполнять статистический анализ с помощью карандаша, бумаги и карманного калькулятора. Ниже приведен краткий обзор программных пакетов, наиболее широко используемых для решения задач, описанных в этой книге.
Microsoft Excel
Microsoft Excel – пожалуй, самая широко используемая программа для вычисления простых статистических показателей, таких как среднее значение и среднеквадратическое (стандартное) отклонение. Кроме того, с помощью Excel можно выполнять базовый регрессионный анализ. Большинство компьютеров комплектуется пакетом Microsoft Office, поэтому Excel, скорее всего, уже есть на жестком диске вашего ПК. В сравнении с более сложными статистическими программными пакетами Excel довольно дружественна к пользователю. Основные статистические вычисления можно выполнять с помощью строки формул.
Excel не умеет решать ряд более сложных задач, рассчитанных на применение более специализированных программ. Однако вы можете купить расширения Excel (впрочем, некоторые из них можно загрузить бесплатно), которые существенно повышают статистические возможности этой программы. Огромное преимущество Excel – в том, что эта программа обеспечивает простые способы отображения двумерных данных посредством весьма наглядной графики, которая легко импортируется в Microsoft PowerPoint и Microsoft Word.
Stata
Stata – статистический пакет, используемый специалистами-исследователями во всем мире; его интерфейс отличается серьезным, научным видом. Stata обладает широким спектром функций для решения базовых статистических задач, таких как создание таблиц данных и вычисление описательных статистик. Разумеется, университетские профессора и другие ученые отдают предпочтение Stata не только по этой причине. Это программное обеспечение предназначено для проведения сложных статистических испытаний и моделирования данных, которые выходят далеко за рамки задач, описанных в этой книге.
Stata представляет собой идеальный инструмент для тех, кто обладает всесторонним знанием статистики (знание основ программирования также не повредит) и кому не требуется изощренное форматирование – лишь ответы на статистические вопросы. Впрочем, Stata окажется не самым идеальным инструментом, если ваша цель – оперативно строить графики на основе имеющихся данных. Опытные пользователи утверждают, что хоть Stata и умеет это делать, для этой цели удобнее пользоваться Excel.
Разработчики Stata предусмотрели несколько разных самостоятельных пакетов программного обеспечения. Вы можете купить бессрочную или годовую лицензию на этот продукт (в последнем случае через год ПО будет заблокировано на вашем компьютере). Один из самых дешевых вариантов – Stata/IC, предназначенный для «студентов и исследователей, оперирующих наборами данных среднего объема». Предусмотрена скидка для работников сферы образования. Однако даже в таком случае однопользовательская годичная лицензия на Stata/IC обойдется вам в 295 долларов, а за бессрочную лицензию придется уплатить 595 долларов. Если же вы собираетесь запустить спутник на Марс, в связи с чем вам предстоит выполнить по-настоящему серьезные научные вычисления, то у вас есть возможность воспользоваться более «продвинутыми» пакетами Stata, стоимость которых исчисляется в тысячах долларов.
SAS
Ввиду наличия у SAS широкого спектра аналитических способностей, этот статистический пакет привлекателен не только для профессиональных исследователей, но и для бизнес-аналитиков и инженеров. У SAS есть два разных статистических пакета. Первый называется SAS Analytics Pro и может считывать данные практически в любом формате, а также выполнять их сложный анализ. В этом пакете также предусмотрены хорошие инструменты визуализации данных; в частности он обладает расширенными возможностями отображения. Пакет не из дешевых. Даже работникам сферы образования и государственных учреждений покупка одной коммерческой или индивидуальной лицензии на него обойдется в 8500 долларов – плюс плата за годовую лицензию.
Второй статистический пакет SAS называется SAS Visual Data Discovery. Он снабжен удобным интерфейсом, который не требует специальных знаний кодирования или программирования и обладает весьма широкими функциями анализа данных. Как следует из названия пакета, он позволяет легко исследовать данные с помощью интерактивной визуализации. Вы можете также экспортировать анимации своих данных в презентации, веб-страницы и прочие документы. Этот пакет также недешев: покупка одной коммерческой или индивидуальной лицензии на него обойдется в 9810 долларов – плюс плата за годовую лицензию.
SAS предлагает ряд специализированных инструментов управления. К их числу относится, например, продукт, использующий статистику для выявления фактов мошенничества и финансовых преступлений.
R
Возможно, это название напоминает вам звуки, издаваемые каким-нибудь персонажем из фильмов о Джеймсе Бонде. На самом же деле R – это бесплатный (с открытым исходным кодом) популярный статистический пакет. Его можно загрузить и установить на компьютер в течение буквально нескольких минут. Кроме того, уже сформировалось так называемое R-сообщество, члены которого готовы поделиться с вами соответствующим кодом и предоставить всю необходимую помощь.
Прелесть пакета R не только в его бесплатности, но и в необычайной пластичности и гибкости. В зависимости от поставленных вами целей эта гибкость может либо разочаровать вас, либо обеспечить немалыми дополнительными возможностями. Если вы только приступаете к использованию статистического программного обеспечения, то эта программа не предоставит вам практически никакой структуры. Мало в чем поможет вам и ее интерфейс. С другой стороны, для программистов (и даже тех, кто знаком лишь с основами программирования) такое отсутствие структуры может оказаться благом, раскрепощающим их творчество. Пользователи вольны попросить программу сделать практически все, что они пожелают; в том числе заставить ее взаимодействовать со сторонними программами.
IBM SPSS
IBM SPSS есть что предложить как «зубрам» статистики, так и бизнес-аналитикам, менее сведущим в вопросах статистики. Пакет IBM SPSS также хорош для начинающих, поскольку в нем предусмотрен интерфейс, управляемый системой меню. Кроме того, в IBM SPSS имеется ряд инструментов, или «модулей», предназначенных для выполнения специализированных функций, например IBM SPSS Forecasting (прогнозирование), IBM SPSS Advanced Statistics (расширенная статистика), IBM SPSS Visualization Designer (дизайнер визуализации) и IBM SPSS Regression (регрессионный анализ). Эти модули продаются по отдельности или пакетами.
Самым базовым из предлагаемых вариантов IBM SPSS является IBM SPSS Statistics Standard Edition (стандартная версия статистики), который позволяет рассчитывать простые статистические закономерности и выполнять базовый анализ данных, такой как выявление тенденций и построение прогнозных моделей. Одну коммерческую лицензию, рассчитанную на фиксированный срок, можно приобрести за 2250 долларов. Премиум-пакет, который включает в себя большинство упомянутых выше модулей, обойдется в 6750 долларов. Скидки предоставляются работникам сферы образования.
(От научного редактора. Здесь уместно привести хотя бы краткие характеристики статистических пакетов, которые распространены на российском рынке. Кроме перечисленных автором, отметим еще один зарубежный статистический пакет, получивший широкое распространение в России. Это универсальный статистический пакет STATISTICA, который может служить не только эффективным инструментом для научных исследований, но и чрезвычайно удобной средой для обучения методам статистического анализа. Из российских разработок отметим пакеты STADIA, «ЭВРИСТА», «МЕЗОЗАВР», «САНИ», «СТАТЭксперт» и др. Советуем обратить внимание на удивительно компактный пакет STADIA. Кроме набора современных и эффективных методов статистического анализа, этот пакет имеет полный комплект научной, деловой и многомерной графики, а также понятную систему интерпретации результатов анализа.)
Назад: Кто и что знает о вас?
Дальше: От автора