Чтобы вычислить коэффициент корреляции между двумя совокупностями чисел, вы должны выполнить перечисленные ниже действия, каждое из которых иллюстрируется путем использования данных о значениях роста и веса для 15 гипотетических учащихся в приведенной ниже таблице.
Корреляция между ростом и весом для этой группы учащихся — 0,83. Учитывая, что коэффициент корреляции может находиться в диапазоне от –1 до 1, это относительно высокая степень положительной корреляции, чего и следовало ожидать.
A — Учащийся; B — Рост; C — Вес; D — Рост в стандартных единицах; E — Вес в стандартных единицах; F — (Вес в стандартных единицах) × (Рост в стандартных единицах)
A | B | C | D | E | F |
Ник | 74 | 193 | 1,21 | 0,99 | 1,19 |
Элана | 66 | 133 | –0,63 | –0,67 | 0,42 |
Дайна | 68 | 155 | –0,17 | –0,06 | 0,01 |
Ребекка | 69 | 147 | 0,06 | –0,29 | –0,02 |
Бен | 73 | 175 | 0,98 | 0,49 | 0,48 |
Чару | 70 | 128 | 0,29 | –0,81 | –0,24 |
Сахар | 60 | 100 | –2,00 | –1,59 | 3,18 |
Мэгги | 63 | 128 | –1,32 | –0,81 | 1,07 |
Фейсал | 67 | 170 | –0,40 | 0,35 | –0,14 |
Тед | 70 | 182 | 0,29 | 0,68 | 0,20 |
Нарцисо | 70 | 178 | 0,29 | 0,57 | 0,17 |
Катрина | 70 | 118 | 0,29 | –1,09 | –0,32 |
Си Джей | 75 | 227 | 1,44 | 1,93 | 2,77 |
София | 62 | 115 | –1,54 | –1,17 | 1,81 |
Уилл | 74 | 211 | 1,21 | 1,49 | 1,80 |
Среднее значение | 68,73 | 157,33 | Итого = 12,39 | ||
Стандартное отклонение | 4,36 | 36,12 | Коэффициент корреляции = Итого/n = 12,39/15 = 0,83 |
Формула для вычисления коэффициента корреляции требует небольшого отступления, которое понадобится для того, чтобы объяснить систему обозначений, используемую в данном случае. Символ ∑ часто применяется в статистике. Он обозначает суммирование величин, которые указаны после него. Если, например, имеется некая совокупность наблюдений x1, x2, x3 и x4, то запись ∑ (xi) говорит о том, что мы должны суммировать четыре наблюдения: x1 + x2 + x3 + x4. Таким образом, ∑ (xi) = x1 + x2 + x3 + x4. Наша формула для среднего значения совокупности из n наблюдений может быть представлена в следующем виде: среднее значение = ∑ (xi)/n.
Мы можем придать этой формуле еще более универсальный вид, записав ее как Эта формула означает суммирование величин x1 + x2 + x3 +...+ xn, или, другими словами, начиная с x1 (поскольку i = 1) до xn включительно (поскольку i = n). Наша формула для среднего значения совокупности из n наблюдений может быть представлена в следующем виде:
С учетом этой универсальной системы обозначений формула вычисления коэффициента корреляции r для двух переменных x и y может выглядеть так:
где
n — количество наблюдений;
x — среднее значение для переменной x;
y — среднее значение для переменной y;
σx — стандартное отклонение для переменной x;
σy — стандартное отклонение для переменной y.
Любая статистическая компьютерная программа может с помощью статистических инструментов вычислить коэффициент корреляции между двумя переменными. Использование Microsoft Excel в примере с ростом и весом учащихся позволяет получить такую же корреляцию между ростом и весом пятнадцати учащихся, что и вычисление, выполненное нами вручную на основе приведенной выше таблицы: 0,83.