1.8. коэффициент корреляции
1.8. коэффициент корреляции
В этой главе большое внимание уделено ковариации. Это объясняется тем, что она весьма удобна с математической точки зрения, а вовсе не тем, что ковариация является особенно хорошим измерителем взаимосвязи между величинами. Мы рассмотрим ее недостатки в разделе 1.9. Более точной мерой зависимости является тесно связанный с ней коэффициент корреляции.
Подобно дисперсии и ковариации, коэффициент корреляции имеет две формы — теоретическую и выборочную. Теоретический коэффициент корреляции традиционно обозначается греческой буквой р, которая произносится как «ро» и соответствует латинской «г». Для переменных х и у этот коэффициент определяется следующим образом:
pop.cov(x,,y) = ох,у ХуУ >/P0P-var(^)P0p.var(.y) Ja2a2 (1.23)
Если х и у независимы, то р равно нулю, так как равна нулю теоретическая ковариация. Если между переменными существует положительная зависимость, то <5ху, а следовательно, и р будут положительными. Если существует строгая положительная линейная зависимость, то р примет максимальное значение, равное 1. Аналогичным образом при отрицательной зависимости рху будет отрицательным с минимальным значением — 1.
Выборочный коэффициент корреляции г определяется путем замены теоретических дисперсий и ковариации в выражении (1.23) на их несмещенные оценки. Мы показали, что такие оценки могут быть получены умножением выборочных дисперсий и ковариации на п/(п 1). Следовательно,
п Со(х,у)
г _ П 1
'г V
Множители п/(п — 1) сокращаются, поэтому можно определить выборочную корреляцию как
r Cov(x,y)
ХчУ VVar(x)VarO>)' С1-25)
Подобно величине р, г имеет максимальное значение, равное единице, которое получается при строгой линейной положительной зависимости между выборочными значениями х и у (когда на диаграмме рассеяния все точки находятся точно на восходящей прямой линии). Аналогичным образом г принимает минимальное значение — 1, когда существует линейная отрицательная зависимость (точки лежат точно на нисходящей прямой линии). Величина г = О показывает, что зависимость между наблюдениями хи у в выборке отсутствует. Разумеется, тот факт, что г=0, необязательно означает, что р = 0, и наоборот.
Иллюстрация
Для иллюстрации вычисления выборочного коэффициента корреляции мы используем пример о спросе на бензин из раздела 1.1. Данные представлены в табл. 1.1 и показаны нарис. 1.1. Мы уже вычислили Cov (р, у) (см. табл. 1.2), которая составляет -16,24, поэтому нам теперь необходимы только Var (р) и Var (у) (см. табл. 1.7).
В последних двух колонках табл. 1.7 можно найти, что Var(p) составляет 888,58 и Var (у) равна 1,33. Следовательно,
-16,24 -16,24
г = = = -0,47. /і
7888,58x 1,33 34,38 U*ZD;
Упражнения
На с. 50 представлены данные о темпах прироста численности занятых — ей темпах прироста производительности труда — р (выпуска продукции за один человеко-час) для промышленности 12 стран за период с 1953—1954 по 1963—1964 гг. (годовые экспоненциальные темпы прироста). Постройте диаграмму рассеяния и вычислите выборочный коэффициент корреляции между е и р. [Рекомендуется сделать его, используя уравнения (1.8) и (1.16) для выборочной ковариации и дисперсии, и сохранить вычисления, поскольку это сэкономит вам время при рассмотрении другого примера, представленного в главе 2.] Объясните полученные результаты и прокомментируйте возможные причины положительной корреляции между двумя переменными.
Пусть наблюдения двух случайных переменных х и у находятся на прямой линии:
y = a+bx.
Покажите, что Cov (х, у) = b Var (х) и что Var (у) = Ь1 Var (х), а следовательно, выборочный коэффициент корреляции равен 1, если наклон линии положителен, и —1, если этот наклон отрицателен.
1.5. Пусть переменная у определяется строгой линейной зависимостью:
у = a + bx,
и предположим, что для х, у и третьей переменной z получена выборка наблюдений. Покажите, что если коэффициент Ъ положителен, то выборочный коэффициент корреляции для у и z должен быть таким же, как и для х и &
Занятость | Производительное ть | |
Австрия | 2,0 | 4,2 |
Бельгия | 1.5 | 3,9 |
Канада | 2,3 | 1.3 |
Дания | 2,5 | 3,2 |
Франция | 1.9 | 3,8 |
Италия | 4,4 | 4,2 |
Япония | 5,8 | 7,8 |
Нидерланды | 1,9 | 4,1 |
Норвегия | 0,5 | 4,4 |
ФРГ | 2,7 | 4,5 |
Великобритания | 0,6 | 2,8 |
США | 0,8 | 2,6 |
Источник: Kaldor, 1966. |
Обсуждение Введение в эконометрику
Комментарии, рецензии и отзывы