3.8. коэффициент ранговой корреляции спирмена
3.8. коэффициент ранговой корреляции спирмена
До сих пор мы анализировали зависимость между двумя количественными переменными. Вместе с тем в практике эконометрика иногда встречаются случаи, когда необходимо установить тесноту связи между ординальными (порядковыми) переменными (например, качество жилищных условий, тестовые баллы, экзаменационные оценки и т. п.). В этом случае объекты анализа упорядочивают или ранжируют по степени выраженности измеряемых переменных. При этом каждому объекту присваивается определенный номер, называемый рангом. Например, объекту с наименьшим проявлением (значением) признака присваивается ранг 1, следующему за ним — ранг 2 и т. д. Если объекты ранжированы по двум признакам, то имеется возможность оценить тесноту связи между переменными, основываясь на рангах, т. е. тесноту ранговой корреляции.
Коэффициент ранговой корреляции Спирмена находится по формуле
P = l—^ , (3.49)
где г/ и Sf ранги /-го объекта по переменным X и У; л — число пар наблюдений.
Если ранги всех объектов равны (г/ = 5/, /=1,2,..., я), то р=1, т. е. при полной прямой связи р=1. При полной обратной связи, когда ранги объектов по двум переменным расположены в обратном порядке, можно показать, что р=—1. Во всех остальных случаях |р| < 1.
При ранжировании иногда сталкиваются со случаями, когда невозможно найти существенные различия между объектами по величине проявления рассматриваемого признака: объекты, как говорят, оказываются связанными. Связанным объектам приписывают одинаковые средние ранги, такие, чтобы сумма всех рангов оставалась такой же, как и при отсутствии связанных рангов. Например, если четыре объекта оказались равнозначными в отношении рассматриваемого признака и невозможно определить, какие из четырех рангов (4,5,6,7) приписать этим объектам, то каждому объекту приписывается средний ранг, равный (4+5+6+7)/4=5,5. В модификациях формулы (3.49) на связанные ранги вводятся поправки.
При проверке значимости р исходят из того, что в случае справедливости нулевой гипотезы об отсутствии корреляционной связи между переменными при я>10 статистика
г^-Щ(3.50)
имеет /-распределение Стьюдента с (п—2) степенями свободы.
Поэтому р значим на уровне а, если |/| > /і_а;„_2, где t-a; п-2 —
табличное значение /-критерия Стьюдента, определенное на уровне значимости а при числе степеней свободы (я—2).
► Пример 3.6. По результатам тестирования 10 студентов по двум дисциплинам А и В на основе набранных баллов получены следующие ранги (табл. 3.4). Вычислить коэффициент ранговой корреляции Спирмена и проверить его значимость на уровне а=0,05.
Для проверки значимости р по формуле (3.50) вычислим
t 0,763—в 3534 и найдем по табл. II приложений Vl-0,7632
*b,95;8= 2,31. Так как t > /Ь,95;8> то коэффициент ранговой корреляции р значим на 5\%-ном уровне. Связь между оценками дисциплин достаточно тесная. ►
Ранговый коэффициент корреляции р может быть использован и для оценки тесноты связи между обычными количественными переменными. Достоинство р здесь заключается в том, что нахождение этого коэффициента не требует нормального распределения переменных, линейной связи между ними. Однако необходимо учитывать, что при переходе от первоначальных значений переменных к их рангам происходит определенная потеря информации. Чем теснее связь, чем меньше корреляционная зависимость между переменными отличается от линейной, тем ближе коэффициент корреляции Спирмена р к коэффициенту парной корреляции г.
Упражнения
3.7. Имеются следующие данные об уровне механизации работ Х(\%) и производительности труда Y (т/ч) для 14 однотипных предприятий:
Xi | 32 | 30 | 36 | 40 | 41 | 47 | 56 | 54 | 60 | 55 | 61 | 67 | 69 | 76 |
Уі | 20 | 24 | 28 | ЗО | 31 | 33 | 34 | 37 | 38 | 40 | 41 | 43 | 45 | 48 |
Необходимо: а) оценить тесноту и направление связи между переменными с помощью коэффициента корреляции; б) найти уравнение регрессии Y по X.
При исследовании корреляционной зависимости между ценой на нефть X и индексом нефтяных компаний Y получены следующие данные:
х =16,2(ден.ед.), у = 4000(усл.ед.), s2=4,sj = 500, G5v{x,y)=40.
Необходимо: а) составить уравнение регрессии Fno Х б) используя уравнение регрессии, найти среднее значение индекса при цене на нефть 16,5 ден. ед.
По данным примера 3.7: а) найти уравнение регрессии Y по X; б) найти коэффициент детерминации R2 и пояснить его смысл; в) проверить значимость уравнения регрессии на 5\%-ном уровне по /"-критерию; г) оценить среднюю производительность труда на предприятиях с уровнем механизации работ 60\% и построить для нее 95\%-ный доверительный интервал; аналогичный доверительный интервал найти для индивидуальных значений производительности труда на тех же предприятиях.
По данным 30 нефтяных компаний получено следующее уравнение регрессии между оценкой У (ден. ед.) и фактической стоимостью X (ден. ед.) этих компаний: ух = 0,8750х + 295. Найти: 95\%-ные доверительные интервалы для среднего и индивидуального значений оценки предприятий, фактическая стоимость которых составила 1300 ден. ед., если коэффициент корреляции между переменными равен 0,76, а среднее квадратиче-ское отклонение переменной Нравно 270 ден. ед.
При приеме на работу семи кандидатам было предложено два теста. Результаты тестирования приведены в таблице:
Тест | Результаты тестирования кандидатов {в баллах) | ||||||
1-й | 2-й | 3-й | 4-й | 5-й | 6-й | 7-й | |
1 | 31 | 82 | 25 | 26 | 53 | 30 | 29 |
2 | 21 | 55 | 8 | 27 | 32 | 42 | 26 |
Вычислить коэффициент ранговой корреляции Спирмена между результатам тестирования по двум тестам и на уровне а=0,05 оценить его значимость.
Обсуждение Эконометрика
Комментарии, рецензии и отзывы