3.3. проверка гипотез, относящихся к коэффициентам регрессии (а, ь)
3.3. проверка гипотез, относящихся к коэффициентам регрессии (а, ь)
ПРОВЕРКА ГИПОТЕЗЫ Н0: Р = р0
Пусть в теоретической зависимости Y= а + $Х+ є
случайный член є распределен нормально с неизвестной дисперсией а2.
Хотя величина р и неизвестна, имеется основание предполагать, что она равна заданной величине р0. Выдвигаются гипотезы
|#0: Р = Р„, [Я,: р*р0.
Задача заключается в проверке гипотезы Н0 на основании выборочных данных.
Пусть по выборочным данным получена оценка Ь.
В качестве критерия проверки гипотезы Н0 принимают случайную величину
*~Ро
которая имеет распределение Стьюдента с v = п 2 степенями свободы.
Вычисляется наблюдаемое значение критерия /. По таблице критических точек распределения Стьюдента по заданному уровню значимости а и числу степеней свободы v = п 2 находят критическую точку /кр.
Сравнивая наблюдаемое значение критерия с критическим, можно принять или отвергнуть нулевую гипотезу.
Результаты оценивания регрессии совместимы не только с конкретной гипотезой Я0: Р = Ро, но и с некоторым их множеством.
Любое значение р, совместимое с оценкой Ь, удовлетворяет условию
б-р
р-6
</кр, или _?кр<_—</кр.
Разрешив это неравенство относительно р, получим b-tKpSb<$<b + tKpSb,
т.е. доверительный интервал для величины (3.
Посредине интервала лежит величина Ъ. Границы интервала одинаково отстоят от Ь, зависят от выбора уровня значимости и являются случайными числами.
Доверительный интервал покрывает значение параметра р с заданной вероятностью (1-а), т.е.
P(b tKpSb < р < * + tKpSb) = 1 а.
ПРОВЕРКА ГИПОТЕЗЫ Н0: р = О
Пусть по выборке получена оценка коэффициента регрессии Ъ.
Гипотеза #0: Р = 0 используется для установления значимости коэффициента регрессии Ъ.
Соответствующая ґ-статистика есть оценка коэффициента регрессии, деленная на ее стандартную ошибку, т.е.
-Ь~°А
Величина / имеет распределение Стьюдента с v = п 2 степенями свободы.
Наблюдаемому (расчетному) значению критерия / соответствует определенная значимость t, которую можно вычислить в Excel с помощью функции
Значимость t = СТЬЮДРАСП(t; V; 2).
Из сравнения значимости t с заданным стандартным уровнем значимости получаем:
если значимость t больше стандартного уровня, то А незначим;
если значимость t меньше стандартного уровня, то Ь значим.
Пример 3.5. Зависимость расходов на питание у от личного дохода х по данным примера 2.5 имеет вид
у = -1,75+ 0,775*
(1,65) (0,143)
(в скобках указаны стандартные ошибки). 48
Оценим значимость коэффициента регрессии b = 0,775 и построим доверительный интервал для (3 при 5\%-ном уровне значимости.
* 0.775 е л
Наблюдаемое значение критерия t — = = 5,4.
Sfo 0,143
Значимость t = 0,0124, соответствующую расчетному значению критерия / = 5,4, определяем с помощью функции Значимость t = СТЫОДРАСП (t; V; 2), где v = 3. Поскольку значимость t 0,0124 < 0,05, то коэффициент регрессии Ъ = 0,775 значим.
При а = 0,05 критическое значение критерия /кр = 3,18 определяем с помощью функции tKp = СТЬЮДРАСПОБР (а; V). Доверительный интервал для Р
0,775 3,18 • 0,143 < р < 0,775 + 3,18 • 0,143, или 0,32 < р < 1,23. ПАКЕТ АНАЛИЗА EXCEL (ПРОГРАММА «РЕГРЕССИЯ»)
Построение линейной регрессии, оценивание ее параметров и их значимости можно выполнить значительно быстрее при использовании пакета анализа Excel (программа «Регрессия»),
Пример 3.6. Имеются данные о расходах на питание у и душевом доходе х для девяти групп семей (усл. ед.):
X | 63 | 158 | 260 | 370 | 480 | 593 | 728 | 935 | 1880 |
v ; : 1 | 43 | 62 | 90 | 111 | 130 | 149 | 165 | 191 | 241 |
Рассмотрим интерпретацию полученных результатов в общем случае (к объясняющих переменных) по данным примера 3.6.
Регрессионная статистика | |
Множественный R | 0,940 |
Я-хвадрат | 0,884 |
Нормированный Д-квадрат | 0,868 |
Стандартная ошибка | 22,87 |
Наблюдения | 9 |
В таблице Регрессионная статистика приводятся значения:
Множественный R — коэффициент множественной корреляции R Ц{*.
Д-квадрат — коэффициент детерминации R1.
4-2337
Нормированный і?-квадрат — скорректированный R2 с поправкой на число степеней свободы.
Стандартная ошибка — стандартная ошибка регрессии S.
Наблюдения — число наблюдений п.
В таблице Дисперсионный анализ приведены:
Столбец df — число степеней свободы, равное:
dfк для строки Регрессия;
1(у-у)2 Ъ(у-у)2
3. Столбец MS MS = SS/df.
факторная
остаточная
dfп-к1 для строки Остаток;
df= п-l для строки Итого.
Столбец SS — сумма квадратов отклонений, равная:
"^{y-yj1 для строки Регрессия;
для строки Остаток;
для строки Итого.
дисперсии, определяемые по формуле
для строки Регрессия; для строки Остаток.
Столбец F — расчетное значение .F-критерия, вычисляемое по формуле
F = MS (регрессия)/MS(остаток).
Столбец Значимость F — значение уровня значимости, соответствующее вычисленной /"-статистике:
Значимость F = FPACII (F-статистика; df (регрессия),• df (остаток)).
Если значимость f меньше стандартного уровня значимости, то R1 статистически значим.
В этой таблице указаны:
Коэффициенты — значения коэффициентов а, Ъ.
Стандартная ошибка — стандартные ошибки коэффициентов регрессии Sa, Sb.
t-статистиха — расчетные значения /-критерия, вычисляемые по формуле
t-статистика = Коэффициенты/Стандартная ошибка.
Р-значение (значимость t) — это значение уровня значимости, соответствующее вычисленной /-статистике:
Р-значение = СТЬЮДРАСП(t-статистика; df(остаток)).
Если Р-значение меньше стандартного уровня значимости, то соответствующий коэффициент статистически значим.
Нижние 95\% и Верхние 95\% — нижние и верхние границы 95\%-ных доверительных интервалов для коэффициентов теоретического уравнения линейной регрессии.
Вывод остатка | ||
Наблюдение | Предсказанное у | Остатки е |
1 | 72,70 | -29,70 |
2 | 82,91 | -20,91 |
3 | 94,53 | -4,53 |
4 | 105,72 | 5,27 |
5 | 117,56 | 12,44 |
6 | 129,70 | 19,29 |
7 | 144,22 | 20,77 |
8 | 166,49 | 24,50 |
9 | 268,13 | -27,13 |
В таблице Вывод остатка указаны:
Наблюдение — номер наблюдения.
Предсказанное у—расчетные значения зависимой переменной.
Остатки е — разница между наблюдаемыми и расчетными значениями зависимой переменной.
Используя результаты работы пакета анализа Excel (программа «Регрессия»), проанализируем зависимость расходов на питание от величины душевого дохода.
4*2337
Результаты регрессионного анализа принято записывать в виде
у = 65,92+ 0,107 .-с, Я2 = 0,884
(1174) (0,014)
(в скобках указаны стандартные ошибки коэффициентов регрессии).
Коэффициенты регрессии а = 65,92 и Ъ = 0,107. Направление связи между у и х определяет знак коэффициента регрессии b = 0,107, т.е. связь является прямой и положительной. Коэффициент b 0,107 показывает, что при увеличении душевого дохода на 1 усл. ед. расходы на питание увеличиваются на 0,107 усл. ед.
Оценим значимость коэффициентов полученной модели. Значимость коэффициентов (а, Ь) проверяется по ґ-тесту:
Р-значение (а) = 0,00080 < 0,01 < 0,05; Р-значение (Ь) = 0,00016 < 0,01 < 0,05.
Следовательно, коэффициенты {а, Ь) значимы при 1\%-ном уровне, а тем более при 5\%-ном уровне значимости. Таким образом, коэффициенты регрессии значимы и модель адекватна исходным данным.
Результаты оценивания регрессии совместимы не только с полученными значениями коэффициентов регрессии, но и с некоторым их множеством (доверительным интервалом). С вероятностью У5\% доверительные интервалы для коэффициентов есть (38,10-93,68) для а и (0,0728-0,142) для Ъ.
Качество модели оценивается коэффициентом детерминации Я2. Величина R2 = 0,884 означает, что фактором душевого дохода можно объяснить 88,4\% вариации (разброса) расходов на питание.
Значимость R2 проверяется по F-тесту: Значимость F= 0,00016 < 0,01 < 0,05.
Следовательно, R2 значим при 1\%-ном уровне, а тем более при 5\%-ном уровне значимости.
В случае парной линейной регрессии коэффициент корреляции можно определить как/= IR2 = 0,94. Полученное значение коэффициента корреляции свидетельствует, что связь между расходами на питание и душевым доходом очень тесная.
ВЗАИМОЗАВИСИМОСТЬ КРИТЕРИЕВ
В парном регрессионном анализе эквивалентны /-критерий для Нй р = 0; /-критерий для Н0: р = 0; f-критерий для R2:
tb = tr = 4f,
причем для критических значений критериев при любом уровне значимости
v'i/Kp v'r/кр -jrKp'
и эти критерии дают один и тот же результат.
Вывод. Проверки значимости коэффициента b в парной линейной регрессии, коэффициента корреляции г и коэффициента детерминации R2 эквивалентны.
Обсуждение Эконометрика
Комментарии, рецензии и отзывы