2. пример проверки гипотезы о значимости коэффициентов парной регрессии и уравнения регрессии в целом
2. пример проверки гипотезы о значимости коэффициентов парной регрессии и уравнения регрессии в целом
На основании исходных данных по двадцати банкам страны о размере прибыли в денежных единицах (результативная переменная) и объемах выданных кредитов в денежных единицах (факторная переменная) было построено уравнение парной регрессии вида:
y = 25,65 + 0,1 x(x 220 ).
При проверке значимости (предположения того, что параметры отличаются от нуля) коэффициента регрессии выдвигается основная гипотеза H0 о незначимости полученной оценки: н0 / Л = 0.
Альтернативной (или обратной) выдвигается гипотеза о значимости коэффициента регрессии: Н1/ в1 ^ 0.
Для проверки выдвинутых гипотез используется t-критерий (t-статистика) Стьюдента.
Формула наблюдаемого значения t-критерия Стьюдента для проверки гипотезы H0 / в1 = 0 имеет вид:
t =^
где Iе 1 — оценка параметра регрессии
— величина стандартной ошибки параметра регрессии /|. В случае парной линейной модели регрессии показатель вычисляется таким образом:
i=1
(n 2)х J(x, x)2
i=1
Числитель стандартной ошибки может быть рассчитан через парный коэффициент детерминации как:
nn
1>2 = £ (у у )) = nxG 2(у) х (1 rX),
где G2(y) — общая дисперсия зависимого признака;
ryx — парный коэффициент детерминации между зависимым и независимым признаками.
Рассчитаем общую дисперсию результативного признака по исходным данным:
G 2(у) = у2 у2 = 721,55-657,92 =63,63. Тогда стандартная ошибка будет равна:
Iе2
(n2)xJ(x( x)2
= /20х 63,63х(1-0,85 ) = (20 2 )х170 =
i=1
190,89 3060
=0,053
Рассчитаем наблюдаемое значение t-критерия:
t6=^~ = = 1,88.
набл со{ 0,053 '
Критическое значение t-критерия tKpum(a; n — h), где а — уровень значимости, (n — h) — число степеней свободы, определяется по таблице распределений t-критерия Стьюдента.
В данном случае tKpum(a; n — h) = Срит(0,05; 20 — 2) = 1,73.
Наблюдаемое значение t-критерия по модулю больше его критического значения, т. е. Ha6j > tKpum. Таким образом, коэффициент парной регрессии оказался значимым.
Проверим значимость уравнения регрессии через проверку гипотезы о значимости парного коэффициента детерминации.
Основная гипотеза формулируется как H0 / r2yx = 0 — парный коэффициент детерминации незначим, и, следовательно, уравнение регрессии также является незначимым.
Альтернативная ей гипотеза H1 / r2^ ^ 0 — парный коэффициент детерминации значимо отличается от нуля, следовательно, построенное уравнение регрессии является значимым.
Рассчитаем коэффициент детерминации как квадрат парного коэффициента корреляции: r2yx= 0,852 = 0,7225.
Для проверки гипотезы о значимости уравнения регрессии в целом используется F-критерий Фишера.
Критическое значение F-критерия находится по таблице распределения Фишера — Снедекора в зависимости от уровня значимости а и числа степеней свободы: к1 = h — 1 и k2 = n — h. В случае проверки значимости уравнения парной регрессии критическое значение F-статистики вычисляется как (а; 1; n — 2). В нашем примере
FKpum (а; 1; n — 2)= (0,05; 1; 18) = 4,41.
Формула наблюдаемого значения F-критерия для проверки гипотезы о незначимости парного уравнения регрессии имеет вид:
r2 0 7225
=^т x(n — 2) = 0,7225 х 18 = 46,84. набл 1 — r2 V ; 1 — 0,7225 '
ух >
Наблюдаемое значение F-критерия оказалось больше его критического значения, следовательно, линейное уравнение парной регрессии является значимым.
Построенное уравнение регрессии между получаемой прибылью и объемом выдаваемых кредитов на 72,25\% объясняет вариацию зависимой переменной в общем объеме ее вариации. 27,75\% дисперсии зависимой переменной остались необъяснен-ными.
Модель множественной регрессии является методом выявления аналитической формы связи между зависимым (или результативным) признаком и несколькими независимыми (или факторными) переменными. Ее построение целесообразно в том случае, если коэффициент множественной корреляции показал наличие связи между переменными.
Общий вид линейного уравнения множественной регрессии:
где yi — значение i-ой зависимой переменной, i = 1, п; x1k, „., xjk — значения независимых переменных; во, вп — параметры уравнения регрессии, подлежащие оценке;
єл — случайные ошибки множественного уравнения регрессии. Модель нормальной линейной множественной регрессии строится исходя из следующих предпосылок:
величины xlp xkjявляются неслучайными и независимыми переменными;
математическое ожидание случайной ошибки уравнения регрессии равно нулю во всех наблюдениях: Е(є1) = 0, где i = 1,п;
дисперсия случайной ошибки уравнения регрессии является постоянной для всех наблюдений: ^(є;) = Е(є2;) = const;
случайные ошибки уравнения регрессии не коррелированы между собой, т. е. ковариация случайных ошибок любых двух разных наблюдений равна нулю: Єоу(єі ,є,) = Е(є, є,) = 0. Это
1 J 1 J
предположение верно в том случае, если изучаемые данные не являются временными рядами;
основываясь на 3 и 4-м предположениях, добавляется условие о том, что случайная ошибка уравнения регрессии является случайной величиной, подчиняющейся нормальному закону распределения с нулевым математическим ожиданием и дисперсией G2 / єл~ N(0,G2).
Обсуждение Эконометрика.Конспект лекций
Комментарии, рецензии и отзывы