Лекция № 5. определение качества модели регрессии. проверка гипотез о значимости коэффициентов регрессии, корреляции и уравнения парной регрессии
Лекция № 5. определение качества модели регрессии. проверка гипотез о значимости коэффициентов регрессии, корреляции и уравнения парной регрессии
Качество модели регрессии — адекватность построенной модели исходным (наблюдаемым) данным.
Качество парной линейной регрессии определяется с помощью парного линейного коэффициента корреляции:
xy — xy Cov (x, y)
* G (x )G (y) G (x)G( y)'
где G(x) — среднеквадратическое отклонение независимого признака;
G(y) — среднеквадратическое отклонение зависимого признака. Коэффициент парной линейной корреляции можно рассчитать через МНК-оценку параметра уравнения регрессии в:
r =~0^. yx G (y)
Парный коэффициент корреляции показывает тесноту связи между изучаемыми признаками. Он изменяется в пределах [ — 1; + 1]. Если ryx Є [0; + 1] то связь между признаками прямая. Если ryx Є [ — 1; 0], то связь между признаками обратная. Если ryx= 0, то связь между признаками отсутствует. Если ryx = 1 или C = —1,то связь между изучаемыми признаками является функциональной, т. е. характеризуется полным соответствием между x и y. Чем ближе xy к 1, тем более тесной считается связь между изучаемыми признаками.
Парный коэффициент корреляции определяется для количественных переменных.
Если парный линейный коэффициент корреляции ryx возвести в квадрат, то получим коэффициент детерминации r2yx. Данный коэффициент показывает, на сколько процентов вариация результативного признака объясняется вариацией факторного признака в общем объеме вариации.
Чтобы оценить качество линейной множественной модели регрессии, необходимо воспользоваться теоремой о разложении дисперсий.
Общая дисперсия зависимой переменной может быть разложена на две составляющие — объясненную и необъясненную построенным уравнением регрессии дисперсии:
G 2( у) = о у) + д у),
n
где V(у _ у )2 — объясненная с помощью по2/"„■>_ i=1
строенного уравнения регрессии дисперсия переменной у;
n
— необъясненная или осVе' таточная дисперсия пере^2 (у) = ;=1 менной у. n
С помощью данной теоремы можно рассчитать множественный коэффициент корреляции между результативным признаком у и несколькими факторными признаками x
у G 2( у)
Множественный коэффициент корреляции показывает тесноту связи между результативным и факторными признаками. Трактовка его значений аналогична трактовке значений парного линейного коэффициента корреляции.
Квадрат множественного линейного коэффициента корреляции называется теоретическим коэффициентом детерминации:
у G 2( у)
Этот коэффициент показывает, на сколько процентов вариация результативного признака объясняется вариацией факторных признаков x. Величина 1 _ Ну2 показывает ту долю вариации результативного признака, которую модель регрессии учесть не смогла.
Среднеквадратическая ошибка (Mean square error — MSE) уравнения регрессии схожа по построению с показателем сред-неквадратического отклонения:
MSE
n _h
где h — число параметров уравнения регрессии.
Показатель средней ошибки аппроксимации рассчитывается по формуле:
Максимально допустимым значением данного показателя считается 12—15\%. Если средняя ошибка аппроксимации составляет менее 6—7\%, то качество модели считается хорошим.
Обсуждение Эконометрика.Конспект лекций
Комментарии, рецензии и отзывы