1.5. «обратная» модель прямолинейной связи
1.5. «обратная» модель прямолинейной связи
Пусть наша задача состоит в оценивании модели прямолинейной связи между некоторыми переменными x и y на основе наблюдений n пар [xt,yi), i = 1,...,n, значений этих переменных. Мы уже рассмотрели вопрос об оценивании параметров такой связи, исходя из модели наблюдений yi =[а + J3 xi) + £ і, i = 1,...,n . Что изменится, если мы будем
исходить из «обратной» модели xi =(а + ft yi) + є i, i = 1, ..., n ?
Пусть axy ,j3xy — оценки параметров а и /3 в модели наблюдений xi =(а + /3 yi) + st, і 1,...,n, a ayx ,j3yx — оценки
параметров в модели наблюдений
yi ={а + /3 xi) + £ і , i = 1,..., n. Тогда
2
n ,n = Cov (x, y) _ Cov (x, y) Pxy'Pyx Var (y) ' Var (x)
Cov(x,y)
ylVar (y )V Var (x ).
В то же время, по первой модели наблюдений мы получаем наилучшую прямую
x = <*xy + Рxyy ,
а по второй — прямую
y = <*yx + Pyxx .
Первую прямую мы можем записать в виде а 1
xy 1
y = —x— + -— x .
Pxy Pxy
Сравнивая коэффициенты при x в двух последних уравнениях, находим, что эти коэффициенты равны в том и только в том случае, когда выполнено соотношение
1
Pyx ~Т '
xy
т. е.
Р yx -Р xy = 1 ,
или, с учетом предыдущего, когдаR2 = 1. Что касается отрезков на осях, то они будут совпадать тогда и только тогда, когда сс
аyx =~~/?_ '
xy
или
^yx 'Pxy — ~&xy .
Но
a yx = y -Pyxx, так что
л, л, л, л, л, л.
Я yx 'Pxy = (y ~ Pyxx )P xy = yP xy PyxP xyx .
При R2 = 1 получаем
Я yx 'Pxy = yPxy x .
В то же время,
«xy =~x + Pxyy ,
так что при R2 = 1 совпадают и отрезки на осях, т. е. наилучшая прямая одна и та же при обеих моделях наблюдений, и это есть прямая, на которой расположены все наблюдаемые точки (xt,yi), i = 1,...,n.
Иными словами, наилучшие прямые, построенные по двум альтернативным моделям, совпадают в том и только в том случае, когда все точки (x,,yi), i = 1,...,n , расположены на
одной прямой (так что e1,...,en = 0); при этом, R2 = 1. В противном случае, R2 Ф 1 и подобранные «наилучшие» прямые имеют разные угловые коэффициенты.
Кстати, в рассмотренном нами примере с уровнями безработицы, диаграмма рассеяния с переставленными осями (соответствующими модели наблюдений
xi ={а + /3 yi) + є і, i = 1,...,n ) имеет вид
Рис.5
7,5 т
5,5
2,8
3,1
3,4
BEL
Количество точек с совпадающими знаками отклонений координат от средних значений равно 10 (4+ 6, сучетомсов-падений), а число точек с противоположными знаками отклонений координат от средних значений равно 7 (4+3, сучетом совпадений). Соответственно, «облако точек» имеет некоторую вытянутость вдоль наклонной прямой, проведенной через «центр» облака. «Наилучшая» прямая имеет вид
x = 1.291 + 1.695y;
коэффициент детерминации равен R2 = 0.212374.
Произведение угловых коэффициентов 0.125265 и 1.695402 наилучших прямых в «прямой» и «обратной» моделях наблюдений равно 0.212374 и совпадает со значением R2.
Отметим, что несовпадение наилучших прямых, конечно, связано с тем, что в этих двух альтернативных моделях наблюдений мы минимизировали различные суммы квадратов: в «прямой» модели мы минимизировали сумму квадратов отклонений точек от подбираемой прямой в направлении, параллельном оси y, а во втором — в направлении, параллельном
оси x.
Обсуждение Институт экономики переходного периода
Комментарии, рецензии и отзывы