3.4. коэффициенты детерминации, разложение полной суммы квадратов
3.4. коэффициенты детерминации, разложение полной суммы квадратов
При анализе панельных данных возникают некоторые проблемы с определением коэффициента детерминации r2, так что во многих руководствах по эконометрике и монографиях, специально посвященных анализу панельных данных, вообще не упоминается о коэффициенте детерминации. В то же время в некоторых пакетах статистического анализа предусмотрено вычисление коэффициентов детерминации и для панельных данных.
Проблема с определением коэффициента детерминации в случае панельных данных связана с неопределенностью в отношении того, что считать полной суммой квадратов, подлежащей разложению на объясненную регрессией и остаточную суммы квадратов. Здесь мы имеем соотношение
1 NT 1 NT 1 N
SS (уг* у )2 =^г SS (уг* уг )2 + ~ S (уг у)),
nt * nt * n
=1*=1 =1*=1 =1
и в качестве полной суммы квадратов может использоваться каждая из входящих в это выражение трех сумм квадратов. Соответствующие этим полным суммам регрессионные модели объясняют:
отклонения наблюдаемых значений уй от их среднего по всем NT наблюдениям;
отклонения наблюдаемых значений у й в группах от их средних по группе;
отклонения средних по группам от среднего по всем NT наблюдениям.
Если мы используем оценку "пул", то она получается в результате применения метода наименьших квадратов к уравнению
yt = а +px,t + ut, i = N, t = 1,...,T .
При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными уit и
угt =а + в OLS Xit,
где eoLS OLS-оценка коэффициента в в модели пула. Об этом
коэффициенте детерминации говорят как о " R2 -полном" (R2-overall),
RLraii = corr2 (yit,a + eoLS xit )= corr2 (yit,Pols xu). Если мы используем оценку "между", то она получается в результате применения метода наименьших квадратов к уравнению
y =М + вХ, +V , i =N . При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными уй и
где вь - "между"-оценка для коэффициента в . Об этом
коэффициенте детерминации говорят как о " R2 -между" (R2-between),
RLween = СОГГ2 ifi + вЬ Xi , yi )= СОГГ2 (Pb Xi , yi ).
Если мы используем оценку "внутри", то она получается в результате применения метода наименьших квадратов к уравнению
Уш ~ Уг = Р{ХШ Х, )+{ХШ U, ), І = N t = 1,K,T ■
В правой части последнего уравнению отсутствует константа. А при OLS-оценивании уравнений вида zг = pw г + vг коэффициент детерминации в общем случае не равен квадрату выборочного коэффициента корреляции между переменными zi = p wг и zг ■ Однако если переменные zг и wг центрированы, так что z = w = 0 , то такое равенство обеспечивается. В нашем случае переменные Уй У г и xit xi центрированы, так что коэффициент детерминации, получаемый при оценивании уравнения в отклонениях от средних по группам равен квадрату (выборочного) коэффициента корреляции между переменными у it = yit у и
Угі =PCV (X,t Хг К г= ^ t = 1,K,T ,
где pCV "внутри"-оценка для коэффициента p ■ Об этом
коэффициенте детерминации говорят как о " R2 -внутри" (R2wi thin),
Rw,th,n = СОГГ 2 [pCV іХгі X г ), y,t y, )^
Каждый из этих трех вариантов R2 является обычным коэффициентом детерминации в соответствующей модели регрессии. В то же время при анализе различных моделей панельных данных часто сообщаются вычисленные значения всех трех вариантов R2 , несмотря на то, что в модели с фиксированными эффектами используется оценка pCV, в модели со случайными
эффектами оценка J3GLS , а в модели пула оценка j3OLS ■
Более точно, при анализе панельных данных принято сообщать
под названиями Rw,h,n , Rbeween , RLrall значения Rlith,n = СОГГ 2 (y,t Уг , в (Хгі X, )), RLtween = СОГГ 2 , в Хг ), Rlerall = СОГГ 2 , в Хгt ),
вне зависимости от того, каким образом была получена оценка в . Если в является p -мерным вектором, то, соответственно,
Rlithin = corr 2 ІУи Уг , {Xit xi У в), RLtween = СОГГ 2 (Уг , XI в), RleraU = СОГГ 2 (yu , XTt в).
При этом приводимое значение ІЇ^шп является коэффициентом детерминации в обычном смысле, если в = вмыып; приводимое значение Rbetween является коэффициентом детерминации в обычном смысле, если в = вышт '> приводимое значение ROvemu является коэффициентом детерминации в обычном смысле, если в = в oLS .
П р и м е р (продолжение)
Приведем результаты оценивания в пакете Stata8 моделей с фиксированными и случайными эффектами для данных о трех предприятиях. При этом заметим, что в рамках этого пакета приняты обозначения, отличающиеся от используемых нами: индивидуальные эффекты обозначаются как ui , а случайные ошибки как ett. Чтобы избежать путаницы, в приводимые далее протоколы оценивания внесены соответствующие изменения.
Fixed-effects (within) regression
R-sq:
within = 0.9478
between = 0.8567
overall = 0.9209
Проверка значимости регрессии в целом: F(1,26) = 472.26, Prob > F = 0.0000
Оцененное значение коэффициента индивидуальным эффектом и переменной x
корреляции
между
sigma_alfa | 1.480319 |
sigma_u | 1.745136 |
rho | .4184474 (fraction of variance due to a i) |
F test that all alfa i=0:
F(2, 26) = 6.81, Prob > F = 0.0042
линейными
Последний критерий соответствует
постоянная
гипотезе с двумя
ограничениями: поскольку в модель включена составляющая, то одно линейное ограничение накладывается заранее как идентифицирующее и не подлежащее проверке.
Random-effects GLS regression
R-sq:
within=0.9478 between=0.8567
u i ~ Gaussian
overall= 0.9209
У | Coef. | Std. Err. | z | P>z |
x | 1.058959 | .0586557 | 18.05 | 0.000 |
cons | -.7474755 | .955953 | -0.78 | 0.434 |
В то же время, если в рамках модели со случайными эффектами применить критерий Бройша-Пагана для проверки гипотезы об отсутствии таковых эффектов, т.е. гипотезы H0 :а2а = 0, то полученное значение статистики критерия равно 8.47. Этому значению соответствует рассчитанное по асимптотическому распределению хи-квадрат с 1 степенью свободы і5-значение 0.0036. Но это говорит против гипотезы H0. И опять это можно объяснить малым количеством наблюдений ведь распределение хи-квадрат здесь только асимптотическое.
В пакете Stata8 есть возможность оценить модель со случайными эффектами, не прибегая к GLS-оцениванию, а используя метод максимального правдоподобия. Это дает следующие результаты:
Random-effects ML regression Random effects: a_i ~ Gaussian Log likelihood = -61.09837
Likelihood-ratio test of sigma alfa=0:
chibar2(01) = 4.70, Prob>=chibar2 = 0.015
По этому критерию гипотеза H0 :о2а = 0 отвергается.
Обсуждение Эконометрика для начинающих (Дополнительные главы)
Комментарии, рецензии и отзывы