3.4. коэффициенты детерминации, разложение полной суммы квадратов

3.4. коэффициенты детерминации, разложение полной суммы квадратов: Эконометрика для начинающих (Дополнительные главы), Носко Владимир Петрович, 2005 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В книге рассматриваются методы статистического анализа регрессионных моделей с ограниченной (цензурированной) зависимой переменной, систем одновременных уравнений, панельных данных, а также структурных форм векторных авторегрессий ...

3.4. коэффициенты детерминации, разложение полной суммы квадратов

При анализе панельных данных возникают некоторые проблемы с определением коэффициента детерминации r2, так что во многих руководствах по эконометрике и монографиях, специально посвященных анализу панельных данных, вообще не упоминается о коэффициенте детерминации. В то же время в некоторых пакетах статистического анализа предусмотрено вычисление коэффициентов детерминации и для панельных данных.

Проблема с определением коэффициента детерминации в случае панельных данных связана с неопределенностью в отношении того, что считать полной суммой квадратов, подлежащей разложению на объясненную регрессией и остаточную суммы квадратов. Здесь мы имеем соотношение

1 NT 1 NT 1 N

SS (уг* у )2 =^г SS (уг* уг )2 + ~ S (уг у)),

nt * nt * n

=1*=1 =1*=1 =1

и в качестве полной суммы квадратов может использоваться каждая из входящих в это выражение трех сумм квадратов. Соответствующие этим полным суммам регрессионные модели объясняют:

отклонения наблюдаемых значений уй от их среднего по всем NT наблюдениям;

отклонения наблюдаемых значений у й в группах от их средних по группе;

отклонения средних по группам от среднего по всем NT наблюдениям.

Если мы используем оценку "пул", то она получается в результате применения метода наименьших квадратов к уравнению

yt = а +px,t + ut, i = N, t = 1,...,T .

При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными уit и

угt =а + в OLS Xit,

где eoLS OLS-оценка коэффициента в в модели пула. Об этом

коэффициенте детерминации говорят как о " R2 -полном" (R2-overall),

RLraii = corr2 (yit,a + eoLS xit )= corr2 (yit,Pols xu). Если мы используем оценку "между", то она получается в результате применения метода наименьших квадратов к уравнению

y =М + вХ, +V , i =N . При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными уй и

где вь - "между"-оценка для коэффициента в . Об этом

коэффициенте детерминации говорят как о " R2 -между" (R2-between),

RLween = СОГГ2 ifi + вЬ Xi , yi )= СОГГ2 (Pb Xi , yi ).

Если мы используем оценку "внутри", то она получается в результате применения метода наименьших квадратов к уравнению

Уш ~ Уг = Р{ХШ Х, )+{ХШ U, ), І = N t = 1,K,T ■

В правой части последнего уравнению отсутствует константа. А при OLS-оценивании уравнений вида zг = pw г + vг коэффициент детерминации в общем случае не равен квадрату выборочного коэффициента корреляции между переменными zi = p wг и zг ■ Однако если переменные zг и wг центрированы, так что z = w = 0 , то такое равенство обеспечивается. В нашем случае переменные Уй У г и xit xi центрированы, так что коэффициент детерминации, получаемый при оценивании уравнения в отклонениях от средних по группам равен квадрату (выборочного) коэффициента корреляции между переменными у it = yit у и

Угі =PCV (X,t Хг К г= ^ t = 1,K,T ,

где pCV "внутри"-оценка для коэффициента p ■ Об этом

коэффициенте детерминации говорят как о " R2 -внутри" (R2wi thin),

Rw,th,n = СОГГ 2 [pCV іХгі X г ), y,t y, )^

Каждый из этих трех вариантов R2 является обычным коэффициентом детерминации в соответствующей модели регрессии. В то же время при анализе различных моделей панельных данных часто сообщаются вычисленные значения всех трех вариантов R2 , несмотря на то, что в модели с фиксированными эффектами используется оценка pCV, в модели со случайными

эффектами оценка J3GLS , а в модели пула оценка j3OLS ■

Более точно, при анализе панельных данных принято сообщать

под названиями Rw,h,n , Rbeween , RLrall значения Rlith,n = СОГГ 2 (y,t Уг , в (Хгі X, )), RLtween = СОГГ 2 , в Хг ), Rlerall = СОГГ 2 , в Хгt ),

вне зависимости от того, каким образом была получена оценка в . Если в является p -мерным вектором, то, соответственно,

Rlithin = corr 2 ІУи Уг , {Xit xi У в), RLtween = СОГГ 2 (Уг , XI в), RleraU = СОГГ 2 (yu , XTt в).

При этом приводимое значение ІЇ^шп является коэффициентом детерминации в обычном смысле, если в = вмыып; приводимое значение Rbetween является коэффициентом детерминации в обычном смысле, если в = вышт '> приводимое значение ROvemu является коэффициентом детерминации в обычном смысле, если в = в oLS .

П р и м е р (продолжение)

Приведем результаты оценивания в пакете Stata8 моделей с фиксированными и случайными эффектами для данных о трех предприятиях. При этом заметим, что в рамках этого пакета приняты обозначения, отличающиеся от используемых нами: индивидуальные эффекты обозначаются как ui , а случайные ошибки как ett. Чтобы избежать путаницы, в приводимые далее протоколы оценивания внесены соответствующие изменения.

Fixed-effects (within) regression

R-sq:

within = 0.9478

between = 0.8567

overall = 0.9209

Проверка значимости регрессии в целом: F(1,26) = 472.26, Prob > F = 0.0000

Оцененное значение коэффициента индивидуальным эффектом и переменной x

корреляции

между

sigma_alfa

1.480319

sigma_u

1.745136

rho

.4184474 (fraction of variance due to a i)

F test that all alfa i=0:

F(2, 26) = 6.81, Prob > F = 0.0042

линейными

Последний критерий соответствует

постоянная

гипотезе с двумя

ограничениями: поскольку в модель включена составляющая, то одно линейное ограничение накладывается заранее как идентифицирующее и не подлежащее проверке.

Random-effects GLS regression

R-sq:

within=0.9478 between=0.8567

u i ~ Gaussian

overall= 0.9209

У

Coef.

Std. Err.

z

P>z

x

1.058959

.0586557

18.05

0.000

cons

-.7474755

.955953

-0.78

0.434

В то же время, если в рамках модели со случайными эффектами применить критерий Бройша-Пагана для проверки гипотезы об отсутствии таковых эффектов, т.е. гипотезы H0 :а2а = 0, то полученное значение статистики критерия равно 8.47. Этому значению соответствует рассчитанное по асимптотическому распределению хи-квадрат с 1 степенью свободы і5-значение 0.0036. Но это говорит против гипотезы H0. И опять это можно объяснить малым количеством наблюдений ведь распределение хи-квадрат здесь только асимптотическое.

В пакете Stata8 есть возможность оценить модель со случайными эффектами, не прибегая к GLS-оцениванию, а используя метод максимального правдоподобия. Это дает следующие результаты:

Random-effects ML regression Random effects: a_i ~ Gaussian Log likelihood = -61.09837

Likelihood-ratio test of sigma alfa=0:

chibar2(01) = 4.70, Prob>=chibar2 = 0.015

По этому критерию гипотеза H0 :о2а = 0 отвергается.

Эконометрика для начинающих (Дополнительные главы)

Эконометрика для начинающих (Дополнительные главы)

Обсуждение Эконометрика для начинающих (Дополнительные главы)

Комментарии, рецензии и отзывы

3.4. коэффициенты детерминации, разложение полной суммы квадратов: Эконометрика для начинающих (Дополнительные главы), Носко Владимир Петрович, 2005 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В книге рассматриваются методы статистического анализа регрессионных моделей с ограниченной (цензурированной) зависимой переменной, систем одновременных уравнений, панельных данных, а также структурных форм векторных авторегрессий ...