3.3. случайные эффекты
3.3. случайные эффекты
Запишем модель
yt =a+Pxu + u,t, г = І*--^ t = l"^ T , соответствующую гипотезе H1 , в равносильном виде:
yit =M + ai +ex,t + u,t,
N
где 2] a = 0 (при таком условии ai называют
i=1
дифференциальными эффектами). В ряде ситуаций N субъектов, для которых имеются статистические данные, рассматриваются как случайная выборка из некоторой более широкой совокупности (популяции), и исследователя интересуют не конкретные субъекты, попавшие в выборку, а обезличенные субъекты, имеющие заданные характеристики. Соответственно, в таких ситуациях предполагается, что a являются случайными величинами, и мы говорим тогда о модели
у и =M + a+ex и + uu как о модели со случайными эффектами (random effects). В такой модели a уже не интерпретируются как значения некоторых фиксированных параметров и не подлежат оцениванию. Вместо этого оцениваются параметры распределения случайных величин
a.
Обозначая vit = a + uit, получаем другую запись такой модели:
уи =M + ex,t + (щ + uit ) = М + Д xit + у* . В такой форме модели ошибка vjt состоит из двух компонент a и ujt. Как и в модели с фиксированными эффектами, случайные эффекты ai также отражают наличие у субъектов исследования
некоторых индивидуальных характеристик, не изменяющихся со временем в процессе наблюдений, которые трудно или даже невозможно наблюдать или измерить. Однако теперь значения этих характеристик встраиваются в состав случайной ошибки, как это делается в классической модели регрессии, в которой наличие случайных ошибок интерпретируется как недостаточность включенных в модель объясняющих переменных для полного объяснения изменений объясняемой переменной. К прежним предположениям о том , что uit~ i.i.d.N(0,a2), i = 1,...,N, t = 1,...,T, и E(xjtuJs) = 0 для любых i, j = 1,...,N, t,s = 1,...,T ,
(это означает, что последовательность значений a1,k,aN
представляет случайную выборку из распределения N (о, стЦ2)),
Е(хиа}) = 0,i, j = N, t = T ,
(так что E(xuVjS) = 0, и в модели со случайными ошибками vu
переменная х является экзогенной переменной). Если предположить еще, что
Е(ииаг)=00,
то тогда условная относительно хй дисперсия случайной величины уй равна
D(yuxlt) = D(vitxit) = D(vit) = D(a, + uit ) = a2a + a2. Таким образом, дисперсия yit складывается из двух некоррелированных компонент; их называют компонентами дисперсии, а саму модель называют
моделью компонент дисперсии;
однофакторной моделью компонент дисперсии;
стандартной моделью со случайными эффектами (RE модель random effects model).
В векторной форме эта модель имеет вид yi = [exi ]S+vt,
где
(1" | л il | (Vi1 ] | |||||
yi = | yi 2 | , e = | 1 | xi 2 | |||
{ yiT J | { xiT J |
Заметим, что
ы ы °a + если t = s,
I aa, если t Ф s,
ковариационная матрица
так что случайные величины vit и vs коррелированы даже если некоррелированы ошибки u it, случайного вектора vt имеет вид
V = E(v,vJ It +ОІ eeT . Например, при T = 3
V
*u + *a *a
*a *u + *a
2 2
і ^-2
При этом
2
Corr{vu ,vls ) = 2 a—r = p для всех t Ф s
(предположение равной коррелированности в модели компонент дисперсии).
Оценивание
В RE-модели оценка
N T
^H(xit xi )yit yi)
PCV = NT
i =1t =1
остается несмещенной и состоятельной оценкой для р . Однако она
перестает быть эффективной оценкой (BLUE), как это было в модели с фиксированными эффектами, поскольку не учитывает коррелированность vjt во времени для субъекта i.
Мы можем ожидать, что обобщенная оценка наименьших квадратов (GLS-оценка), учитывающая такую коррелированность,
будет более эффективной. Заметим, что GLS-оценка для 8 имеет
вид
V-1 =
1
N T
л §§(x't -x Wit -у )
= i=1 t =1
N T
i =1t =1
где
1 NT 1 NT
Г = NT § § y;' r = NT § § 4.
Это выражение можно представить в виде где
T
§ ((i x її, У)
Дь = 1 1 "межгрупповая" оценка (между
i =1
оценка, between-group estimate), соответствующая регрессии средних значений у на константу и средние значения xi, т.е.
yi =Ju + exi +v~i
("модель для групповых средних"), и игнорирующая внутригрупповую изменчивость,
N
i =1
w =—— .
§§(xit -X)) + 4>§ft -x))
i=1t=1 i=1 Таким образом, обобщенная оценка наименьших квадратов eGLS в RE-модели учитывает и внутригрупповую и межгрупповую изменчивость. Она является взвешенным средним "межгрупповой" оценки Дь (учитывающей только межгрупповую изменчивость) и
"внутригрупповой" оценки pCV (учитывающей только внутригрупповую изменчивость), а w измеряет вес, придаваемый межгрупповой изменчивости. При сделанных предположениях обе
оценки /Зь и /3CV состоятельны, так что состоятельна и сама J3GLS . Если T — оо, то Ч — 0, w — 0 и
Pgls — Pcv ,
так что при больших T оценки для в, получаемые в рамках моделей фиксированных и случайных эффектов, эквивалентны.
Если о2а — 0, то Ч — 1 и V = e(vivt )=alIt + 02аeeT —>оIt . Соответственно, при этом GLS-оценка переходит в OLS-оценку, т.е.
N T
^^{хи -xЇУи -y)
1^GLS — N T = в
i=1 t=1
(в пределе нет никаких эффектов). Заметим далее, что
d(Pgls ) = —
°1
i=1 t=1 i =1
В то же время
П(всу )= aU
N T
ZZfexi)2
i=1 t=1
Поскольку Ч > 0, то из двух последних соотношений следует, что
d(0gls )< d(0cv ), т.е. GLS-оценка эффективнее. Она эффективнее оценки pCV именно потому, что использует как информацию о внутригрупповой изменчивости, так и информацию о межгрупповой изменчивости.
Чтобы реализовать эту GLS, т.е. получить доступную GLS-оценку (FGLS feasible GLS, или EGLS estimated GLS), надо подставить в выражения для *Р (и в) подходящие оценки для сг2 и
<*1 + Тої
Оценить о2и можно, используя внутригрупповые остатки
ІУи Уі )-Pcv(xit xi )>
полученные при оценивании модели, скорректированной на индивидуальные средние:
О2 = j=u=^
N(X і)1
(в знаменателе число степеней свободы равно количеству наблюдений NT минус количество оцениваемых параметров N +1).
Оценить дисперсию Оа случайных эффектов оа = D(ai) можно, заметив, что при оценивании модели yi = f + в xt + vi, приводящей к межгрупповой оценке
Т
Z (xix )yiy)
вb =
_ i =1
b
Z (xix )2
i =1
дисперсия
остатка для i -й группы равна
D{yl -ft ь в)=ои2/ T + a2a
Состоятельной оценкой для о21Т + О2а является
N I- " V
N — 2
i =1
Поэтому состоятельной оценкой для о2а служит
а N — 2
N
а2 + Tol = T —
N—2
является состоятельной оценкой для а"2 + To2a. Эти две оценки используют межгрупповые остатки. Они являются также оценками максимального правдоподобия соответствующих дисперсий.
Следует только отметить, что, особенно при небольших значениях N и T , значение вычисленной указанным образом оценки дисперсии о2а может оказаться отрицательным.
З а м е ч а н и е
Внутригруповую и GLS-оценки можно получить в пакете STATA, используя команду xtreg (с опциями fe или re).
Как мы уже отмечали выше, J3GLS можно представить в виде
Pols = wPb + (1 — w)Pcv , так что j3GLS является линейной комбинацией "внутри" и "между" оценок. Эта линейная комбинация оптимальна. Поэтому, например, оценка fiOLS, также являющаяся линейной комбинацией этих
двух оценок (при У = 1), хотя и состоятельна, но менее эффективна.
Критерий Бройша-Пагана для индивидуальных эффектов.
Это критерий для проверки в рамках RE-модели (со стандартными предположениями) гипотезы
H0.a1a = 0 (сведение к модели пула). Идея критерия основана на тождестве
N ( T Л2 NT N
i =1 =1
i =1 s*t
из которого следует , что
2
ZIZ'
i
ZZusuit
i =1
i =1 s&
ZZu2 ZZu2
i =1 =1 i =1 =1
При отсутствии автокоррелированности случайных ошибок ий правая часть последнего равенства мала. Поэтому статистику критерия можно основывать на выражении, стоящем в левой части, в которое вместо ненаблюдаемых значений ий подставляются
остатки uit, полученные при OLS-оценивании модели пула. Против гипотезы H0 говорят "слишком большие" значения
Г
N ( T
i =1 { t=1
N T
Y
— 1
2
EE" I
i =1 =1
Статистика критерия Бройша-Пагана
при гипотезе h0 имеет асимптотическое распределение X ()• Соответственно, гипотеза H0 отвергается, если наблюдаемое значение статистики BP превышает критическое значение, рассчитанное по распределению X ()•
Обсуждение Эконометрика для начинающих (Дополнительные главы)
Комментарии, рецензии и отзывы