Тема 3.4 несбалансированные панели, эндогенные объясняющие переменные, модели с индивидуально-специфическими переменными
Тема 3.4 несбалансированные панели, эндогенные объясняющие переменные, модели с индивидуально-специфическими переменными
Несбалансированные панели
Сосредоточимся на однофакторной модели. Такая модель могла бы включать временные дамми как фиксированные эффекты. До сих пор мы предполагали, что
|=1, /=1,...,Г,
так что в каждый из Т моментов времени имеются данные обо всех N субъектах, участвующих в анализе. В таких случаях говорят о сбалансированной панели (balancedpanel). Теперь рассмотрим модель
n
yit=ju + at+fixit+uit9 i = l9...9N9 t = l9...9Ti9 £аг=0,
/=і
в которой количество наблюдений для разных субъектов может быть различным. В этом случае говорят о несбалансированной панели (unbalanced panel).
Основными результатами для несбалансированных панелей являются следующие:
О/^-оценка та же, что и раньше, и она является BLUE, если crj = 0;
внутригрупповая (CV) оценка в основных чертах та же, что и ранее, хотя у( и xt вычисляются по периодам времени разной длины для разных субъектов;
«между»-оценка также в основном сохраняется, только средние вычисляются по Ti наблюдениям для субъекта /;
преобразование переменных для получения GLS-оценки здесь имеет вид:
У и =Уа ~віУі>
Xit ~Xit ~~ @iXi>
Ч t= Т-і t= сти+Тіста
т.е. 0t изменяется от субъекта к субъекту.
Эндогенные объясняющие переменные
Рассмотрим модель с несколькими объясняющими переменными, часть из которых являются эндогенными:
Уги=УиУ + хиР + аі+Щ> i = l9...,N, / = 1,...,Г,
где ухи — вектор-строка gx эндогенных переменных; хи — вектор-строка кх экзогенных переменных; уи /3 — векторы-столбцы размерностей gx икх.
Пусть zit — вектор-строка к2 инструментальных переменных, к2 > gx, так что E(zit uit) = 0. Обозначим:
Ун =ГІЬ» Ум = тУ£Уи<> = ^ZX*>
j n t j n t j n t
л^Цл». u=t^X5>i*> *=т^Х5>*іуі /=і t= iyi i=i r=i /=i *=i
Оценив методом инструментальных переменных (метод IV) «внутри»-регрессию
(У at Ун) = (У га У и) У + (** " */)/? + (и а ~ Щ \%
получим ІУ-«внутри»-оценки (IV within estimators) yIVW, J3IVW. Оценив методом инструментальных переменных «между»-регрессию
(Ун ~Уг) = (Уи -У)У + {*і-x)P + (ut-її),
получим ІУ-«между»-оценку (IV between estimator) yIVB.
Например, если k2 = gx = 1,kx = 0, так что j/2/, =ylity+ at + uin то
n t
_ /=1 t= У WW ~ t~
n
Х^д
i= t=l
n
Если E(YUt а і) = О, то более эффективна оценка со случайными эффектами. Чтобы получить ее, используем преобразование переменных:
У га =ynt ~ вУт Ухи =Ум ~ вУи> їїії=иії-вїїі9 zit=zit-6zi9
где
N Т
Z Z «Ум Уи) (Ум У и )rivw f
.2 і=1 t=l
NT-N
N
Т^(у2і-Уиїіув)2
л2 /=1
°и +Т(7а =
N
Применим метод IV к уравнению ylit = Уі(у + uit, используя в качестве
инструментов zit -zi^zi или zir
Более общим образом, пусть 8[у ft] — вектор-строка размерности {gx + кх). На практике приходится применять метод IV (2SLS) трижды:
для получения Slvw
для получения SIVB;
в результате этих двух шагов получают оценки &1 и а2 + Та2, которые используются для преобразования модели;
реализуя метод IV для преобразованной модели.
ПРИМЕР 3.4.1
Для исследования зависимости заработной платы женщин от различных факторов были взяты данные из National Longitudinal Survey, Youth Sample, США, no N = 4134 молодым женщинам, находившимся в 1968 г. в возрасте от 14 до 26 лет. Наблюдения проводились с 1968 по 1988 г. Однако данные неполные: по отдельным субъектам количество наблюдений изменялось от 1 до 12 (в среднем 4.6 наблюдения для одного субъекта).
Рассмотрим сначала модель с фиксированными эффектами:
In wit = Д tenure + /?2 age + /?3 age! + /?4 notsmsa +
+ J35 union + P6 south + /и + (Х;+ии, i = l9...9N9 t = ,...,T, где wit — размер заработной платы;
tenure — продолжительность (стаж) работы на наблюдаемом рабочем
месте; age — возраст;
notsmsa — проживание вне столичных регионов; union — принадлежность к профсоюзу; south — проживание на юге страны.
При оценивании указанной модели с использованием «внутри»-оценки получим результаты, приведенные в табл. 3.36. Все оцененные коэффициенты имеют высокую статистическую значимость и ожидаемые знаки. Значительная часть изменчивости (70\%) объясняется индивидуальными эффектами (табл. 3.37).
В то же время если считать, например, что стаж работы на наблюдаемом рабочем месте зависит от принадлежности к профсоюзу и от региона проживания (юг — не юг) и ошибки в уравнении для такой связи коррелированы с ошибками в уравнении для логарифма заработной платы, тогда переменная tenureit в уравнении
In wit = Д tenureit + /?2 ageit + fi3 age2it + /?4 notsmsait + ju + at+ uit
коррелирована с ошибкой uit, и для получения состоятельных оценок коэффициентов этого уравнения приходится прибегать к методу инструментальных переменных. При сделанных предположениях в качестве инструментов для tenureit можно использовать union и south. Полный список инструментов, обеспечивающих однозначную идентификацию коэффициентов /і и /?3, /?4, включает 5 переменных: union, south, age, agel, notsmsa. При использовании этих переменных в качестве инструментов получим результаты, приведенные в табл. 3.38 и 3.39. Оцененные коэффициенты и здесь имеют ожидаемые знаки. Однако на этот раз оказались статистически незначимыми оцененные коэффициенты при переменных age и notsmsaМ
Таблица 3.38
Результаты применения инструментальных переменных
.xtivreg ln_w age age_2 not_smsa (tenure = union south), fe i(idcode) Fixed-effects (within) IV regression
R-SQ:
within = 0.1333, between = 0.2375, overall = 0.2031 Wald chi2(4) = 147926.58 Prob > chi2 = 0.0000
Применение «внутри»-оценки предпочтительно при интерпретации индивидуальных эффектов как фиксированных эффектов. Если эти эффекты рассматривать как случайные и некоррелированные с остальными объясняющими переменными, то предпочтительнее использовать инструментальное GLS-оце-нивание, как это было описано выше. Такой подход приводит к результатам, представленным в таблицах 3.40 и 3.41.
Модели
с индивидуально-специфическими переменными
Оценивание в REи FE-моделях. До сих пор в модели с фиксированными эффектами неоднородность субъектов исследования характеризовалась наличием ненаблюдаемых характеристик, влияние которых отражалось в модели посредством параметров at. Однако неоднородность субъектов может выражаться также в различных значениях для этих субъектов некоторых наблюдаемых характеристик, не изменяющихся для каждого субъекта в процессе наблюдений. Например, в исследованиях, касающихся зависимости размера заработной платы индивида от различных факторов, такими характеристиками могут быть пол, базовое образование и т.п. В связи с этим рассмотрим модель
yit =M + aj + Pxit+yzt +utt> i = l,.~9N, t = 1,7], где z, — переменная, специфическая только в отношении субъекта.
Если эта модель трактуется как ЛЕ-модель, в которой эффекты не коррелированы с xit и zi9 то проблем с оцениванием коэффициентов /?и у т возникает: в этом случае BLUE являются GLS-оценки для /?и у.
Если же эта модель трактуется как Fit-модель или если at случайны и E(at z,) = 0, но E(at xit) * О, то GLS-оценки (строящиеся, как в ЛЕ-модели) несостоятельны, и приходится искать другие оценки. Усредним обе части уравнения по t:
yt = ju + af+ 0х(+уг(+ип z = l,...,7V.
Тогда
у u у і = Р(х» */)+(«* -Ю> i = i,...,^.
В применении к последнему уравнению метод наименьших квадратов приводит опять к оценке с фиксированными эффектами (/вСУ). Но при таком подходе из исходного уравнения выметаются не только ai9 но и zt. Однако если at фиксированы или E(at xit) Ф О, но E(at zf.) = 0, то тогда все же можно построить состоятельную оценку коэффициента у.
Для этого заметим, что
Уі-Рхі^И + У^і + ІсСі + щ). Если считать значение (5 известным, можно оценить эту модель, минимизиN
руя ^(ягг + ut)2, и получить between-оценки:
/=і
/ч /' = 1
У - fj '
/=1
fi = y-xfi-zy.
Подставив pcv вместо (і в эти два выражения, получим оценки у и р для у и /и. При этом plim/ = у9 т.е. у — состоятельная оценка.
7V->oo
ПРИМЕР 3.4.2 (продолжение примера 3.2.3 —размер заработной платы)
При оценивании модели с фиксированными эффектами оказались выметенными переменные SCHOOL, BLACK, HISP. Попробуем все же получить оценки коэффициентов при этих переменных. Использование процедуры, имеющейся в пакете Stata 8, приводит к результату, представленному в табл. 3.42. Полученные оценки практически совпадают с оценками для соответствующих коэффициентов в модели со случайными эффектами (при С15-оценивании).И
Модель Хаусмана — Тейлора. Рассмотрим модель
yit = Xitj3 + Zfy+at +uin i = l,...,N9 t = 1,..., T,
где Xit— строка к наблюдаемых переменных, изменяющихся и от субъекта к субъекту, и во времени; Z, — строка g наблюдаемых переменных, инвариантных относительно времени на периоде наблюдений.
Предполагается, что выполнены обычные предположения ЛЕ-модели (в частности, что все объясняющие переменные экзогенны в обычном смысле), за исключением того, что теперь ненаблюдаемые индивидуальные эффекты at могут быть коррелированными с одними объясняющими переменными и не коррелированными с другими объясняющими переменными.
Хаусман и Тейлор предложили в таком случае производить разбиение:
хи = №iit X2it ], Zi = [ZXi Z2i ],
в котором k{ переменных, входящих в состав Хип и gx переменных, входящих в состав Zh, экзогенны по отношению к at в том смысле, что
ад,.,а,) = £(гиа,.) = 0,
а к2 переменных, входящих в состав X2it9 и g2 переменных, входящих в состав Z2/, эндогенны по отношению к at в том смысле, что
E(X2itat)^^ E(Z2iat)^Q.
При таком разбиении модель записывается в виде:
У и = хмА + х at Pi + 2мУх + znYi +ai + И//, и переход к модели, скорректированной на индивидуальные средние,
Уа-Уі=(Ххи-ХХІ)Рх +(X2it-X2i)P2+uin
приводит к возможно неэффективной, но состоятельной оценке pcv для Р = (Рхт, Р2)т. Однако при этом опять вместе с at выметаются переменные, инвариантные относительно времени.
Получив оценку Pcv (Pier* Pi,cv)T дая А вычислим для каждого субъекта остатки от оцененной «внутри»-регрессии:
и получим состоятельную оценку для дисперсии случайных ошибок D(uit) = crw2:
о-2 RSSCV u NT-(kx+k2)'
Далее по аналогии с приведенным выше заметим, что
уt ХХІРХ Х2ір2 = ZXiyx + Z2iy2 + (a,. + uit).
Только на этот раз в правой части E{Z2ia^) * 0, так что О/^-оценки для ух и у2, получаемые по этой модели (6еґи>ееи-оценки), смещены и несостоятельны. Поэтому здесь для получения состоятельных оценок для ух и у2 применяем метод инструментальных переменных (2SLS), используя инструменты [ZXi XXit], При этом количество экзогенных переменных в XXit (кх) должно быть не меньше числа эндогенных переменных в Z2i (g2). Полученные оценки для ух и у2 обозначим yXIV и y2iv.
Используя все четыре полученные оценки, образуем «остатки»
еи = У it ~ XuP\£v ~ xntPi,cv + ZiYjv + ^иУі,іу и на их основе определим статистику
которая является состоятельной оценкой для суммы (сг^ + 7сг^). Тогда состоятельная оценка для сг^ получается как
с2 л2
Т
Следующим шагом является выполнение стандартного GZ,S-npeo6pa30Ba-ния всех переменных, используемого в Л^-модели:
УІ=Уц-вУі ит-пДля реализации этого преобразования в качестве оценки параметра в берется а1
где Ф =
&1 и а £ — полученные выше состоятельные оценки для ol и crj. Это приводит к преобразованному уравнению
у и = КіА + Pi + Аії + z2/^2+iv
К этому уравнению применим метод IV (2SLS), используя инструменты [XUt XXh X2it X2h Xlh Zu]9 в результате получим для вектора 8 = [J3T, ут]т
инструментальную оценку Хаусмана — Тейлора: днт = [РнТ, УнТ]т Замечание 3.4.1
В процедуре Хаусмана — Тейлора инструменты берутся внутри самой модели.
XUt используется как инструмент дважды: как среднее и как отклонение от среднего.
Если кх < g2, то параметр у неидентифицируем. В этом случае
Рнт Pcv и Унт не существует.
Если кх = g2, то рнт = рСу и унт = у/у = (у*^ y{IV)T (случай точной идентифицируемости).
Если кх > g2, то уравнение сверхидентифицируемо. В этом случае
матрица Cov{(3cv) Cov{flHT) положительно определена и оценка Хаусмана — Тейлора более эффективна, чем «внутри»-оценка.
Влияние метода Хаусмана — Тейлора на прикладные исследования относительно мало из-за трудности нахождения экзогенных переменных Хх, которые можно было бы уверенно рассматривать как не коррелированные с at (так что E(XUt at) = 0).
КОНТРОЛЬНЫЕ ВОПРОСЫ
Каковы особенности оценивания несбалансированных панелей?
Каковы особенности оценивания моделей, в которых некоторые объясняющие переменные являются эндогенными?
Каковы особенности оценивания моделей, в которых некоторые объясняющие переменные специфичны только в отношении субъекта?
Обсуждение Эконометрика Книга вторая Часть 3
Комментарии, рецензии и отзывы