10.7.1. оценивание со случайно пропущенными данными
10.7.1. оценивание со случайно пропущенными данными
Выражения для оценок с фиксированными и случайными эффектами легко обобщить на несбалансированный случай. Оценку с фиксированными эффектами, как и прежде, можно определить как МНК-оценку в линейной модели, где для каждого г (номера индивидуума) определен свой свободный член. Альтернативно, оценку вектора неизвестных параметров (3 можно получить непосредственным применением МНК к внутригрупповой преобразованной модели, где теперь все переменные являются отклонениями от среднего значения по доступным наблюдениям. Индивидуумы, которые наблюдаются только один раз, не обеспечивают никакой информации относительно (3 и их следует исключить из процесса оценивания. Определив «доступные средние значения» как20)
т
т
У і =
t=i т
t=i
т
Мы предполагаем, что
Гц > 1, то есть каждый индивидуум наблюдался,
t=i
по крайней мере, один раз.
функцию оценивания фиксированных эффектов можно кратко написать в виде
, N Т v -1 N Т
ДфЭ = ( YI rit(xit -Xi)(xit -Xi)' J ^2 Y2 Ггі(Хіі-Хі)(Уіі-УіУ
^i=l t=l ' i=l t=l
(10.85)
Таким образом, просто все суммируется только по доступным наблюдениям.
Аналогичным образом можно обобщить оценку со случайными эффектами. Для несбалансированного случая ее можно получить в виде
, N Т
РОМНК = Tit(Xit Xi)(Xit Xi)f +
4=1 t=l
N ч-1
+ ^2 ^гЩхи X)(xit -ХУ) x г=1 ' / N Т
х (]С ]С rit(xu ~ ~ уі) + ^г=1 t=i
N .
+ ^2фгТг(хг-х)(уг-у)1 (10.86) 1=1 '
т
где Ті = Гц обозначает число тактов времени, когда наблюдался
t=i
индивидуум г, а
Иначе эту функцию можно получить с помощью МНК, примененного к следующей преобразованной модели
(Ун ~ їїіУі) = Ml #») + (xit іїіХі) + uiu (10.87)
1 /2
где її і — 1 — фі/ . Отметим, что применяемое здесь преобразование является индивидуальной спецификацией, поскольку оно зависит от числа наблюдений для индивидуального г.
По существу, более общие формулы для оценок с фиксированными и случайными эффектами характеризуются тем, что все суммы и средние значения вычисляются только по доступным наблюдениям,
и что Г заменяется на Ті. Полностью аналогичные корректировки применяются к выражениям для ковариационных матриц этих двух оценок, которые задаются выражениями (10.13) и (10.23). Состоя
ла т
^2
" Е Е т« Ы ~Уг- ЪУРфэ)2 (Ю.88)
г=і
N г _ _ і
(Уг ^^М)2 ^
(10.89)
соответственно, где /?л/ — межгрупповая оценка для вектора параметров /3 (вычисляемая как МНК-оценка в выражении (10.18), где средние значения теперь отражают «доступные средние значения»).
су с
Поскольку эффективность оценок для сга и оЕ асимптотически не влияет на эффективность оценки со случайными эффектами, то в вычислительном отношении можно использовать более простые состоятельные оценки для а и о2е. Например, можно использовать стандартные оценки, вычисленные только по остаткам, полученным из оценивания, основанного на сбалансированной субпанели, а затем использовать выражение (10.86) или (10.87), чтобы вычислить оценку со случайными эффектами.
/0.7.2. Смещение, обусловленное выборочной
селективностью и некоторые простые тесты
В дополнение к обычным условиям для состоятельности оценок со случайными и фиксированными эффектами, основанных на сбалансированной субпанели или на несбалансированных панельных данных, выше предполагалось, что индикатор отклика Гц независим от всех ненаблюдаемых переменных в модели. Такое предположение может быть нереалистичным. Например, основанное на таком предположении объяснение работы фондов может быть некорректным из-за того, что менее вероятно продолжение существования фондов с плохой работой (Тег Horst, Nijman, Verbeek, 1998), исследование эксперимента по эффективности политики использования дохода может пострадать от смещений, если более вероятен отказ от участия в панельном обследовании людей, которые извлекают меньшую выгоду из эксперимента (Hausman, Wise, 1979), или оценивание воздействия уровня безработицы на индивидуальную заработную плату может нарушаться, если в случае увеличивающейся безработицы более вероятен уход с трудового рынка людей с относительно высокой заработной платой (Keane, Moffitt, Runkle, 1988).
Если ги зависит от эффекта осі или остатка ец, то в стандартных оценках может возникнуть смещение, которое в дальнейшем мы будем называть селективным смещением (см. главу 7). Это означает, что распределение у при заданном х и условное по способу отбора выборочных единиц в выборке отличается от распределения у при заданном х (которое нас интересует). Для состоятельности оценки с фиксированными эффектами теперь требуется, чтобы
E{(xit Xi)sit iU ... , riT} = 0. (10.90)
Это означает, что оценка с фиксированными эффектами несостоятельна, если факт, находится ли индивидуум в выборке или нет, говорит нам кое-что об ожидаемом значении остатка, который связан с хц. Ясно, что если справедливо условие (10.11) и Гц не зависит от эффекта ai и всех остатков Єі8 (для данного xis), то сформулированное выше условие удовлетворяется. Заметим, что отбор единиц в выборку может зависеть от эффекта ai, не влияя на состоятельность оценки с фиксированными эффектами для вектора параметров /3. Фактически, даже ец может зависеть от Гц до тех пор, пока их соотношение не зависит от времени (подробности см. в работах (Verbeek, Nijman, 1992, 1996)).
В дополнение к условию (10.90), условия для состоятельности оценки со случайными эффектами теперь задаются в виде
Е{хіЄигіи ... ,riT} = 0
и
Е{хгаггги...,ггТ} = 0. (10.91)
Условия не позволяют математическому ожиданию любой компоненты остатка зависеть от индикаторов пропущенных данных (наблюдений). Если менее вероятно, что индивидуумы с определенными значениями для их ненаблюдаемой гетерогенности ai будут наблюдаться в некотором такте времени панельных данных, то, как правило, это будет приводить к смещению оценки со случайными эффектами. Аналогично, если более вероятно, что индивидуумы с определенными возмущениями Ец-> имеют пропущенные данные (наблюдения), то оценка со случайными эффектами, как правило, несостоятельна. Заметим, что поскольку оценка с фиксированными эффектами позволяет пропущенным данным зависеть от эффектов oti и от возмущений єц, независимо от времени, то она является более устойчивой к смещениям из-за пропущенных данных, чем оценка со случайными эффектами. Другое важное наблюдение, сделанное в статье (Verbeek, Nijman, 1992) состоит в том, что оценки для несбалансированных панельных данных не обязательно страдают меньше от смещения из-за пропущенных данных, чем оценки для сбалансированных подпанельных данных. В общем, смещения из-за пропущенных данных в оценках для несбалансированных и сбалансированных выборок не обязательно будут одинаковыми, и их относительная величина априори не известна.
В статье (Verbeek, Nijman, 1992) предлагается ряд простых тестов на смещение из-за пропусков в данных. Эти тесты основаны на вышеупомянутых наблюдениях. Во-первых, поскольку условия для состоятельности утверждают, что остатки модели должны, в том или другом смысле, не зависеть от индикаторных переменных, то их можно протестировать, просто включая некоторую функцию от ?"гъ • • • > ггТ в модель и проверяя ее значимость. Ясно, что нулевая гипотеза, говорящая о том, что индивидуум наблюдался в любом из тактов времени от 1 до Г, не давала бы нам никакой информации о его ненаблюденных значениях в модели. Очевидно, что добавление Гц в модель (10.84) приводит к мультиколлинеарности, так как Гц = 1 для всех наблюдений в выборке. Вместо этого следует добавить некоторые функции от га,..., т^т? такие, например, как r^t-i, т т
Ci = JJ Гц или Ті — ^Г^ Гц, показывающие, соответственно, наблюt=i t=i далась ли выборочная единица і в предыдущем временном такте,
или она наблюдалась в течение всех тактов времени, или какое общее число тактов времени эта единица наблюдалась. Заметим, что в сбалансированной субпанели все значения переменных таких функций идентичны для всех индивидуумов, и таким образом включаются в свободный член. В статье (Verbeek, Nijman, 1992) предполагается, что включение Сі и Ті может обеспечить приемлемую процедуру, чтобы проверить наличие смещения из-за пропущенных данных. Отметим, что это требует, чтобы модель оценивалась в рамках схемы со случайными эффектами, поскольку внутригрупповое преобразование исключило бы Сі и Ті. Конечно, если нулевые гипотезы не отклоняются, то это еще не является основанием для их принятия, т. е. для утверждения об отсутствии смещения из-за пропущенных данных, поскольку мощность критериев может быть низкой.
Другая группа тестов основана на идее, что четыре различных оценки для моделей со случайными и фиксированными эффектами, основанные либо на сбалансированной субпанели, либо на несбалансированных панельных данных, обычно имеют различные смещения из-за пропуска данных. Поэтому сравнение этих оценок может служить показанием правдоподобия смещения из-за пропущенных данных. Однако, хотя и можно сравнить любую пару оценок (см. (Verbeek, Nijman, 1992) или (Baltagi, 1995, Section 10.5)), известно, что оценки с фиксированными и случайными эффектами могут различаться и по другим причинам, чем смещение из-за пропущенных данных (см. п. 10.2.3). Поэтому, наиболее естественно сравнивать либо оценки с фиксированными, либо оценки со случайными эффектами, использующие сбалансированную субпанель, с их аналогами, использующими несбалансированные панельные данные. Если различные выборки, отобранные на основе индикаторов Гц,... ,Гіт, приводят к значимо различным оценкам, то процесс отбора должен говорить нам кое-что о пропущенных наблюдениях в модели. Таким образом, значимо различные оценки указывают на наличие смещения из-за пропущенных данных. Поскольку оценки, использующие несбалансированные панельные данные, эффективны внутри специфического класса оценок, то мы опять можем использовать результат Хаусмана и вывести критическую статистику, основанную на оценке со случайными эффектами, в виде (сравните с критической статистикой (10.27)),
£сэ = {Щэ Шэ)'[У{Шэ} ~ У{Щэ}]~1Фсэ ££э). (Ю.92)
где V обозначают оценки ковариационных матриц, а надстрочные прописные буквы С и Н относятся к сбалансированной и несбалансированной выборке соответственно. Точно так же можно получить тест, основанный на двух оценках с фиксированными эффектами. При нулевой гипотезе критическая статистика подчиняется хи-квадрат распределению с К степенями свободы. Заметим, что неявная нулевая гипотеза для такого теста состоит в том, что plim фсэ ~ Рсэ) ~ 0Если такая гипотеза верна приближенно, или обе эти оценки страдают от смещения из-за пропущенных данных в равной степени, то тест не имеет никакой мощности К Отметим, что можно проводить такое же тестирование и лишь для подмножества элементов вектора (3.
Обсуждение Путеводитель по современной эконометрике
Комментарии, рецензии и отзывы