10.7.1. оценивание со случайно пропущенными данными

10.7.1. оценивание со случайно пропущенными данными: Путеводитель по современной эконометрике, Вербик Марно, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Марно Вербик (Marno Verbeek) — профессор эконометрики в Центре экономических исследований Лёвенского университета (Бельгия). Работает также в Центре экономических исследований Тилбургского университета (Голландия).

10.7.1. оценивание со случайно пропущенными данными

Выражения для оценок с фиксированными и случайными эффектами легко обобщить на несбалансированный случай. Оценку с фиксированными эффектами, как и прежде, можно определить как МНК-оценку в линейной модели, где для каждого г (номера индивидуума) определен свой свободный член. Альтернативно, оценку вектора неизвестных параметров (3 можно получить непосредственным применением МНК к внутригрупповой преобразованной модели, где теперь все переменные являются отклонениями от среднего значения по доступным наблюдениям. Индивидуумы, которые наблюдаются только один раз, не обеспечивают никакой информации относительно (3 и их следует исключить из процесса оценивания. Определив «доступные средние значения» как20)

т

т

Подпись: Подпись: У і =

t=i т

t=i

т

Подпись:

Мы предполагаем, что

Гц > 1, то есть каждый индивидуум наблюдался,

t=i

по крайней мере, один раз.

функцию оценивания фиксированных эффектов можно кратко написать в виде

, N Т v -1 N Т

ДфЭ = ( YI rit(xit -Xi)(xit -Xi)' J ^2 Y2 Ггі(Хіі-Хі)(Уіі-УіУ

^i=l t=l ' i=l t=l

(10.85)

Таким образом, просто все суммируется только по доступным наблюдениям.

Аналогичным образом можно обобщить оценку со случайными эффектами. Для несбалансированного случая ее можно получить в виде

, N Т

РОМНК = Tit(Xit Xi)(Xit Xi)f +

4=1 t=l

N ч-1

+ ^2 ^гЩхи X)(xit -ХУ) x г=1 ' / N Т

х (]С ]С rit(xu ~ ~ уі) + ^г=1 t=i

N .

+ ^2фгТг(хг-х)(уг-у)1 (10.86) 1=1 '

т

где Ті = Гц обозначает число тактов времени, когда наблюдался

t=i

индивидуум г, а

Иначе эту функцию можно получить с помощью МНК, примененного к следующей преобразованной модели

(Ун ~ їїіУі) = Ml #») + (xit іїіХі) + uiu (10.87)

1 /2

где її і — 1 — фі/ . Отметим, что применяемое здесь преобразование является индивидуальной спецификацией, поскольку оно зависит от числа наблюдений для индивидуального г.

По существу, более общие формулы для оценок с фиксированными и случайными эффектами характеризуются тем, что все суммы и средние значения вычисляются только по доступным наблюдениям,

и что Г заменяется на Ті. Полностью аналогичные корректировки применяются к выражениям для ковариационных матриц этих двух оценок, которые задаются выражениями (10.13) и (10.23). Состоя 

ла т

^2

" Е Е т« Ы ~Уг- ЪУРфэ)2 (Ю.88)

г=і

Подпись: 1 lVПодпись: г=1

N г _ _ і

(Уг ^^М)2 ^

(10.89)

соответственно, где /?л/ — межгрупповая оценка для вектора параметров /3 (вычисляемая как МНК-оценка в выражении (10.18), где средние значения теперь отражают «доступные средние значения»).

су с

Поскольку эффективность оценок для сга и оЕ асимптотически не влияет на эффективность оценки со случайными эффектами, то в вычислительном отношении можно использовать более простые состоятельные оценки для а и о2е. Например, можно использовать стандартные оценки, вычисленные только по остаткам, полученным из оценивания, основанного на сбалансированной субпанели, а затем использовать выражение (10.86) или (10.87), чтобы вычислить оценку со случайными эффектами.

/0.7.2. Смещение, обусловленное выборочной

селективностью и некоторые простые тесты

В дополнение к обычным условиям для состоятельности оценок со случайными и фиксированными эффектами, основанных на сбалансированной субпанели или на несбалансированных панельных данных, выше предполагалось, что индикатор отклика Гц независим от всех ненаблюдаемых переменных в модели. Такое предположение может быть нереалистичным. Например, основанное на таком предположении объяснение работы фондов может быть некорректным из-за того, что менее вероятно продолжение существования фондов с плохой работой (Тег Horst, Nijman, Verbeek, 1998), исследование эксперимента по эффективности политики использования дохода может пострадать от смещений, если более вероятен отказ от участия в панельном обследовании людей, которые извлекают меньшую выгоду из эксперимента (Hausman, Wise, 1979), или оценивание воздействия уровня безработицы на индивидуальную заработную плату может нарушаться, если в случае увеличивающейся безработицы более вероятен уход с трудового рынка людей с относительно высокой заработной платой (Keane, Moffitt, Runkle, 1988).

Если ги зависит от эффекта осі или остатка ец, то в стандартных оценках может возникнуть смещение, которое в дальнейшем мы будем называть селективным смещением (см. главу 7). Это означает, что распределение у при заданном х и условное по способу отбора выборочных единиц в выборке отличается от распределения у при заданном х (которое нас интересует). Для состоятельности оценки с фиксированными эффектами теперь требуется, чтобы

E{(xit Xi)sit iU ... , riT} = 0. (10.90)

Это означает, что оценка с фиксированными эффектами несостоятельна, если факт, находится ли индивидуум в выборке или нет, говорит нам кое-что об ожидаемом значении остатка, который связан с хц. Ясно, что если справедливо условие (10.11) и Гц не зависит от эффекта ai и всех остатков Єі8 (для данного xis), то сформулированное выше условие удовлетворяется. Заметим, что отбор единиц в выборку может зависеть от эффекта ai, не влияя на состоятельность оценки с фиксированными эффектами для вектора параметров /3. Фактически, даже ец может зависеть от Гц до тех пор, пока их соотношение не зависит от времени (подробности см. в работах (Verbeek, Nijman, 1992, 1996)).

В дополнение к условию (10.90), условия для состоятельности оценки со случайными эффектами теперь задаются в виде

Е{хіЄигіи ... ,riT} = 0

и

Е{хгаггги...,ггТ} = 0. (10.91)

Условия не позволяют математическому ожиданию любой компоненты остатка зависеть от индикаторов пропущенных данных (наблюдений). Если менее вероятно, что индивидуумы с определенными значениями для их ненаблюдаемой гетерогенности ai будут наблюдаться в некотором такте времени панельных данных, то, как правило, это будет приводить к смещению оценки со случайными эффектами. Аналогично, если более вероятно, что индивидуумы с определенными возмущениями Ец-> имеют пропущенные данные (наблюдения), то оценка со случайными эффектами, как правило, несостоятельна. Заметим, что поскольку оценка с фиксированными эффектами позволяет пропущенным данным зависеть от эффектов oti и от возмущений єц, независимо от времени, то она является более устойчивой к смещениям из-за пропущенных данных, чем оценка со случайными эффектами. Другое важное наблюдение, сделанное в статье (Verbeek, Nijman, 1992) состоит в том, что оценки для несбалансированных панельных данных не обязательно страдают меньше от смещения из-за пропущенных данных, чем оценки для сбалансированных подпанельных данных. В общем, смещения из-за пропущенных данных в оценках для несбалансированных и сбалансированных выборок не обязательно будут одинаковыми, и их относительная величина априори не известна.

В статье (Verbeek, Nijman, 1992) предлагается ряд простых тестов на смещение из-за пропусков в данных. Эти тесты основаны на вышеупомянутых наблюдениях. Во-первых, поскольку условия для состоятельности утверждают, что остатки модели должны, в том или другом смысле, не зависеть от индикаторных переменных, то их можно протестировать, просто включая некоторую функцию от ?"гъ • • • > ггТ в модель и проверяя ее значимость. Ясно, что нулевая гипотеза, говорящая о том, что индивидуум наблюдался в любом из тактов времени от 1 до Г, не давала бы нам никакой информации о его ненаблюденных значениях в модели. Очевидно, что добавление Гц в модель (10.84) приводит к мультиколлинеарности, так как Гц = 1 для всех наблюдений в выборке. Вместо этого следует добавить некоторые функции от га,..., т^т? такие, например, как r^t-i, т т

Ci = JJ Гц или Ті — ^Г^ Гц, показывающие, соответственно, наблюt=i t=i далась ли выборочная единица і в предыдущем временном такте,

или она наблюдалась в течение всех тактов времени, или какое общее число тактов времени эта единица наблюдалась. Заметим, что в сбалансированной субпанели все значения переменных таких функций идентичны для всех индивидуумов, и таким образом включаются в свободный член. В статье (Verbeek, Nijman, 1992) предполагается, что включение Сі и Ті может обеспечить приемлемую процедуру, чтобы проверить наличие смещения из-за пропущенных данных. Отметим, что это требует, чтобы модель оценивалась в рамках схемы со случайными эффектами, поскольку внутригрупповое преобразование исключило бы Сі и Ті. Конечно, если нулевые гипотезы не отклоняются, то это еще не является основанием для их принятия, т. е. для утверждения об отсутствии смещения из-за пропущенных данных, поскольку мощность критериев может быть низкой.

Другая группа тестов основана на идее, что четыре различных оценки для моделей со случайными и фиксированными эффектами, основанные либо на сбалансированной субпанели, либо на несбалансированных панельных данных, обычно имеют различные смещения из-за пропуска данных. Поэтому сравнение этих оценок может служить показанием правдоподобия смещения из-за пропущенных данных. Однако, хотя и можно сравнить любую пару оценок (см. (Verbeek, Nijman, 1992) или (Baltagi, 1995, Section 10.5)), известно, что оценки с фиксированными и случайными эффектами могут различаться и по другим причинам, чем смещение из-за пропущенных данных (см. п. 10.2.3). Поэтому, наиболее естественно сравнивать либо оценки с фиксированными, либо оценки со случайными эффектами, использующие сбалансированную субпанель, с их аналогами, использующими несбалансированные панельные данные. Если различные выборки, отобранные на основе индикаторов Гц,... ,Гіт, приводят к значимо различным оценкам, то процесс отбора должен говорить нам кое-что о пропущенных наблюдениях в модели. Таким образом, значимо различные оценки указывают на наличие смещения из-за пропущенных данных. Поскольку оценки, использующие несбалансированные панельные данные, эффективны внутри специфического класса оценок, то мы опять можем использовать результат Хаусмана и вывести критическую статистику, основанную на оценке со случайными эффектами, в виде (сравните с критической статистикой (10.27)),

£сэ = {Щэ Шэ)'[У{Шэ} ~ У{Щэ}]~1Фсэ ££э). (Ю.92)

где V обозначают оценки ковариационных матриц, а надстрочные прописные буквы С и Н относятся к сбалансированной и несбалансированной выборке соответственно. Точно так же можно получить тест, основанный на двух оценках с фиксированными эффектами. При нулевой гипотезе критическая статистика подчиняется хи-квадрат распределению с К степенями свободы. Заметим, что неявная нулевая гипотеза для такого теста состоит в том, что plim фсэ ~ Рсэ) ~ 0Если такая гипотеза верна приближенно, или обе эти оценки страдают от смещения из-за пропущенных данных в равной степени, то тест не имеет никакой мощности К Отметим, что можно проводить такое же тестирование и лишь для подмножества элементов вектора (3.

Путеводитель по современной эконометрике

Путеводитель по современной эконометрике

Обсуждение Путеводитель по современной эконометрике

Комментарии, рецензии и отзывы

10.7.1. оценивание со случайно пропущенными данными: Путеводитель по современной эконометрике, Вербик Марно, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Марно Вербик (Marno Verbeek) — профессор эконометрики в Центре экономических исследований Лёвенского университета (Бельгия). Работает также в Центре экономических исследований Тилбургского университета (Голландия).