Тема 4.4 модели бинарного выбора для панельных данных

Тема 4.4 модели бинарного выбора для панельных данных: Эконометрика Книга вторая Часть 3, Носко Владимир Петрович, 2011 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В учебнике излагаются методы эконометрического анализа — от самых простых до весьма продвинутых. В основе учебника — курсы лекций, прочитанные автором в Институте экономической политики им. Е.Т. Гайдара, на механико-математическом факультете..

Тема 4.4 модели бинарного выбора для панельных данных

Выше уже рассматривались модели такого рода, но только для данных, относящихся к одному-единственному моменту (периоду) времени (cross-section data — данные в сечениях).

Перейдем теперь к панельным данным. И здесь модель бинарного выбора обычно связывается с наличием некоторой ненаблюдаемой (латентной) переменной у*и и наблюдаемой индикаторной переменной yin такой, что fl, если .у* >0, и [0, если yi < 0.

Например, yit может указывать на то, работает і-й индивид в период t или нет. Типичной является модель, в которой

yi = xlP + at + sit, i = l,...,N, t = 1,Г,

где xTit— вектор-строка значений объясняющих переменных для /-го субъекта в период t.

Предположим, что случайные ошибки eit независимы, одинаково распределены в обоих направлениях и имеют симметричное распределение с функцией распределения G и что объясняющие переменные строго экзогенны.

Если трактовать at как фиксированные неизвестные параметры, то это соответствует включению в модель N дамми-переменных. Логарифмическая функция правдоподобия тогда принимает вид:

L(P,al,...,aN) = Ydy^G(ai + xlP) + ^(l-yit)ln(-G(ai+xfl/3))і, t і, t

И здесь возникает ситуация, когда оценка максимального правдоподобия для Ди ai9 даже при выполнении стандартных предположений, состоятельна только если Т -> оо, а при конечном Т и N -> со она несостоятельна. Такая ситуация уже встречалась в рамках 0££-оценивания линейной модели с фиксированными эффектами. Только там при несостоятельности оценок для а( оценка для (З оставалась все же состоятельной, тогда как здесь несостоятельность оценок для at в общем случае переносится и на оценку для Д В работе (Chamberlain, 1980) приведено несколько примеров, иллюстрирующих такое положение, причем в одном из примеров (с Т = 2) оценка максимального правдоподобия для р сходится по вероятности при N -> оо не к истинному значению Д а к значению 2Д. В этой же работе был предложен альтернативный подход к оцениванию параметра Д в модели бинарного выбора для панельных данных — метод условного максимального правдоподобия (CML — conditional maximum likelihood), который может быть применен к логит-модели (но не годится для пробит-модели).

Логит-модель с фиксированными эффектами

Логит-модели с фиксированными эффектами соответствует латентное уравнение

yu =xlP + at+eU9

ez

где sit имеют логистическое распределение G(z) = A(z) = . При этом:

l + ez

1 + ехр {*,, fi + a,}

P{yit = 0х„ «„ Р) = 1- + = L .

l + exp{xz^/? + az} l + exp{xz^/? + az}

Следуя работе (Chamberlain, 1980), рассмотрим логит-модель с Т= 2. В этом случае сумма (уп + yi2) есть просто общее количество периодов безработицы (суммарная продолжительность пребывания в состоянии безработицы) для /-го субъекта, и для каждого субъекта есть 4 возможные последовательности состояний (yn,yi2): (0, 0), (0, 1), (1, 0), (1, 1). Соответственно сумма (уп +yi2) может принимать только 3 возможных значения: 0, 1, 2 (у /-го субъекта не было периодов безработицы, был один период безработицы, был безработным в течение обоих периодов).

Вычислим условные вероятности указанных 4 последовательностей при различных значениях суммы (уп +yi2).

Если>>п +уа = 0, то возможна только последовательность (0, 0), так что

P{(0,0)yn+yi2=0,ai,P} = l,

а условные вероятности 3 других последовательностей при уп +yi2 = 0 равны 0. Если уп + уа = 2, то возможна только последовательность (1, 1), так что

Р{(Л)уІІ+уі2=,аі,Р} = ,

а условные вероятности 3 других последовательностей при j>n +уа = 1 равны 0.

Если же>-п +уа = 1, то возможны две последовательности: (0, 1) и (1, 0), и они имеют условные вероятности, отличные от 0 и 1, тогда как условные вероятности последовательностей (0, 0) и (1, 1) равны 0. При этом:

p(mn, ^ , m Р{(0,1)К„

Р{(0,1)уп + у а = 1, х„, а„ р) = —— — =

Р{У]+у2=\хи,апР}

= Р{Уа = 0хи,а„ Р) ПУа = а„ Р) =

P{yn = 0xB,ai,fi) P{ya=\xit,ai,p} + P{ya=\xit,ai,p} P{yi2 = 0|х(„а,,/?}

1 ехр(х£/? + а,.}

l + exp{x,^ + «,} l + expfo,^/? + «,}

1 exp{4/? + «,} t екр{ХпР + а,} 1

1 + ехр{д^/? + а,} l + exp{jc,^ + a,} 1 + ехр{лгд/? + а,} 1 + ехр{лг,^/? + а,}

ехр{х12р + сс;} = exp{x[2fi)

ехр {xlp + а і} + ехр {xj2p + ai} exp {xjxp} + exp {xj2p}'

так что индивидуальные эффекты выметаются, и

/.«о,.)|„, +,а.и..«,.я-,др<(;?-;ь)*

1 + ехр {(*„-*„ )г #

Соответственно

Л(10)|Лі +Л2 = 1, хй, а„ /?} = 1-Р{(0,+ уі2 = 1, xit9ai9 /3} =

1

l + exp{(xi2-xn)T /3} Таким образом, все условные вероятности

Р{(Уп > Уі2 ) = (Г> *ІУі + #2 = ^ *//> > #>

где r, s = 0, 1, / = 0, 1, 2, не зависят от индивидуальных эффектов ai9 так что максимизация по Д и az условной (при условии заданных фиксированных значений хі7 и (yzl +^2)) функции правдоподобия сводится к максимизации этой функции только по параметру Д что приводит к состоятельной оценке для Д.

Полученные результаты означают, что при Т =2 можно оценивать логит-модель с фиксированными эффектами, используя стандартную логит-модель, в которой в качестве объясняющей переменной выступает (хі2 хп), а в качестве наблюдаемой бинарной переменной — переменная, отражающая изменение значения переменной yit при переходе от первого ко второму наблюдению (1 — при возрастании^, 0 — при убывании^,). Соответственно функцию правдоподобия можно записать в виде:

L = f[P{(0,0)|.} Р{(0,1)|-} />{(!, 0)|-} />{(!, 1)|.) =

/=1

где Srs= l, еслиyn = r9yi2 = s9 и Srs = 0, еслиyn * r и/илиyi2 * s.

Заметим, что субъекты, для которых уп = yi2 = 0 или уп = yi2 1, не вносят дополнительный вклад в функцию правдоподобия и фактически игнорируются при оценивании. Для оценивания существенны только те субъекты, которые хотя бы однажды изменяют свой статус в отношении уи.

Проверку гипотезы Я0 об отсутствии индивидуальных эффектов можно осуществить с помощью критерия типа критерия Хаусмана, основанного на разности между оценкой Дсж для Д полученной методом условного максимального правдоподобия, и обычной логит-АС-оценкой f3ML9 игнорирующей индивидуальные эффекты (при вычислении последней константа исключается). Яотт-MLE состоятельна и эффективна только при гипотезе Н0 и несостоятельна при альтернативе. Условная же MLE состоятельна и при гипотезе #0, и при альтернативе, но неэффективна, так как использует не все данные. Таким образом, положение здесь соответствует тому, при котором реализуется схема Хаусмана (см. разд. 1, тема 1.2). Статистика критерия

П = Фсж-PML)T(Cdv0CML)-Cdv(pML)ypcML-pML)

имеет при гипотезе Н0 асимптотическое распределение хи-квадрат с числом степеней свободы, равным размерности вектора Д

у/ Замечание 4.4.1. Существенным недостатком метода условного правдоподобия является то, что он предполагает (условную) независимость уп, ...,yiT при фиксированных xin ah /3. Метод неприменим к моделям с запаздывающими значениями объясняющей переменной в правой части.

Пробит-модель со случайными эффектами

Если at статистически независимы от объясняющих переменных, то естественно рассмотреть модель со случайными эффектами. В этом случае можно использовать и логит-, и пробит-модели, проще применять пробит-модель. Здесь исходим из спецификации:

[l, если y*t >0, (О, если у], < О,

uit =<*і+Єіп

где at — случайные индивидуальные эффекты, at ~ lid. N(0, ст*); єи — случайные ошибки, eit ~ lid. N(0, сгД

и предполагаем, что индивидуальные эффекты и ошибки статистически независимы. В этих условиях совместное распределение случайных величин иП9 uiT нормально, причем Е(ии) = О, D{uit) ст2 + cr*, Cov(uin uis) = = Cov(a{ + eit9 at + єі8) = а* для s Ф /, так что значение коэффициента корреCov(uinuis) <j2a

ляции р = , ' = — g между ошибками uit и uis внутри одной

4D(uit)jD(uis) а2а+а2

группы (субъекта) одинаково для любых s * t. В стандартной спецификации D(uit) = 1 и р = а*. Это соответствует предположению о том, что а2 = 1 <та2.

Совместная вероятность получения наборауп, ...9yiT при заданныххП9..., хІТ определяется следующим образом:

оо

р(Уп ,.:,УІТхц,..., хІТ, р) = jP(yn ,...,уІГхп,..., хІТ, а і, р) р(а, )da, =

tlP{y„x„,a„P)

1=1

p{.at)da,

где

Р(Уі1хі„аі,р) =

Г ґ т ф х„А + а,

^1

( т

1-Ф

если yit = 1, , если yit = О,

Итоговый интеграл вычисляется численными методами. Соответствующие программы имеются в некоторых пакетах (например, в Stata).

При гипотезе Я0 об отсутствии индивидуальных эффектов р = &а = О, так что проверка отсутствия индивидуальных эффектов сводится к проверке гипотезы /7=0.

ПРИМЕР 4.4.1

Рассмотрим результаты исследования панельных данных по Германии (German Socio-Economic Panel) за 5-летний период с 1985 по 1989 г., проводившихся с целью выяснения влияния состояния безработицы на степень удовлетворенности жизнью (well-being) (см.: (Winkelmann L., Winkelmann R.9 1995)).

Исходные данные были представлены в порядковой шкале и индексировались от 0 до 10. Ввиду сложности построения порядковых логити пробит-моделей для панельных данных данные были сжаты до бинарных. Индивиды, у которых удовлетворенность жизнью индексировалась от 0 до 4, считались неудовлетворенными жизнью, тогда как индивиды с индексом 5 и выше считались более или менее удовлетворенными жизнью.

В качестве объясняющих переменных первоначально были привлечены следующие характеристики индивидов:

непрерывная переменная:

LOGINCOME — логарифм (располагаемого) дохода (см. ниже);

дамми-переменные:

UNEMP (безработный), NOPARTIC (не включен в рынок труда), SELFEMP (самозанятый), PARTTIME (частично занятый) — указывают текущий статус на рынке труда (категория «полностью занятый» не снабжается

дамми-переменнной);

MALE — индивид мужского пола;

OKHEALTH— хорошее состояние здоровья;

AGE — возраст и AGESQUARED — квадрат возраста;

VOCATIONAL D. — наличие профессиональной степени;

UNIVERSITYD. — наличие университетской степени;

MARRIED — состояние в браке.

Для правильной интерпретации влияния безработицы на удовлетворенность жизнью надо учитывать целый ряд обстоятельств.

Например, безработица обычно ведет к сокращению дохода, что, в свою очередь, может снизить удовлетворенность. Однако если доход включается в число объясняющих переменных, то коэффициент при безработице фактически измеряет влияние безработицы при прочих равных, т.е. при сохранении дохода постоянным. Это могло быть в реальности, если бы страховое возмещение при безработице достигало 100\%. При высоком (отрицательном) коэффициенте корреляции между безработицей и доходом оценки остаются несмещенными, но их точность может значительно уменьшаться.

Удовлетворенность индивида может снижаться вследствие безработицы также и потому, что доля его вклада в общий семейный бюджет уменьшается. Поскольку, в отличие от доходов домохозяйства, имеющиеся в панели данные в отношении индивидуального дохода ограничены прошлыми доходами, в уравнение включается не индивидуальный доход, а доход домохозяйства.

Включение в модель взаимодействий факторов позволяет выделять дифференциальные эффекты влияния безработицы в группах, имеющих разные атрибуты (например, в разных возрастных группах). В связи с этим в модель помимо собственно UNEMP включены также переменные:

UNEMP*AGE<29 UNEMP* AGE30-49.

Важным также является взаимодействие между безработицей и продолжительностью текущего периода пребывания в состоянии безработного. Влияние продолжительности безработицы на психическое состояние индивида достаточно хорошо документировано в психологической литературе. В соответствии с этим в уравнение включаются переменные:

UNEMPDUR — продолжительность периода безработицы, продолжающегося в настоящее время;

UNEMPDURSQ* 10~2 — для учета возможной нелинейности.

К сожалению, в данных полностью отсутствовал региональный аспект, так что не удалось выяснить влияние локального уровня безработицы.

Следует отметить очень существенное взаимодействие безработицы и пола индивида. По этой причине обработка данных производилась также раздельно по мужчинам и женщинам.

Наличие протяженных наблюдений позволяет, в принципе, включать в модель элементы динамики. Однако выше уже говорилось о проблемах с оцениванием динамических моделей бинарного выбора, в частности, с включением в правую часть запаздывающих значений объясняемой переменной. В данном анализе предполагается устойчивость индивидуальных откликов во времени, и она учитывается введением в модель индивидуальных эффектов. Для проверки этого свойства в модель помимо переменной UNEMPDUR включается также переменная PREVDUR, указывающая на суммарную продолжительность периодов безработицы за 10 лет, предшествующих анализируемому периоду.

Кроме того, в модели в качестве объясняющей используется еще и переменная CHANGEINC — относительное изменение дохода домохозяйства по сравнению с предыдущим годом. Это связано с некоторой неясностью в отношении того, что именно влияет на удовлетворенность — собственно уровень доходов или его изменение.

Наконец, нельзя исключать возможного наличия и обратной причинной связи между безработицей и уровнем удовлетворенности, т.е. того, что внутренне менее удовлетворенные индивиды скорее и оказываются безработными. Если это так, то переменная UNEMP коррелирует со случайным эффектом в модели случайных эффектов и оценка максимального правдоподобия, не учитывающая этого, оказывается несостоятельной. Поскольку далее приводятся результаты статистического анализа и по модели с фиксированными эффектами, и по модели со случайными эффектами, можно оценить устойчивость результатов к этой допустимой эндогенности.

Основная задача состоит в проверке гипотезы о негативном влиянии безработицы на удовлетворенность при очистке от влияния прочих факторов, включая влияние снижения доходов.

В табл. 4.29 и 4.30 приведены результаты оценивания порядковой пробит-модели, не учитывающей панельную структуру данных (данные усреднены по времени), но включающей временные дамми. В этой порядковой пробит-модели предполагается, что уравнение полезности имеет вид:

и наблюдаемое значение индекса удовлетворенности определяется соотношениями:

0, 1,

если 5,* < 0, если0<S*t <ух,

Ю,

если <S(* >у9.

В табл. 4.31 и 4.32 приведены результаты оценивания FE логит-модели и RE пробит-модели с бинарным откликом (1 — если уровень удовлетворенности равен 5 или выше, 0 — если уровень удовлетворенности ниже 5).

Результаты, приведенные в таблицах, подтверждают сделанные ранее выводы. В частности, влияние безработицы выглядит отрицательным. Однако следует помнить, что в нелинейных моделях оцененные коэффициенты не представляют предельные эффекты. Более того, они несравнимы для разных спецификаций модели.

Тем не менее в рамках оценивания порядковой пробит-модели без разделения по полу можно отметить следующие моменты:

влияние пола оказывается весьма значимым (оценка коэффициента равна -0.059 при стандартной ошибке 0.015), что говорит в пользу раздельного анализа данных по мужчинам и женщинам;

подтверждаются результаты более ранних исследований, указывающие на U-образную форму степени негативного влияния безработицы на удовлетворенность: оцененный коэффициент выше по абсолютной величине в наиболее активных возрастных группах;

уровень доходов имеет существенный положительный эффект при измерении его в уровнях, но не в приращениях.

Положительное влияние имеют наличие профессионального или университетского диплома, а также состояние в браке.

При раздельном оценивании по мужчинам и женщинам обнаруживаются большие дифференциальные эффекты, так что публикация результатов только по объединенной выборке, как это делают некоторые авторы, может вводить в заблуждение. Наиболее существенное различие заключается в том, что на мужчин состояние безработного действует в значительно большей степени. Так, для мужчин среднего возраста эффект безработицы равен:

-0.402 0.245 = -0.647, тогда как для женщин он равен только:

-0.118 -0.175 = -0.293.

Это соответствует росту неудовлетворенности на 12\% для мужчин и только на 4\% для женщин.

Отметим также, что пребывание вне рынка рабочей силы негативно влияет на мужчин, но не на женщин.

При переходе к анализу собственно панельными методами следует заметить, что в F^-модели выметаются все регрессоры, значения которых не изменяются во времени {Constant, PREVDUR, VOCATIONAL £>., UNIVERSITY D.). Кроме того, количество индивидов, по которым производится оценивание, сокращается, поскольку в этом случае в выборку надо включать только тех, у кого значение бинарного отклика изменялось на 5-летнем периоде исследования. Переход к FEи ЛЕ-моделям не очень сильно повлиял на выводы, сделанные ранее на основе порядковой модели.■

КОНТРОЛЬНЫЕ ВОПРОСЫ

Какие проблемы возникают при оценивании моделей бинарного вывода для панельных данных?

Какие модели бинарного вывода со случайными эффектами можно оценить методом максимального правдоподобия?

Эконометрика Книга вторая Часть 3

Эконометрика Книга вторая Часть 3

Обсуждение Эконометрика Книга вторая Часть 3

Комментарии, рецензии и отзывы

Тема 4.4 модели бинарного выбора для панельных данных: Эконометрика Книга вторая Часть 3, Носко Владимир Петрович, 2011 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В учебнике излагаются методы эконометрического анализа — от самых простых до весьма продвинутых. В основе учебника — курсы лекций, прочитанные автором в Институте экономической политики им. Е.Т. Гайдара, на механико-математическом факультете..