7.3. тобит-модели

7.3. тобит-модели: Путеводитель по современной эконометрике, Вербик Марно, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Марно Вербик (Marno Verbeek) — профессор эконометрики в Центре экономических исследований Лёвенского университета (Бельгия). Работает также в Центре экономических исследований Тилбургского университета (Голландия).

7.3. тобит-модели

В определенных приложениях зависимая переменная непрерывна, но ее диапазон может быть ограничен. Часто это происходит, когда зависимая переменная равна нулю для существенной части генеральной совокупности, но положительна (со многими различными исходами) для остальной ее части. Например, расходы на товары длительного пользования, часы работы, и величина прямых иностранных инвестиций фирмы. Тобит-модели особенно подходят для моделирования переменных такого типа. Оригинальная тобит-модель предложена Джеймсом Тобином (Tobin, 1958), который проводил анализ семейных расходов на товары длительного пользования, принимая во внимание их неотрицательность, но только в 1964 году Артур Голдбергер назвал эту модель тобит-моделью из-за ее подобия пробит-моделям. С тех пор оригинальная модель обобщалась разными способами. В частности, начиная с обзора (Amemiya, 1984), экономисты также называют эти обобщения тобит-моделями. В этом и следующем параграфе мы представим оригинальную тобит-модель и некоторые ее обобщения. Более детальное описание можно найти в работах (Maddala, 1983), (Amemiya, 1984) и (Lee, 1996).

7.3.7. Стандартная тобит-модель

Ясно, что этот пример упрощен. В приложениях к маркетингу свойство независимости несущественных альтернатив часто является неприемлемым. Кроме того, модель не принимает во внимание наблюдаемую и ненаблюдаемую гетерогенность по потребителям. Более подробное обсуждение этих проблем см. в работах (Louviere, 1988) или (Caroll, Green, 1995).

Предположим, что мы интересуемся объяснением расходов на табак в американских домашних хозяйствах в данном году. Пусть у обозначает расходы на табак, в то время как с помощью z обозначены все другие расходы (все расходы в долларах США). Общий располагаемый доход (или общие расходы) обозначим через х. Мы можем думать о простой проблеме максимизации полезности, описывающей решение проблемы домашним хозяйством, как о задаче вида:

max [/(у, г), (7.41)

y + z<x, (7.42) V,z > 0. (7.43)

Конечно, решение этой проблемы зависит от вида функции полезности U. Поскольку нереально предполагать, что некоторые домашние хозяйства потратили бы все свои деньги на табак, то граничное решение z — 0 можно исключить априорно. Однако решение для у может быть нулевым или положительным, и мы можем ожидать граничное решение у — 0 для большой доли домашних хозяйств. Обозначим решение проблемы максимизации (7.41)-(7.42) без ограничения (7.43) как у*. При соответствующих предположениях о функции полезности U это решение будет линейно по х. Как экономисты мы не наблюдаем ничего, что определяет полезность, которую семьи приписывают табаку. Принимая во внимание ненаблюдаемую гетерогенность в функции полезности, а, следовательно, и ненаблюдаемую гетерогенность в решении, мы можем принять, что

У* = (Зі + fax + є, (7.44)

где є соответствует ненаблюдаемой гетерогенности 17 Так что, если бы не было никаких ограничений на у и потребители могли бы потратить какую-либо сумму на табак, то они потратили бы у*. Поэтому решение исходной проблемы при ограничениях будет иметь вид

у = у*, если у* > О,

У (7.45) у = 0, если у* < 0.

Так, если семье хотелось бы потратить отрицательную сумму у*, то на табак не будет потрачено ничего. По существу, это приводит нас к стандартной тобит-модели, которую мы формализуем следующим образом.

у* = х[(3 + Єі, і = 1,2,..., TV,

Уі = Уі, если у*>0, (7.46)

Альтернативные интерпретации є возможны. Они могут включать ошибки в оптимизационном решении, принятом домашним хозяйством или ошибки измерения.

Уі = 0, если у* < 0,

где предполагается, что Єі, есть НОНР(0,а2) и не зависит от вектора объясняющих переменных Хі. Заметим сходство этой модели со стандартной пробит-моделью, которая задается выражениями (7.10); различие состоит в отображении латентной переменной в наблюдаемую переменную. (Также отметим, что здесь мы можем идентифицировать масштаб, так что мы не должны налагать ограничение нормировки.)

Модель (7.46) также называется цензурированной моделью регрессии. Такая модель является стандартной моделью регрессии, где все отрицательные значения отображаются в нуль. То есть, наблюдения цензурированы (снизу) в нуле. Таким образом, модель описывает два обстоятельства. Первое обстоятельство заключается в том, что вероятность уі — 0 (при заданном векторе объясняющих переменных х{) имеет вид

Р{т = 0} = РЫ < 0} = Р{є, < -т = р||<-^| =

= ,(_£Ё)=1 _,(ї£). (7.47)

И второе обстоятельство — это распределение переменной уі при условии, что оно положительно. Распределение переменной у і является усеченным нормальным распределением с математическим ожиданием

Е{угУг > 0} = х'ф + E{£i\£i > -х'ф) = х'ф + ^|^у^у• (7-48)

Последний член в этом выражении обозначает условное математическое ожидание нормально распределенной переменной Єі с нулевым средним при условии, что она больше — х'г/3 (см. Приложение Б). Очевидно, что это математическое ожидание больше нуля. Результат (7.48) также показывает, почему не следует ограничивать внимание только положительными наблюдениями и оценивать линейную модель из этой подвыборки: условное математическое ожидание у і больше не равняется оно также зависит нелинейно от объясняющих переменных вектора Хі через отношение ф(')/Ф(').

Коэффициенты в тобит-модели можно интерпретировать несколькими способами в зависимости от нашего интереса. Например, тобит-модель описывает вероятность нулевого исхода как

р{уі = о} = і-ф(^).

Это означает, что /3/ог может интерпретироваться так же, как (3 в пробит-модели для определения предельного влияния изменения в переменной Xik на вероятность наблюдения нулевого исхода (сравните п. 7.1.2). То есть,

аР{ш = о} = _ф(<ЕЛ (749)

OXik V сг / сг

Кроме того, как показывает выражение (7.48), тобит-модель описывает математическое ожидание у і при условии, что значения у і положительны. Тогда предельное влияние изменения в переменной Xik на значение учитывая цензурирование, будет отличаться от коэффициента (3k • Он также будет включать предельное изменение во втором члене выражения (7.48), соответствующее цензурированию. Из выражения (7.48) следует, что математическое ожидание yi имеет вид18)

ЯЫ=4/И>(^) +^{^f)(7-50)

Отсюда следует, что предельный эффект изменения в переменной Xik на математическое ожидание у і задается как19^

ВЕЫ-М(Щ (7.51)

дхік V ° ,

Это говорит нам, что предельное влияние изменения в переменной Xik на ожидаемый исход yi задается коэффициентом модели, умноженным на вероятность реализации положительного исхода. Если эта вероятность равна единице для конкретного индивидуума, то предельный эффект просто равен /3/~, как в линейной модели. И, наконец, предельное влияние на латентную переменную легко получить как

™ = А. (7.52)

OXik

18) Используйте, что Е{у} = Е{уу > 0}Р{у > 0} + 0.

19) Это выражение получается дифференцированием по переменной . Несколько членов при этом сокращаются (сравните с (Greene, 2000, Sect. 20.3)).

Если латентная переменная не имеет ясной интерпретации, что не является типичным случаем, то, по-видимому, более естественно интересоваться соотношением (7.51).

7.3.2. Оценивание

Оценивание тобит-модели обычно выполняется с помощью метода максимального правдоподобия. Вклад в функцию правдоподобия наблюдения либо равняется вероятностной мере (в точке наблюдения у і = 0), либо условной плотности у і при условии, что она положительна, умноженной на вероятностную меру наблюдения у і > 0. Таким образом, логарифмическую функцию правдоподобия можно записать в виде

logLx(/?,а2) = ]Г logР{уг = 0} + J2 [bgf{ViVi > 0} + logP{yi > 0}] -= logP{Vi = 0} + £ log/Ы, (7-53)

+

1-Ф

где f(')— общее обозначение для функции плотности, а последнее равенство следует из определения условной плотности 20). Множества индексов /о и 1 определяется как множества тех индексов, которые соответствуют нулю и положительным наблюдениям соответственно. То есть, /0 = {г = 1,..., N: у і = 0}. Используя соответствующие выражения для нормального распределения, мы получаем

а

logLxOS, a2) = J2

ielo

Максимизация (7.54) относительно f3 и a2 приводит к ММП-оценкам. Предполагая, что модель специфицирована корректно, получаем состоятельные и асимптотически эффективные оценки для (3 и а2 (при умеренных условиях регулярности).

Напомним, что f(yy > с) = f(y)/P(y > с) для у > с и f(yy > с) = 0 в противном случае (см. Приложение Б).

Компоненты вектора (3 имеют двойную интерпретацию: первая интерпретация касается влияния изменения в Хі на вероятность ненулевых затрат, а вторая связана с оценкой влияния изменений в Хі на уровень этих затрат. Таким образом, оба эффекта автоматически имеют один и тот же знак. Хотя выше мы мотивировали применение тобит-модели с помощью схемы максимизации полезности, обычно в прикладной работе этот момент не является отправной точкой: латентная переменная у* могла бы просто интерпретироваться в виде «желаемых затрат», с фактическими расходами, равными нулю, если желаемая величина отрицательна.

В некоторых приложениях наблюдения полностью отсутствуют, если латентная переменная у* < 0. Например, наша выборка может быть ограничена семьями только с положительными расходами на табак. В этом случае, мы можем все еще предполагать ту же самую лежащую в основе схему, но с немного другим правилом наблюдения. Это приводит к так называемой усеченной модели регрессии. Формально, она имеет вид

у* =х[р + вг, г = 1,2,...,ЛГ,

Уі = у*, если у*>0, (7.55)

(г/г, Хі) не наблюдается, если у* < 0,

где, как и прежде, предполагается, что остаток Єі является НОНР(0, а2) и не зависит от объясняющих переменных вектора хг. В этом случае мы больше не имеем случайную выборку, и, когда делаем выводы (например, оценивание параметров /3, сг2), должны принимать это во внимание. Вклад в правдоподобие наблюдения і не просто плотность, оцененная в точке наблюдения уг, а плотность в точке у і;, условная по ограничению при формировании выборки, то есть условная по уг > 0. Таким образом, логарифмическая функция правдоподобия для усеченной модели регрессии задается как

L2((3,a2) = >0) = J2 [log/Ы -logPfo >0}]. (7.56)

іЄІі іЄІі

которая для нормального распределения сводится к выражению

logL2(/3, а2) =

-£{Ч^Ч-^}]-*Ч?)}Несмотря на то, что нет никакой необходимости наблюдать, какие характеристики индивидуумов связаны с у і, = 0, и знать, сколько индивидуумов «пропущено», мы должны предполагать, что индивидуумы не наблюдаемы только потому, что их характеристики таковы, что у* < 0. Максимизация log L2 относительно /3 и а2 снова приводит к состоятельным оценкам. Если наблюдения с у і, — 0 действительно отсутствуют, это наилучшее, что можно сделать. Однако даже если наблюдения с у і — 0 доступны, все еще возможно вместо log L максимизировать log L2, то есть, возможно оценивать усеченную модель регрессии, даже если будет применяться тобит-модель. Интуитивно очевидно, что последний (тобит-модельный) подход использует больше информации и поэтому, в общем, будет приводить к более эффективным оценкам. Фактически, можно показать, что информация, содержащаяся в тобит-модели, объединяет информацию, которая содержится в усеченной модели регрессии, с информацией пробит-модели, описывающей нулевое/ненулевое решение. Этот факт легко следует из того результата, что логарифмическая функция правдоподобия тобит-модели является суммой функций логарифмов правдоподобия усеченной регрессии и пробит-модели.

7.3.3. Пример: расходы на алкоголь и табак (часть 1)

В экономике для анализа влияния на потребительский спрос, например, дохода, налоговых изменений или изменения цен часто используются (системы) уравнения спроса. Возникает практическая проблема, которая состоит в том, что расходы на специфические предметы потребления могут быть нулевыми, особенно если товары не агрегированы в широкие категории. Несмотря на то, что, как правило, это имеет место с товарами длительного пользования, здесь мы сконцентрируемся на другом типе предметов потребления: алкогольных напитках и табаке.

Начиная с предположения, что потребитель максимизирует свою полезность как функцию от количеств товаров потребления, можно получить функцию спроса Маршалла (Marshallian demand function) для каждого товара как

где qj обозначает количество товара j, х обозначает общие расходы, а р является вектором цен всех соответствующих товаров. Функция gj зависит от предпочтений потребителя. В эмпирическом приложении мы рассмотрим пространственные ("cross-sectional") данные, когда цены по наблюдениям не изменяются. Поэтому вектор цен р можно исключить из функции спроса, и мы получаем

Qj =9j(x).

Это соотношение обычно называется кривой Энгеля (см., например, (Deaton, Muellbauer, 1980, Chapter 1)). Отсюда можно определить эластичность количества потребляемого товара qj по общим расходам как

ддЦх) х 3 dx qj'

Эта эластичность измеряет относительный эффект 1\%-ого увеличения общих расходов и ее можно использовать для классификации товаров на предметы роскоши, предметы первой необходимости и товары низкого качества. Товар называется предметом роскоши, если потребляемое количество возрастает более чем пропорционально с возрастанием общих расходов (ej > 1), в то время как он является предметом первой необходимости, если 6j < 1. Если при возрастании общих расходов количество покупок товара уменьшается, то, говорят, что это товар низкого качества, что подразумевает отрицательную эластичность ej. Удобная параметризация кривой Энгеля имеет вид

wj — aj + Pj 1°S x->

где Wj — pjqj/x обозначает бюджетную долю товара j. При этом просто получается вывод, что эластичности по общим расходам для этой функции задаются как

6j = l + &-. (7.58)

Wj

Вспомним, что товар j является предметом первой необходимости, если 6j < 1 или /3j < 0, в то время как предмет роскоши соответствует f3j > 0.

Ниже мы сосредоточимся на двух специфических товарах, алкогольных напитках и табаке. Кроме того, мы явно сосредоточимся на гетерогенности по домашним хозяйствам, и индекс і будет применяться для индексирования индивидуального номера наблюдаемого домашнего хозяйства. Система почти идеального спроса Деатона и Мюлльбауэра (Deaton, Muellbauer, 1980, Section 3.4) предполагает кривые Энгеля вида

Wji = OLji + (3ji log Хі + Sji,

где Wji — доля бюджета семьи г потребления предмета j, а ^ обозначает общие расходы. Параметры otji и /3ji могут зависеть от таких характеристик семьи, как, например, состав семьи, возраст и образование главы семьи. Случайные члены Sji улавливают ненаблюдаемые различия между семьями. Поскольку /3^ изменяется по семьям, вид функции вышеупомянутой кривой Энгеля позволяет товарам являться предметами роскоши или предметами первой необходимости в зависимости от характеристик семьи.

Когда мы рассматриваем расходы на алкоголь или табак, то ожидается, что число нулей будет существенным. Первый способ объяснить эти нули состоит в том, что они являются результатом граничных решений, когда ограничение неотрицательности на долю бюджета (w^ > 0) становится обязательным. Это означает, что семьи предпочитают не покупать алкогольные напитки или табак при текущих ценах и доходе, но снижение цены или возрастание дохода (в конечном счете) изменят это. Обсуждение, реалистическое это предположение или нет, откладывается до п. 7.4.4. Поскольку граничные решения не удовлетворяют условиям первого порядка для внутреннего оптимума, лежащим в основе проблемы максимизации полезности, то кривая Энгеля не применяется к наблюдениям с долями бюджета Wji = 0. Вместо этого предполагается, что если не налагается ограничение неотрицательности, то отрицательное решение, соответствует нулевым расходам на специфический товар, и кривая Энгеля должна описывать решение проблемы максимизации полезности домашнего хозяйства. Таким образом, мы можем скорректировать модель, представив ее в виде

Wji = aJi + Pji І0§ Хг + ЄЗП

Wji = ЄСЛИ Wji > 0,

Wji = 0 в противном случае.

Теперь эта модель соответствует стандартной тобит-модели, если предполагается, что Sji ~ НОНР(0, а2) для данного товара j. Аналогичный подход применяется в статье (Atkinson, Gomulka, Stern, 1990). В статье проводится оценивание кривой Энгеля для алкоголя, но в ней предполагается, что Sji имеет не нормальное скошенное распределение.

Я благодарен НИС за разрешение, использовать эти данные; доступные как TOBACCO.

Для оценивания приведенной выше модели мы используем данные21^ из обследования семейных бюджетов в Бельгии за период с 1995 года по1996 год, представленные Национальным институтом статистики (НИС). Выборка содержит 2724 семьи, для которых наблюдались расходы по широкому диапазону товаров, а также ряд статусных и количественных переменных, касающихся, например состава семьи и профессионального статуса ее членов. В этой выборке 62\% семей имеют нулевые расходы на табак, тогда как 17\% нисколько не тратили на алкогольные напитки. Средние доли бюджета для соответствующих подвыборок положительных расходов составили 3,22\% и 2,15\%.

Ниже мы оценим две кривые Энгеля для алкоголя и табака по отдельности. Это означает, что мы не принимаем во внимание возможность, что обязательное ограничение неотрицательности на табак также может влиять на расходы на алкоголь, или наоборот. Мы предположим, что ctji является линейной функцией от возраста главы семьи 22 числа взрослых в семье и числа детей, меньше 2 лет и 2 года и старше, a f3ji является линейной функцией от возраста и числа взрослых. Это означает, что в тобит-модель в качестве объясняющих переменных включаются произведения логарифмов общих расходов с возрастом и числом взрослых. Результаты оценивания для стандартных тобит-моделей представлены в таблице 7.4.

Для табака есть существенное свидетельство, что возраст является важным фактором в объяснении доли бюджета, как отдельно, так и в комбинации с общими расходами. Для алкогольных напитков индивидуально значимы только переменные — число детей и общие расходы. Из результатов в таблице 7.4 видно, что тесты Вальда для проверки гипотезы равенства всех коэффициентов нулю, кроме свободного члена, характеризуются высоко значимыми значениями для обоих товаров. При нулевой гипотезе эти критические статистики сравнимы с F-статистикой, которая, как правило, вычисляется для линейной модели (см. п. 2.5.4), и имеют асимптотическое хи-квадрат распределение с 7 степенями свободы.

Возраст измерен в возрастных группах с десятилетним интервалом, упорядоченных от нулевой возрастной группы (моложе 30 лет) до четвертой возрастной группы (60 лет и старше).

Если мы предполагаем, что рассматриваемые домашние хозяйства имеют достаточно большую долю бюджета, чтобы пренебречь изменениями во втором члене выражения (7.48), то эластичность по общим расходам можно вычислить на основе выражения (7.58) как 1 + (3ji/wji. Она измеряет полную эластичность для тех, которые потребляют алкоголь и тех, которые курят соответственно. Если мы вычисляем вышеупомянутые эластичности как выборочные средние по тем семьям, которые имеют положительные расходы, то

мы получаем оцененные эластичности равные 1,294 и 0,180 соответственно. Это показывает, что алкогольные напитки являются предметами роскоши, в то время как табак является предметом первой необходимости. Фактически, эластичность по общим расходам на табак довольно близка к нулю.

В этом приложении тобит-модель предполагает, что все нулевые расходы являются результатом граничных решений, и что достаточно большое изменение в доходе или относительных ценах, в конечном счете, привело бы к положительным расходам для любой

Мы сначала берем средние, а затем вычисляем отношение.

семьи. В частности для табака это, повидимому, не соответствует действительности. Например, многие люди не курят из-за сохраненья здоровья или по социальным причинам, и не стали бы курить, даже если сигареты были бесплатные. Если это так, то, по-видимому, более уместно моделировать решение курить или нет, в виде процесса, не связанного с решением, сколько расходовать на это. Так называемая тобит-модель II, одна из обобщений тобит-модели, которая будет обсуждаться ниже, могла бы подойти для такой ситуации. Поэтому мы возвратимся к этому примеру в п. 7.4.4 ниже.

7.3.4. Спецификационные тесты для тобит-модели

Нарушение предположений о распределении остатка Єі, в общем, будет приводить к несостоятельным МПП-оценкам для неизвестных вектора параметров (3 и дисперсии <т2. В частности, не нормальность распределения и гетероскедастичность вызывают беспокойство. Мы можем протестировать эти альтернативы, так же как и наличие не включенных в модель существенных переменных, в рамках схем множителей Лагранжа. Чтобы начать обсуждение, сначала отметим, что условия первого порядка логарифма правдоподобия log L относительно /3 задаются как

где мы определяем обобщенный остаток ег° как масштабированный остаток Si/a — (уі — х'ф)/Э для положительных наблюдений и как значение —ф{-)/{1 — Ф(-))5 вычисленное в точке х'ф/Э, для нулевых наблюдений. Таким образом, мы получаем условия первого порядка, которые имеют тот же самый вид, как и в пробит-модели, или линейной модели регрессии. Единственное различие состоит в определении соответствующего (обобщенного) остатка.

Поскольку сг2 также является оцениваемым параметром, то нам, чтобы получить спецификационные тесты, также требуется условие первого порядка для а2. За исключением несущественного множителя масштабирования, условие первого порядка для а2 имеет

вид

Подпись:
Е

гЄІо

о 1-Ф(х0/Э)

1 = Е ^G(2) = 0, (7.60)

і=1

где мы определяем є і , как обобщенный остаток второго порядка. Условие первого порядка относительно а2 говорит, что выборочное среднее £\^2) должно равняться нулю. Можно показать (см. (Gourieroux et al., 1987)), что обобщенный остаток второго порядка является оценкой для Е{(є2/а2) — 1|у;, точно так же, как обобщенный остаток (первого порядка) является оценкой для Е{бі/ауі, Хі}. В рамках этого текста нет возможности провести такой вывод, тем не менее, интуитивно ясно: если Єі нельзя определить по уі, Хі и вектору параметров /3, то мы заменяем выражения значениями условных математических ожиданий при условии, что все, что мы знаем о у*, отражается в у і . Просто это была бы наилучшая догадка о том, что мы думаем об остатке при условии, что мы знаем только, что удовлетворяется є і < —х'ф.

Из выражения для условий первого порядка (7.59) непосредственно ясно, как мы могли бы протестировать невключение в модель J существенных переменных Zi. Поскольку дополнительные условия первого порядка означали бы, что

n

J2eiGZi = 0,

i=l

то мы просто можем построить регрессию единиц по К + 1 + J пере-менным Єі Хі, Єі и Єі z , и вычислить критическую статистику как 7V, умноженное на нецентрированный В2. При нулевой гипотезе соответствующим асимптотическим распределением является хи-квадрат распределение с J степенями свободы.

Тестирование на гетероскедастичность может быть основано на альтернативной гипотезе, что

V{£i} = a2h(z'ia), (7.61)

где h(-) — неизвестная дифференцируемая функция с Л(0) = 1 и h(-) > 0, a Zi — J-мерный вектор объясняющих переменных, не включающий свободный член. Нулевая гипотеза соответствует а — О, означая, что ^{^г} = о-2. Дополнительные метки относительно а, вычисленные по текущим значениям оценок параметров (3,а2, легко получаются как кє{ z{, где к — несущественная константа, которая зависит от функции h. Следовательно, критическая статистика МЛ-теста для гетероскедастичности легко получается как 7V, умноженное на нецентрированный R2 регрессии единиц по К +1 + J пере

менным егСх, eg<^ и e^z'. Отметим, что в этом случае критическая статистика также не зависит от вида функции /і, а только от zi.

Если гомоскедастичность отклоняется, то мы можем оценить модель с гетероскедастичными остатками, если мы специфицируем вид функции /г, например, h(z[a) — ехр{гг'а}. В логарифмической функции правдоподобия мы просто заменяем дисперсию <т2 функцией <т2 exp {z[a} и оцениваем а одновременно с неизвестными вектором параметров (3 и а2. Альтернативно возможно, что гетероскедастичность может обнаружиться из-за того, что в модели неправильно что-то еще. Например, может не соответствовать общий вид функции, и следует включить нелинейные функции от вектора объясняющих переменных Хі. Проблему гетероскедастичности также можно исключить преобразованием зависимой переменной. Например, этим объясняется, почему во многих случаях модель специфицируется для логарифма заработной платы, а не для самой заработной платы непосредственно.

И, наконец, мы обсудим тест на выявление ненормальности распределения. Этот тест может основываться на структуре Пагана и Велла (Pagan, Vella, 1989) и предполагает тестирование следующих двух условий для условных моментов, которые следуют из нормальности: Е{є3/а3хі} = 0 и E{sf/a4 — 3хі} — 0, что соответствует отсутствию асимметрии и избыточного эксцесса, соответственно (см. параграф 6.4). Сначала рассмотрим величины Е{є3/а3уі, хг} и E{ef/a4 — 3уі, Хі}, отметив, что взятие математических ожиданий по Уі (при заданном векторе Хі) приводит к двум интересным моментам. Если у і > 0, то мы просто можем оценить выборочные эквиваленты как ef/а3, так и є4/а4 — 3, соответственно, где єі = Уі — х'ф. Для у і — 0 условные математические ожидания более сложны, но их можно вычислить, используя следующие формулы (Lee, Maddala, 1985):

Подпись: 

 
. V о) .

Подпись: а2 а Подпись: 1
Подпись: = ЗЕ
Подпись: +
Подпись: Е

Е

Е

Хі,Уі = о

Хі,Уі = о Хі,Уі = о| +

— Хі, Уі=0

а

(7.62)

(7.63)

Эти две величины легко можно оценить из ММП-оценок /3 и а2 и обобщенных остатков и е^2 Обозначим полученные оценки

•Ф) „ ?G(4)

С73

-G(3) ?i ^ п

£г ЄСЛИ У* > °>

(7.64)

,G(3) _

2 +

а

єі в противном случае

^гС(4) = ^4 " 3' ЄСЛИ 2/i > °»

а4

/ >£3 (7*65) = бє{ + [ -к~ ) в противном случае.

Согласно закону итеративных математических ожиданий нулевая гипотеза нормальности означает, что (асимптотически) Е{є^^хі) — О и Е{є^^хі} = 0. Следовательно, тест условных моментов на ненормальность распределения можно получить построением регрессии

. о / -G(2) -G(3) -G(4)

вектора единиц по К + 3 переменным ^ ^, ^ v , ^ w v, и вычислением JV, умноженного на нецентрированный R2. При нулевой гипотезе асимптотическое распределение полученной в результате критической статистики имеет хи-квадрат распределение с 2 степенями свободы.

Хотя вывод различных критических статистик может казаться сложным, их вычисление относительно легкое. Они могут быть вычислены, используя вспомогательную регрессию после некоторых прямых вычислений, включающих ММП-оценки и данные. Поскольку состоятельность ММП-оценок кардинально зависит от корректной спецификации функции правдоподобия, тестирование на некорректную спецификацию должно быть стандартной общепринятой практикой в эмпирической работе.

7.4. Обобщения тобит-моделей

Стандартная тобит-модель имеет структуру, которая часто слишком ограничена: в точности одни и те же переменные, влияющие на вероятность ненулевого наблюдения, определяют уровень положительного наблюдения и, кроме того, с тем же самым знаком. Например, это подразумевает, что те, кто более вероятно расходуют положительную сумму, в среднем также являются теми, которые тратят больше на товар длительного пользования. В этом разделе мы обсудим модели, которые ослабляют это ограничение. Приводя определенный пример расходов на отпуск, представляется, что многодетные семьи менее вероятно будут иметь положительные расходы, в то время как, если отпуск оплачивается, то ожидаемый уровень расходов для таких семей выше.

Предположим, что мы интересуемся объяснением заработной платы. Очевидно, что заработная плата наблюдается только для людей, которые фактически работают, но в экономических целях мы часто интересуемся (потенциальной) заработной платой совокупности индивидуумов, не ограниченной этим условием. Например: изменение в некоторой переменной х может привести к снижению чьей-то заработной платы настолько, что он решает прекратить работать. Следовательно, его заработная плата больше не наблюдалась бы, и эффект этой переменной х может быть недооценен из имеющихся данных. Поскольку возможно, что выборка работников не является случайной выборкой из генеральной совокупности (потенциальных работников) — в частности можно ожидать, что люди с более низкой (потенциальной) заработной платой более вероятно будут безработными — эта проблема часто называется проблемой, связанной с ограничениями на процесс формирования выборки ("sample selection problem")*^.

7.4. j. Модель тобит II

Традиционной моделью для описания проблем, связанных с ограничениями на процесс формирования выборки, является модель тобит II24), также называемая моделью с выборочной селективностью. В этом контексте она состоит из линейного уравнения заработной платы

w* = ж'и/?і (7.66)

*) В дальнейшем мы будем называть это «проблемой выборочной селективности» (примеч. научн. ред. перевода).

4) Такая классификация тобит-моделей исходит из статьи (Amemiya, 1984). Тогда стандартная тобит-модель параграфа 7.3 называется моделью тобит I.

где хц обозначает вектор экзогенных характеристик (возраст, образование, пол, ...), a w* обозначает заработную плату г-го индивидуума. Здесь имеется в виду заработная плата w* для неработающих индивидуумов (что пояснено звездочкой *), и она не наблюдается.

W* = Wi, Ы = 1, и w* не наблюдается hi = 0,

если h* > 0, если /г* < 0,

(7.68) (7.69)

где Wi обозначает фактическую заработную плату г-го индивидуума 25 Бинарная переменная hi просто указывает, работает г-ый индивидуум {hi — 1) или нет {hi = 0). Постановка модели завершается предположением о распределении ненаблюдаемых остатков (єіг)£2г)Обычно предполагается двумерное нормальное распределение с нулевым математическим ожиданием, дисперсиями а, а, соответственно, и ковариацией а2Модель (7.67) фактически является стандартной пробит-моделью, описывающей выбор, работает индивидуум или нет. Поэтому, как и ранее требуется ограничение нормировки и обычно полагается а — 1. Переменные вектора Х2і с коэффициентами /?2 влияют на выбор — работать. Уравнение (7.66) описывает (потенциальную) заработную плату как функцию от переменных вектора хц с коэффициентами (3. Знаки и величина коэффициентов /3 в этих двух уравнениях могут различаться. В принципе переменные в векторах х и Х2 могут отличаться, хотя в этом отношении следует быть очень осторожным (см. ниже). Легко заметить, что если бы мы наложили условия x'uf5i — х'2ф2 и Єц = Е2г, то вернулись бы к стандартной тобит-модели (модели тобит I).

Условное математическое ожидание заработной платы при условии, что индивидуум работает, задается в виде

E{wihi = 1} = я'н/Зі + E{euhi = 1} =

= + Е{еие2г > -Х'2М =

= х'иРі + ^Е{є2іЄ2г > -х'2М

где в последнем равенстве используются нормировка <т2 = 1 и выражение для математического ожидания усеченного стандартного нормального распределения, подобного тому, которое использовалось при выводе выражения (7.49). В третьем равенстве используется тот факт, что для двух нормальных случайных переменных Е{єів2} = {&12/,(j2)^2' В Приложении Б эти результаты описаны более детально. Отметим, что мы можем написать <ті2 = ^12^1? гДе р2 — коэффициент корреляции между двумя остатками. Тем самым снова показывается общность модели в сравнении с выражением (7.49). Из выражения (7.70) непосредственно следует, что условное ожидание заработной платы равно х'и(3, если только о2 — Р2 — 0. Так, если остатки этих двух уравнений являются некоррелированными, то уравнение заработной платы можно оценить состоятельно обычным МНК. Смещение из-за селективности выборки в МНК-оценке возникает, если а2 -ф 0. По Хекману (Heckman, 1979) член Ф(х2і^)i'Ф(х2гАг) обозначается в виде Х(х^Р2) и поэтому иногда он называется лямбдой Хекмана.

Критическим параметром, который делает модель с выборочной селективностью отличающейся от просто модели регрессии и пробит-модели, является коэффициент корреляции (или ковариация) между остатками этих двух уравнений. Если остатки некоррелированы, то мы просто могли бы оценить уравнение заработной платы с помощью МНК и игнорировать уравнение с выборочной селективностью (если в нем мы не заинтересованы). Теперь, почему мы можем ожидать корреляцию между этими двумя остатками? Хотя модель тобит II можно мотивировать по-разному, мы будем более или менее следовать за ее обсуждением в статье (Gronau, 1974). Предположим, что проблему максимизации полезности индивидуума (в случае статьи (Gronau, 1974): домохозяйки), можно охарактеризовать заработной платой сохранения работы w (стоимостью времени). Индивидуум будет работать, если фактическая заработная плата, которую ему предлагают, превысит эту заработную плату сохранения работы. Конечно, заработная плата сохранения работы зависит от личностных характеристик, через функцию полезности и бюджетное ограничение, так что мы пишем (предполагаем)

где Zi — вектор личностных характеристик, а гі не наблюдаем. Обычно заработная плата сохранения работы не наблюдается.

Теперь предположим, что заработная плата, которую индивидууму предлагают, зависит от его личностных характеристик (и некоторых характеристик работы) как в уравнении (7.66), то есть.

Если эта заработная плата ниже w^, то предполагается, что индивидуум і не будет работать. Таким образом, мы можем написать его решение по предложению рабочей силы как

hi — 1, если W* — Wi > О, hi = 0, если w* — w < 0.

Неравенство можно написать в терминах наблюдаемых характеристик и ненаблюдаемых остатков как

h = < < = хфХ Z'd + (Єц щ) = X2ifo + £2г, (7.71)

соответственно определяя X2i и Е2г • Следовательно, наша простая экономическая модель, где предложение рабочей силы основано на заработной плате сохранения работы, приводит к модели вида тобит П. Для соотношения (7.71) стоит отметить несколько положений. Во-первых, на решение, работать или нет, влияет размер предлагаемой заработной платы. Это подразумевает, что остаток є2\% включает ненаблюдаемую гетерогенность, влияющую на предложение заработной платы, то есть включает єц. Если щ не коррелирован с Єц, то ожидается, что корреляция между остатками є2і и єц будет положительной. Следовательно, мы можем ожидать смещение из-за выборочной селективности в МНК-оценках по экономическим доводам. Во вторых, все переменные вектора хц плюс все переменные вектора Zi, которые не содержатся в хц, включаются в вектор Х2і-Таким образом, экономические доводы убеждают нас в том, что в вектор Х2і следует включить, по крайней мере, те переменные, которые содержатся в векторе Хц •

Чтобы лучше почуствовать обобщение, повторим статистическую модель, модель тобит II, подставляя у вместо W

У* = xuPi + £u

К = Х2г^2 + Є2І

(7.72) (7.73)

Уі = уі, hi = 1, если h* > 0, (7.74) у і не наблюдаемо, hi = 0, если /і* < 0, (7.75)

где

(:;:)~яояр((о>(;1 ?))■ <™>

Эта модель имеет две наблюдаемые эндогенные переменные Уі и hi. Статистически она описывает совместное распределение у і и hi, условное по обоим векторам переменных хц и Х2і. То есть, уравнение (7.72) описывает условное распределение у*, условное по обоим векторам переменных хц и Х2ІЕдинственная причина, побуждающая нас не включать определенную переменную из вектора Х2і в вектор Хи-> заключается в нашей уверенности, что в уравнении заработной платы эта переменная имеет нулевой коэффициент. Например, к таким переменным можно было бы отнести переменные, которые влияют только на заработную плату сохранения работы, но не на саму заработную плату. Некорректное исключение переменной из уравнения (7.72), и в то же время ее включение в уравнение (7.73), может серьезно повлиять на результаты оценивания и привести к ложным выводам о существовании смещения из-за ограничений при формировании выборки.

7.4.2. Оценивание

В целях оценивания о модели можно думать как состоящей из двух частей. Первая часть описывает бинарную проблему выбора. Вклад в функцию правдоподобия есть просто вероятность наблюдения hi = 1 или hi = 0. Вторая часть описывает распределение заработной платы для тех, кто фактически работает, так что вклад в правдоподобие есть f(yihi — 1). Таким образом, для логарифмической функции правдоподобия мы имеем

log L3(/3, (т, (7і2) = Yl lo§ pih* = °> +

іЄІо

+ ]T[log/Ы/гг = 1) + log Р{Ы = 1}]. (7.77)

Часть модели, описывающая бинарный выбор стандартна; единственная сложная часть — это условное распределение переменной Уі при условии hi — 1. Поэтому общепринято анализировать совместное распределение Уі и hi иначе, используя тот факт, что

f(yihi = 1)р{Ы = 1} = р{Ы = 1уі}Пуі). (7.78)

В правой части последний член является просто функцией плотности нормального распределения, в то время как первый член является вероятностью из условной функции плотности нормального распределения, характеризуемой (см. Приложение Б),

Е{КУі) = X'2ifo + Щ(УгХМ,

V{h*yt} = l-^,

где последнее равенство обозначает дисперсию h* условную по Уі и данным экзогенным переменным. Таким образом, мы напишем логарифм правдоподобия в виде

log L3((3, о, <7i2) = loS p{h* = °} +

іЄІо

+ J][log f(yi) + log Р{Ы = 1Уі}] (7.79)

іЄІі

со следующими равенствами

P{hi = 0} = 1 Ф(х'2і02), (7-80)

р{ы = i|w} = Ф(^і±І^Щ^Щ, (7.81)

V Vі ^12M /

Максимизация log Ьз(/?, сг2, <ті2) относительно неизвестных параметров приводит (при умеренных условиях регулярности) к состоятельным и асимптотически эффективным оценкам, которые имеют асимптотическое нормальное распределение.

В эмпирической работе модель с выборочной селективностью чаще оценивается двухшаговым способом. В вычислительном отношении это проще, а также обеспечивает хорошие начальные значения для процедуры максимального правдоподобия. Двухступенчатая процедура исходит из статьи (Heckman, 1979) и основана на следующей регрессии (сравните с выражением (7.70) выше),

Уі = x'uPi + 012 А* + 77г, (7.83)

где

ф{х'2г(32)

1 ф(^&)"

Остаток в этой модели равняется

гц = єц Е{єцхі, hi = 1}.

Учитывая предположение, что распределение єц не зависит от Хі (но не от hi), остаток щ не коррелирован с хц и по построению. Это означает, что мы могли оценить параметры (3 и а2 в виде МНК-оценок регрессии по исходным регрессорам хц и дополнительной переменной Хі. Тот факт, что не наблюдается, в действительности не является проблемой, поскольку единственный неизвестный элемент в Хі есть вектор /?2, который можно оценить состоятельно с помощью ММП, примененного к пробит-модели с выборочной селективностью. Это означает, что в регрессии (7.83) мы заменяем Хі ее оценкой Хі , и МНК все еще будут приводить к состоятельным оценкам для (3 и а2. В общем же, эта двухшаговая оценка не будет эффективна, но ее просто вычислить и она состоятельна.

Одна из проблем двухшагового оценивания состоит в том, что обычно вычисляемые стандартные ошибки МНК являются некорректными, если о2 -ф 0. Эта проблема часто игнорируется, потому что все еще правомерно протестировать нулевую гипотезу отсутствия смещения из-за выборочной селективности, используя стандартный ^-критерий для проверки, что <7і2 = 0. Однако, в общем, стандартные ошибки следует скорректировать, поскольку остаток гі в уравнении (7.83) гетероскедастичен, и поскольку оценивается вектор j32. Подробности см. в книге (Greene, 2000, Sect. 20.4). Если векторы хц и х2і идентичны, то модель идентифицируема только из-за факта, что является нелинейной функцией. Поэтому эмпирически двухшаговый подход не будет работать очень хорошо, если существует небольшая вариация в , и — близка к линейной функции по х2і . Эти обстоятельства являются предметом многих исследований методами Монте-Карло, например, исследование (Leung, Yu, 1996). Включение переменных в вектор х2і дополнительно к тем, которые содержатся в векторе хц, может быть важным для идентифицируемости на втором шаге, хотя для включения таких переменных часто нет никаких естественных претендентов, и любой выбор легко критикуется. По крайней мере, некоторый анализ чувствительности к наложенным исключающим ограничениям следует выполнить, чтобы убедиться, что член А корректно улавливает эффект невключенных существенных переменных.

Модель, которая оценивается на втором шаге, описывает условное математическое ожидание у і для данного Хі и при условии, что hi = 1, например, математическое ожидание заработной платы при условии, что индивидуум работает. Эта информация непосредственно не предоставляется, если модель оценивается ММП, хотя это условное математическое ожидание можно легко вычислить из оценок. Часто интересно математическое ожидание г/і для данного Хі , безусловное по hi — 1, и оно задается хф, которое также предоставляется последней регрессией. Таким образом, прогнозирование заработной платы для произвольного индивидуума может быть основано на уравнении (7.83), но не должно включать член а2^{x2iР2)• Положительная ковариация а2 указывает, что существует ненаблюдаемая гетерогенность, которая положительно влияет как на заработную плату, так и на вероятность наличия работы. То есть, более правдоподобно, что будут работать те индивидуумы, заработная плата которых выше чем ожидаемая (условная при данном множестве значений Хі ).

Двухшаговая оценка модели с ограничениями при формировании выборки является одной из оценок, наиболее часто используемых в эмпирической микроэконометрической работе. По-видимому, существует вера, что включение в модель члена коррекции Л исключает все проблемы смещения, обусловленного выборочной селективностью. В общем, это конечно неверно. Наличие неслучайной выборки приводит к фундаментальной проблеме идентифицируемости и, следовательно, правомерность любого решения будет зависеть от правомерности сделанных предположений, которые можно протестировать только частично. В параграфе 7.5 ниже больше внимания уделяется смещению из-за выборочной селективности и связанной с ним проблеме идентифицируемости.

7.4.3. Дальнейшие обобщения

Структуру модели с одной или более латентными переменными, нормальными остатками и правилом наблюдения, отображающим ненаблюдаемые эндогенные переменные в наблюдаемые, можно использовать в разнообразных приложениях. В статье (Amemiya, 1984) характеризуются несколько тобит-моделей в форме функций правдоподобия, так что различные структуры могут приводить к моделям, которые являются статистически неразличимыми. Очевидным обобщением, приводящим к модели тобит III, является такое обобщение, когда h в вышеупомянутых моделях уравнений предложения труда и заработной платы частично наблюдается как часы работы. В том случае мы наблюдаем

Уі = у*, hi = h*, если h* > О, (7.84) Уі не наблюдается, /і^ = 0, если h < О, (7.85)

с одной и той же в основе лежащей латентной структурой. По существу, это говорит, что модель с выборочной селективностью не является моделью типа пробит-модели, а относится к моделям типа стандартной тобит-модели. Приложения, в которых применяются модели таких и более сложных структур, часто можно найти в экономике труда, где объясняется заработная плата в различных секторах с учетом членства в профсоюзах и т.п., принимая во внимание, что выбор секторов, вероятно, не является экзогенным, но основан на потенциальной заработной плате в сравниваемых секторах, или что не экзогенно предложение труда, или что не экзогенно ни то, ни другое. Другие типы моделей выбора также возможны, включая, например, модель с упорядоченным множественным откликом. Для более подробного обсуждения этой темы см. статью (Vella, 1998).

7.4.4. Пример: расходы на алкоголь и табак (часть 2)

В п. 7.3.3 мы рассматривали оценивание кривых Энгеля для алкогольных напитков и табака, принимая во внимание проблему нулевых расходов. Стандартная тобит-модель предполагает, что нулевые расходы являются результатом граничных решений. То есть, ограничение бюджета семьи и предпочтения таковы, что оптимальные доли бюджета на алкоголь и табак, которые определяются условиями первого порядка, при отсутствии ограничения неотрицательности, были бы отрицательными. Как следствие, оптимальными для семьи являются нулевые расходы, соответствующие граничному решению, которое не характеризуется обычными условиями первого порядка. Можно обсуждать, насколько такое предположение реалистично, и в этом пункте параграфа рассматриваются некоторые альтернативы модели тобит I. Альтернативами являются просто МНК для положительных наблюдений, возможно объединенный с моделью бинарного выбора, с помощью которой объясняется, являются расходы положительными или нет, и объединенная модель тобит II, которая моделирует расходы долей семейного бюджета совместно с бинарным решением, потреблять или нет.

Очевидно, что можно подумать о других причинах, кроме подразумеваемых в тобит-модели, почему в семьях не потребляют табак или алкоголь. Например, по социальным причинам или по причинам здоровья многие некурящие не курили бы, даже если бы табак был доступен бесплатно. Это подразумевает, что, наблюдаем мы или нет, нулевые расходы можно определить совершенно независимо от общих сумм расходов тех семей, которые потребляют этот товар. Возможно, что некоторые предметы потребления подлежат воздержанию26^. Имея это в виду, мы можем рассмотреть альтернативные спецификации для тобит-модели. Первая альтернатива очень проста и предполагает, что воздержание определяется случайным образом в том смысле, что ненаблюдаемые значения, которые определяют расходы долей семейного бюджета, не зависят от решения потреблять или нет. Если это так, то мы можем специфицировать просто кривую Энгеля, которая правомерна для людей, которые не воздерживаются и игнорируют решение воздержания. Она позволила бы нам оценить эластичность общих расходов для людей, которые имеют положительные расходы доли семейного бюджета, но не позволила бы нам проанализировать возможные эффекты, возникающие вследствие изменяющегося состава населения с положительными значениями расходов. Статистически, это означает, что мы можем оценить кривую Энгеля просто обычным МНК, но используя только те наблюдения, которые имеют положительные расходы. Результаты такого оценивания представлены в таблице 7.5. По сравнению с результатами для тобит-модели, представленными в таблице 7.4, удивительно, что коэффициент при логарифме общих расходов в кривой Энгеля для алкоголя является отрицательным и статистически не значимо отличается от нуля. Оценивание эластич-ностей общих расходов, которые определяются выражением (7.58), на основе результатов МНК-оценивания приводит к значениям 0,923 и 0,177 для алкоголя и табака соответственно.

Эластичности, основанные на МНК-оценках, правомерны, если воздержание определяется на основе наблюдаемых переменных модели, а не на основе ненаблюдаемых переменных, которые улавливаются остатком. Кроме того, эластичности являются условными по тому факту, что семья имеет положительные расходы. Чтобы понять, каковы причины потребления или непотребления семьями этих двух товаров, мы можем использовать модель бинарного выбора, самой очевидной версией которой является пробит-модель.

Некоторые авторы относят эти товары к «вредным

Если все нулевые расходы объясняются воздержанием, а не граничными решениями, то пробит-модель должна включать переменные, которые определяют предпочтение, и не должна включать переменные, которые определяют ограничение семейного бюджета. Это так, поскольку в этом случае изменения в ограничениях семейного бюджета никогда не будут побуждать семью начать потреблять алкоголь или табак. Тогда подразумевалось бы, что общие расходы и относительные цены не должны включаться в пробит-модель. При отсутствии вариации в ценах по семьям, общие расходы являются очевидной кандидатурой на исключение из пробит-модели. Однако представляется, что уровень образования является важным показателем воздержания от алкоголя или табака, и, к сожалению, в нашей выборке никакой информации об образовании не имеется. Причина, по которой, несмотря на нашу оговорку, мы включаем общие расходы в пробит-модель, состоит в том, что мы думаем об общих расходах как о приближенном заменителе уровня образования, социального статуса или других переменных, которые влияют на предпочтение семьи. В дополнение к переменным, включенным в кривую Энгеля, модель для воздержания также включает две фиктивных переменные для рабочих и служащих27^. Предполагается, что эти две фиктивные переменные не влияют на расходы доли семейного бюджета на алкоголь и табак, а влияют только на решение, потреблять или нет. Как любое ограничение исключения влияния, это обстоятельство также можно обсуждать, и мы возвратимся к этой проблеме ниже, оценивая объединенную модель для расходов долей семейного бюджета и воздержания.

Результаты оценивания для этих двух пробит-моделей представлены в таблице 7.6. По-видимому, для объяснения воздержания от алкогольных напитков статистически значимы общие расходы, число взрослых в семье, а также число детей в возрасте не менее двух лет. Для воздержания от табака статистически важными объясняющими переменными являются общие расходы, число детей в возрасте не менее двух лет, возраст и принадлежность к рабочим. Чтобы проиллюстрировать результаты оценивания, рассмотрим семью, состоящую из двух взрослых, главы семьи, являющимся 35-летним рабочим, и двух детей в возрасте не менее двух лет. Если для примера общие расходы такой семьи равны общему выборочному среднему, то предполагаемые оцененные вероятности положительных расходов долей семейного бюджета на алкоголь и табак равняются 86,8\% и 51,7\% соответственно. Увеличение общих расходов на 10\% изменяет эти вероятности только незначительно до 88,5\% и 50,4\%.

Предполагая, что спецификации кривой Энгеля и модели воздержания корректны, результаты оценивания, представленные в таблицах 7.5 и 7.6, приемлемы при условии, что остаток в пробит-модели независим от остатка в кривой Энгеля. Наличие корреляция между этими остатками делает результаты МНК неправомерными, и тогда была бы более уместна модель тобит П. Выражаясь иначе, две модели уравнений, которые были оценены, являются частным

Исключенная категория (группа начального (нулевого) отсчета) включает экономически не активное население и людей, занятых собственным бизнесом.

случаем модели тобит II, в которой остатки в соответствующих уравнениях являются некоррелированными. Наличие ненулевой корреляции можно протестировать, если мы оценим более общую модель. Как обсуждалось выше, для модели тобит II очень важно, какие переменные включены в каждое из этих двух уравнений. Если в оба уравнения включаются одни и те же переменные, то модель является идентифицируемой только при предположении нормальности, которое налагается на остатки 28^. Как правило, такая ситуация

Чтобы увидеть это, отметим, что вид функции Л определяется предположениями о распределении регрессионного остатка. См. обсуждение в параграфе 7.5 ниже.

рассматривается как нежелательная. Исключение переменных из модели воздержания не решает эту проблему. Вместо этого в модель воздержания желательно включить переменные, относительно которых мы уверены, что они не определяют расходы семейного бюджета непосредственно. Проблема поиска таких переменных аналогична проблеме поиска соответствующих инструментальных переменных по отношению к эндогенным регрессорам (см. главу 5), и нам следует быть одинаково критичными и осторожными при их выборе; наши результаты оценивания будут критически зависеть от выбора, который мы сделаем. В вышеупомянутой модели воздержания фиктивные переменные принадлежности к рабочим или служащим включались для обсуждения их роли. Если мы уверены, что эти переменные не влияют на расходы доли семейного бюджета непосредственно, то оценивание модели тобит II может быть правомочным.

Используя двухшаговую процедуру оценивания, которая предложена Хекманом (Heckman, 1979), мы можем повторно оценить эти две кривые Энгеля, принимая во внимание проблему выборочной селективности, обусловленную возможной эндогенностью решения о воздержании. Результаты такого оценивания представлены в таблице 7.7, и для оценивания применен МНК, но стандартные ошибки скорректированы с учетом гетероскедастичности и ошибки в оценивании Л. Для алкогольных напитков включение Л не очень сильно повлияло на результаты, и мы получили оценки, которые достаточно близки к тем, которые представлены в таблице 7.5. Значение t-статистики для коэффициента Л не дает оснований для отклонения нулевой гипотезы об отсутствии корреляции, поскольку результаты оценивания говорят, что оцененный коэффициент корреляции (вычисленный как отношение коэффициента Л и среднеквадратичного отклонения остатка д) равен только —0,01. Вычисление таких коэффициентов корреляции важно, поскольку двухшаговый метод может легко повлечь за собой корреляции вне интервала [—1, 1], указывая, что модель тобит II, возможно, неправомерна, или что некоторые ограничения исключения неуместны. Отметим, что эти результаты оценивания означают, что общие расходы имеют значимое влияние на вероятность наличия положительных расходов на алкоголь, но значимо не влияют на расходуемую на это долю семейного бюджета. С другой стороны, для табака мы действительно нашли значимое влияние члена Л, связанного с выборочной селективностью, и соответствующий оцененный коэффициент корреляции, равный —0,31.

Однако представляется, что качественно эти результаты не очень отличаются от результатов в таблице 7.5. Отрицательный коэффициент корреляции указывает на существование ненаблюдаемых характеристик, которые положительно влияют на решение курить, но отрицательно влияют на долю семейного бюджета, расходуемую на табак. И, наконец, мы вычислили эластичности общих расходов алкоголя и табака на основе результатов оценивания, представленных в таблице 7.7. Применив для этого, как и ранее, аналогичные

вычисления, мы получили оцененные эластичности, равные 0,920 и 0,243 соответственно. Очевидно, и не удивительно, что табак является предметом первой необходимости для тех, кто курит. Фактически, расходы на табак близки к неэластичным.

Путеводитель по современной эконометрике

Путеводитель по современной эконометрике

Обсуждение Путеводитель по современной эконометрике

Комментарии, рецензии и отзывы

7.3. тобит-модели: Путеводитель по современной эконометрике, Вербик Марно, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Марно Вербик (Marno Verbeek) — профессор эконометрики в Центре экономических исследований Лёвенского университета (Бельгия). Работает также в Центре экономических исследований Тилбургского университета (Голландия).