1.8. модель тобит-11
1.8. модель тобит-11
В предыдущем разделе мы рассмотрели линейную модель наблюдений
price* =a + [3xi +стєі , i = 1, к, n,
в которой price* цена, которую уплатила за покупку автомобиля
(автомобилей) i-я семья, если эта семья имеет автомобиль, или цена, которую уплатила бы за покупку автомобиля i-я семья, не имеющая автомобиля, если бы эта семья решила приобрести автомобиль. При этом мы предполагали, что i-я семья покупает автомобиль по цене
price*, если price* > у. Таким образом, в этой модели решение о
приобретении или неприобретении собственного автомобиля определяется самой ценой, по которой предполагается приобрести автомобиль. В то же время мы могли бы рассмотреть и другую модель, в которой процесс принятия решения о стоимости покупаемого автомобиля отделен от процесса принятия решения о покупке автомобиля.
Пусть мы имеем дело с некоторым показателем у*, значения которого наблюдаются не для всех i . Значение у* наблюдается,
если выполнено условие к* > 0, где к* некоторая функция полезности. Мы будем предполагать, что у* = xlft + єи, i = n ,
к = x2>A + Є2і , i = 1 П ,
где
x1i ={x11i, k,x1 i) - вектор значений p1 объясняющих
переменных в уравнении для у i ,
в1 = {д11,...,д1рі ) вектор коэффициентов при этих переменных, x2i = (x21 i, к, x2p2 i) - вектор значений p2 объясняющих
переменных в уравнении для к*,
в2 = [б21,...,62p2) вектор коэффициентов при этих переменных.
Случайные составляющие єи и є2і могут быть коррелированными, так что Cov{e1i ,є2і )^ 0. Следуя обычной практике, мы будем предполагать, что двумерные случайные
векторы (єи,є2і) , і = 1,n , независимы в совокупности и имеют одинаковое двумерное нормальное распределение N2 (0, I) с нулевым вектором математических ожиданий и ковариационной матрицей
(
012 1
2
02 J
т.е.
Vf2i J
і'.і.й?. N2
0,*
12
22
01
2 JJ
Для нормализации функции полезности полагаем
2 =1.
Наблюдаемыми являются
значения объясняющих переменных
і = 1,к,n ;
значения переменной кі,
кі =
1, если к* > 0,
і
0, если к* < 0; значения переменной уі, y,, если кі = 1,
x1 j,і' x2j,і'j = 1k' j
0, если кі = 0.
Определенную таким образом модель называют стандартной Тобит-II моделью. Соответственно, о модели рассмотренной в предыдущем разделе, в этом контексте говорят как о стандартной Тобит-I модели.
З а м е ч а н и е
Объясняющие переменные в уравнениях для у* и к* могут
быть как одинаковыми, так и различными. В ряде ситуаций экономическая аргументация указывает на необходимость
включения в правую часть уравнения для к* (уравнение выбора)
всех переменных, включенных в правую часть уравнения для у*. При этом коэффициенты при одной и той же переменной в уравнениях для у* и к* могут быть различными.
Если предположить, что x^i01 = x12i92 и e1i =£2i, то мы возвращаемся к стандартной Тобит-модели, рассмотренной в предыдущем разделе (модель Тобит-I).
Обращаясь опять к примеру с автомобилями, мы могли бы расмотреть, например, модели, в которых значение price* определяется по той же формуле price* = а + в xi +<j£j, i = 1,n,
но наличие автомобиля соответствует выполнению соотношения
к* >0, в котором
к* = y+SXj + ut, или, например,
К =7+SXi + fCd+ ui,
где man =1 , если главой семьи является мужчина, и man = 0 , если главой семьи является женщина.
Прежде всего заметим, что (при фиксированных значениях x1i,
X2i )
Е{у,к, = 1}= xfa + E[exhl = 1}= xlA + E^he2l > -x^2}= где, как и ранее,
Ж z) = <p(z ) 0>(z).
Если <712 = 0, то
E{yhl = 1}= х1і^1 .
Это означает, что если є1і и є2і не коррелированы, то можно,
игнорируя уравнение для к*, производить непосредственное оценивание уравнения регрессии
методом наименьших квадратов по наблюдениям с к{ = 1. Это приводит к состоятельному оцениванию значений x1^i91.
Однако если <т12 ф 0, то при таком оценивании возникает
смещение оценки х1^ів1, пропорциональное величине ж{х12і92 ), которую называют в этом контексте лямбдой Хекмана.
Получить состоятельные и асимптотически эффективные оценки параметров модели Тобит-II можно, используя метод максимального правдоподобия, при котором соответствующая функция правдоподобия максимизируется по всем возможным значениям параметров модели 0ъ02,оъо12. Однако чаще такую модель оценивают, используя двухшаговую процедуру Хекмана. Она проста в вычислительном отношении и дает хорошие стартовые значения для итерационной процедуры максимизации функции правдоподобия.
Идея Хекмана состоит в использовании уже приводившегося выше соотношения
E{yk = 1}= Х?& +CX12/fc?2 )
и построения на его основе модели регрессии
У, = хЇА + a12X,+V, ,
где X переменная, определяемая соотношением
х1=х{хт11вг )=<р(хт2&)/ ф(хт2А).
Если е1i не коррелирована с х1i и х2i, то V не коррелирована с х1i и X, так что эту модель регрессии можно оценивать методом наименьших квадратов. Проблема, однако, в том, что значения X не наблюдаются, поскольку неизвестен вектор коэффициентов 02 в модели выбора.
Оценивание вектора 02 производится в рамках пробит-модели бинарного выбора. При этом получаем оцененные значения X =х(хт§2) (первый шаг процедуры Хекмана). Эти оцененные значения используются затем на втором шаге процедуры вместо X .
Модель y t = х'тів1 + a12X +V оценивается методом наименьших квадратов; в результате получаем состоятельные (хотя и не эффективные) оценки для в1 и а12. Используя эти оценки, мы
получаем оцененное ожидаемое значение y t при заданных х1 t, х2 t и ht = 1 в виде
E{{ х1г , х2, , h, = 1}= х1Т 01 + aal2X(xT,^2 ) .
Если же нас интересует ожидаемое значение y при заданных х1 і , х2 t без условия h = 1, то оно оценивается величиной
E {yгХU, х 2, }= хТ<01.
Поскольку смещение при оценивании уравнения для у* методом наименьших квадратов вызывается коррелированностью е1 i и є2i, представляет интерес проверка гипотезы об отсутствии такой коррелированности в рамках модели, оцененной на втором шаге. Отметим только, что при проверке этой гипотезы следует производить коррекцию значений стандартных ошибок оценок, учитывающую гетероскедастичность модели и тот факт, что вместо переменной Я, на втором шаге используется
предварительно оцененная переменная Я .
Заметим, наконец, что в описанной выше стандартной Тобит-II модели функция правдоподобия имеет вид
Ь(вх,в2—2) = П№ = OF"''(P[h, = 1}f(yK = if ,
i=1
где f (ytyii = i) условная плотность распределения случайной величины yt при ht = 1. Здесь
P[hl = 0} = 1 ф(д2>2 ),
P{h = 1}f (yK = 1)=p[{ = 1 y,}f (y,),
f (y)=-rr
^2 + {-12І — )yi ХЇА
(y, <A )
exp
2-2
Для начала итерационной процедуры в качестве стартовых можно взять значения оценок параметров, полученные в процессе реализации двухшаговой процедуры Хекмана.
П р и м е р 1
Пусть в примере с автомобилями наличие у семьи собственного автомобиля определяется условием w* > 2000, где
w* =-3600 + 8x, + 1800^2i, є21,...,є2Д000 ~ i.i.d. N(0,1).
Обозначив к* = w* — 2000, запишем это условие в виде к* > 0, где
к* = —5600 + 8 x, +1800 є2і,
и нормализуем функцию полезности, разделив обе части последнего равенства на 1800:
к* = —3.111 + 0.00445x, +є2і.
Пусть "потенциальная цена" автомобиля для i-й семьи определяется уравнением
price*, = 4000 + 6xi +є1і , єп,...,є1Д000 ~ i.i.d. N(0,10002). В смоделированной выборке пары (є11,є21 ),..., (є1 1000,є21000 ) взаимно независимы, но Соу(єи ,є2і ) = 707, так что коэффициент корреляции случайных величин є1і ,є2і равен р12 = 0.707.
В принятых выше общих обозначениях модели Тобит-II получаем:
у* = ^11x11,i + ^12x12,i +є1і , кі = ^21x21,i + ^22 x22,i + є2і , где x11,i = x21,i = u x12,i = x22,i = xi, °11 = 4000, °12 = ^ °21 =—3.111,
<922 = 0.00445; при этом a1 = 1000, o2 = 1, <r12 = 707.
Применяя к смоделированным данным двухшаговую процедуру Хекмана, получаем на первом шаге оцененное уравнение
к* = —3.450 + 0.00476 xt, а на втором шаге оцененное уравнение
price*] = 3936.2 + 5.995xi.
Используя полученные оценки параметров в качестве стартовых значений итерационной процедуры максимального правдоподобия, приходим к уравнениям
к* =-3.483 + 0.00480 x,,
price* = 4159.3 + 5.828хі.
При этом получаем также <т1 = 1010.7, Д2 = 0.598 .
1.2 п
1
0.8
0.6 -j 0.4
0.2 0
о Hi H_F
18000 16000 -j
14000 12000 10000 8000 6000
4000 2000
0
о Y_STAR ■ Y_STAR_F582
S89d У VIS d У VIS Л ■ У VIS Л°
96
П р и м е р 2
В условиях Примера 1 перемоделируем данные с измененной функцией полезности, полагая теперь h* =_4 + о.оозx + 2(dman),. + є2і,
где dman = 1, если главой семьи является мужчина, и dman = 0, если главой семьи является женщина.
Применяя к новым смоделированным данным двухшаговую процедуру Хекмана, получаем на первом шаге оцененное уравнение
к* =-4.280 + 0.00297 x, + 2.347(dman)., а на втором шаге оцененное уравнение
price* = 3879.97 + 6.124xI.
При этом получаем также ст1 = 984.2, Д2 = 0.643.
Обратим внимание на две ветви графика оцененных ожидаемых значений yi. Верхняя ветвь соответствует семьям, которые возглавляют мужчины, а нижняя семьям, которые возглавляют женщины.
Обсуждение Эконометрика для начинающих (Дополнительные главы)
Комментарии, рецензии и отзывы