Глава 1. модели с дискретными объясняемыми переменными. метод максимального правдоподобия 1.1 модели, в которых объясняемая переменная принимает только два различных значения

Глава 1. модели с дискретными объясняемыми переменными. метод максимального правдоподобия 1.1 модели, в которых объясняемая переменная принимает только два различных значения: Эконометрика для начинающих (Дополнительные главы), Носко Владимир Петрович, 2005 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В книге рассматриваются методы статистического анализа регрессионных моделей с ограниченной (цензурированной) зависимой переменной, систем одновременных уравнений, панельных данных, а также структурных форм векторных авторегрессий ...

Глава 1. модели с дискретными объясняемыми переменными. метод максимального правдоподобия 1.1 модели, в которых объясняемая переменная принимает только два различных значения

Ситуации такого рода возникают при исследовании влияния тех или иных субъективных и объективных факторов на наличие или отсутствие некоторого признака у отдельных домашних хозяйств (наличие или отсутствие в семье автомобиля), у отдельных индивидуумов (занятый безработный), у отдельных фирм (обанкротилась или нет в течение определенного периода) и т.п. Если исследование затрагивает n субъектов, т.е. если мы имеем n наблюдений, то факт наличия или отсутствия такого признака в i -м наблюдении удобно индексировать числами 1 (наличие признака) и

(отсутствие признака). Тем самым мы определяем индикаторную (дихотомическую, бинарную) переменную y, которая принимает в

-м наблюдении значение yi. При этом yi = 1 при наличии рассматриваемого признака у i -го субъекта и yi = 0 при отсутствии рассматриваемого признака у i -го субъекта.

Если пытаться объяснить наличие или отсутствие рассматриваемого признака значениями (точнее, сочетанием значений) некоторых факторов (объясняющих переменных) , то, следуя идеологии классической линейной модели, мы могли бы расмотреть модель наблюдений

yi =#Лі + ■■■+&px,p+є,, i = n,

в которой xi1,..., xip значения p объясняющих переменных в i -м

наблюдении, в1,...,вр неизвестные параметры, а є1,...,єп случайные ошибки, отражающие влияние на наличие или отсутствие рассматриваемого признака у i -го субъекта каких-то неучтенных дополнительных факторов. Однако попытка оценить такую модель обычным методом наименьших квадратов (OLS -ordinary least squares) наталкивается на определенные трудности.

При обычном предположении EЄ | х1) = 0, i = 1,...,n , мы получаем

E (yx,) = 01 x,1 +... + врх1р = xTtd,

где 0 = (0,...,0p) вектор-столбец (неизвестных) коэффициентов, (верхний индекс T указывает на транспонирование вектора или матрицы), а xT =(хл,...,х1р) вектор-строка (известных) значений объясняющих переменных в і -м наблюдении.

Вместе с тем, поскольку yi случайная величина, принимающая только два значения 0 и 1, то ее условное математическое ожидание (при заданном значении х1) равно

E (yxt) = 1 • P{y, = 1 х,}+ 0 • P[yt = 0 х, }= P{y, = 1 х,}. Таким образом,

01xi1 + l + Bpxip = p[y, =1 xi},

т.е. 01xi1 + +0pxip вероятность, а значит должно выполняться

соотношение

0<0xi1 + .•• + 0pxip < 1.

Это первая из трудностей, с которыми мы сталкивамся при обращении к таким моделям.

Далее, при yt = 1 получаем єі = 1 xT0, а при yt = 0 имеем Є = -xT 0, так что (при фиксированном х1) єі может принимать в

і -м наблюдении только два значения, и (условные) вероятности этих значений равны

Р[є, = 1 xT0 х, }= P[y, = 1 х, }= xT0, р[є, = -xT 0 x, }= P[y, = 0 x, }= 1 xT 0.

Соответственно, случайная величина е{ имеет условное математическое ожидание

Е (є, x,) = (і xT вр[є, = 1 xT в x,}+ (xT в Pe, = xT в x, }=

= (l xT в xT в-xj0-(l xT в)= 0 и условную дисперсию

D(4 x,) = Е(є2x,)(E (є,x, ))2 = E (є2x, ) =

= (l-xTe) ■xTie + (-xjef-(l-xTe)= = xje-(l-xTe)x]в + (і-xTв)]= xTe-(l-xTв) . Таким образом, здесь возникает также проблема гетероскедастичности, осложненная еще и тем, что в выражения для дисперсий є входит и (неизвестный) вектор параметров в .

Предположим, что yt индексирует наличие или отсутствие собственного автомобиля у , -й семьи, а x t средний ежемесячный

доход, приходящийся на каждого члена этой семьи (в условных единицах). Естественно предполагать, что вероятность наличия автомобиля возрастает с ростом xt. Если использовать линейную модель

y, =a + /3x, +є, , = n ,

то

E (y,x,) = P[y, = l x,}=a + ex,, так что если значение x увеличить на единицу, то вероятность наличия автомобиля увеличится на величину, равную

(a + fi(xt + l))-(a + fixt ) = fi, независимо от того, сколь большим или малым является среднедушевой доход xt.

Между тем такое положение вряд ли можно считать оправданным. Скорее можно предположить, что для семей с малыми доходами наличие автомобиля большая редкость, и некоторое

увеличение среднедушевого дохода лишь ненамного увеличит вероятность приобретения автомобиля такой семьей. Для семей с весьма высокими доходами возрастание вероятности наличия автомобиля также не может быть существенным, поскольку такие семьи, как правило, уже обладают автомобилем. Большее влияние увеличения дохода на возрастание вероятности наличия автомобиля должно наблюдаться для семей со "средними" доходами, т.е. в "переходной зоне" от доходов, еще не позволяющих обзавестись собственным автомобилем, к доходам, уже обеспечившим возможность приобретения собственного автомобиля.

Возьмем прямоугольную систему координат, в которой по оси абсцисс будем откладывать размеры среднедушевых семейных доходов. Пусть

= minjxi,..., xn), x{n) = maxjxi,..., xn },

так что Х(1) < x < X(n) интервал значений среднедушевых доходов

рассматриваемых семей. Разобъем этот интервал на некоторое количество m подинтервалов одинаковой длины l = — )/ m .

Построим над каждым таким подинтервалом прямоугольник, нижнее основание которого совпадает с этим подинтервалом. Пусть в пределы j -го подинтервала (j = 1,..., m) попадают среднедушевые

доходы nj семей, и при этом лишь у nj 1 из этих семей имеется

автомобиль. (Для определенности, значения xb лежащие на границе двух соседних подинтервалов, будем относить к подинтервалу, расположенному левее.) Тогда высоту прямоугольника, построенного над j -м подинтервалом, положим равной

hj = nj,i/ nj.

При этом мы предполагаем, что общее количество рассматриваемых семей n достаточно велико, так что можно взять не слишком малое количество подинтервалов m, и при этом все еще иметь достаточное количество значений xt в каждом подинтервале.

Построим теперь ломаную с концами в точках (x(1),o) и (x(n),1),

узлы которой совпадают с серединами верхних сторон построенных прямоугольников. Эта ломаная является графиком некоторой кусочно-линейной функции Gn (x). И если P{yi = 1 xi = x}= G(x), то функция Gn (x) в какой-то мере "оценивает" функцию G(x). Правда, если функцию G(x) естественно считать неубывающей (возрастающей) по x, то в силу случайных причин функция Gn ( x) вполне может иметь и участки убывания. Тем не менее при большом количестве наблюдений и достаточном количестве подинтервалов график функции Gn (x) отражает в общих чертах форму "истинной" функции G(x), так что по поведению функции Gn ( x) можно судить о совместимости или о несовместимости линейной модели с данными наблюдений.

Рассмотрим (искусственно смоделированную) выборку, состоящую из 1000 семей со среднедушевыми месячными доходами от 100 до 2100 условных единиц, среди которых 510 семей имеют собственный автомобиль.

Построенная по этим данным ломаная (график функции Gn (x)) имеет следующий вид: 0.8 J

0.6 J

5 0.4 . Ґ

0.2 /

100 600 1100 1600 2100

X

и указывает на то, что "истинная" функция G(x) имеет скорее не

линейную, а S-образную форму.

Если, тем не менее, исходить из линейной модели наблюдений, то метод наименьших квадратов дает для параметров такой модели

следующие оценки: а = -0.237628 , /3 = 0.000680, так что условная вероятность P{yi = 1 xi} оценивается как

P{yi = 1 x, }= -0.237628 + 0.000680 x,. При xi < 349 правая часть принимает отрицательные значения, а при xi > 1821 значения, превышающие единицу, что выходит за пределы интервала возможных значений вероятности.

Заметим теперь, что в число функций, имеющих S-образную форму и значения в пределах от 0 до 1, входит целый ряд функций распределения, используемых в теории вероятностей и математической статистике, например, нормальные функции распределения.

2

имеющего математическое ожидание ц и дисперсию о1

Если использовать функцию нормального распределения N (ц,о2), то тогда

2

1 — „Х (£-Л

2

Замена переменной (z — ц)/о = t приводит это соотношение к виду

, (х—ц)/о /

G(x) =1L J e~t2/2dt = Ф ї^іі),

1 z —t2 /2

где Ф(z) = —;= I e dt функция стандартного нормального л/2л—L

распределения N(0,l), математическое ожидание которого равно нулю, а дисперсия равна единице.

Соотношение G(x) = ФІ ——1 можно записать также в виде

l о J

G( x) = Ф(а + в—),

где

а = —ц/о, в = 1/о.

Таким образом, используя для аппроксимации G(x) функцию нормального распределения, мы приходим к модели у, = Ф(а + в—,)+£,, i = n .

Оценив параметры а и в этой модели, мы тем самым получим и оценки параметров функции нормального распределения, аппроксимирующего функцию G(x):

ц=—а/в, о=1/в .

Проблема, однако, в том, каким образом производить оценивание.

Заметим, что функция G( х) = Q>(a + j3x) нелинейна по

параметрам, так что мы имеем здесь дело с нелинейной моделью регрессии. Следуя принципу наименьших квадратов, для получения

оценок а и в надо минимизировать по а и в сумму квадратов Q(a,в) = £ (у, Ф(а + вх, ))2.

Однако в отличие от линейной модели, получающиеся здесь нормальные уравнения нелинейны, не имеют решения в явном виде,

и для получения приближенных значений оценок а и в приходится использовать итерационные процедуры. Как и в рассмотренном ранее случае линейной модели, здесь возникает и проблема гетероскедастичности: условные дисперсии ошибок равны

D(ext) = Ф(а + вх,) • (1 Ф(а + в х,)).

Соответственно, для учета различия этих дисперсий при разных і следует использовать взвешенный метод наименьших квадратов, т.е. минимизировать по а и в сумму квадратов

Q(a,в) = I>,-(yt -Ф(а + вх,))2,

где веса wi определяются соотношением

w, = 1/ D(e х,) = [Ф{а + вх, )■ (1 Ф{а + вх, ))]-1.

К сожалению, эти веса зависят не только от хі, но и от значений параметров а и в, которые нам не известны и которые как раз и подлежат оцениванию. Поэтому для реализации итерационной процедуры оценивания необходимы некоторые начальные оценки

весов W0, і = 1,...,n , а для этого необходимы начальные оценки Gг° значений Gi = G(хі) = Ф(а + вхі), которые дали бы оценки весов в виде

WW0 =

[g 0 (1 G г°

Поскольку же у нас y i = 0 или y i = l, то единственная разумная

возможность положить G0 = l, если y j = l, и G0 = 0, если y j = 0 .

Однако в обоих случаях вес w0 не определен (знаменатель равен нулю).

Ввиду отмеченных выше трудностей в применении метода наименьших квадратов к рассмотренным моделям, мы используем альтернативный метод оценивания, широко применяемый в прикладных исследованиях, а именно метод максимального правдойодобия.

Однако прежде чем переходить к изложению этого метода, мы должны заметить, что в качестве объясняющих факторов в моделях рассмотренного типа могут выступать несколько переменных, и тогда мы получаем модель вида

y, = G(elx,l + ■■■ + epx,p)+є, , = ^--^n , которую обычно называют моделью бинарного выбора.

Эконометрика для начинающих (Дополнительные главы)

Эконометрика для начинающих (Дополнительные главы)

Обсуждение Эконометрика для начинающих (Дополнительные главы)

Комментарии, рецензии и отзывы

Глава 1. модели с дискретными объясняемыми переменными. метод максимального правдоподобия 1.1 модели, в которых объясняемая переменная принимает только два различных значения: Эконометрика для начинающих (Дополнительные главы), Носко Владимир Петрович, 2005 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В книге рассматриваются методы статистического анализа регрессионных моделей с ограниченной (цензурированной) зависимой переменной, систем одновременных уравнений, панельных данных, а также структурных форм векторных авторегрессий ...