4.2. вывод альтернативной оценки

4.2. вывод альтернативной оценки: Путеводитель по современной эконометрике, Вербик Марно, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Марно Вербик (Marno Verbeek) — профессор эконометрики в Центре экономических исследований Лёвенского университета (Бельгия). Работает также в Центре экономических исследований Тилбургского университета (Голландия).

4.2. вывод альтернативной оценки

В этом разделе мы получим наилучшую линейную несмещенную оценку для вектора неизвестных параметров (3 в условиях, определенных соотношением (4.5), предполагая, что Ф полностью известна. Идея, на которой основан вывод, состоит в том, что мы знаем наилучшую линейную несмещенную оценку при предположениях Гаусса-Маркова (А1)-(А4), так что мы сначала преобразуем модель таким образом, чтобы она снова удовлетворяла условиям Гаусса—Маркова (то есть так, чтобы остатки нашей новой модели были бы гомоскеда-стичными и взаимно некоррелированными). Мы начинаем с записи

ф-1 = р/р (47)

для некоторой квадратной, невырожденной матрицы Р, не обязательно определяемой однозначно. В настоящий момент не важно, как найти такую матрицу Р. Достаточно заметить, что поскольку матрица Ф положительно определенная, то всегда существует матрица Р, которая удовлетворяет соотношению (4.7). Используя соотношение (4.7) можно написать

ф"1 = (Р'Р)"1 = р-р')РФР' = РР~1{Р')-1Р' = I.

4.2. Вывод альтернативной оценки

141

Следовательно, для вектора регрессионных остатков є, умноженного слева на матрицу преобразования Р, справедливо, что

Е{РеХ} = РЕ{еХ} = О,

V{PeX} = PV{eX}Pf = a2P4>P' = a2L

Другими словами Ре удовлетворяет условиям Гаусса—Маркова. Следовательно, мы можем преобразовать всю модель с помощью этой матрицы Р, чтобы получить

Ру = РХ(3 + Ре или у* = X* /3 + £*, (4.8)

где вектор остатков е* удовлетворяет условиям Гаусса—Маркова. Мы знаем, что применение обычного метода наименьших квадратов к этой преобразованной модели приводит к наилучшей линейной несмещенной оценке для вектора параметров (Зх Следовательно, эта оценка автоматически является наилучшей линейной несмещенной оценкой для вектора параметров /3 в исходной модели с предположениями (4.3) и (4.5). Получающаяся оценка имеет вид

Р = (Х+'х^Х+'у* = (Х'Ф^Х^Х'Ф-У (4.9)

Эта оценка называется оценкой обобщенного метода наименьших квадратов или ОМНК-оценкой. Легко заметить, что она совпадает с МНК-оценкой, если Ф = /. Кроме того, для этой оценки выбор матрицы Р является несущественным; имеет значение только матрица Ф-1. Ниже мы увидим несколько конкретных примеров ОМНК-оценок, которые легче интерпретировать, чем общую формулу (4.9). Следует иметь в виду, что все ОМНК-оценки, которые мы рассмотрим ниже, являются частными случаями выражения (4.9).

Ясно, что мы можем вычислить ОМНК-оценку, только если матрица Ф известна. На практике обычно матрица Ф неизвестна и сначала ее следует оценить. Применение оцененной версии для Ф в выражении (4.9) в результате приводит к оценке реализуемого обобщенного метода наименьших квадратов для вектора неизвестных параметров /3 или, обычно в сокращении, к РОМНК 

Можно найти альтернативные матрицы преобразования Р, такие, что вектор Ре не покажет автокорреляцию или гетероскедастичность. Требование невырожденности матрицы Р гарантирует, что в результате преобразования не будет потеряно никакой информации.

оценке*^. Это приводит к некоторым дополнительным проблемам, которые мы рассмотрим ниже.

Факт, что ОМНК-оценку можно получить как МНК-оценку для некоторой преобразованной модели, имеет не только теоретический интерес. Напротив, довольно обычно преобразовать сами наблюдаемые переменные и применять стандартные подпрограммы МНК. Преимущество получения ОМНК-оценок таким способом состоит также в том, что мы не должны получать новую ковариационную

2

матрицу или новую оценку для a : мы просто можем использовать все стандартные результаты МНК после замены исходных переменных их преобразованными аналогами. Например, ковариационная матрица для вектора (3 (при данной матрице X) имеет вид

V0} = ^(Х+'Х*)-1 = а2{Х'Ч!-1Х)(4.10)

где сг2 можно оценить делением остаточной суммы квадратов на число наблюдений минус число регрессоров, то есть,

= дгЬ^ ЗД'ф-Чу х&(4-п)

Тот факт, что (3 является НЛНО, подразумевает, что /3 имеет меньшую ковариационную матрицу, чем МНК-оценка Ъ. Действительно, можно показать, что ковариационная матрица (4.6) МНК-оценки больше ковариационной матрицы (4.10) ОМНК-оценки в том смысле, что разность матриц является положительно полуопределенной матрицей.

4.3. Гетероскедастичность

4.3.7. Введение

В оригинале предлагается также использовать термин «оцененный обобщенный метод наименьших квадратов», ("estimated generalized least squares estimator"), т. е. ООМНК-оценки. В русскоязычной литературе для обозначения этого метода иногда используется определение «доступный», т. е. «доступный обобщенный метод наименьших квадратов» (примеч. научн. ред. перевода).

Ситуация, когда условная дисперсия V{e|X} является диагональной, но не равной сг2, умноженной на единичную матрицу, называется гетероскедастичностью. Это означает, что регрессионные остатки являются взаимно некоррелированными, тогда как дисперсия остатков є і может меняться от наблюдения к наблюдению. С этой проблемой часто сталкиваются в пространственных моделях. Например, рассмотрим случай, в котором у і обозначает расходы на питание, а Х{ состоит из константы и располагаемого дохода DPI{. Ожидается, что кривая Энгеля для питания должна быть восходящей (с убывающим наклоном). Таким образом, в среднем более высокий доход соответствует более высоким расходам на питание. Кроме того, можно ожидать, что вариация расходов на питание среди семей с высоким доходом является несколько больше, чем вариация среди семей с низким доходом. Если дело обстоит так, то дисперсия є і увеличивается с доходом. Этот вид гетероскедастично-сти можно смоделировать как

V{€iDPIi} = a2 = а2 ехр {a2DPU} = ехр {ai + a2DPIi} (4.12)

для некоторого OL2 и а = loga2. В настоящий момент мы не будем делать дополнительные предположения о виде гетероскедастично-сти. Мы просто предположим, что

V{eiX} = V{eixi} = cr2hl (4.13)

где все Н2-ые известны. Объединив это условие с предполагаемым отсутствием автокорреляции, мы можем сформулировать новое предположение в виде

V{eX} = a2Diag{h2} = а2Ф, (А9)

где Diag{h2} — диагональная матрица с элементами h,... ,h2N. Предположение (А9) заменяет предположения (A3) и (А4) из главы 2. Ясно, если дисперсии наших членов ошибок зависят от объясняющих переменных, мы больше не можем предполагать независимость, как в предположении (А2). Поэтому, мы заменяем предположения (А1) и (А2) на более слабое предположение

Е{еХ} = 0. (А10)

Заметим, что предположение (А10) все еще существенно более строгое, чем предположение (А7), которое говорит, что Е{єіХі] — 0.

Мы интересуемся наилучшей линейной несмещенной оценкой для вектора параметров (3 в модели

Уі = х'і0 + єі, i = l,...,N (4.14)

при предположениях (А9) и (А10). С этой целью мы можем использовать общие матричные выражения из вышеизложенного. Из структуры матрицы Ф легко видеть, что соответствующая матрица преобразования Р имеет вид

P = Diag{h~1}, (4.15)

которая является диагональной матрицей с элементами h^1, ... , h^1 • Таким образом, типичными элементами в преобразованном векторе данных Ру являются элементы у* = Уі/hi (и аналогично для эле-мжтаъ ъекхо^сга х<у i С,У Тогда, ОМККчш^цка* да^^тао^хш^^мат-ров (3 получается применением МНК к следующей преобразованной модели

у*=х*'(3 + є* (4.16)

или

Ni)'"+l<4-17)

Легко заметить, что преобразованный член ошибки гомоскедасти-чен. Полученная в результате МНК-оценка имеет вид

р = (Еhi2x*xi) Ек2™с4-18)

М=1 ' г=1

(Отметим, что она является частным случаем оценки (4.9).) Эта ОМНК-оценка иногда называется оценкой взвешенного метода наименьших квадратов, потому что она получена с помощью метода наименьших квадратов, в котором каждое наблюдение взвешено (с помощью множителя, пропорционального обратной величине дисперсии остатка). Ее можно получить непосредственно с помощью минимизации остаточной суммы квадратов (2.4) после деления каждого элемента в сумме на элемент hf. Согласно предположениям (А9) и (А10) ОМНК-оценка является наилучшей линейной несмещенной оценкой для вектора параметров (3. Использование весов подразумевает, что наблюдения с более высокой дисперсией получают меньший вес в оценивании. Говоря нестрого, самые большие веса приписываются наблюдениям высшего качества, а наименьшие веса — наблюдениям низшего качества. Важно отметить, что в преобразованной модели преобразуются все переменные, включая свободный член. Это подразумевает, что новая модель не содержит свободного члена. Следует также подчеркнуть, что преобразованная регрессия используется только для упрощения способа вычисления ОМНК-оценки и не обязана иметь собственную интерпретацию. Таким образом, оценки параметров должны интерпретироваться в контексте исходной, не преобразованной модели.

4.3.2. Свойства оценок и проверка гипотез

Поскольку ОМНК-оценка является просто МНК-оценкой в преобразованной модели, которая удовлетворяет свойствам Гаусса-Маркова, то мы можем непосредственно определить свойства (3 из стандартных свойств МНК-оценки после замены всех переменных их преобразованными аналогами. Например, ковариационная матрица /3 задается в виде

где неизвестную дисперсию ошибки сг2 можно оценить несмещенно как

1 N

?2 = ^ЕЛ-^)2(4-2°)

1=1

Если в дополнение к предположениям (А9) и (А 10) мы предполагаем нормальное распределение остатков как в предположении (А5), то отсюда также следует, что (3 имеет нормальное распределение с нулевым средним и дисперсией (4.19). Это можно использовать, чтобы получить критерии для линейных ограничений на коэффициенты вектора [3. Например, чтобы проверить гипотезу Но : /?2 = 1 против альтернативной гипотезы Н± : ф 1, мы можем использовать t-статистику, заданную как

t2 = f2"1 . (4.21)

'уш

Поскольку мы предполагали, что все hf-ые известны, то оценивание дисперсии ошибки посредством <т2 имеет обычное следствие в виде замены стандартного нормального распределения на tjsf-к распределение. Если нормальность ошибок не предполагается, то нормальное распределение справедливо только асимптотически. Нулевую гипотезу следует отклонить на 5\%-ом уровне значимости, если |І21 больше критического значения стандартного нормального распределения, которое равно 1,96.

Как и прежде для тестирования множества из J линейных ограничений на коэффициенты вектора /3, представленных в итоге в виде нулевой гипотезы Hq : Rj3 — q, где матрица R имеет размерность J х К, можно использовать F-критерий. Например, мы могли бы протестировать совместно два ограничения /З2 + /Зз + (З4 = 1 и /З5 = 1 (J = 2). Альтернативной гипотезой является гипотеза Hi : 7^ 9 (которая означает, что знак равенства не справедлив, по крайней мере, для одного элемента). Тестовая статистика основана на ОМНК-оценке (3 и требует (оцененную) дисперсию для вектора которая задается, как V{R(3} = RV{/3}R'. Критическая статистика имеет вид

£ = (R0q)'{RV{P}B!)-Rflq). (4.22)

При нулевой гипотезе Но эта статистика имеет асимптотическое X2-распределение с J степенями свободы. Этот тест обычно называется тестом Вальда (сравните с главами 2 и 3). Поскольку оценка ковариационной матрицы V^{/3} получается из выражения для V{(3} с заменой а2 ее оценкой а2, то мы также можем построить версию этого критерия, который имеет точное F-распределение (при условии нормальности остатков) как в стандартном случае (см. п. 2.5.6). Критическая статистика задается в виде / = £/ J и при нулевой гипотезе имеет F-распределение с J и N — К степенями свободы.

4.3.3. Случай неизвестных дисперсий

Очевидно, трудно представить какой-либо экономический пример, в котором дисперсии остатков были бы известны с точностью до коэффициента пропорциональности. Возможно, единственно важный случай возникает, когда гетероскедастичность связана только с одной наблюдаемой переменной, например

У{е>х{} = а2хЪ, (4.23)

где Хі2 — наблюдаемая экзогенная переменная (удовлетворяющая \%і2 > 0). В этом случае hi = Х{2 и преобразованная регрессия задается в виде

»L= ЛЕіУ/з+ІЦ (4.24)

Хі2 Хі2 J Хі2

в то время как дисперсия нового остатка равна

Подпись: (4.25)

Если /i—ые неизвестны, то больше невозможно вычислить ОМНК-оценку. В этом случае (3 представляет только теоретический интерес. Повидимому, очевидное решение состоит в замене неизвестных /?|-х их несмещенными или состоятельными оценками в надежде, что это не повлияет на свойства (псевдо) ОМНК-оценки. Однако это не так просто как кажется. Главная проблема состоит в том, что существует N неизвестных h2-x и только N наблюдений для их оценивания. В частности для любого наблюдения г есть только один оцененный остаток Єі , чтобы оценить дисперсию Єі . Как следствие мы не можем ожидать, что найдем состоятельные оценки для /г|-х, если только не сделаны дополнительные предположения. Эти предположения касаются формы гетероскедастичности, и обычно специфицируют N неизвестных дисперсий как функцию от наблюдаемых (экзогенных) переменных и небольшого числа неизвестных параметров.

Часто дисперсия члена ошибки может быть связана с более чем только одной экзогенной переменной. Кроме того, возможно, что соотношение между af и хк может не быть пропорциональным. Поэтому часто используются более общие разновидности соотношений, чем соотношение (4.23). Например,

V{£i} = a2xfk (4.26)

или

V{ei} = o*(x\%+x?), ' (4-27)

где (xjfc, хц) — две наблюдаемые экзогенные переменные. Спецификации (4.26) и (4.27) содержат дополнительные неизвестные параметры, которые следует сначала оценить, чтобы применить процедуру ОМНК с оцененными значениями hf. Предположим в настоящий момент, что мы имеем состоятельные оценки для параметров а и OL2 • Тогда можно вычислить h2, которая является состоятельной оценкой для hf, а затем вычислить оценку

= (Е к2**!) Е к2™(4-28)

М=1 / г=1

Эта функция оценивания является реализуемой (или оцененной) оценкой обобщенного метода наименьших квадратов (РОМНК-оценкой), поскольку она основана на оцененных значениях Если неизвестные параметры /і| оценены состоятельно, то справедливо (при некоторых слабых условиях регулярности), что

РОМНК-оценка /3* и ОМНК-оценка /3 асимптотически эквивалентны. Это просто означает, что асимптотически мы можем игнорировать тот факт, что неизвестные веса заменяются состоятельными оценками. К сожалению, РОМНК-оценка не обладает свойствами ОМНК-оценок при малых выборках, поэтому мы не можем сказать, что /3* является НЛНО. Фактически, обычно /3* будет нелинейной функцией оценивания, поскольку h2 является нелинейной функцией от Уі-х. Таким образом, хотя и можно ожидать, что в разумно больших выборках поведение РОМНКи ОМНК-оценок довольно похожи, нет никакой гарантии, что РОМНК-оценка имеет преимущества перед обычной МНК-оценкой при малых выборках (хотя обычно это так).

Мы можем заключить, что при предположениях (А9) и (А10) вместе с предположением о виде гетероскедастичности реализуемая ОМНК-оценка является состоятельной для вектора параметров (3 и асимптотически наилучшей (асимптотически эффективной). Ее ковариационную матрицу можно оценить в виде

9{р} = д*&К2Хі4) (4.29)

где Э2 — стандартная оценка для дисперсии остатка преобразованной регрессии (получена на основе несмещенной оценки (4.20), но с заменой /3 на /3*).

В оставшейся части нашего обсуждения гетероскедастичности мы обратим внимание на три проблемы. Во-первых, мы увидим, что можно применить обычный метод наименьших квадратов и скорректировать его стандартные ошибки с учетом гетероскедастичности, не делая никаких предположений о виде гетероскедастичности. Во вторых, мы увидим, как можно воспользоваться предположениями о виде гетероскедастичности, чтобы состоятельно оценить неизвестные параметры h2 и определить РОМНК-оценку. В-третьих, в параграфе 4.4, мы обсудим ряд альтернативных тестов для проверки на гетероскедастичность.

4.3.4. Состоятельные оценки стандартных ошибок МНК-оценок при наличии гетероскедастичности

Снова рассмотрим модель с гетероскедастичными ошибками

Уг = х№ + 6г, (4.30) с Е{біХ} = 0 и V{^|X} = of. В матричной системе обозначений эту модель можно написать как

у = Хр + є

с V{eX} = сг2Ф = Diag{(rf}. Если мы применяем обычный метод наименьших квадратов к этой модели, то из приведенных выше общих результатов известно, что МНК-оценка вектора параметров /3 является несмещенной и состоятельной. Соответствующая ковариационная матрица имеет вид

V{bX} = (X/X)-1X/Dm5{(jz2}X(X/X)-1. (4.31)

На первый взгляд кажется, что для оценивания этой ковариационной матрицы мы также должны оценить все <т2-ые, что без дополнительных предположений невозможно. Однако в важной статье Уайта (White, 1980) доказано, что требуется только состоятельная оценка К х К матрицы

1 1 N

Е = -Х'Огад{а2г}Х = £ ах&. (4.32)

г=1

При очень общих условиях можно показать, что

1 N

s = jfl2eiXiX^ (4-33)

і=1

где Єі — МНК-оцененный остаток, является состоятельной 2^ оценкой для матрицы Е. Поэтому

n

V{b} = (Х'ХГ1 £ єіХіоІЇХ'Х)-1 =

г=1

, n ч-1 iV , n ч-1

= (Е х*< Е Е ) (4-34)

можно использовать в качестве оценки истинной ковариационной матрицы МНК-оценки Ъ. Этот результат показывает, что мы все же можем делать соответствующие выводы, основанные на 6, без фактического определения вида гетероскедастичности. Все, что нам следует сделать, чтобы вычислить ковариационную матрицу МНК-оценки

Точнее, предел по вероятности матрицы S — Е равняется нулевой матрице.

6, состоит в замене стандартной формулы на формулу (4.34), вычисление которой является простой опцией в большинстве современных пакетов программ. Стандартные ошибки, вычисленные в виде квадратного корня из диагональных элементов в формуле (4.34), обычно называются состоятельными стандартными ошибками при наличии гетероскедастичности или просто стандартными ошибками Уайта 3). Общепринято сообщать их внутри квадратных скобок.

4.3.5. Модель с двумя неизвестными дисперсиями

В этом разделе мы рассмотрим простой случай, когда выборка состоит из двух отдельных групп, которые могут иметь различные дисперсии остатков. В качестве примеров можно привести выборки развитых и развивающихся стран, домашних хозяйств с одним человеком и со многими лицами, работающих мужчин и женщин и т. д. Линейное уравнение заработной платы для выборки работающих мужчин и женщин можно специфицировать в виде

Уі = х'і(3 + Єі,

где Е{єіхі} = 0, V{£i|#i} — aAi если і принадлежит к группе А (мужчин), и 1^{єг|^г} = ®•> если і принадлежит к группе Б (женщин). Если бы мы знали дисперсии cr2A и a^4 то ОМНК-оценивание было бы выполнимо напрямую. Если дисперсии о2А и g неизвестны, то их можно оценить очень просто. Непосредственно разбить выборку на две группы (мужчин и женщин) и построить отдельные регрессии. Используя оцененные остатки из этих регрессий, дисперсию остатков можно оценить обычным способом, поскольку в пределах каждой подвыборки остаток является гомоскедастичным.

Предположим, что имеется N а наблюдений из первой группы и Nb наблюдений из второй группы. МНК-оценка для вектора параметров /3, основанная на группе наблюдений А, имеет вид

Ьа = у^ХіхА ^ХіУі,

3) Эта оценка ковариационной матрицы также приписывается Эйкеру (Eicker,

1967), так что некоторые авторы называют соответствующие стандартные

ошибки — стандартными ошибками Эйкера—Уайта.

4) Чтобы вычислить ОМНК-оценку, фактически достаточно знать лишь отноше2 / 2 ние Яд/& веЛ ' ІЄА

где суммирование проводится по всем наблюдениям из группы А. Точно так же мы получаем ЬвДисперсия ошибки оценивается стандартным способом, то есть

А ІЄА

и аналогично для s2B. Величины s2A и s2B являются несмещенными и состоятельными оценками, соответственно, для дисперсий сг2А и сг2в. Тогда РОМНК-оценка для вектора параметров (3 имеет вид

Р* = [52 *~Axix'i + 52 s~bXiX'i ) ( 52 sa2xiVi + 52 sb2xiVi

ЧЄА ієв ' ЧЄА ієв

(4.36)

Легко заметить, что выражение (4.36) является частным случаем выражения (4.28). Кроме того, можно показать, что выражение (4.36) является матрично-взвешенным средним этих двух МНК-оценок Ъа и ЬвВ частности /3* = \¥Ьл + (I — W)6b, где / является единичной матрицей порядка К, а

w = (52 8~ахЛ + 52 8~в2хіх'Ї) 52 s~axix'i(4-37)

ЧЄА ієв ' іЄА

Матрицы весов W и I — W связаны обратно пропорционально с (оцененными) дисперсионными матрицами соответствующих оценок. Таким образом, более точная оценка получает более высокий вес, чем менее точная (с более высокой дисперсией) оценка.

4.3.6. Мультипликативная гетероскедастичность

Общей формой используемой на практике гетероскедастичности является мультипликативная гетероскедастичность. Предполагается, что дисперсия остатка связана со множеством экзогенных переменных, собранных в J-мерный вектор Zi (не включая константу). Чтобы гарантировать положительность дисперсии ошибки для всех значений параметра, используется экспоненциальная функция. В частности предполагается, что

= or2 = (J2 ехр {aizn + ... + ajzu} = a2 ехр {z-a}, (4.38)

где Zi является вектором наблюдаемых переменных, который является функцией от элементов вектора Хі (обычно подмножества переменных вектора Хі или их преобразования). В этой модели дисперсия регрессионного остатка связана с одной или более экзогенными переменными, как в примере кривой Энгеля, приведенном выше. Заметим, что в частном случае, когда J = 1 и гц — фиктивная переменная (например, фиктивная пременная для мужчин), мы получаем модель с двумя неизвестными дисперсиями.

Чтобы иметь возможность вычислить РОМНК-оценку, нам необходимы состоятельные оценки для неизвестных параметров в h2 = ехр{^а}, то есть для вектора неизвестных параметров а. Такие функции оценивания могут основываться на МНК-оцененных остатках. Чтобы видеть каким образом, сначала заметим, что

log a2 = log а2 + z[a.

Можно ожидать, что МНК-оцененные остатки єі — у і — х[Ъ имеют что-то, что говорит о а2. Действительно, можно показать, что

log е2 = log а2 + z[a + щ, (4.39)

где Vi = log (е^/of) является остатком, который (асимптотически) гомоскедастичен и некоррелирован с вектором экзогенных переменных Z{. Одна из проблем состоит в том, что этот остаток не имеет нулевого математического ожидания (даже асимптотически). Однако это повлияет только на оценивание константы log а2, которая нас не интересует. Следовательно, РОМНК-оценку для вектора параметров (3 можно получить по шагам следующим образом.

Оценить модель с помощью обычного МНК. В результате получаем МНК-оценку Ь.

Вычислить log е2 = log (уі — х[Ъ)2 из МНК-оцененных остатков.

Оценить уравнение (4.39) методом наименьших квадратов, то есть регрессию log е2 по вектору переменных Zi и константе. В результате получаем состоятельную оценку а вектора параметров а.

Вычислить h2 = exp {^S} и провести преобразование всех наблюдений, чтобы прийти к преобразованному уравнению регрессии

hi hi/ hi Оценить полученное преобразованное уравнение регрессии обычным методом наименьших квадратов. Не забудьте провести преобразование константы. В результате получаем РОМНК-оценку /5* вектора параметров (3.

5. Скаляр о можно оценить состоятельно по формуле

^2 1 ^ Ы ~

N -К ^ h2

і=і п\%

6. И, наконец, состоятельная оценка ковариационной матрицы вектора /?* вычисляется по формуле

n / -1

4=1 і

Она соответствует ковариационной матрице МНК-оценке для преобразованной регрессии, которая автоматически вычисляется в пакетах программ по регрессии.

4.4. Тестирование на гетероскедастичность

Для ответа на вопрос, вводят ли в заблуждение результаты применения МНК к данной модели из-за неприемлемых стандартных ошибок, обусловленных гетероскедастичностью, существует ряд альтернативных тестов. Если в результате тестирования нулевая гипотеза о гомоскедастичности остатков не отклоняется, то незачем сомневаться в результатах, полученных с помощью метода наименьших квадратов. Если же в результате тестирования нулевая гипотеза отклоняется, можно рассмотреть применение РОМНК-оценок, или использовать оценки Уайта для ковариационной матрицы МНК-оценок, или пересмотреть спецификацию нашей модели. В этом разделе, мы обсудим несколько тестов, которые разработаны для проверки нулевой гипотезы гомоскедастичности против разных альтернативных гипотез гетероскедастичности.

4.4.7. Тестирование равенства двух неизвестных дисперсий

Первый критерий, который мы рассмотрим, касается проблемной ситуации двух неизвестных дисперсий, которая обсуждалась выше, то есть дисперсия Єі равна о2А, если наблюдение і принадлежит группе А, и равна о2в, если наблюдение і принадлежит группе Б. Нулевая гипотеза заключается в том, что дисперсия является константой, то есть Hq : о2А — о2в. Критерий для проверки гипотезы Но можно получить, применив результат, что (который является прибта&женшя^ шга^ го^ж шдерщшжении. нормального распределения остатков точным):

(Мі-К)І~Х\%-к, 3=А,В. (4.40)

Кроме того, s2A и s2B независимы, и поэтому мы имеем, что (см. Приложение Б),

sja2B tNB-K' 14,4 >

При нулевой гипотезе Но : сг — о результат (4.41) сводится к

в

Таким образом, в случае двусторонней альтернативной гипотезы Н : g ф нулевая гипотеза гомоскедастичности отклоняется, если отношение двух оцененных дисперсий является или слишком малым, или слишком большим. Для односторонней альтернативы Н : а2А > о нулевая гипотеза отклоняется, если Л является слишком большой. Если альтернативная гипотеза специфицируется, как g < о, то при вычислении критической статистики можно просто поменять ролями группы А и В. Этот тест является частным случаем теста Голдфелда—Куандта (Goldfeld, Quandt, 1965; Greene, 2000, Sect. 12.3).

4.4.2. Тестирование на мультипликативную гетероскедастичность

Для этого теста хорошо специфицирована альтернативная гипотеза, которая задается условием (4.38), то есть

<т2 = <т2ехр{г',а}, (4.43)

где Zi как и прежде J-мерный вектор. Нулевая гипотеза гомоскедастичности соответствует а = 0, и таким образом, проблема заключается в тестировании

Но : а — 0 против Н : а ф 0.

Нулевую гипотезу можно протестировать, используя результаты МНК-регрессии для уравнения (4.39). Существует несколько (асимптотически эквивалентных) способов выполнения этого теста, но самый простой способ основан на стандартном F-критерии, примененном к уравнению (4.39) для проверки гипотезы, что все коэффициенты кроме константы равны нулю. Критическую статистику можно вычислять автоматически с помощью подпрограммы, обычно предоставляемой в пакете программ регрессии. Поскольку регрессионный остаток в уравнении (4.39) не удовлетворяет условиям Гаусса—Маркова точно, то F-распределение (с J и N — J — 1 степенями свободы) справедливо только приближенно. Другая аппроксимация основана на асимптотическом \%2-распределении (с J степенями свободы) критической статистики после умножения на J (сравните с п. 2.5.6).

4.4.3. Тест Бреуша—Пагана

В этом критерии, предложенном Бреушем и Паганом (Breusch, Pagan, 1980), альтернативная гипотеза является менее специфичной и обобщает условие (4.38). Она имеет вид

(4.44)

где h — неизвестная, непрерывно дифференцируемая функция (которая не зависит от г) такая, что h(-) > 0 и /г(0) = 1. В качестве частного случая (если h(t) — ехр{£}) мы получаем условие (4.38). Критерий проверки нулевой гипотезы Но : a = 0 против альтернативной гипотезы Hi : а ф 0 можно получить независимо от функции h. Самый простой вариант теста Бреуша—Пагана состоит в вычислении критической статистики в виде числа наблюдений, умноженного на R2 вспомогательной регрессии, в частности на R2 регрессии е2 (квадратов МНК-оцененных остатков) по вектору переменных Zi и константе. Полученная критическая статистика, заданная в виде £ = NR2, асимптотически имеет \%2-распределение с J степенями свободы. Тест Бреуша—Пагана является тестом множителей Лагранжа на гетероскедастичность. Главные особенности тестов множителей Лагранжа состоят в том, что для этих тестов не требуется, чтобы модель оценивалась при альтернативной гипотезе, и что критические статистики часто вычисляются просто из R2 некоторой вспомогательной регрессии (см. главу 6).

4.4.4. Тест Уайта

Все вышеизложенные тесты на гетероскедастичность тестируют отклонения от нулевой гипотезы гомоскедастичности при специфических постановках вида гетероскедастичности. Таким образом, необходимо специфицировать вид гетероскедастичности, против которого проводится это тестирование. В тесте Уайта (White, 1980) дополнительная спецификация вида альтернативной гипотезы не требуется, а реализуется идея состоятельной оценки ковариационной матрицы МНК-оценок коэффициентов регрессии при наличии гетероскедастичности. Как мы видели, корректная формула для вычисления ковариационной матрицы МНК-оценки задается выражением (4.31) и ее можно оценить по формуле (4.34). Обычная оценка ковариационной матрицы справедливая в условиях гомоске-дастичности остатков имеет вид

m = *2(£*i*i) • (4-45)

Если никакой гетероскедастичности нет, выражение (4.45) предоставляет состоятельную оценку ковариационной матрицы если же

гетероскедастичность существует, то выражение (4.45) не обладает

свойством состоятельности. Уайт разработал статистический тест,

основанный на этом наблюдении. Простая практическая версия этого теста выполняется вычислением значения NR2, полученного по

уравнению регрессии е2 по константе и по всем первым и вторым

моментам исходных регрессоров включая смешанные вторые моменты). Критическая статистика асимптотически распределена как

хи-квадрат с Р степенями свободы, где Р — число регрессоров во

вспомогательной регрессии за исключением свободного члена.

Тест Уайта является обобщением теста Бреуша—Пагана, который также включает вспомогательную регрессию квадратов остатков, но исключает любые члены более высоких порядков. Следовательно, с помощью теста Уайта можно обнаружить более общие формы гетероскедастичности, чем с помощью теста Бреуша—Пагана. Фактически, тест Уайта является очень общим. Хотя это является его достоинством, в то же самое время он имеет потенциально серьезный недостаток. Тестирование может обнаружить гетероскедастичность, но вместо этого может просто идентифицировать некоторую другую ошибку спецификации (как например, некорректный функциональный вид уравнения регрессии). С другой стороны мощность теста Уайта может быть довольно низкой против некоторых определенных альтернативных гипотез, особенно если число наблюдений мало.

4.4.5. Какой тест?

На практике, выбор соответствующего критерия на наличие гетероскедастичности определяется тем, насколько явно мы хотим рассмотреть вид гетероскедастичности. Вообще, чем более определен вид гетероскедастичности, например, of = о2х2ік, тем более мощным будет критерий, то есть более вероятно, что, в результате, тестирование справедливо приведет к отклонению нулевой гипотезы. Однако если истинная гетероскедастичность имеет другой вид, выбранный критерий, возможно, вообще не укажет на присутствие гетероскедастичности. Самый общий тест, тест Уайта, имеет ограниченную мощность против большого числа альтернативных гипотез, тогда как специфический тест, например, для мультипликативной гетероскедастичности, имеет большую мощность, но только против ограниченного числа альтернативных гипотез. В некоторых случаях визуальный осмотр МНК-оцененных остатков (например график зависимости этих остатков от одной или более экзогенных переменных) или экономическая теория может помочь в выборе соответствующей альтернативной гипотезы. Кроме того, Вы можете обратиться к графикам, представленным в параграфе 3.5.

4.5. Пример: объяснение спроса на рабочую силу

В этом разделе мы рассмотрим простую модель объяснения спроса на рабочую силу бельгийских фирм. С этой целью мы получили пространственную совокупность данных от 569 фирм, которая содержит информацию за 1996 год относительно общего количества служащих, их средней заработной платы, стоимости основных фондов и показателя объема производства. Рассматриваются следующие четыре переменные 5):

labour: полная занятость (число рабочих);

5) Данные доступны в LABOUR.

6) Обменный курс: 1 миллион бельгийских франков = 24 789 евро.

capital: общая стоимость основных фондов (в миллионах бельгийских франков) 6);

wage: суммарные расходы на заработную плату деленные на число рабочих (в миллионах бельгийских франков); output: добавленная стоимость (в миллионах бельгийских франков).

Чтобы понять идеи, начнем с простой производственной функции 7)

Q = f(K,L),

где Q обозначает объем производства, а К и L обозначают капитальные и трудовые затраты соответственно. Суммарные издержки производства равны г К + wL, где г обозначает стоимость единицы капитала, и w обозначает ставку заработной платы. Минимизация суммарных затрат (относительно К и L) при заданных общем виде производственной функции, стоимости капитала г, ставки заработной платы w и уровня объема производства Q позволяет вывести функции спроса на основные фонды и рабочую силу. В общей форме функцию спроса на рабочую силу можно написать как

L = g{Q,r,w)

для некоторой функции g. Поскольку наблюдения относительно стоимости капитала трудно доступны и, как правило, не показывают большую пространственную вариацию, при оценивании мы аппроксимируем г с помощью акционерного капитала К.

Сначала мы предположим, что функция g линейна по аргументам и добавим аддитивно случайный остаток. Оценивание получающейся линейной модели регрессии, используя выборку, содержащую 569 фирм, приводит к результатам, представленным в таблице 4.1. Все оценки коэффициентов имеют ожидаемый знак: более высокая заработная плата при прочих равных условиях приводит к снижению затрат на рабочую силу, в то время как больший объем производства требует большего количества труда.

В прикладном контексте эконометрики краткий превосходный обзор производственных функций с минимизацией затрат представлен Уоллисом (Wallis, 1979)

Перед интерпретацией соответствующих стандартных ошибок и других статистик полезно провести проверку на возможность гетероскедастичности. Мы сделали это, выполнив тест Бреуша— Пагана, используя альтернативную гипотезу, что дисперсия МНК-оцененного остатка зависит от трех объясняющих переменных. Применение МНК для построения вспомогательной регрессии квадратов

остатков по переменным wage, output, и capital, включая константу, приводит к результатам, представленным в таблице 4.2. Высокие ^-отношения так же как относительно высокий R2 показывают, что дисперсия остатков вряд ли является константой. Мы можем вычислить критическую статистику Бреуша—Пагана, равную N = 569, умноженное на R2 этой вспомогательной регрессии. Она оказалась равной 331,0. Поскольку асимптотически эта статистика при нулевой гипотезе должна подчиняться хи-квадрат распределению с тремя степенями свободы, то это подразумевает уверенное отклонение гипотезы гомоскедастичности.

В действительности весьма естественно обнаружить гетероскедастичность в подобных ситуациях, в которых размер наблюдаемых единиц существенно различается. Например, наша выборка содержит фирмы с1 одним служащим и фирмы с более чем 1000 служащих. Мы можем ожидать, что большие фирмы имеют большие абсолютные значения всех переменных в модели, включая ненаблюдаемые значения, отраженные в регрессионном остатке. Общий подход к ослаблению этой проблемы состоит в том, чтобы использовать логарифмические преобразования всех переменных, а не их уровни (сравните с параграфом 3.5). Следовательно, наш первый шаг в обработке проблемы гетероскедастичности должен состоять в рассмотрении логарифмически линейной модель. Можно показать, что логарифмически линейная модель получается, если производственная функция имеет вид производственной функции Кобба—Дугласа, то есть Q = AKaLP.

Результаты МНК-оценивания логарифмически линейной модели представлены в таблице 4.3. Напомним, что коэффициенты в логарифмически линейной модели имеют интерпретацию эластичностей. Оцененная эластичность спроса на рабочую силу, обусловленная заработной платой, равна —0,93, что является довольно высоким значением. Это подразумевает, что 1\%-ое увеличение заработной платы при прочих равных условиях приводит почти к 1\%-ому снижению спроса на рабочую силу. Эластичность спроса на рабочую силу относительно объема производства имеет оценку приблизительно равную единице, так что повышение объема производства на 1\% требует повышение на 1\% затрат на рабочую силу.

Если регрессионный остаток в логарифмически линейной модели гетероскедастичный, то стандартные ошибки и ^-отношения в таблице 4.3 не приемлемы. Мы можем выполнить тест Бреуша—

Пагана как и прежде аналогичным образом: вспомогательная регрессия квадратов МНК-оцененных остатков по этим трем объясняющим переменным (в логарифмах) приводит к і?2, равному 0,0136. Полученная в результате критическая статистика равна 7,74; это значение находится на грани значимости на 5\%-ом уровне. Более общим критерием является тест Уайта. Чтобы вычислить критическую статистику, мы построили вспомогательную регрессию квадратов МНК-оцененных остатков на все исходные регрессоры, их квадраты и на все их взаимодействия. Результаты представлены в таблице 4.4. Мы видим, что R2 равняется 0,1029 и критическая статистика принимает значение 58,6, которое является высоко значимым для хи-квадрат переменной с 9 степенями свободы. Посмотрев на ^-отношения в этой регрессии, мы видим, что дисперсия остатка существенна связана с объемом производства и основными фондами.

Поскольку тест Уайта определенно указывает на присутствие гетероскедастичности, то, по-видимому, для МНК-оценки следует вычислить состоятельные стандартные ошибки с учетом наличия

гетероскедастичности. Это стандартная опция в большинстве современных пакетов программ. Результаты представлены в таблице 4.5. Ясно, что скорректированные стандартные ошибки больше нескорректированных стандартных ошибок, приведенных в таблице 4.3. Заметим, что F-статистика также скорректирована и использует состоятельную ковариационную матрицу, вычисленную с учетом гетероскедастичности. Качественно выводы не изменились: заработная плата и объем производства значимы в объяснении спроса на рабочую силу, а основные фонды нет.

Если мы желаем сделать предположения о виде гетероскедастичности, то появится возможность построения более эффективной РОМНК-оценки. Рассмотрим мультипликативный вид (4.38), где полагаем Zi = Х{. То есть дисперсия для Єі зависит от log (wage), log (output) и log (capital). Мы можем оценить параметры мультипликативной гетероскедастичности с помощью вычисления логарифмов квадратов МНК-оцененных остатков, а затем построения регрессии log е2 по Z{ и константе. Результаты представлены в таблице 4.6. По-видимому, переменные log (capital) и log (output) существенны в объяснении дисперсии остатка. Также заметим, что F-значение этой вспомогательной регрессии приводит к отклонению нулевой гипотезы гомоскедастичности. Чтобы проверить, не слишком ли ограничена эта спецификация вида гетероскедастичности, мы оценили версию, где также включены три квадратных члена. F-критерий на трех ограничениях, предполагаемых в модели, пред

ставленный в таблице 4.6, привел к значению /-статистики, равному 1,85 (р = 0,137), так что нулевая гипотеза не отклоняется.

Напомним, что предыдущая регрессия приводит к состоятельным оценкам для параметров, описывающих мультипликативную гетероскедастичность, за исключением константы. Для перехода к исходным данным можно использовать экспоненциальное преобразование прогнозных значений регрессии. Поскольку несостоятельность константы воздействует на все переменные равно пропорционально, то это не влияет на результаты оценивания, основанные на преобразованных данных. Преобразование всех переменных и применение процедуры МНК к преобразованному уравнению приводит к оценкам РОМНК, представленным в таблице 4.7. Если мы сравниваем результаты в таблице 4.7 и результаты МНК с состоятельными стандартными ошибками при наличии гетероскедастичности в таблице 4.5, то видим, что увеличение эффективности существенно. Стандартные ошибки для метода РОМНК существенно меньше. Заметим, что сравнение с результатами в таблице 4.3 неуместно, поскольку стандартные ошибки в последней таблице действительны только при отсутствии гетероскедастичности. Оценки РОМНК коэффициентов довольно близки к оценкам МНК. Поразительное различие состоит теперь в значимости на 5\%-ом уровне эффекта основных фондов, в то время как ранее мы не нашли статистического подтверждения значимости этого эффекта. Мы можем проверить гипотезу, что эластичность относительно заработной платы равна минус единице, с помощью вычисленной /:-статистики (—0,856 + 1)/0,072 = 2,01, что означает (пограничное) отклонение этой гипотезы на 5\%-ом уровне значимости.

Факт, что R2 в таблице 4.7 больше чем в случае МНК, вводит в заблуждение по двум причинам. Во-первых, преобразованная модель не содержит свободного члена, поэтому вычислялся нецентрированный R2. Во вторых, R2 вычислялся для преобразованной модели с преобразованной эндогенной переменной. Если бы для исходной модели вычислялся подразумеваемый і?2, то он был бы меньше Д2, полученного на базе применения МНК. Из главы 2 известно, что альтернативные определения R2 не приводят к одному и тому же результату, если модель не оценивалась с помощью МНК. Используя определение

і?2 = согг2{уг,уг}, (4.46)

где у і = х'ф*, к вышеприведенному примеру, приходим к /?2, равному 0,8403. Это значение только немного ниже, чем его значение, оцененное в рамках МНК. Поскольку МНК определяется так, что он должен минимизировать остаточную сумму квадратов, он автоматически максимизирует R2. Следовательно, применение любой другой функции оценивания никогда не будет увеличивать і?2, и R2 не является хорошим критерием для сравнения альтернативных функций оценивания. (Конечно, в эконометрической жизни есть более важные вещи, чем высокий R2.)

4.6. Автокорреляция

Рассмотрим теперь другой случай, когда нарушается условие v{e} = <j2I, а именно, когда ковариации между разными остат-

ками не все равны нулю. Наиболее подходящий пример имеет место, когда два или больше последовательных члена ошибок коррели-рованы, и мы говорим, что регрессионные остатки подвержены автокорреляции или сериальной корреляции. Учитывая наше общее обсуждение выше, до тех пор, пока можно предполагать, что Е^^Х} = 0 (предположение (А9)), последствия автокорреляции подобны последствиям гетероскедастичности: МНК остается несмещенным, но он становится неэффективным, и его стандартные ошибки оцениваются некорректно.

Автокорреляция обычно имеет место, когда используются данные временного ряда. Чтобы подчеркнуть это, мы последуем за литературой и индексируем номер наблюдения индексом £=1,2,...,Т, а не индексом i = l,2,...,7V. Самое важное различие состоит в том, что теперь порядок наблюдений действительно имеет значение, и индекс отражает естественное упорядочивание. В общем, регрессионный остаток Єі отражает влияние тех переменных, которые влияют на зависимую переменную, но которые не были включены в модель. Постоянство существования эффектов, не включенных в модель переменных, является частой причиной положительной автокорре-лированности остатков. Если бы такие невключенные переменные наблюдались и могли бы быть включены в модель, то мы также могли бы интерпретировать полученную автокорреляцию как признак неправильно специфицированной модели. Этим объясняется, почему тесты на наличие автокорреляции очень часто интерпретируются как тесты на наличие неправильной спецификации. Некорректные функциональные формы, неучтенные переменные и неадекватная динамическая спецификация модели — все это может привести к наличию автокорреляции.

Предположим, что Вы используете ежемесячные данные, чтобы оценить модель, которая объясняет спрос на мороженое. Как правило, состояние погоды будет важным фактором, скрытым в остатке Єі . В этом случае, вероятно, Вы будете иметь дело с наблюдениями, аналогично тем, что отображены на рисунке 4.1. На этом рисунке мы построили график потребления мороженого от времени, в то время как соединенные точки описывают «подогнанные» значения модели регрессии, которая объясняет потребление мороженого в зависимости от совокупного дохода и ценового индекса 8 Ясно, что

Данные, используемые на этом рисунке, взяты из работы (Hildreth, Lu, 1960) и доступны в ICECREAM; см. также раздел 4.8.

Подпись: ° Потребление мороженого на душу (cons)
0.548

0.256

30

время

Рисунок 4.1. Фактическое и «подогнанное» потребление мороженого, июль 1951 г. март 1953 г.

положительные остатки группируются вместе, также как и отрицательные остатки. В макроэкономических исследованиях движения делового цикла могут иметь очень похожие эффекты. В большинстве экономических приложений автокорреляция остатков положительна, но иногда она будет отрицательной: положительный остаток для одного наблюдения, вероятно, будет сопровождаться отрицательным остатком для следующего наблюдения и наоборот.

4.6.1. Автокорреляция первого порядка

Существует много форм автокорреляции, и каждая приводит к разной структуре ковариационной матрицы ошибок Самая популярная форма известна как процесс авторегрессии первого порядка. В этом случае предполагается, что регрессионный остаток

в модели

Уі = х'ф + et (4.47) зависит от его предшествующего остатка следующим образом

et = pet-i + ut, (4.48) где щ — независимые одинаково распределенные случайные величины с нулевыми средними значениями и дисперсиями, равными а2 (т.е. vt ~ НОР(0,а\%)). Это означает, что значение остатка в любом наблюдении равно коэффициенту р, умноженному на значение остатка в предыдущем наблюдении плюс новая компонента возмущения щ. Предполагается, что эта новая компонента имеет нулевое среднее и постоянную дисперсию, и не должна зависеть от времени. Кроме того, налагается предположение (А2) из главы 2, которое подразумевает, что все объясняющие переменные независимы от всех остатков*^. Параметры р и а2 обычно неизвестны, и, мы можем пожелать оценить их наряду с /3. Отметим, что статистические свойства компоненты щ те же, что предполагаются для члена ошибки St в стандартном случае: таким образом, если р = О, то et = щ и стандартные условия Гаусса—Маркова (А1)-(А4) из главы 2 удовлетворяются.

Чтобы вывести выражение для ковариационной матрицы вектора остатков є, мы должны сделать предположение о распределении остатка для начального периода, е. Обычно, предполагается, что Є имеет нулевое среднее и такую же дисперсию как и все другие члены ошибок £г-ые. Это согласуется с идеей, что процесс функционировал в течение длительного периода в прошлом и что |р| < 1. Если условие |р| < 1 удовлетворяется, то мы говорим, что авторегрессионный процесс первого порядка является стационарным. Стационарный процесс таков, что среднее значение, дисперсии и ковариации членов ошибок et не изменяются по времени (см. главу 8 ниже). Наложение стационарности легко следует из выражения

E{et} = pE{et-i} + E{vt},

в котором

Е{єі] = 0.

Кроме того, из выражения

V{et} = V{pet-i + vt) = p2V{et} + al мы получаем, что дисперсия St, обозначенная как а, имеет вид

В нашем случае это означает, в частности, что Е{ег-щ} = 0 (примеч. научн. ред. перевода).

°l = V{et} = (4.49)

Вне диагональные элементы в ковариационной матрице вектора є следуют из выражения

2

cov{euet-i} = Eietet-!} = р£{є2_і} + E{et-ivt} = Р^^' (4*50)

Ковариация между членами ошибок, отстоящими на два периода друг от друга, равна

2

E{etet-2} = pE{et-iet-2} + E{et-2ut} = Р2^р> (4-51) и вообще для неотрицательных значений s мы имеем

E{etet„s} = Psj^~. (4.52)

1 — pZ

Это показывает, что для 0 < р < 1 все элементы в векторе є взаимно коррелированы с ковариацией, убывающей по мере взаимного удаления этих элементов по времени (то есть, если s становится большим). Ковариационная матрица вектора є таким образом является полной матрицей (матрицей без нулевых элементов). Из этой матрицы можно вывести соответствующую матрицу преобразования, как это обсуждалось в разделе 4.2. Однако, непосредственно посмотрев на выражения (4.47) и (4.48), сразу же становится очевидным, какое преобразование является уместным. Поскольку St = pst-i + Щ, где щ удовлетворяет условиям Гаусса—Маркова, то, очевидно, что преобразование подобное et — pst-i приведет к гомоскедастичным не автокоррелированным остаткам. То есть, все наблюдения должны быть преобразованы как yt — pyt-i и xt — pxt-iСледовательно, преобразованная модель задается в виде

yt pyt-i = (xt pxt-іУР + vu * = 2, 3,... , Г. (4.53)

Технически неявная матрица преобразования Р, которая здесь используется, не является квадратной матрицей и следовательно она необратима.

Поскольку модель (4.53) удовлетворяет условиям Гаусса—Маркова, оценивание с помощью МНК приводит к ОМНК-оценкам (предполагая коэффициент р известным). Однако, это утверждение не совсем корректно, так как преобразование в (4.53) не может быть применено к первому наблюдению (поскольку у о и хо не наблюдаются). Информация в этом первом наблюдении теряется, и МНК для преобразованной модели (4.53) предоставляет только приближенную ОМНК-оценку9). Конечно, когда число наблюдений является большим, потеря единственного наблюдения не будет обычно иметь большого воздействия на результаты.

Первое наблюдение можно сберечь, заметив, что остаток для первого наблюдения е некоррелирован со всеми ^-ми, t — 2,... , Г. Однако дисперсия е (заданная выражением (4.49)) является намного больше чем дисперсия новых возмущений {ъ>2,.. • , ^т), особенно когда р близко к единице. Чтобы получить гомоскедастичные и неавтокоррелированые остатки в преобразованной модели (которая включает первое наблюдение), это первое наблюдение должно быть преобразовано с помощью его умножения на множитель VT^p2. Таким образом, полностью преобразованная моделью задается в виде

Vl Р2Уі = Vl Р2х[(3 + ^1-р2еъ (4.54) и выражения (4.53) для наблюдений t = 2,... , Г. Легко проверить, что преобразованный остаток в выражении (4.54) имеет такую же дисперсию как щ. МНК, примененный к преобразованной модели (4.53) и (4.54), дает ОМНК-оценку /?, которая является наилучшей линейной несмещенной оценкой (НЛНО) для вектора параметров /3.

В ранней работе (Cochrane и Orcutt, 1949) было обычным исключать первое (преобразованное) наблюдение и оценивать f3 из оставшихся Г — 1 преобразованных наблюдений. Как говорилось, это приводит только к приближенной ОМНК-оценке, которая не будет столь же эффективной как ОМНК-оценка, использующая все Г наблюдений. Однако если Г является большим, различие между этими двумя оценками пренебрежимо мало. Оценки, не использующие первые преобразованные наблюдения, часто называются оценками Кохрейна— Оркатта. Точно так же преобразование, не включающее первое наблюдение, называется преобразованием Кохрейна—Оркатта. Оценка, которая использует все преобразованные наблюдения, иногда называют оценкой Прейза—Уинстена (Prais, Winsten, 1954).

4.6.2. Значение р неизвестно

Конечно, на практике редко бывает так, что значение коэффициента р известно. В случае неизвестного значения р мы должны его оценить. Начиная с выражения

et = pet-i + щ, (4.55)

где щ удовлетворяет обычным предположениям, кажется естественным оценить коэффициент р из регрессии МНК-оцененного остатка et по Є£_і. Полученная таким образом МНК-оценка для коэффициента р задается в виде

(4.56)

М=2 J 4=2 '

Несмотря на то, что эта оценка для коэффициента р обычно смещенная, она является состоятельной оценкой для р при слабых условиях регулярности. Если мы используем р вместо р, чтобы вычислить РОНК-оценку /?*, свойство НЛНО больше не сохраняется. При тех же самых условиях, как и раньше, справедливо, что РОМНК-оценка /3* асимптотически эквивалентна ОМНК-оценке (3. То есть, для выборок больших объемов мы можем игнорировать тот факт, что коэффициент р оценивается.

Родственной процедурой оценивания является так называемая итерационная процедура Кохрейна—Оркатта, которая применяется во многих пакетах программ. В этой процедуре коэффициент р и вектор параметров (3 оцениваются рекурсивно до момента ее сходимости, то есть при наличии РОМНК-оценки /3* вектора /3, остатки вычисляются повторно, и коэффициент р оценивается снова, используя РОМНК-оцененные остатки из предыдущего шага. С этой новой оценкой для р снова применяется РОМНК и получается новая оценка для вектора параметров (3. Эта процедура продолжается до достижения сходимости, то есть до тех пор, пока оценка для коэффициента р и оценка для вектора параметров (3 больше не изменяются. Можно ожидать, что эта процедура увеличивает эффективность (то есть, снижает дисперсию) получаемой оценки коэффициента р. Однако нет никакой гарантии, что она также повышает эффективность РОМНК-оценки вектора параметров (3. Мы знаем, что асимптотически не имеет значения, что коэффициент р мы заменяем его оценкой, и, следовательно, также (асимптотически) не имеет значения, как мы его оцениваем до тех пор, пока р оценивается состоятельно. Однако в малых выборках итерационные РОМНК-процедуры обеспечивают обычно несколько лучший результат, чем их деухшаговый вариант.

Путеводитель по современной эконометрике

Путеводитель по современной эконометрике

Обсуждение Путеводитель по современной эконометрике

Комментарии, рецензии и отзывы

4.2. вывод альтернативной оценки: Путеводитель по современной эконометрике, Вербик Марно, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Марно Вербик (Marno Verbeek) — профессор эконометрики в Центре экономических исследований Лёвенского университета (Бельгия). Работает также в Центре экономических исследований Тилбургского университета (Голландия).