Раздел 11 регрессионный анализ для нестационарных переменных. коинтегрированные временные ряды. модели коррекции ошибок тема 11.1 проблема ложной регрессии. коинтегрированные временные ряды. модели коррекции ошибок

Раздел 11 регрессионный анализ для нестационарных переменных. коинтегрированные временные ряды. модели коррекции ошибок тема 11.1 проблема ложной регрессии. коинтегрированные временные ряды. модели коррекции ошибок: Эконометрика Книга первая Часть 2, Носко Владимир Петрович, 2011 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Под временным рядом (time series) в экономике понимается ряд значений некоторой переменной, измеренных в последовательные моменты времени.

Раздел 11 регрессионный анализ для нестационарных переменных. коинтегрированные временные ряды. модели коррекции ошибок тема 11.1 проблема ложной регрессии. коинтегрированные временные ряды. модели коррекции ошибок

Проблема ложной регрессии

Начнем обсуждение с проблемы ложной (фиктивной, паразитной — spurious) регрессии. О ней говорилось в первой части учебника (см. пример 1.3.4 в разд. 1) и при этом был сделан вывод о том, что близость к 1 абсолютной величины наблюдаемого значения коэффициента детерминации необязательно означает наличие причинной связи между двумя переменными, а может являться лишь следствием наличия тренда значений обеих переменных.

ПРИМЕР 11.1.1

Смоделируем реализации двух статистически независимых между собой последовательностей єи и s2t независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение 7V(0, 1). Смоделированные реализации показаны на рис. 11.1 и 11.2. На их основе построим реализацию линейной модели DGP

DGP: xt = 1 +0.2t+sln

yt = 2 + 0At + e2n

в которой переменные х и у не связаны между собой причинными отношениями.

Рассмотрим, однако, результаты оценивания статистической модели

SM: yt = а + J3xt + st

по смоделированной реализации. Графики рядов xt иу, приведены на рис. 11.3. Оба ряда имеют выраженные линейные тренды.

Оцененная статистическая модель приведена в табл. 11.1.

Оцененные коэффициенты статистически значимы, коэффициент детерминации высокий, проверка на адекватность не выявляет нарушений стандартных предположений классической линейной модели регрессии.

Включим в правую часть статистической модели линейный тренд. Оценивание расширенной модели дает следующий результат (табл. 11.2).

Остатки проходят тесты на адекватность, так что можно обратить внимание на протокол оценивания расширенной статистической модели. В соот ветствии с этим протоколом коэффициент при переменной xt статистически незначим, так что хп по существу, не проявляет себя в качестве переменной, объясняющей изменчивость значений переменной^.

Исключение xt из правой части уравнения приводит к оцененной модели (табл. 11.3), которая предпочтительнее расширенной модели и по критерию Акаике, и по критерию Шварца.

Более того, по этим критериям последняя модель намного предпочтительнее исходной модели j;, = а + j3xt + єг Это связано с тем, что при оценивании исходной SM остаточная сумма квадратов равна 233.59, а при оценивании

последней модели — равна всего лишь 41.91. Это еще более убедительно подтверждает, что изменчивость переменной yt в действительности не объясняется изменчивостью переменной хгШ

В рассмотренном примере паразитная связь между переменными была обусловлена тем, что в модели DGP обе переменные имеют в своем составе детерминированный линейный тренд.

Однако ложная (паразитная) связь между переменными может возникать не только в результате наличия у этих переменных детерминированного тренда. Паразитная связь может возникать и между переменными, имеющими не детерминированный, а стохастический тренд. Приведем соответствующий пример.

ПРИМЕР 11.1.2

Возьмем процесс порождения данных в виде:

DGP: xt =х,_! + €и,

где єи и єь — те же, что и в примере 11.1.1. Графики рядов xt nyt показаны на рис. 11.4.

Предположим, что нам доступны статистические данные, соответствующие последним 50 наблюдениям (с 51-го по 100-е). Оценивание по этим наблюдениям статистической модели

SM: yt = а + j3xt + st

приводит к следующим результатам (табл. 11.4).

Таблица 11.4

Объясняемая переменная У

Sample: 51 100; Included observations: 50

Переменная

Коэффициент

Стандартная ошибка

/-статистика

Р-значение

С

8.616496

0.748277

11.515120

0.0000

X

0.597513

0.077520

7.707873

0.0000

R-squared

0.553120

Mean dependent var

3.404232

Adjusted R-squared

0.543810

S.D. dependent var

3.354003

S.E. of regression

2.265356

Akaike info criterion

4.512519

Sum squared resid

246.3283

Schwarz criterion

4.589000

Log likelihood

-110.8130

F-statistic

59.41131

Durbin-Watson stat

0.213611

Prob. (F-statistic)

0.000000

Несмотря на то что в DGP ряды yt и xt порождаются независимо друг от друга и их модели не содержат детерминированного тренда, здесь также наблюдаем довольно высокое значение коэффициента детерминации: 0.553. Конечно, это связано с тем, что на рассматриваемом периоде реализации обоих рядов имеют видимый тренд (рис. 11.5).

Если, однако, обратиться ко всему периоду из 100 наблюдений, то результаты оценивания будут совсем другими (табл. 11.5).

В этом случае значение коэффициента детерминации близко к нулю, а оцененный коэффициент при xt равен 0.0551 против 0.5975, полученного при оценивании по наблюдениям с 51-го по 100-е. Это отражает действительное отсутствие детерминированного тренда в DGP и в связи с этим крайнюю нестабильность оценок коэффициента при хп полученных на различных интервалах. Последнее сопровождается также крайне низкими значениями статистики Дарбина — Уотсона (0.214 на полном периоде наблюдений и 0.062 на второй половине этого интервала). ■

Все указанные признаки являются характерными чертами, которые присущи результатам оценивания линейной модели связи между переменными, которые имеют стохастический (но не детерминированный!) тренд и порождаются статистически независимыми моделями. Теоретическое исследование подобной ситуации показывает следующее.

Пусть DGP: xt =xt_{ + єи, yt = yt_x + є2п где xQ = 0, yQ = 0, a eu и slt — статистически независимые между собой последовательности одинаково распределенных случайных величин, єи ~ N(0, <j{2 єь ~ N(0, сг^Х так что Cov(xn yt) = 0. Предположим, что по Т наблюдениям (хп yt)9 t 1,2, Г, производится оценивание статистической модели

SM: yt = j3xt + ип ut i.i.d. 7V(0, <тм2), Cov(xn ut) = 0.

Стандартная оценка наименьших квадратов для коэффициента J3 в этой гипотетической модели имеет вид:

т

t=

При сделанных предположениях относительно DGP оценка /3Т не сходится по вероятности при Т -> оо ни к какой константе и имеет предельное распределение, отличное от нормального.

Вместе с тем при выбранной спецификации SM (статистической модели), в предположениях этой модели (а не DGP!) имеем

Cov(xt, yt) = Cov(xn J3xt+ut) = j3Cov(xn xt) = /?£)(*,),

т.е. оцениваемым параметром является

Cov(xnyt) D(xt)

Поскольку в действительности (в DGP) Cov(xn yt) = О, то и это значение J5 равно нулю, так что если бы гипотетическая модель (соответствующая SM) была верна, то имело бы место J3T —> О по вероятности.

Далее, при Т -> со значения /-статистики tp для проверки гипотезы Я0: J3= О неограниченно возрастают по абсолютной величине, так что использование таблиц /-распределения будет практически всегда приводить к отклонению этой гипотезы, т.е. к выводу о том, что между переменными xt и yt существует линейная регрессионная связь. В действительности нетривиальное предель1

ное распределение имеет не статистика tfi9 а статистика —f=tp, причем прел/71

дельное распределение последней является нестандартным.

Что касается статистики Дарбина — Уотсона (DW), то в рассматриваемой ситуации DW —> 0 по вероятности при Т —» оо, и это позволяет распознавать неправильную спецификацию статистической модели в форме паразитной регрессии. Последнее обстоятельство проявляется в поведении остатков от оцененной статистической модели, которое не соответствует поведению стационарного процесса.

ПРИМЕР 11.1.3

В предыдущем примере было задано

DGP: xt =xt_x + єи, y,=yt-x +еЬ9

где єи и s2t — последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение yV(0, 1).

Мы оценивали статистическую модель

SM: yt = а + Pxt + st

и по наблюдениям с 51-го по 100-е получили

рТ = 0.598, /, = 7.708, DW= 0.214.

При этом график остатков (рис. 11.6) не похож на график стационарного ряда.И

Естественно было бы для выявления такого «неподобающего» поведения остатков не просто увидеть график остатков, но и попытаться использовать формальные статистические критерии, тем более что критерии проверки интегрированное™ временных рядов были рассмотрены ранее (критерии Дики — Фуллера, Филлипса — Перрона и др.).

Проблема, однако, в том, что теперь мы имеем дело не с «сырым» рядом, а с рядом остатков, которые вычисляются после предварительного оценивания модели (коэффициентов а и Р в последнем примере). Это обстоятельство существенно влияет на распределения соответствующих статистик и не дает возможности пользоваться таблицами, которые были использованы ранее при анализе на интегрированность «сырых» рядов. С учетом этого были построены таблицы, позволяющие производить анализ остатков в случае интегрированных объясняемой и объясняющих переменных, о чем подробнее будет сказано в теме 11.2. Сейчас же только покажем, что дает применение соответствующих таблиц к рассмотренному выше примеру.

ПРИМЕР 11.1.4

При оценивании статистической модели SM: yt = а + Pxt + st по наблюдениям с 51-го по 100-е получили оцененную модель

yt = 8.616 + 0.598х, + е,.

С полученным рядом остатков поступим так же, как и в случае применения критерия Дики — Фуллера к «сырому» ряду, т.е. оценим модель

Aet = (pet_ j + V,

и вычислим /-статистику / для проверки гипотезы Я0: 0, интерпретируя эту гипотезу как гипотезу единичного корня для ряда остатков.

Гипотеза Н0 отвергается в пользу НА: (р < 0 (интерпретируемой как гипотеза стационарности ряда остатков), если /^ < /крит. Приближенные значения /крит (в применении к ряду остатков) можно найти по формуле: ^крит ~ к™ + КТ + ,

где к^, кх, лг2 зависят от выбранного уровня значимости и указаны в табл. П-9 в Приложении к заданиям для семинарских занятий... (MacKinnon, 1991). Для 5\%-го уровня значимости

/крит * -3.3377 5.967Г"1 8.98Г"2,

что при Т = 50 дает /крит = -3.46. Последнее значение существенно меньше 5\%-го критического значения статистики Дики — Фуллера (-2.92), рассчитанного для случая «сырого» ряда.

В нашем примере оценивание тестового уравнения Дики — Фуллера дает значение f = -2.01. Последнее существенно выше 5\%-го критического уровня, и гипотеза единичного корня не отвергается. ■

Вообще говоря, вопрос о ложной (паразитной) или неложной (действительной) линейной регрессионной связи между двумя переменными xt и уп представляющими интегрированные ряды первого порядка (xt, yt ~ 7(1)), более точно формулируется следующим образом: существует ли такое значение Д при котором ряд yt Де, стационарен?

Если ответ на этот вопрос положительный, то говорят, что ряды xt и yt (переменные xt и yt) коинтегрированы (cointegrated time series). Если же ответ оказывается отрицательным, то ряды xt и yt (переменные xt и yt) не являются коинтегрированными.

В последнем случае непосредственное оценивание модели yt = а + f3xt + ut

бессмысленно, так как получаемая оценка J3T, собственно говоря, не является оценкой какого-либо теоретического параметра связи между переменными xt nyt (см., впрочем, ниже замечание 11.1.6).

Напротив, если переменные xt и yt коинтегрированы, то (3Т является оценкой того единственного значения Д при котором ряд jy, J3xt стационарен. Заметим теперь, что если в

DGP: xt =xt_{ + єи,

Уг=Уг+£lt

допустить коррелированность значений єи и slt в совпадающие моменты времени, т.е. Cov(slt, s2t) * 0, то коррелированность єи и s2t вовсе не означает, что ряды xt и yt коинтегрированы. Предположим все же, что существует некоторое значение Д при которому, = j5xt + ut, где ut — стационарный ряд. Тогдаyt_x = /3xt_x + ut_x, так что Ayt = (5Axt + Aut, а отсюда єь = /Зєи + Aut. Последнее можно записать в виде ut -ut_x + rjt, где

Пі = £it ~P£ ~ iidN(09 rf). Но это означает, что ut — нестационарный процесс. В то же время если х0 = у0 = 0, то

Cov(xt,yt) = Cov(sn + ... + єи, є2Х + ... + єь) = tCov(slu є2)9

так что xt и yt — коррелированные, но не коинтегрированные случайные блуждания.

Существенно, что распределение статистики Дики — Фуллера в подобной ситуации не зависит от конкретного вида матрицы ковариаций

І, = (Соу(єкІ9єЯІ))9 k9s =192.

Тем же свойством обладает и распределение статистики Дарбина — Уотсона, примененной к ряду остатков (CRDW — cointegrating regression DW)

et=yt~ dTpTxt.

При T = 50 5\%-е критическое значение последней статистики равно 0.78. Гипотеза некоинтегрированности рядов отвергается, если наблюдаемое значение этой статистики превышает критическое значение.

В примере 11.1.3 значение статистики Дарбина — Уотсона равно 0.214, так что гипотеза некоинтегрированности не отвергается и этим критерием.

Что следует предпринять в случае обнаружения паразитной связи между интегрированными порядка 1 переменными xt nyt? Имеются три возможных пути обхода возникающих здесь трудностей.

1. Включить в правую часть уравнения запаздывающие значения обеих переменных, точнее, рассмотреть статистическую модель

SM: yt = а+ уУг+ Pxt + $xt+ ип где ut — стационарный ряд и переменная xt трактуется как экзогенная переменная.

Последнее уравнение можно записать иначе в следующих двух формах:

а) yt = а+ ryt+ + (/? + S)xt_x + щ9

б) yt = а+ ryt-i S)xt SAxt + ut9

В обеих формах слева стоит интегрированная переменная^ ~/(1).

В правой части уравнения а) параметр J3 является коэффициентом при стационарной переменной Ахп имеющей нулевое математическое ожидание; yt_l9 xt_x ~ 1(1), ut — стационарный ряд. Как было показано в (Sims, Stock, Watson, 1990), в такой ситуации оценки наименьших квадратов для всех коэффициентов SM состоятельны, оценка параметра Д асимптотически нормальна. Обычная /-статистика для проверки гипотезы Я0: Р = 0 имеет асимптотически нормальное распределение N(0, 1), если ut — белый шум.

Аналогично в правой части уравнения б) параметр -8 является коэффициентом при стационарной переменной Ахп имеющей нулевое математическое ожидание; yt_l9 xt ~ 1(1), ut — стационарный ряд. Поэтому оценка параметра 8 в рамках модели SM асимптотически нормальна, и /-статистика для проверки гипотезы Н0: 8 = 0 имеет асимптотически нормальное распределение N(0, 1), если ut — белый шум.

Оценки для Р и 8 остаются асимптотически нормальными и в том случае, если ut — стационарный ряд, не являющийся белым шумом. Однако при этом асимптотическое распределение N(0, 1) имеет скорректированные варианты /-статистик, в знаменателях которых стандартные оценки дисперсии ряда ut заменяются состоятельными оценками долговременной дисперсии этого ряда, определенной в теме 10.2.

В то же время статистика qF = 2F для проверки гипотезы Н0: Р = 8 = О

не имеет асимптотического распределения ;f2(2), поскольку рассматриваемую SM не удается линейно репараметризовать таким образом, чтобы в правой части преобразованного уравнения и р и 8 одновременно стали коэффициентами при стационарных переменных, имеющих нулевые математические ожидания (у нас они становятся таковыми при разных репараметризациях).

Перед оцениванием модели связи продифференцировать ряды xt и уп т.е. рассмотреть модель в разностях

SM: Ay, = а + ДДх, + ип

где ut — стационарный ряд.

В этой модели оценки наименьших квадратов и для а, и для Р асимптотически нормальны. Обе /-статистики имеют асимптотически нормальное распределение N(0, 1), если ut — белый шум. Если ut — стационарный ряд, не являющийся белым шумом, то необходимо произвести коррекцию /-статистик, как в предыдущем пункте.

Использовать для оценивания модель регрессии с автокоррелированными остатками:

SM: yt = а + Pxt + ип ut = pxt_x + єп ut ~ i.i.d. N(0, a]),

При этом предпочтительнее оценивать все три параметра а, Д, р одновременно, используя представление

Уг-РУг= а(1 -Р) + Р(Х,-РХ,_Х) + ЄГ

В случае ложной регрессии р —> 1 (по вероятности), так что при больших Т этот метод фактически равносилен предварительному дифференцированию рядов.

ПРИМЕР 11.1.5

Применим указанные три подхода к анализу реализаций, смоделированных ранее в данном разделе в соответствии с

DGP: xt =xt+ єп

где єи и slt — последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение 7V(0, 1).

Для анализа используем последние 50 наблюдений.

Применив первый подход, получим оцененную модель, приведенную в табл. 11.6.

Наблюдаемые Р-значения для коэффициентов при переменных xt и xt_x указывают на то, что переменная xt фактически не объясняет изменчивость переменной уг

Применив второй подход, получим оцененную модель, приведенную в табл. 11.7.

Оба коэффициента статистически незначимы, и это отражает некоррелированность рЯДОВ Єи И £1г.

Применив третий подход, оценим модель

yt -pyt.x = a(l -р) + J3(xt -pxt_x) + єп

т.е.

Уг = a+Pyt+ A*r -Pxt-i) + *r При этом получим следующие результаты (табл. 11.8).

Как и ожидалось, коэффициент при оказался очень близким к 1, а два других коэффициента статистически незначимы. Проверка на одновременное зануление этих двух коэффициентов дает Р-значение 0.367.■

ПРИМЕР 11.1.6

Изменим процесс порождения данных, оставляя те же формулы для xt и уп т.е.

Xt — Xt_ і + £f, yt=yt-x +£2r

Но теперь пусть:

s -> £2t — последовательности независимых, одинаково распределенных случайных величин, имеющих нормальное распределение N(0, 1.25); Cov(su, s2s) 0 для t*s, Cov(su, s2t) = 1.

Отсюда, в частности, следует, что Согг(єи, s2t) = 0.8.

Смоделированные реализации єи и s2t изображены на рис. 11.7.

Траектории смоделированной пары рядов єи и є2і ведут себя достаточно согласованным образом, оцененный коэффициент корреляции между этими рядами равен 0.789. Полученные при этом реализации рядов xt nyt ведут себя так, как показано на рис. 11.8. Для сравнения на рис. 11.9 изображено поведение реализаций рядов хг и уг при полной статистической независимости

рЯДОВ £и И Є2г

Для сопоставимости с ранее полученными результатами опять обратимся ко второй части отрезка наблюдений; здесь оцененный коэффициент корреляции между рядами еи и e2t равен 0.792.

Сначала оценим модель yt = а + J3xt + иг В результате получим для ряда остатков значение статистики Дики — Фуллера, равное -2.112, которое выше 5\%-го критического уровня -3.46. Соответственно гипотеза о ложности регрессионной связи не отвергается.

Применив первый подход, получим оцененную модель, приведенную в табл. 11.9.

По сравнению с ранее рассмотренным случаем, где ряды єи и еъ были между собой статистически не связанными, теперь оказываются статистически значимыми и коэффициенты при переменных xt и xt_!. Исключив из правой части модели константу, получим табл. 11.10.

То есть>>г = .005yt_x + 0.695л;, 0.101 xt_x + et. Оценка коэффициента при^_! близка к 1, оцененные коэффициенты при xt и xt_x близки по абсолютной величине и противоположны по знаку, что вполне согласуется с реализованной моделью DGP.

Объясняемая переменная D(Y)

Применив второй подход, получим оцененную модель, приведенную в табл. 11.11.

И здесь в отличие от ранее использовавшегося DGP становится значимым коэффициент при переменной Ахп что отражает коррелированность случайных величин єи и s2t, т.е. коррелированность Axt и Ауг Исключив из правой части уравнения статистически незначимую константу, получим результаты, приведенные в табл. 11.12.

То есть Ayt = 0.7ЮДх, 4еп ишу{ = yt_x + 0.710jc, 0.710хг_! 4et. Наконец, применив третий подход, оценим модель

yt = a+ pyt.! + j3(xt -pxt_х) + єг

При этом получим табл. 11.13.

Объясняемая переменная У

Convergence achieved after 8 iterations; У=С(1)+С(2)*У(-1)+С(3)*(Х-С(2)*Х(-1))

Объясняемая переменная У

Convergence achieved after Л iterations; У=С(2)*У(-1)+С(3)*(Х-С(2)*Х(-1))

Здесь становится статистически значимым коэффициент Д Исключение из правой части константы дает табл. 11.14.

То есть

yt = 1.014уг_! + 0.702(jc, №4xt_x) + en

или

yt = 1.014>>,_i + 0.702jc, 0.712jcr_! + er

Отметим близость результатов, полученных тремя методами:

yt = 1.005^.! + 0.695jc, 0.707х,_! + et (метод 1);

yt = yt-X + 0.71 Ox, 0.7 Юх^ 4et (метод 2);

yt = 1.014^_! + 0.702x, 0.712jc,_! + e, (метод 3).

Фактически во всех трех случаях воспроизводится одна и та же линейная модель связи между рядами разностей:

Ду, = 0.7Дх, 4ег

Эта регрессионная связь между продифференцированными рядами не является ложной (в отличие от регрессионной связи между рядами уровней): статистика Дарбина — Уотсона принимает значение 1.985, Р-значение критерия Харке — Бера равно 0.344.■

у/ Замечание 11.1.1. В связи с результатами, полученными в последних примерах, естественно возникает следующий вопрос, который поднимался в свое время различными исследователями. Не будет ли разумным, имея дело с рядами, траектории которых обнаруживают выраженный тренд, сразу приступать к оцениванию связей между рядами разностей (между продифференцированными рядами)?

Против некритичного использования такого подхода говорят два обстоятельства:

если ряды в действительности стационарны относительно детерминированного тренда, то дифференцирование приводит к передифференцированным рядам, имеющим необратимую МА-составляющую;

если ряды являются интегрированными порядка 1 и при этом коинтегрированы, то при переходе к продифференцированным рядам теряется информация о долговременной связи между уровнями этих рядов.

Дифференцирование рядов оправданно и полезно, если ряды являются интегрированными, но при этом между ними отсутствует коинтеграционная связь.

Коинтегрированные временные ряды

Пусть yt ~ 7(1), х, ~ ДО). Строить регрессию уг на xt в этом случае бессмысленно, так как для любых аиЬв такой ситуации

yt a bxt ~/(1).

Пусть, наоборот, yt ~ 1(0), xt ~ 7(1). Для любых аиЬ^О здесь опять

yt a bxt ~/(1)

и только при Ь = 0 получаем

yt-a-bxt -1(0\%

так что и в таком сочетании строить регрессию одного ряда на другой не имеет смысла.

Пусть теперь^ ~ 7(1), xt ~1(1) — два интегрированных ряда. Если для любого Ъ

yt-bxt ~/(1),

то регрессия yt на xt является фиктивной, и мы уже выяснили, как следует действовать в такой ситуации.

Обратимся теперь к случаю, когда при некотором ЬфО

yt bxt ~ 1(0) — стационарный ряд.

Если это так, то ряды yt и xt называют коинтегрированными, а вектор (1, -Ь)Т— коинтегрирующим вектором (cointegrating vector).

Вообще, ряды^г ~ 1(1), xt ~1(1) называют коинтегрированными (в узком смысле — детерминистская коинтеграция, deterministic cointegration), если существует ненулевой (коинтегрирующий) вектор Р= (Рх, J32)T * 0, для которого

Pxxt + P2yt ~ 1(0) — стационарный ряд.

Заметим, что если вектор /? = (Д, р2)Т является коинтегрирующим для рядов xt nyt, то коинтегрирующим для этих рядов будет и любой вектор вида с/? = (сД, сР2)т, где с ф 0 — постоянная величина. Чтобы выделить какой-то определенный вектор, приходится вводить условие нормировки (normalization) — например, рассматривать только векторы вида (1, -Ь)т (или только векторы (-а, )т).

Поскольку предполагаем в данном случае, что xt,yt ~ 1(1), то ряды разностей Дх,, Ayt стационарны. Будем предполагать в дополнение, что стационарен векторный ряд (Axt, Ayt)T и для него существует представление в виде векторного скользящего среднего (VMA)

(Axt, Ayt)T = ju +B(L)st, где /£ = (jil9 ju2)T, ju{ = E(Axt), ju2 = E(Ayt), 6t = (eXt, s2t)T — векторный белый шум,

т.е. єх, є2, ... — последовательность не коррелированных между собой, одинаково распределенных случайных векторов, для которых

E(st) = (О, 0)Т, d(sXt) = <jx, d(s2t) = <j2, Cov(sXt, є2і) = an— постоянные величины;

B(L) =

О 1

+ 1

k =

(h{k) h(k)

Uik) r(k) u2l u22 J

Таким образом, предполагается, что разложение Вольда центрированного векторного ряда (Дх„ Ayt)Tju не содержит линейно детерминированной компоненты.

Знаменитый результат Грейнджера (см. (Granger, 1983), а также (Engle, Granger, 1987)), состоит в том, что в случае коинтегрированности 7(1) рядов xt nyt (в узком смысле):

в представлении (Axt, Ayt)T = ju + B(L)st матрица 5(1) имеет ранг 1;

система рядов xt и yt допускает векторное ARMA представление

A(L)(xt,yt)T = c + d(L)st,

где et — тот же векторный белый шум, что и в (I); с = (сх, с2)Т, сх и с2 — постоянные; А(Ь)— матричный полином от оператора запаздывания; d(L) — скалярный полином от оператора запаздывания,

причем ДО) = 12 (единичная матрица размера (2 х 2)),

rank А() = 1 (ранг (2 х 2)-матрицыЛ(1) равен 1), значение d() конечно.

В связи с тем что в последнем представлении ранг (2 х 2)-матрицы А() меньше двух, об этом представлении часто говорят как о векторной авторегрессии пониженного ранга (reduced rank VAR).

В развернутой форме представление (II) имеет вид:

Р ч

xt = ci + ХКЛ-У Y*ek*u-k>

7=1 k = 0

Р Я

Уі~С2 + Z(*2/*f-y +b2jyt_j)+ YuekS2,t-k7=1 k = 0

При этом верхние пределы р и q у сумм в правых частях могут быть бес-конечными.

Если возможно векторное AR представление, то в нем d(L) =1,р <ю.

Система рядов xt и yt допускает представление в форме модели коррекции ошибок (error correction model — ЕСМ)

00 00

Axt =fix + axzt_x + Х(Гі7-Л*,-7 +sijAyt-j)+ Z^*u-*>

7=1 k=0

00 00

Ayt = //2 + a2zt_x + Y.iYij A*,-; + S2J Ayt_j) + ^0ke2tt_k,

7=1 k=0

где zt=yt J3xt E(yt J3xt) — стационарный ряд с нулевым математическим ожиданием, zt ~ 1(0); ах2 + ai > 0.

Если в (II) возможно векторное AR(p) представление (р < оо), то ЕСМ принимает вид:

РAxt=px+axzt_x + Y, (Г и Л*, -у + sj ДУг -j ) +

7 = 1

Ayt = р2 + a2zt_x + £(^f Дх,_, + ДУг-у) + *2,г

7 = 1

Здесь важно отметить следующее.

Если ряды xt, yt ~ 1(1) коинтегрированы, то все составляющие в ЕСМ стационарны.

Если векторный ряд (xt, yt)T ~ 1(1) (так что векторный ряд (Дх„ Ayt)T стационарен) и порождается ЕСМ-моделью, то ряды xt и yt коинтегрированы. (Действительно, в этом случае все составляющие ЕСМ, отличные от zt_х, стационарны, но тогда стационарна и z,_ х.)

Если ряды xt, уг ~1(1) коинтегрированы, то VAR в разностях не может иметь конечный порядок (в отличие от случая, когда ряды xt и yt не коинтегрированы).

Абсолютную величину zt-yta-J3xt, где а = E(yt J3xt), можно рассматривать как расстояние, отделяющее систему в момент t от равновесия (equilibrium), задаваемого соотношением yt a-fixt = 0. Величины и направления изменений хг и yt принимают во внимание величину и знак предыдущего отклонения от равновесия zt_x. Ряд zt, конечно, вовсе не обязательно убывает по абсолютной величине при переходе от одного периода времени к другому, но он является стационарным и поэтому расположен к движению по направлению к своему среднему (mean-reversion).

Замечание 11.1.2. Переменная xt не является причиной по Грейнд-жеру для переменной уt, если неучет прошлых значений переменной xt не приводит к ухудшению качества прогноза значения yt по совокупности прошлых значений этих двух переменных. Переменная yt не является причиной по Грейнджеру для переменной xt, если неучет прошлых значений переменной yt не приводит к ухудшению качества прогноза значения xt по совокупности прошлых значений этих двух переменных1. (Качество прогноза измеряется среднеквадрати-ческой ошибкой прогноза.)

В четвертой части учебника рассмотрим более подробно вопросы, связанные с определением причинности по Грейнджеру.

Если xt, yt ~1(1) и коинтегрированы, то должна иметь место причинность по Грейнджеру (Granger causality), по крайней мере, в одном направлении. Этот факт вытекает из представления такой системы рядов в форме ЕСМ, в которой ах + а2 > 0. Значение xt_x через посредство zt_ х помогает в прогнозировании значения yt (т.е. переменная хг является причиной по Грейнджеру для переменной yt), если а2 ф 0. Значение yt_ х через посредство zt_, помогает в прогнозировании значения xt (т.е. переменная yt является причиной по Грейнджеру для переменной xt), если ах ф 0.

Замечание 11.1.3. Пусть xt, yt ~ 1(1) коинтегрированы и wt ~ 1(0). Тогда для любого к коинтегрированы ряды xt и yyt_k + wt, у ф 0. Если xt ~ 1(1), то коинтегрированы ряды xt и xt_k. (Действительно, тогда xt хг_к = Axt + Axt_x 4... + Axt_k — сумма /(О)-переменных, которая также является /(О)-переменной.)

Процедура Энгла — Грейнджера построения модели коррекции ошибок

Итак, при коинтегрированности рядов xt,yt ~ 1(1) имеем:

модель долговременной (равновесной) связи уt = а + J3xt;

модель краткосрочной динамики в форме ЕСМ,

и эти модели согласуются друг с другом.

Проблема, однако, состоит в том, что для построения ЕСМ по реальным статистическим данным надо знать коинтегрирующий вектор (в данном случае — знать значение /?). Хорошо, если этот вектор определяется экономической теорией. К сожалению, чаще его приходится оценивать по имеющимся данным.

Энгл и Грейнджер (Engle, Granger, 1987) предложили двухшаговую процедуру построения ЕСМ для коинтегрированных рядов.

На первом шаге значения а и (5 оцениваются в рамках модели регрессии Ух на xt

ytа лJ3xt + ut.

Получив методом наименьших квадратов оценки а и ft для параметров этой модели (МНК-оценки), находим оцененные значения отклонений от положения равновесия

zt=yt-d-f3xt, т.е. остатки от оцененной регрессии.

На втором шаге методом наименьших квадратов раздельно (не как система!) оцениваются уравнения:

рAxt=jux + axzt_x + ХО^'-У +SXJAyt_j) + vn р-і

Ayt=ju2 + a2zt_x + ^(rij^t-j +S2jAyt_j) + wn y = i

т.е. предполагается модель VAR(p) для xt9yr

Определяющим в этой процедуре является то обстоятельство, что (в случае коинтегрированности рядов xt nyt) полученная на первом шаге оценка J3 быстрее обычного приближается (по вероятности) к истинному значению (З — второй компоненте коинтегрирующего вектора (1, Д)г (иначе говоря, /? является суперсостоятельной оценкой для Д). Это, в конечном счете, приводит к тому, что оценки в отдельном уравнении ЕСМ, использующие оцененные значения zt_l9 имеют то же асимптотическое распределение, что и оценка максимального правдоподобия, использующая истинные значения zt_ х (обычно это асимптотически нормальное распределение). При этом МНК-оценки стандартных ошибок всех коэффициентов являются состоятельными оценками истинных стандартных ошибок.

Заметим, что последние результаты справедливы, несмотря на то что ряд оцененных значений £, формально не является стационарным, поскольку

Отметим также, что если использовать другую нормировку коинтегрирующего вектора в виде (Д 1)г, то придется оценивать регрессию xt на константу иуп а это приведет к вектору, не пропорциональному вектору, оцененному в первом случае.

/

v Замечание 11.1.4. Тот факт, что Р быстрее обычного сходится (по вероятности) к Д вовсе не означает, что на первом шаге процедуры Энгла — Грейнджера можно использовать обычные регрессионные критерии. Дело в том, что получаемые на первом шаге оценки и статистики имеют, вообще говоря, нестандартные асимптотические распределения. Кроме того, при небольших Т оценка J3 может иметь весьма значительное смещение.

Однако в данном контексте первый шаг является вспомогательным, и на этом шаге нет необходимости обращать внимание на сообщаемые в протоколах соответствующих пакетов программ значения статистик. Напротив, на втором шаге можно использовать обычные статистические процедуры (разумеется, если количество наблюдений достаточно велико и ряды коинтегрированы).

у/ Замечание 11.1.5. При практическом применении двухшаговой процедуры Энгла — Грейнджера полученный на первом шаге ряд остатков z , -yt а j5xt используют не только при оценивании модели коррекции ошибок на втором шаге процедуры, но и для проверки гипотезы о некоинтегрированности рядов xtnyr

Эту гипотезу можно проверять следующим образом. Для ряда z, строится статистика Дики — Фуллера t9, которая использовалась бы для проверки гипотезы существования единичного корня у этого ряда, если бы этот ряд был «сырым», а не являлся рядом остатков от оцененной регрессии. Гипотеза некоинтегрированности рядов xt и yt отвергается, если вычисленное значение f оказывается ниже критического значения tKpm, соответствующего заданному уровню значимости, т.е. если t < tKpm. Следует отметить только, что это tKpm отличается от критического значения статистики t9, рассчитанного для случая «сырого» ряда, так что здесь необходимы другие таблицы критических значений. В связи с этим уже указывалась работа (MacKinnon, 1991); среди других источников, содержащих необходимые таблицы, упомянем монографии (Patterson, 2000) и (Hamilton, 1994). Более подробно этот вопрос будет рассмотрен в теме 11.2.

ПРИМЕР 11.1.7

Расмотрим реализацию процесса порождения данных

DGP: xt = х,_1 + st, Уг = 2х, + v„

где х{ = 0;

et и v, — порождаемые независимо друг от друга последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение yV(0, 1).

Графики полученных реализаций рядов xt uyt изображены на рис. 11.10. Пара (xt,yt) образует векторный процесс авторегрессии

xt — xt_ і 4st, yt = 2xt_l + r/t,

где 77, = v, 42st ~ Lid. N(0, 5).

В форме ЕСМ пара уравнений принимает вид:

Ду, = -(у,_і -2xt_x) + rit = -zt_x + //„

rjxezt =yt-2xt,

ИЛИ

Дх, = alzt_l + єп

Ayt = a2zt_x + rjn

где ax = 0, a2 = -1, так что ах + а2 > 0.

На практике, приступая к анализу статистических данных, исследователь не знает точно, какой порядок имеет VAR в DGP. Имея это в виду, выберем для оценивания в качестве статистической модели ЕСМ в виде:

Axt = axzt_x +ГцА*/-і +£ц4У/-і +v»

Ayt = a2zt_x + y2XAxt_x + S2xAyt.x + w„

допуская, что данные порождаются моделью векторной авторегрессии второго порядка (р = 2). Для анализа используем 100 наблюдений.

Шаг I. Исходим из модели yt а + (3xt + иг Оцененная модель приведена в табл. 11.15.

То есть у, = -0.006764 + 1.983373л:, + й„ так что

zt = u,=y, + 0.006764 1.983373jc,.

Допустив, что VAR имеет порядок 2, при использовании критерия Дики — Фуллера для проверки рядов yt и xt на коинтегрированность в правую часть уравнения включаем одну запаздывающую разность:

Azt=<pzt_x +6xl±zt_x + £. Оценивив последнее уравнение, получим табл. 11.16.

Значение тестовой статистики f = -7.614 ниже 5\%-го критического уровня -3.396 (см. {Patterson, 2000, табл. 8.7)). Гипотеза некоинтегрированности рассматриваемых рядов уверенно отвергается. (Ввиду статистической незначимости коэффициента при запаздывающей разности можно было бы переоценить модель, не включая запаздывающую разность в правую часть уравнения. Но это дало бы значение f = -11.423, при котором гипотеза некоинтегрированности отвергается еще более уверенно.)

Таким образом, принимаем решение о коинтегрированности рядову, и^и переходим к построению модели коррекции ошибок.

Шаг П. Сначала отдельно оцениваем уравнение для Axt (табл. 11.17).

Поочередное исключение из правой части уравнения переменных со статистически незначимыми коэффициентами и наибольшим Р-значением приводит к оцененной модели (табл. 11.18) и, в конечном счете, к модели

Ах, = v„

которая и была использована при порождении ряда хг

Исключая из правой части оцениваемого уравнения константу, получаем табл. 11.20.

Хотя формально здесь следовало бы начать исключение статистически незначимых переменных с £j, необходимо учитывать уже принятое решение о коинтегрированности рядову, и хг Но если эти ряды действительно коинтег-рированы, то в ЕСМ должно выполняться соотношение ах2 + а2 > 0. Поскольку переменная z,_! не вошла в правую часть уравнения для Дх„ она должна оставаться в правой части уравнения для Ауг Если начать исключение с переменной Ду,_і, то в оцененном редуцированном уравнении (табл. 11.21) оказывается статистически незначимым коэффициент при Дх,_15 что приводит нас к уравнению Ay, = a2zt_{ + wr Оценивая последнее, получаем табл. 11.22.

Проверка гипотезы Н0: а2=-1 дает табл. 11.23.

Поскольку эта гипотеза не отвергается, можно остановиться на модели ЕСМ

Axt = st, Ayt=-zt_x +и>„ где £,_! = yt_x + 0.0067641.983373х,_1.

Подстановка последнего выражения для zt_ х в уравнение для Ayt приводит к соотношению

yt = -0.0068 + 1.983*,.! + wn которое близко к соотношению

yt = 2xt_x + rjn

соответствующему использованному DGP.

Заметим, наконец, что последовательность wt = Ayt + zt_ х идентифицируется по наблюдаемой ее реализации как гауссовский белый шум с оцененной дисперсией 4.62 (использованному DGP соответствует значение 5.00), а последовательность et Ах, идентифицируется как гауссовский белый шум с оцененной дисперсией 1.04 (использованному DGP соответствует значение 1.00).

Остановившись на модели

Axt = sn Ayt = -zt_x +и>„ тем самым получили, что коррекция производится только в отношении ряда>>„ а именно — при положительных zt_x, т.е. при

yt_x (-0.0068 + 1.983Х,.!) > 0,

в правой части уравнения для Ду, корректирующая составляющая £,_ х отрицательна и действует в сторону уменьшения приращения переменной^,. Напротив, при отрицательных z,_ х корректирующая составляющая действует в сторону увеличения приращения переменной^,.

Прошлые значения переменной х, через посредство £,_ х помогают в прогнозировании значения уп т.е. переменная х, является причиной по Грейнджеру для переменной уг В то же время прошлые значения переменной yt никак не помогают прогнозированию значения х„ так что у, не является причиной по Грейнджеру для х,.И

Заметим далее, что даже если в ЕСМ Cov(vn wt) Ф 0, оценивание пары уравнений ЕСМ как системы не повышает эффективности оценок, поскольку в правые части обоих уравнений входят одни и те же переменные.

Расмотренный в нашем примере процесс порождения данных

DGP: х, = х,_! + £„ yt = 2х, + v,

является частным случаем модели, известной как треугольная система Филлипса (Phillips's triangular system). В общем случае (для двух рядов) эта система имеет вид:

Уг = P*t + V/f X, — Х,_ і + €t9

где (snvt)T ~ lid. N2(0, X) — последовательность независимых, одинаково распределенных случайных векторов, имеющих двумерное нормальное распределение с нулевым математическим ожиданием и ковариационной матрицей I. Такая последовательность называется двумерным гауссовским белым шумом (two-dimentional Gaussian white noise).

Если матрица X диагональная, так что Cov(sn v,) = 0, то х, является экзогенной переменной в первом уравнении, и никаких проблем с оцениванием коэффициента /? в этом случае не возникает.

Если же Cov(sn v,) Ф 0, то х, не является экзогенной переменной в первом уравнении, так как при этом Cov(x„ v,) = Cov(xt_x + єп v,) Ф 0. Поэтому получаемая в первом уравнении оценка наименьших квадратов для /3 не имеет даже асимптотически нормального распределения.

В дальнейшем еще вернемся к проблеме оценивания коинтегрирующего вектора, а сейчас обратимся к вопросу о коинтеграции нескольких временных рядов.

Коинтегрированная система нескольких временных рядов. Проверка на коинтегрированность нескольких временных рядов

Пусть имеем N временных рядову,,yNt, каждый из которых является интегрированным порядка 1. Если существует такой ненулевой вектор Р=(РХ,PN)T, для которого

РУи + • • • + P^y^t ~ ДО) — стационарный ряд,

то говорят, что эти ряды коинтегрированы (в узком смысле), такой вектор Р называется коинтегрирующим. Если при этом

c = E(PxyXt + ...+pNyNt),

то можно говорить о долговременном положении равновесия системы

{long-run equilibrium relation) в виде:

Pxyx + ...+PNyN = c.

В каждый конкретный момент времени t существует некоторое отклонение (deviation) системы от этого положения равновесия, характеризующееся величиной

В силу сделанных предположений ряд zt является стационарным, имеющим нулевое математическое ожидание, так что он достаточно часто пересекает нулевой уровень, т.е. система колеблется вокруг указанного выше положения равновесия.

При проверке на коинтегрированность нескольких рядов надо различать несколько случаев.

Коинтегрирующий вектор определяется экономической теорией.

В этом случае надо просто проверить на наличие единичного корня соответствующую линейную комбинацию

РУи + — +РыУиг При этом используются те же критические значения, которые рассчитаны на применение к отдельно взятому «сырому» ряду. Эти значения не зависят от количества задействованных рядов N.

Пусть возможный коинтегрирующий вектор не определен заранее.

Тогда отдельно рассматриваются следующие ситуации.

Ряды у1п yNt не имеют детерминированного тренда (точнее, E(Aykt) = О для всех к =1,2,N).

2а. В коинтеграционное соотношение (SM) константа не включается. В этом случае оцениваем

SM: yXt = y2y2t + ... + yNyNt + щ, получаем ряд остатков

оцениваем модель регрессии

Aut = (piit_x + £xAut_x + ... + £KAut_K + st

с достаточным количеством запаздывающих разностей и проверяем гипотезу Н0: <р = 0 против альтернативы Н0: ^ < 0.

На этот раз критические значения для ^-статистики f зависят от количества задействованных рядов N. При большом количестве наблюдений можно использовать критические значения, приведенные в (Hamilton, 1994, табл. В.9, случай 1). Однако на практике в правую часть оцениваемого уравнения константа обычно включается.

2Ь. В коинтеграционное соотношение (SM) константа включается.

В этом случае оцениваем

SM: уи = а+ y2y2t + ... + yNyNt + щ, опять получаем ряд остатков — теперь это будет ряд

"/ =Уи ~ (а + y2y2t + ... + yNyNt оцениваем модель регрессии

Aw, = cput_x + £xAut_x + ... + + €t

с достаточным количеством запаздывающих разностей и проверяем гипотезу Н0: ср 0 против альтернативы Н0: р<0.

Критические значения в этом случае отличаются от случая 2а. При большом количестве наблюдений можно использовать критические значения, приведенные в (Hamilton, 1994, табл. В.9, случай 2). При небольших Т критические значения вычисляются по формуле, приведенной в (MacKinnon, 1991, табл. 1 (вариант «по trend»)) (см. также (Patterson, 2000)).

3. Хотя бы один из рядов у1п yNt имеет линейный тренд, так что

E(Aykt) Ф 0 хотя бы для одного из регрессоров.

За. В коинтеграционное соотношение включается константа. В этом случае оцениваем

SM: ylt = a+ y2y2t + ... + yNyNt + ur

Действуем опять как в случае 2Ь, только критические значения другие. При большом количестве наблюдений можно использовать критические значения, приведенные в (Hamilton, 1994, табл. В.9, случай 3). При небольших Т критические значения вычисляются по формуле, приведенной в работе (MacKinnon, 1991, табл. 1 (вариант «with trend»)) и воспроизведенной в (Patterson, 2000).

ЗЬ. В коинтеграционное соотношение включается линейный тренд.

В этом случае оцениваем

SM: уи = а+ St+y2y2t + ... + yNyNt + ur

Действуя так же, как и ранее, используем те же таблицы, что и в случае За, но не для N, а для (Л/Ч 1) переменных.

Включение тренда в коинтеграционное соотношение приводит к уменьшению мощности критерия из-за необходимости оценивания «мешающего» параметра 8. Однако такой подход вполне уместен в тех случаях, когда нет полной уверенности в том, имеется ли ненулевой тренд хотя бы у одного из рядовуи,у2п .Ум-пример 11.1.8

Смоделируем реализации 4 рядов уи, y2t, y3t, y4t, следуя процессу порождения данных

DGP: уи=Уъ+Уы+Уъ + еи

Уіі ~Уі,і+ Є2п

Узг=Уз,гУаі =Уа,і+ ^4/'

где єи, s2t, s3t, s4t— независимые друг от друга процессы гауссовского белого шума с дисперсиями, равными 1 для s2t, s3t, s4t и 2 для єи.

Графики полученных реализаций для Т= 200 приведены на рис. 11.11.

Не зная точно процесс порождения данных, нужно было бы начать с исследования отдельных рядов. У всех 4 рядов не обнаруживается детерминированного тренда. Проверка по критерию Дики — Фуллера дает значения /-статистик, равные -2.18, -1.78, -0.57, -1.70 соответственно. Все 4 ряда признаются интегрированными. Продифференцированные ряды идентифицируются как гауссовские белые шумы, так что ряды уи, y2t, y3t, y4t идентифицируются как АЫ(1)-ряды с единичным корнем, т.е. как интегрированные ряды порядка 1.

Эконометрика Книга первая Часть 2

Эконометрика Книга первая Часть 2

Обсуждение Эконометрика Книга первая Часть 2

Комментарии, рецензии и отзывы

Раздел 11 регрессионный анализ для нестационарных переменных. коинтегрированные временные ряды. модели коррекции ошибок тема 11.1 проблема ложной регрессии. коинтегрированные временные ряды. модели коррекции ошибок: Эконометрика Книга первая Часть 2, Носко Владимир Петрович, 2011 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Под временным рядом (time series) в экономике понимается ряд значений некоторой переменной, измеренных в последовательные моменты времени.