Часть 4 временные ряды: дополнительные главы. модель стохастической границы раздел 5 сглаживание и прогнозирование временных рядов тема 5.1 адаптивные методы, метод наименьших квадратов

Часть 4 временные ряды: дополнительные главы. модель стохастической границы раздел 5 сглаживание и прогнозирование временных рядов тема 5.1 адаптивные методы, метод наименьших квадратов: Эконометрика Книга вторая Часть 4, Носко Владимир Петрович, 2011 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Для студентов, аспирантов, преподавателей, а также для специалистов по прикладной экономике.

Часть 4 временные ряды: дополнительные главы. модель стохастической границы раздел 5 сглаживание и прогнозирование временных рядов тема 5.1 адаптивные методы, метод наименьших квадратов

Во второй части учебника уже говорилось о том, что под временным рядом (time series) в экономике понимается ряд значений некоторой переменной, измеренных в последовательные моменты времени. Для многих рядов измерения производятся через равные промежутки времени (годовые, квартальные, недельные, дневные данные). Если принять длину такого промежутка за единицу времени (год, квартал, неделя, день), то можно считать, что последовательные наблюдения х{9 хт переменной х произведены в моменты

t = 1, Т. Для некоторых экономических и финансовых показателей производить измерения через равные промежутки времени не удается. Например, значения биржевых индексов на момент закрытия фиксируются только в те дни, когда биржа работает. В последнем случае наблюдения х{9 хт соответствуют Т последовательным рабочим дням биржи.

В динамике уровней ряда могут наблюдаться «систематические эффекты»:

некоторая основная тенденция (тренд — trend);

циклические колебания (cyclicity);

сезонная изменчивость (seasonality).

После учета этих систематических эффектов остается некоторая флуктуация, которая носит нерегулярный характер (irregularity). В связи с этим уровень рядах, часто представляется в виде:

суммы тренда, циклической, сезонной и нерегулярной компонент (аддитивная модель):

xt = Tt + Ct + St + It;

произведения этих компонент (мультипликативная модель):

В рамках такого подхода исследование временного ряда состоит в выявлении и придании количественного выражения каждой из указанных компонент. При этом конечной целью исследования может являться использование полученных результатов для прогнозирования будущих значений ряда.

Нерегулярная составляющая ряда может быть уменьшена или удалена путем применения различных методов сглаживания ряда, так что при этом более отчетливо выявляются трендовые, сезонные и циклические составляющие ряда. В рамках темы 5.1 не делается никаких предположений о возможной вероятностной модели порождения ряда и рассматриваются методы сглаживания, не требующие явного описания такой модели. При изложении этих методов предполагается, что наблюдается некоторый временной ряд хх, х29 ..., хТ (Т— количество наблюдений). Для реализации рассматриваемых ниже методов используется пакет программ эконометрического анализа Econometric Views (версия 6). Приведены результаты применения этих методов к различным экономическим временным рядам.

Скользящие средние

Простое скользящее среднее (SMA — simple moving average) с периодом усреднения К (K-point moving average) формируется путем усреднения К последовательных значений ряда х{9х2, хт. Если в качестве К берется нечетное число, K=2m+ 1, то значение х, исходного ряда заменяется значением

Xi-m Xi-m +1 ~* Xi + т

sma, =

К

Разумеется, значения sma{ определяются только для / = т + 1, Тт. В частном случае К = 3 имеем:

Х/-1 +х/+Х/ + 1 . ~ гг Л

sma: = , / = 2,Г-1;

если^= 5, то

Х/-2 + Xi+ Xi + X/ + l + Xi + 2 . ~ rr ~

smai = , / = 3,Г 2.

ПРИМЕР 5.1.1

Рассмотрим динамику значений индекса ММВБ (Московской межбанковской валютной биржи) на периоде с 18 сентября 2007 г. по 14 февраля 2008 г. (ряд IND — рис. 5.1).

Сгладим этот ряд, используя трехпериодное скользящее среднее. Результат сглаживания приведен на рис. 5.2. Для наглядности на рис. 5.3 приведены графики исходного (IND) и сглаженного (SMAJS) рядов.

На рис. 5.4 приведен график разности DELTA3 = IND SMA_39 динамика этой разности не имеет систематического тренда.

IND

SMA 3

■ lIND • SMA 3

10 20 30 40 50 60 70 80 90 100 t

10 20 30 40 50 60 70 80 90 100 t

Используем теперь 5-периодное скользящее среднее. График сглаженного ряда приведен на рис. 5.5, а график разности DELTA_5 = IND SMA_5 — на рис. 5.6.■

При рассмотрении месячных и квартальных данных в динамике рядов часто проявляются сезонные колебания, в таких случаях естественно использовать простые скользящие средние с периодами усреднения К = 12 и К 4, соответственно. Но возникает следующий вопрос. Когда используется усреднение по нечетному количеству точек, например, по К = 3 точкам, то усредненное

Х- ~~ Х~~ Хзначение ——^ — сопоставляется /-му периоду времени, т.е. центральному из трех наблюдений. Если же взять, например, К = 4, какому периоду

Х- ~~ Х~~ Х- ~~ Хвремени следует сопоставить усредненное значение —— 1 1+1 — ?

По аналогии со случаем нечетного К это должен быть период / + 0.5, и это порождало бы значения sma259 sma35, smaT_l5. Чтобы обойти это затруднение, производят дополнительное усреднение полученного ряда простых скользящих средних, используя малое четное значение периода усреднения К (например, К = 2). В последнем случае получаем в итоге последовательность значений sma, sma, smaT_2, где

sma,

2

* 1

sma, = — 1 2

которую называют центрированным скользящим средним {centered moving average). Заметим, что при этом

( V _ 4V . 4V. 4Y. . V . 4Y 4V. . 4V. . ^

Xi2 + Xi-1 + Xi + Xi+1 + Xi-1 + Xi + Xi+ 1 + Xi+ 2

V

= ^ (0.5^.2 +(*,._! +xt +x/+1) + 0.5x/+2). ПРИМЕР 5.1.2

Рассмотрим временной ряд AGRO, представляющий квартальные данные об индексе реального объема сельскохозяйственного производства (1993:01 = 100) за 12-летний период — с I квартала 1994 г. по IV квартал 2005 г. Динамика этого ряда имеет ярко выраженный сезонный характер (рис. 5.7).

Сгладим этот ряд, используя центрированное среднее с периодом 4. Получим сглаженный ряд SMA_4_CENTERED (рис. 5.8), не определенный для первых двух и для последних двух наблюдений исходного ряда.

На графике разности DELTA = AGRO SMA_4_CENTERED (рис. 5.9) видно, что динамика этой разности не имеет систематического тренда, который взял на себя сглаженный ряд.И

Подпись:

ПРИМЕР 5.1.3

Рассмотрим временной ряд IMP, представляющий квартальные данные об импорте товаров и услуг в Российскую Федерацию (в млрд долл.) за 12-летний период — с I квартала 1994 г. по IV квартал 2005 г. Динамика этого ряда показана на рис 5.10.

О) О) ю

О) О) со

О) О)

О) О) 00 О) О)

IMP

Рис. 5.10

Сгладим этот ряд, опять используя центрированное среднее с периодом 4. Для наглядности поместим исходный и сглаженный ряды на одном графике (рис. 5.11).

Рассмотрим график разности DELTA = IMP SMA_4_CENTERED (рис. 5.12). Динамика этой разности не имеет систематического тренда. ■

Фильтр Ходрика — Прескотта

Этот инструмент используется для получения сглаженной оценки долговременного тренда ряда хг Соответствующий алгоритм подбирает сглаженный ряд sn для которого минимизируется сумма

Т т

£(х, -s,)2 +Я£((я, + 1-st)-(st-st_{))2.

f = 1 t=

Параметр Я > О управляет гладкостью получаемого ряда. Чем больше Я, тем более гладким является ряд sr При Я —> оо ряд st приближается к линейному тренду. В пакете EViews по умолчанию используются следующие значения параметра Я:

Я = 100 для годовых данных;

Я = 1600 для квартальных данных;

Я = 14 400 для месячных данных.

ПРИМЕР 5.1.4

Применяя фильтр Ходрика — Прескотта с Я = 1600 к ряду AGRO, получаем ряд HPTREND, интерпретируемый как «долговременный тренд». График этого ряда вместе с графиком ряда AGRO представлен на рис. 5.13.И

ПРИМЕР 5.1.5

Рис. 5.14

ПРИМЕР 5.1.6

Применим фильтр Ходрика — Прескотта к ряду IND. Здесь данные дневные, с пропусками на выходные дни. Попробуем использовать различные значения параметра сглаживания: 100 (как для годовых данных), 1600 (как для квартальных данных), 14 400 (как для месячных данных) и 100 ООО. Получим результаты, отраженные на графиках, приведенных на рис. 5.15 (я, б, в, г)М

Применяя фильтр Ходрика — Прескотта с Л = 1600 к ряду IMP, выделяем из этого ряда «долговременный тренд» HPTREND. Графики рядов IMP и HPTREND представлены на рис. 5.14.И

Сглаживание ряда и прогнозирование будущих значений ряда

Прогнозирование будущих значений ряда с использованием простого скользящего среднего опирается на понятие локального «текущего уровня» (current level), вокруг которого происходят случайные (нерегулярные) флуктуации ряда. Этот уровень может изменяться с течением времени, и для периода і (/ = К, К + 1, ..., Т) он определяется как

г _ Xi-K+ + Хі-К+2 + '" + *, 

(т.е. среднее арифметическое К последних значений ряда).

Прогнозные значения ряда на любое количество h шагов вперед приравниваются последнему текущему уровню LT9 который можно получить на основании имеющихся наблюдений хХ9х29 ..., хт:

v = Т — ХТ-К+ + ХТ-К+2 ~* ХТ xT+h -^Т £

Такой прогноз не принесет большой пользы, если ряд содержит сезонную компоненту и/или имеет выраженный возрастающий или убывающий тренд.

Взвешенное скользящее среднее (WMA — Weighted Moving Average) — метод сглаживания, в котором наблюдения усредняются с различными весами, так что наибольшие веса приписываются последним наблюдениям.

При использовании усреднения ряда jc, , xl9 ..., хт по трем периодам (К = 3)

wmal = wx xt_x + w2 xi + w3 xi+x,

где whw2,w3— веса, приписываемые усредняемым наблюдениям: w3 > w2 > >wx>0 и wx + w2 + w3 = 1.

Например, можно положить

wx = Уб, w2 = 2/б, w3 = 3/б, и при таком выборе весов

х, + 2w7X: + 3w^x.-.t

wma=-и- — 5-LtL.

6

При усреднении ряда х{9 х29 ...9 хт по К периодам прогнозы на h шагов вперед приравниваются последнему «текущему уровню» LT9 вычисляемому по формуле:

LT = wx хт_к+х + w2 хт_к+2 + • • • + wK хт,

где wK >wK_x >...>w{ >0, wx+w2+ hwK = 1.

Под экспоненциальным сглаживанием (Exponential Smoothing) понимают методику, при которой наблюдения усредняются с разными весами, и при этом значения весов, приписываемых прошлым наблюдениям, убывают экспоненциальным образом по мере «старения» наблюдений.

Простое экспоненциальное сглаживание (SES — Single Exponential Smoothing) — метод, подходящий для рядов, случайным образом флуктуирующих вокруг постоянного среднего (уровня), в которых не проявляются тренды и сезонные колебания. В этом методе «текущий уровень» ряда в /-м периоде определяется рекуррентным образом:

Ц=ах(+(1-а)Ц_19

где а — некоторая постоянная, 0 < а < 1, так что «текущий уровень» ряда в /-м периоде есть взвешенное среднее текущего значения ряда и «текущего уровня» ряда в (/ 1)-м периоде.

Из указанной формулы получаем последовательно:

Lt = а X; + (1 a)Lt_x =axt+(а)(а jcm + (1 а)Ц_2) = ахі + а{-а)хі_х + (-а)2 Ц_2 =... =

= а х1f + а(1 - + а{ a)2 xt_2 + • • • + а( a)l~{ хх + (1 a)1 L0,

т.е. в формировании значения участвуют все значения xi9 xt_X9 хХ9 но в соответствующую сумму они входят с экспоненциально убывающими коэффициентами.

Как и при использовании скользящего среднего, прогнозные значения на h шагов вперед приравниваются последнему «текущему уровню» LT, так что прогнозное значение ряда на период (Т + Л), получаемое на основании наблюдений xl9x2, ..., хТ9 определяется по формуле:

xT+h = LT для любого h = 1,2, ...

Заметим еще, что

Xy"_j_j Xj* CX^Xj* "—" Xj*),

где хт — прогнозное значение ряда на период Г, полученное на основании наблюденийxl9x29 ..., хт_х.

Иными словами, прогнозное значение хт+ х на период Т + 1 отличается от прогнозного значения хТ9 полученного на период Г, на величину, пропорциональную ошибке прогноза на период Г, так что этот механизм обеспечивает адаптивный характер процедуры.

Параметр сглаживания а определяет роль последнего наблюдения в формировании «текущего уровня» ряда. Если значение а близко к 1, то влияние на «текущий уровень» всех предыдущих наблюдений оказывается незначительным. При малых значениях а «текущий уровень» определяется в большей степени прошлой динамикой ряда.

Многие специалисты рекомендуют использовать значения а в пределах 0.1—0.5, при этом аналитики большинства фирм при обработке рядов используют свои традиционные значения а. Для динамично развивающихся фирм и рынков характерны более высокие значения а9 чем для более консервативных компаний и стабильных рынков; для прогнозов используют более высокие значения а9 чем для анализа предшествующих тенденций.

Для реального построения прогнозных значений необходимо определить также значение L0. Часто в качестве него берется само хх.

Параметр сглаживания можно подобрать по имеющимся данным, выбрав значение, минимизирующее сумму квадратов ошибок одношаговых прогнозов, получаемых последовательным добавлением наблюдений.

ПРИМЕР 5.1.7

Применим процедуру простого экспоненциального сглаживания к ряду xt = INDn не задавая заранее значение параметра а, а предоставляя программе самой выбрать оптимальное значение этого параметра (результаты приведены в табл. 5.1). Это приводит к значению а = 0.914.

В табл. 5.1:

Sum of Squared Residuals — сумма квадратов расхождений между значениями исходного и сглаженного рядов:

SSE = fj(xi-si)2;

/=1

Root Mean Squared Error (RMSE) — квадратный корень из суммы квадратов расхождений, деленной на число наблюдений:

RMSE = jj£ (*,.-5,.)2;

Mean — «текущий уровень» в конце периода наблюдений:

Mean = LT.

На рис. 5.16 приведены графики исходного и сглаженного ряда.

Похоже, что график сглаженного ряда получается сдвигом вправо графика исходного ряда. Чтобы проверить это, совместим график сглаженного ряда INDSM01 и сдвинутый вправо на один период времени график исходного ряда, т.е. график ряда IND(-).

Получим практически одинаковые графики (рис. 5.17), и это означает, что

прогнозные значения xt+l практически равны текущим значениям хг Почему так, можно понять, построив вероятностную модель порождения ряда, что мы и сделаем в дальнейшем.

Вместе с тем посмотрим, что изменит некритический выбор одного из рекомендуемых значений 0.1—0.5, а именно а = 0.2. В этом случае получим достаточно сглаженный ряд INDSM02 (рис. 5.18), который, однако,

дает весьма плохие прогнозы (табл. 5.2): среднеквадратическая ошибка (RMSE = 55.99679) намного больше, чем при оцененном а =0.914, где RMSE = 35.76871. ■

Двойное экспоненциальное сглаживание, метод Брауна (DES — Double Exponential Smoothing) — метод, подходящий для рядов с выраженным линейным трендом, наличие которого учитывается при прогнозировании значений ряда на несколько периодов вперед.

Само название метода говорит о том, что процедура экспоненциального сглаживания здесь применяется дважды (с одним и тем же значением а): сначала — к исходному ряду, а затем — к сглаженному ряду:

xt =ахі + (l-a)jtM, xi = axi + (-a)xi_x.

При этом значение xT+h прогноза на h периодов времени вперед вычисляется по формуле:

XT+h ~

ah „

2 + - хт-а

Л ah 1^ /0~ ~ Л а _ ~

1 + хт =(2хт -хт) + (хт -хт)п,

1-а) 1-а

или

xT+h =a + bh, h = 1,2,...,

где а = 2хт -хт, Ъ - а (хт-хт).

1-а

Значения а и b суть параметры локального прямолинейного тренда ряда. Прогнозные значения лежат на прямой, определяемой этими параметрами.

ПРИМЕР 5.1.8

На периоде с I квартала 1994 г. по IV квартал 1997 г. количество безработных в Российской Федерации (в млн. человек) (ряд UNEMP) изменялось следующим образом (рис. 5.19).

Ряд имеет выраженный линейный тренд. Применим двойное экспоненциальное сглаживание для получения прогнозных значений этого ряда на 1997 г. по наблюдениям этого ряда за 1994—1996 гг. Сначала положим а = 0.2. Результаты отражены на рис. 5.20 и в табл. 5.3.

Если оставить программе подбор оптимального значения параметра а, то это приводит к значению а = 0.162 и практически к тем же результатам (рис. 5.21 и табл. 5.4).

UNEMP_DESM_02 UNEMP_DESM_EST

Двойное сглаживание ряда с подбором оптимального значения а

Sample: 1994:1 1996:4; Included observations: 12; Method: Double Exponential; Original Series: UNEMP; Forecast Series: UNEMP_DESM_EST

РИС. 5.21

Простое экспоненциальное сглаживание ряда с оцениваемым а

Sample: 1994:1 1996:4; Included observations: 12; Method: Single Exponential; Original Series: UNEMP; Forecast Series: UNEMPSM

Заметим, что если для сглаживания и прогнозирования этого ряда использовать простое экспоненциальное сглаживание с оцениваемым значением сг, то это значение оценивается как а = 0.999, и получим результаты, приведенные в табл. 5.5 и на рис. 5.22.

Как видно на рис. 5.23, здесь прогнозы на один шаг вперед практически совпадают с текущими значениями ряда; прогнозы на несколько шагов вперед не отличаются от прогнозов на один шаг вперед. ■

Рис. 5.23

Метод Хольта (Holt's Linear Trend Algorithm) используется для прогнозирования рядов с выраженным линейным трендом без сезонных составляющих. При этом прогноз осуществляется в направлении текущего локального линейного тренда, определяемого текущим уровнем ряда и текущим угловым коэффициентом локального тренда.

Пусть

Lt — текущий уровень ряда;

Г, — текущий угловой коэффициент локального тренда, соответствующие периоду /.

Эти величины вычисляются рекуррентным образом по следующим формулам: Lt =axi+(l-a)(Li_l +ГМ), 0<а<1,

ї;=^-ім)+(і-л о</?<і.

Иначе говоря:

«текущий уровень» для периода / есть взвешенное среднее значения ряда xt в этом периоде и (Lt_x + Tt_x) — прогноза этого значения по локальному тренду, оцененному по предыдущим наблюдениям;

«текущий угловой коэффициент» для периода / есть взвешенное среднее приращения «текущего уровня» (Lf Z^) и значения «текущего углового коэффициента» для периода (/ 1).

Соответственно значение xi+h прогноза на h периодов времени вперед, сделанного в период /, вычисляется по формуле:

ПРИМЕР 5.1.9

Применим метод Хольта к ряду данных о безработице в России, предоставив компьютеру возможность выбора оптимальных значений параметров а и /? (название сглаженного ряда UNEMP_HW_EST, предпрогнозный период 1994:1 —1996:4). Результаты приведены в табл. 5.6. На рис. 5.24 изображены график ряда UNEMP в интервале 1994:1 —1997:4, а также график сглаженного ряда UNEMP_HW_EST на предпрогнозном периоде и сделанные по нему прогнозы на 4 квартала 1997 г.

Таблица 5.6

Сравним прогнозы на 1997 г., полученные методами Брауна и Хольта (с оцениваемыми параметрами). Для этого вычислим сумму квадратов ошибок прогнозов и RMSE на прогнозном периоде. Непосредственный подсчет этих величин (в протоколе оценивания в пакете EViews они не приводятся) дает результаты, указанные в табл. 5.7 (для метода Брауна) и в табл. 5.8 (для метода Хольта). Алгоритм Хольта дает большее значение угловому коэффициенту локального тренда (рис. 5.25), при этом качество прогноза несколько лучше. ■

UNEMP UNEMP_HW_EST

Прогноз, полученный с помощью метода Брауна

Метод Хольта — Винтерса (Holt — Winters's Algorithm). Этот метод был предложен Винтерсом как обобщение метода Хольта, допускающее наличие сезонного фактора в динамике ряда. К паре уравнений Хольта, определяющих текущий уровень и текущий угловой коэффициент ряда, здесь добавляется третье уравнение, определяющее текущий сезонный фактор При этом сезонный фактор может быть как аддитивным, так и мультипликативным.

Если сезонный фактор аддитивный, то используется следующая система:

Ц = a(xt St_s) + (1 а)(Ц_х + Гм), 0 < а < 1, <Ti=P(Li-Li_x) + (~P)Ti_X9 0</?<1, Si=y(xi-Li) + (-y)Si_s9 0<r<U

где s = 4 для квартальных данных и s = 12 для месячных данных.

Значение xi+h прогноза на h периодов времени вперед, сделанного в период /, вычисляется по формуле:

xi+h =Ц +Tth + Si+h_s для h = 1,2,...,5і, xi+h=Li+Tih + Si+h_2s для h = s + l,s + 29...,2s9

и т.д. Прогноз представляет собой прямую линию, на которую накладываются аддитивные сезонные факторы.

Если сезонный фактор мультипликативный, то используется следующая система:

Ц=^ + (-а)(Ц_х+Т(_х)9 0<а<9 <Ti=P(Li-Li_x) + (-P)Ti_X9 0</?<1, Si=^ + (-y)Si_s9 0<г<1.

Значение xi+h прогноза на h периодов времени вперед, сделанного в период /, вычисляется по формуле:

*/+а = (А + Tth)si+h-s Ддя h = 9 29 ...9 s9 х{+ь=(Ц+Т{Ь)8,+к_2а для h = s + 9s + 29...9 2s9

и т.д.

Чаще применяют вариант с мультипликативной сезонностью, поскольку в аддитивном случае сглаженный ряд имеет постоянные сезонные колебания, величина которых не зависит от общего уровня значений ряда, а в мультипликативном случае величина сезонных колебаний может изменяться в зависимости от общего уровня значений ряда. Можно, однако, применить оба варианта метода Хольта — Винтерса и выбрать из них лучший по качеству ретроспективных прогнозов.

ПРИМЕР 5.1.10

Вернемся к ряду AGRO, имеющему ярко выраженный сезонный характер (рис. 5.26). Применим к нему алгоритм Хольта — Винтерса с оцениваемыми параметрами. Оценивание проведем по данным до IV квартала 2003 г. включительно, а прогнозные значения вычислим на период с I квартала 2004 г. по IV квартал 2005 г. В табл. 5.9 приведены результаты применения алгоритма с аддитивной сезонностью, а в табл. 5.10 — результаты применения алгоритма с мультипликативной сезонностью.

Таблица 5.9

Вариант с мультипликативной сезонностью дает лучшие результаты ретроспективных прогнозов. Диаграмма на рис. 5.27 дает возможность сравнить перспективные прогнозы по аддитивной и мультипликативной моделям. Сумма квадратов ошибок прогнозов на период с I квартала 2004 г. по IV квартал 2005 г. равна 813.75 для аддитивной модели и 489.98 для мультипликативной, так что мультипликативная модель оказалась лучшей по этому показателю и для перспективного прогнозирования. ■

Экстраполирование тренда, оцененного методом наименьших квадратов

Выше было показано, как можно получать прогнозы на основе выделения трендовых и сезонных составляющих методом сглаживания. Часто на основе визуального анализа графика ряда удается делать более определенные суждения о характере тренда. В динамике ряда на рассматриваемом периоде может явно проявляться линейный, полиномиальный или экспоненциальный характер тренда. В таких случаях прогнозирование может опираться на результаты оценивания параметров функции, описывающей тренд на всем периоде наблюдений, а само оценивание можно производить, используя метод наименьших квадратов.

ПРИМЕР 5.1.11

Ряд UNEMP — ряд данных о безработице в Российской Федерации на периоде с I квартала 1994 г. по IV квартал 1997 г. (квартальные данные) имеет выраженный линейный тренд (рис. 5.28).

Прогнозные значения этого ряда на 1997 г. получим по наблюдениям ряда за 1994—1996 гг., оценивая методом наименьших квадратов модель

UNEMP, =ex+d2t + en / = 1 12.

Подобранная модель имеет вид:

UNEMP, =4.963 + 0.194/.

Прогнозные значения UNEMPt ряда на 1997 г. (табл. 5.11) получим по этой формуле, подставив в правую часть последовательно значения / = 13, 14, 15, 16. На рис. 5.29 сопоставлены наблюдаемые и прогнозные значения ряда на прогнозном периоде.

В табл. 5.12 приведены характеристики качества сделанного прогноза.И

Таблица 5.12

Характеристики качества прогноза на 1997 г.

Forecast: UNEMPF; Actual: UNEMP; Forecast sample: 1997Q1 1997Q4; Included observations: Л

Root Mean Squared Error

0.111852

Mean Absolute Error

0.072552

Mean Absolute Percent Error

0.918228

Theil Inequality Coefficient

0.007155

Bias Proportion

0.420744

Variance Proportion

0.000077

Covariance Proportion

0.579178

В этой таблице:

• Root Mean Squared Error (RMSE) — корень из среднего квадрата ошибки прогноза ряда уt на прогнозном периоде:

rmse=\ Т^{у,-у,)2;

Mean Absolute Error (МАЕ) — средняя абсолютная ошибка прогноза ряда у, на прогнозном периоде:

j T+h

МАЕ = J^y,-yt\;

Mean Absolute Percent Error (МАРЕ) — средняя абсолютная процентная ошибка прогноза ряда>>, на прогнозном периоде:

і T+h

МАРЕ = У

У,-у,

•100\%;

У,

Theil Inequality Coefficient (TIC) — нормированный коэффициент Тейла:

т1с = -

v

л T+h

Т Ш-У,)2

1 1 Г^ г

-h 2> +h 2>

Значения этого коэффициента изменяются от 0 до 1. Близкие к 0 значения TIC свидетельствуют о хорошем качестве прогноза.

В трех последних строках таблицы указаны величины, связанные со следующим разложением среднего квадрата ошибки прогнозов на прогнозном периоде длины h:

где j), у, Sy,sy — выборочные средние и стандартные отклонения рядов yt nyt на прогнозном периоде; г — выборочный коэффициент корреляции между у и у на прогнозном периоде.

Bias Proportion — доля первого слагаемого в сумме. Большие значения этого показателя соответствуют систематическому смещению прогнозных значений по одну сторону от наблюдаемых значений ряда на прогнозном периоде.

Variance Proportion — доля второго слагаемого в сумме. Большие значения этого показателя наблюдаются при несоответствии вариабель-ностей прогнозных и наблюдаемых значений ряда на прогнозном периоде.

Covariance Proportion — доля третьего слагаемого в сумме. Малые значения этого показателя соответствуют расхождению по фазе колебаний ряда прогнозных и наблюдаемых значений ряда на прогнозном периоде.

ПРИМЕР 5.1.12

Рассмотрим статистические данные о размерах совокупной прибыли нефинансовых корпораций США (до уплаты налогов, в млрд долл., квартальные данные) за период с I квартала 1985 г. по I квартал 1989 г. — ряд PROFITS. График этого ряда изображен на рис. 5.30.

PROFITS

Рис. 5.30

Здесь тренд сложнее считать прямолинейным, но можно попытаться приблизить его полиномом — например, рассмотреть модель квадратичного тренда:

PROFITS, = вх +e2t + e2t2+sn / = 1,...,17.

Результаты оценивания такой модели по данным до I квартала 1988 г. включительно приведены в табл. 5.13. На рис. 5.31 приведены графики наблюдаемых и прогнозных значений ряда.

Прогнозные значения ряда на период со II квартала 1988 г. по I квартал 1989 г. расположены выше реально наблюдаемых значений. Предупредить такое завышение прогнозных значений можно, обратившись к модели кубического тренда:

PROFITS, = вх + 62t + e2t2 + e3t3 + єп t = 1,..., 17.

Результаты оценивания этой модели по данным до I квартала 1988 г. включительно приведены в табл. 5.14.

Теперь (рис. 5.32) прогнозные значения на период со II квартала 1988 г. по I квартал 1989 г. оказались ниже реально наблюдаемых. В то же время RMSE для этой модели (13.12275) вдвое меньше RMSE для квадратичной модели (27.46526).

Сравним полученные прогнозы с прогнозами, сделанными ранее в результате применения двойного экспоненциального сглаживания с оцениваемыми параметрами (рис. 5.33). На этот раз не все прогнозные значения оказываются по одну сторону от наблюдаемых, а значение RMSE на прогнозном периоде равно RMSE 5.244, что лучше, чем для моделей квадратичного и кубического трендов. ■

ПРИМЕР 5.1.13

Применив филыр Ходрика — Прескотта с Я = 1600 к ряду AGRO, получили ряд HPTREND, интерпретируемый как «долговременный тренд» (рис. 5.34).

Residual

Actual

Рис. 5.35

Fitted

Попробуем теперь выделить тренд регрессионными методами. Рассмотрим сначала модель квадратичного тренда:

AGROt =вх+ 02t + въг2 +єп t = 1,..., 48,

и оценим ее по данным до IV квартала 2003 г. включительно.

В остатках (ряд Residual на рис. 5.35) видимого тренда нет, но есть явно выраженная сезонность, которую можно учесть, введя в правую часть уравнения регрессии вместо постоянной составляющей 4 сезонные дамми-пере-менные:

DI — переменная, равная 1 в I квартале и равная 0 в остальных трех кварталах;

D2 — переменная, равная 1 во II квартале и равная 0 в остальных трех кварталах;

D3 — переменная, равная 1 в III квартале и равная 0 в остальных трех кварталах;

D4 — переменная, равная 1 в IV квартале и равная 0 в остальных трех кварталах.

Расширенную квадратичную модель с 4 сезонными дамми-переменными

AGROt=eiDlt+62D2t +63D3t +64D4t+в5ґ + в6ґ2 +et

оцениваем по данным до IV квартала 2003 г. включительно. Прогнозирование по оцененной модели на 2004—2005 гг. дает весьма высокую долю смещения (Bias Proportion = 0.779), что иллюстрирует рис. 5.36, при этом RMSE= 17.741.

В пакете Е Views 6 предусмотрена возможность выделения из временного ряда циклических составляющих в заданном интервале частот. Пользуясь этой возможностью, выделим из ряда остатков RESIDEQ1 колебания с периодами от 1.5 до 4 лет (ряд RESID_01 CYCLIC). Очищенный от колебаний с такими частотами ряд RESID 01JRREG ULAR = RESID_EQ RESID J) 1 CYCLIC интерпретируем как нерегулярную компоненту ряда AGRO. Графики рядов RESID 01 CYCLIC и RESID_01 IRREGULAR представлены на рис. 5.38 (а, б).

Итоговое разложение ряда AGRO представлено на рис. 5.39.

240-■ 200-160 120 4

80

40 0

і і і | І і і | I I I | і I і | і і і | і і і | і і і | і і і | і і і | і і і | і і і | і і і

О)

ю

О) О) со

О) О) 1^

О) О) 00 О) О)

О) О) О) о о о см о о см см о о см со о о см

о о о о см см

Год

TREND_QUADR SEASONAL

RESID_01_CYCUC RESID 01 IRREGULAR

Центрируем ряд SEASONAL, объединим тренд и циклическую компоненту. Соответствующее разложение ряда AGRO представлено на рис. 5.40.

Итак, прогнозы можно получать на основе оценивания трендовых и сезонных составляющих методом наименьших квадратов. Однако эти прогнозы не учитывают информацию о будущих значениях ряда, которая может содержаться в нерегулярной компоненте ряда. Чтобы учесть такую информацию, необходимо иметь подходящую модель и для этой компоненты. Для этой цели можно использовать стохастические (вероятностные) модели временных рядов, которые рассматривались во второй части учебника. Такие модели допускают наличие в динамике исходного ряда стохастического тренда, который может выглядеть как детерминированный, но наличие которого приводит к совершенно другим оптимальным прогнозам.

КОНТРОЛЬНЫЕ ВОПРОСЫ

Какие систематические эффекты выделяют в поведении временного ряда?

Как представляется временной ряд в форме мультипликативной и в форме аддитивной модели?

Как определяется простое скользящее среднее с периодом усреднения К?

В каких случаях используется центрированное скользящее среднее и как оно определяется?

С какой целью используется фильтр Ходрика — Прескотта и как он определяется?

Как строятся прогнозы на h шагов вперед при использовании простого скользящего среднего и при использовании взвешенного скользящего среднего?

Как производится простое экспоненциальное сглаживание? Как в этом случае строятся прогнозные значения на h шагов вперед? Как осуществляется выбор параметра сглаживания?

Как производится двойное экспоненциальное сглаживание и когда оно применяется? Как строятся в этом случае прогнозные значения на h шагов вперед?

В чем состоит метод Хольта и когда он применяется? Как строятся в этом случае прогнозные значения на h шагов вперед?

Чем отличается метод Хольта — Винтерса от метода Хольта? Чем различаются два варианта метода Хольта — Винтерса?

Как может применяться метод наименьших квадратов для прогнозирования будущих значений временного ряда?

Каковы основные характеристики качества прогнозов? Как они интерпретируются?

Эконометрика Книга вторая Часть 4

Эконометрика Книга вторая Часть 4

Обсуждение Эконометрика Книга вторая Часть 4

Комментарии, рецензии и отзывы

Часть 4 временные ряды: дополнительные главы. модель стохастической границы раздел 5 сглаживание и прогнозирование временных рядов тема 5.1 адаптивные методы, метод наименьших квадратов: Эконометрика Книга вторая Часть 4, Носко Владимир Петрович, 2011 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Для студентов, аспирантов, преподавателей, а также для специалистов по прикладной экономике.