3.4. коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок)

3.4. коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок): Институт экономики переходного периода, Носко Владимир Петрович, 2000 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Предлагаемое учебное пособие имеет своей целью обеспечить базу для изучения вводного полугодового курса эконометрики, когда в распоряжении преподавателя имеется всего порядка 12 лекций и некоторое количество часов практических занятий.

3.4. коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок)

Пример. Для исследования вопроса о зависимости количества руководящих работников от размера предприятия были собраны статистические данные по 27 промышленным предприятиям. Далее обозначено:

xi — численность персонала на і-м предприятии,

yi — количество руководителей на і-м предприятии.

Оцениваем линейную модель наблюдений

yi =а +/3xt + є і , і = 1,...,27.

Регрессионный анализ дает следующие результаты: R =

-1

-2

-3

100 150 200

Похоже, что имеет место тенденция линейного возрастания абсолютных величин остатков с ростом у, соответствующая наличию приближенной зависимости вида

Подпись: 2 2
• X, D(st ) = а2 =а

для дисперсий ошибок. Чтобы погасить

такую неоднородность дисперсий, разделим обе части соотношения yi = а + f3xt + є i на xi:

XX X

т. е. перейдем к модели наблюдений і і

у* =fi+ajc.+s*,

выполняется

соотношение

Если действительно D{e .) = а2 = а2 • х2, то тогда в преобразованной модели

E[є ;) = 0,D(є ;) = -1 D(є i )=а

y = 3.803 + 0.121л: .|

Отметим уменьшение оцененных стандартных ошибок оценок обоих параметров а и р. Именно на эти значения следует опираться при построении доверительных интервалов для этих параметров. Средними точками этих интервалов будут,

соответственно, а = 3.803 и /3 = 0.121. Следующий график показывает характер зависимости стандартизованных остатков в преобразованной модели от y *.

На сей раз неоднородности дисперсий остатков (по крайней мере явной) не обнаруживается.

2і 1

і. ° ° °° ° °

о °

< О °

W, 0- ° о

0 о °

И ° п ° °

Ш ° о °

01 о °

-1-2-1 , , , °

0 50 100 150 200 250

YF*

Рассмотрим внимательнее наши действия при оценивании преобразованной модели. Оценки коэффициентов, приведенные в последней таблице, получены применением метода наименьших квадратов к модели наблюдений у* = /3+ ах* + є * , т. е. путем минимизации суммы квадратов

которую, вспоминая, что обозначают переменные со звездочками^

± ( ~-Р-*А2= ± (У,-<*-fi х, )2.

Обозначая теперь 1 І

хі

получаем, что задача минимизации суммы квадратов отклонений в преобразованной модели равносильна задаче минимизации взвешенной суммы квадратов отклонений в исходной (непреобразованной) модели. Величина wi

интерпретируется в этом контексте как вес, приписываемый квадрату отклонения в і м наблюдении. Этот вес будет тем меньше, чем больше значение х2, которое в силу наших предположений пропорционально дисперсии случайной ошибки D^s i) = cr2 а2 ■ х2 в і -м наблюдении. Следовательно, чем больше дисперсия случайной ошибки є і, тем меньше вес, с которым входит квадрат отклонения в і -м наблюдении в минимизируемую сумму.

Имея в виду, что оценивание преобразованной модели наблюдений сводится к минимизации суммы

Z w (у~а -Р х )2,

і=1

рассмотренный метод оценивания называют взвешенным методом наименьших квадратов (хотя точнее его следовало бы называть методом наименьших взвешенных квадратов).

Замечание. В некоторых руководствах по эконометрике и в некоторых пакетах статистического анализа данных (например, в пакете EVIEWS) используется несколько иное равносильное представление минимизируемой суммы квадратов в преобразованной модели наблюдений:

n 2

T;{Wi iyi -<*-Р xi )) .

i=1

В этом случае вес приписывается не квадрату отклонения,

а самому отклонению (yi — а — /3 xi). Разумеется, в рассмотренном примере при таком определении веса последний будет

равен

І Г~

На это обстоятельство следует обратить внимание при спецификации весов в процедурах, реализующих взвешенный метод наименьших квадратов.

Обратим теперь внимание на то, в каком виде выдается информация о результатах применения взвешенного метода наименьших квадратов на примере пакета EVIEWS. При этом используем данные из рассмотренного выше примера. Согласно сказанному в Замечании, при обращении к процедуре оценивания взвешенным методом наименьших квадратов в условиях нашего примера мы специфицируем веса как w = 1/x .

Протокол оценивания имеет следующий вид: Dependent Variable: Y Method: Least Squares Date: Time: Sample: 1 27 Included observations: 27 Weighting series: 1/X

Variable	Coefficient	Std. Error	t Statistic	Prob.
C	3.803296	4.569745	0.832277	0.4131
X	0.120990	0.008999	13.44540	0.0000
Weighted Statistics
R-squared	0.026960	Mean dependent var		74.04946
Adjusted R-squared	-0.011961	S. D. dependent var		13.08103
S. E. of regression	13.15902	Akaike info criterion		8.063280
Sum squared resid	4328.998	Schwarz criterion		8.159268
Log likelihood	-106.8543	F-statistic		180.7789
Durbin-Watson stat	2.272111	Prob (F-statistic)		0.000000
Unweighted Statistics
R-squared	0.758034	Mean dependent var		94.44444
Adjusted R-squared	0.748355	S. D. dependent var		45.00712
S. E. of regression	22.57746	Sum squared resid		12743.54
Durbin-Watson stat	2.444541

В этом протоколе приводятся значения двух видов статистик:

Weighted Statistics (взвешенные статистики)

статистики, основанные на остатках, получаемых

это по

/3ax*

Уі

взвешенным данным, т. е. на остатках в преобразованной модели.

Unweighted Statistics (невзвешенные статистики) —

WLS

WLS .

Х.

■Р

это статистики, основанные на «остатках»

т. е. на отклонениях наблюyі -а

даемых значений объясняемой переменной y от значений, предсказываемых линейной моделью связи, в качестве параметров которой берутся их оценки aWLS ,Р WLS, полученные в преобразованной модели. Отметим весьма низкое (0.2696) значение коэффициента детерминации в преобразованной модели. Однако это обстоятельство не должно нас волновать — линейная связь в преобразованной модели значима, о чем говорит весьма высокое значение F -статистики, равное 180.7789, и соответствующее ему P -значение 0.0000 (см. Weighted Statistics). В конечном

счете нас интересует значение R2, находящееся в части протокола, соответствующей невзвешенным статистикам, а это значение достаточно велико (0.7580).

Отметим еще, что приведенные в начале таблицы значения оценок параметров, их стандартных ошибок и t -статистик, а также P -значения соответствуют величинам, полученным на стадии оценивания преобразованной модели.

Заметим, наконец, что значение R2 = 0.758 , указанное в числе невзвешенных статистик, отличается от значения R2 = 0.776, полученного нами при оценивании исходной (не-преобразованной) модели наблюдений. Причина этого, разумеется, в том, что при вычислении значения R2 = 0.776 использовались остатки

e = Уі -ct ~Р xi , где ос, Р — оценки наименьших квадратов параметров исходной модели, полученные без использования взвешивания отклонений.

Мы уже отмечали выше, что результатом неоднородности дисперсий случайных ошибок в модели наблюдений является смещение оценок дисперсий случайных величин в^,...,0 . В то же время, наличие такого нарушения стандартных предположений оставляет оценки в Х,...,Ъp несмещенными. В связи

с этим, один из методов коррекции статистических выводов при неоднородности дисперсий ошибок состоит в использовании обычных оценок наименьших квадратов (OLS-оценок,

Ordinary Least Squares estimates) вx,...,6p коэффициентов в 1,..., вp вместе со скорректированными на гетероскеда-стичность оценками стандартных ошибок sg ^. Один из вариантов получения скорректированных на гетероскедастичность значений sff ^ был предложен Уайтом (White) и реализован в

ряде пакетов статистического анализа данных, в том числе и в пакете EVIEWS. При этом удовлетворительные свойства оценки Уайта гарантируются только при большом количестве наблюдений. Мы не будем приводить здесь детали получения оценки Уайта, а просто воспользуемся пакетом EVIEWS для анализа данных из только что рассмотренного примера.

Пример. Используем данные из предыдущего примера, но применим для их анализа последнюю процедуру. Согласно этой процедуре, мы оцениваем коэффициенты а и /3 обычным

методом наименьших квадратов, так что в качестве оценок берутся значения а = 14.448 и J3 = 0.105. В качестве же оценок стандартных ошибок s~ и вместо значений s~ = 9.562 и

= 0.011, полученных выше при оценивании модели обычным методом наименьших квадратов, берем значения оценок Уайта s. = 10.633 и s= 0.018.

а р

Бросающееся в глаза значительное различие оценок для параметра а при применении двух рассмотренных методов (3.803 и 14.448) в действительности не столь уж удивительно, поскольку оценки стандартной ошибки для а, полученные каждым из двух методов довольно высоки (s~a = 4.570 и

s~ = 10.633, соответственно).

Избавиться от неоднородности дисперсий ошибок в ряде случаев позволяет переход к логарифмам объясняемой переменной.

Пример. По данным, использованным в двух предыдущих примерах, оценим модель наблюдений

Inyt = а + f5xi + є i , i = 1,...,27.

График зависимости стандартизованных остатков, полученных при оценивании этой модели, от предсказанных значеЛ

ний In yi (левый график)

3.5

5.5

указывает на неправильную спецификацию модели, связанную с возможным пропуском квадратичной составляющей x2 . Оценивание расширенной модели наблюдений, включающей дополнительную объясняющую переменную x2, приводит к остаткам, обнаруживающим существенно более удовле y = 3.803 + 0.121x и lny = 2.851 + 0.003 x 1.1 • 10 6x

Первую из этих двух моделей можно предпочесть из соображений простоты интерпретации.

Институт экономики переходного периода

Предмет: Экономика Автор: Носко Владимир Петрович Год издания: 2000 Язык учебника: русский Рейтинг:

Просмотров: 323

Обсуждение Институт экономики переходного периода

Комментарии, рецензии и отзывы