10.2. выбор одной из двух классических моделей. практические аспекты
10.2. выбор одной из двух классических моделей. практические аспекты
Величина Э, стоящая в левой части равенства (10.16), зависит от неизвестного параметра у, т. е. является ненаблюдаемой, так что полученный в § 10.1 критерий еще не дает ответа на вопрос, как осуществлять альтернативный выбор между моделями (10.1) и (10.2) на практике.
В реальности же мы располагаем лишь значением оценки:
Преобразуем величину 9. Для этого представим оценки g и C6v(g) в удобной для нас форме. Имеем:
g = {z'MxzY Z'MXY = (Z'MxZyx ҐМХ (АГр + Zy + є).
Непосредственно перемножая матрицы, легко убедиться, что имеет место равенство МхХ=0. Таким образом, получаем:
g = у + (Z'MxZyl ҐМхг. (10.17)
В то же время
C6v(g) ~Cov(g) = b'MxZy а2
где а2 =—— оценка параметра а2 (см. (4.21)). Здесь е —
п-рстолбец остатков регрессии (10.1). Таким образом, используя равенство (10.17), получаем:
Є = J-[y' + z'MxZ(Z'MxZ)-[ ](Z'MxZ)[y + (Z'MxZ)-[ Z'Mxe] =
g2
gz gl gl
или Є =—Є + ^-^є'Яє, (10.18)
a a
где £, = 4r{y'Z'Mxe + e'M^Zy);
a2
B=MXZ (Zr MXZ)~{Z' Mx. Можно показать, что величина £ принимает с равной вероятностью как положительные, так и отрицательные значения, в
то время, как величина —еВг принимает лишь положительg2
ные значения. Если число наблюдений п достаточно велико,
значения а2 и оценки а2, как правило, близки. Таким образом, используя равенство (10.18), мы можем считать малые значения
наблюдаемой величины 0 достаточной предпосылкой малости и параметра Э. В частности:
Если 9<1, разумно предположить, что и 9<1. (10.19)
Оказывается, величина F = Q/l (где / — число регрессоров Z) есть не что иное, как наблюдаемое значение статистики при обычном тестировании гипотезы о равенстве нулю коэффициентов у в модели (10.1). Если параметр у на самом деле равен нулю, F имеет распределение Фишера—Снедекора).
В самом деле, явный вид этой статистики (см, например, [13])
Не2е2-еех)
F=+ -2 . (10.20)
a
В то же время, используя (10.9), получаем: е2 = YXbi = Xb + Zg+ еXb — Xbzxg = ex MxZg. Отсюда
e2'e2 e{'ei = aV(Cov(£))-ig, (10.21)
и утверждение доказывается подстановкой (10.21) в (10.20).
248
Таким образом, может быть предложен следующий подход к альтернативному выбору модели: выбирается некоторое значение с. Если наблюдаемое значение /"-статистики меньше с, то предпочитается модель (10.2), если больше с — то модель (10.1).
При этом пороговое значение с выбирается, вообще говоря,
произвольно, как правило, в границах у < с < Fa.i.n_p_i_{, где
обычно а = 0,05.
Рассмотрим более подробно случай / = 1, т. е. имеется один регрессор Z, относительно которого ставится вопрос о включении или невключении его в модель. В этом случае F = Q. Используя (10.19), получаем следующий критерий предпочтения:
В случае 1=1 (наличие одного «спорного» регрессора) модель (10.2) оказывается предпочтительней, чем модель (10.1), если наблюдаемое значение F-статистики при тестировании гипотезы у = 0 оказывается меньше 1.
Получим еще одну формулировку приведенного критерия. Используем выражение (4.34') для скорректированного коэффициента детерминации R2.
1^1 <^2
Соответственно для регрессий (10.1), (10.2):
1 , 1 >
ЄЄ е>е>
—-уу —-у у
ппгде у = Y— Y. Отсюда
Таким образом, модель (10.2) оказывается предпочтительней модели (10.1), если скорректированный коэффициент детерминации при удалении регрессоров Z увеличивается (заметим, что простой коэффициент детерминации модели (10.1) всегда больше, чем модели (10.2)).
Обсуждение Эконометрика
Комментарии, рецензии и отзывы