8.2. метод инструментальных переменных
8.2. метод инструментальных переменных
Идея метода заключается в том, чтобы подобрать новые переменные Zj(J= 1,..., /), которые бы тесно коррелировали с Xj и не коррелировали сев уравнении (8.1). Набор переменных {ZJ может включать те регрессоры, которые не коррелируют с є, а также другие величины. При этом, вообще говоря, количество переменных {Zj} может отличаться от исходного количества регрессоров (обычно набор {Zj} содержит большее число переменных).
Такие переменные Zi,..., Ze называются инструментальными.
Они позволяют построить состоятельную оценку параметра р модели (8.1). Такая оценка имеет вид:
( Xх ( PlV=(z5!r)',ZY= -Z'X -ZT . (8.8)
п J
Здесь Z, X, Y — матрицы наблюдаемых значений переменных.
Если рассматривается модель парной регрессии, и единственная переменная X заменяется на единственную инструментальную переменную Z, формула (8.8) примет вид:
Если рад zt — также стационарный и, следовательно, случайные величины zt одинаково распределены, то формула (8.9) может быть записана в виде:
(8.10)
Так как Zh є не коррелируют, равенство (8.10) означает, что оценка p/v является состоятельной (очевидно, что коррелированность X и Z означает, что Cov (zhxt) не стремится к нулю с увеличением объема выборки). В то же время из равенства (8.10) не следует несмещенность оценки p/v. Также эта оценка, вообще говоря, не обладает минимальной ко-вариацией. В самом деле p/v явно зависит от Z (то они разные при разных наборах инструментальных переменных). Между тем оценка, обладающая минимальной ковариацией, очевидно, единственная.
Естественно, возникает вопрос: как выбрать «наилучшие» инструментальные переменные, т. е. такие переменные, при которых оценка p/v имела бы наименьшую возможную ковариацию. Основой для решения этой задачи служит следующая теорема, которую мы примем без доказательства.
Теорема. Распределение р-мерной случайной величины p/v при
неограниченном увеличении объема выборки стремится к нормальному с математическим ожиданием р и ковариационной матрицей, пропорциональной матрице (RR)~l, где R — корреляционная
матрица между инструментальными переменными Z и исходными переменными X.
Здесь р — число исходных регрессоров, / — число инструментальных переменных (/>/?); матрица R имеет размерность їх р.
Таким образом, чем теснее коррелируют исходные переменные X и инструментальные Z, тем более эффективной будет
оценка p/v. При этом, однако, должно выполняться условие
Cov(Z,e)=0. Отсюда следует, что оптимальными инструментальными переменными являются переменные вида
Z*=Xj -Ms(Xj),j= 1,...,р.
Здесь X, Z — р-мерные случайные величины.
Однако случайные величины Z* ненаблюдаем ы. Таким образом, реально наилучшего набора инструментальных переменных не существует.
Пусть существует произвольный набор инструментальных переменных {Zj}, имеющих реальный экономический смысл, причем их число, вообще говоря, может превосходить р — число
исходных регрессоров Xj. Рассмотрим проекции Xj регрессоров
Xj на пространство {Z}1. Для этого надо осуществить регрессию вида
Xj = Zy+v
для всех регрессоров X/ и взять их объясненные (прогнозные) значения Xj
Xj =Zy = Z(Z,Z)-lZ,XJ . (8.11)
Переменные Xj не коррелируют с ошибками регрессии, так как линейно выражаются через инструментальные переменные Zi,..., Ze. Рассмотрим Xj как новые инструментальные переменные.
По свойству проекции имеем Х'Х Х*Х, так что оценка pfV (см. (8.8)) принимает вид:
\%у=(хх)-*Х79 (8.12)
1 Напомним, что в § 3.7 мы рассматривали геометрическую интерпретацию регрессии и, в частности, проекцию вектора Уна пространство регрессоров.
т. е. совпадает с оценкой, полученной обычным методом наименьших квадратов, модели Y Х$ + є.
Описанная процедура называется двухшаговым методом наименьших квадратов. По сути метод наименьших квадратов применяется здесь дважды: сначала для получения набора регрессоров Х9 затем для получения оценок параметра р.
Подставляя (8.11) в (8.12), получаем выражение оценки двухшагового метода наименьших квадратов через исходные инструментальные переменные Z:
(8.13)
Процедура двухшагового метода наименьших квадратов реализована в большинстве компьютерных регрессионных пакетов.
Рассмотрим пример из § 8.1. Строя модель зависимости цены конечного товара от стоимости субпродукта, в качестве инструментальных переменных можно выбрать цены на сырье I и П.
Применяя двухшаговый метод наименьших квадратов, получаем уравнение:
j> = 16,72 + 1,408*, d= 2,16, R2 = 0,997. (4,86) (0,01)
Сравнивая полученные результаты с полученными обычным методом наименьших квадратов (см. (8.7)), можно заметить, что модельные уравнения различаются, хотя и оказываются довольно близкими друг к другу.
На практике, как правило, возможности выбора инструментальных переменных не столь широки. Так, в рассматриваемом примере мы имели, по сути, единственно возможный набор Z9 Z2. Нередко бывает, что нет и вовсе никаких наблюдаемых инструментальных переменных.
В следующем параграфе мы опишем еще некоторые возможные способы оценивания моделей, в которых регрессоры коррелируют с ошибками регрессии.
Обсуждение Эконометрика
Комментарии, рецензии и отзывы