6.3. влияние включения в модель переменной, которая не должна быть включена
6.3. влияние включения в модель переменной, которая не должна быть включена
Допустим, что истинная модель представляется в виде:
у = а + р,х, + и, (6.15)
а вы считаете, что ею является
у = а + р,х, + p^-2 + и, (6.16)
и рассчитываете оценку величины используя формулу (5.12) вместо выражения Cov(x,,<y)/Var(xl).
В целом проблемы смещения здесь нет, даже если 6, будет рассчитана неправильно. Величина Е(ЬХ) остается равной р,, но в общем оценка будет неэффективной. Она будет более неустойчивой, в смысле наличия большей дисперсии относительно Р,, чем при правильном вычислении. Это проиллюстрировано на рис. 6.2.
Функция плотности вероятности
у = ос + р,х, + 0х2 + и.
(6.17)
Таким образом, если вы строите регрессионную зависимость от х, и х2, то Ьх будет являться несмещенной оценкой величины Pi, а Ь2 будет несмещенной оценкой нуля (при выполнении условий Гаусса—Маркова). Практически вы обнаруживаете для себя, что р2 равно нулю. Если бы вы заранее поняли, что р2 равно нулю, то могли бы использовать эту информацию для исключения х2 и применить парную регрессию, которая в данном случае является более эффективной.
Утрата эффективности в связи со включением х2 в случае, когда она не должна была быть включена, зависит от корреляции между х, и х2. Сравните дисперсии величины bx при построении парной и множественной регрессии (табл. 6.5).
Дисперсия в общем окажется большей при множественной регрессии, и разница будет тем большей, чем ближе коэффициент корреляции к единице или —1. Единственным исключением в связи с проблемой утраты эффективности является вариант, когда коэффициент корреляции точно равен нулю. В этом случае оценка bJ для множественной регрессии совпадает с оценкой для парной регрессии. Доказательство этого опустим, поскольку оно довольно простое.
Таблица 6.5
Парная регрессия
Множественная регрессия
В выводе о несмещенности есть одно исключение, которое необходимо иметь в виду. Если величина х2 коррелирует с и, то коэффициенты регрессии будут в конечном счете смещенными. Если модель записать как уравнение (6.17), то это будет означать, что четвертое условие Гаусса—Маркова применительно к величине х2 не выполняется.
Обсуждение Введение в эконометрику
Комментарии, рецензии и отзывы