8.2. последствия ошибок измерения
8.2. последствия ошибок измерения
В экономике при исследовании какой-либо зависимости используемые переменные часто оказываются неправильно измеренными. Например, в обследованиях часто имеются ошибки, сделанные по вине опрашиваемого, неправильно понимающего вопрос (а в некоторых случаях и по вине опрашивающего). Вместе с тем сообщение неправильных сведений является не единственным источником неточностей. Иногда случается, что вы каким-то образом определили переменную в модели, но имеющиеся данные свидетельствуют о несколько другом определении. Широко известным примером такого случая является рассматриваемый в разделе 8.3 критический анализ М. Фридменом стандартной функции потребления.
Первоначально мы рассмотрим классический случай, в котором дисперсия объясняющей переменной стремится в больших выборках к конечной теоретической дисперсии. В конце этого раздела мы проанализируем последствия принятия альтернативного допущения о том, что дисперсия неограниченно увеличивается.
Ошибки измерения объясняющих переменных
Допустим, переменная у зависит от переменной z, что задано следующим соотношением:
y = a + pZ + v, (8.7)
где v — случайный член с нулевым средним и дисперсией av2.
Предположим, что z невозможно измерить абсолютно точно, и мы будем использоватьх для обозначения его измеренного значения. В/-м наблюдении*,, равно истинному значению г, плюс ошибка измерения н>,:
= + (8.8)
Допустим, что w имеет нулевое среднее и дисперсию aw2, что Var (z) в больших выборках стремится к конечному пределу ог2 и что z и v распределены независимо.
Подставляя формулу (8.8) в уравнение (8.7), получим:
>> = a + p;c + v-pw. (8.9)
Это уравнение имеет две случайные составляющие — первоначальный случайный член v и ошибку измерения w (умноженную на —Р). Вместе они образуют составную случайную переменную, которую мы назовем и:
и — v ~ pw. (8.10)
Соотношение (8.9) можно теперь записать как
у = а + $х + и. (8.11)
Имея значения переменных у (временно будем предполагать, что они измерены точно) и х, мы, несомненно, можем оценить регрессионную зависимость у ОТ X.
Коэффициент регрессии Ь, как обычно, представляется выражением (8.2). Анализируя ошибку, можно заметить, что она, вероятно, поведет себя не так, как требуется. Переменная х зависит от w (8.8), от этой величины зависит также и и (8.10). Когда ошибка измерения в наблюдении оказывается положительной, происходят две вещи: х;. имеет положительную составляющую и>., а ui имеет отрицательную составляющую — pw7. Аналогично, если ошибка измерения отрицательна, она вносит отрицательный вклад в величину х( и положительный вклад в величину иг Следовательно, корреляция между х и и отрицательна. Величина pop. cov (х, и) не равна нулю, а из соотношения (8.2) следует, что Ъ является несостоятельной оценкой р.
Даже если бы у нас была очень большая выборка, оценка оказалась бы неточной. Она бы занижала р на величину
a; +а:
Р.
(8.12)
Доказательство этого дается ниже. Сначала мы отметим его очевидные следствия. Чем больше теоретическая дисперсия ошибки измерения по отношению к теоретической дисперсии z, тем больше будет отрицательное смещение. Например, если бы о2 было равно 0,25а2, то отрицательное смещение составило бы:
l,25o2z
что равняется 0,2р. Даже если бы выборка была очень большой, оценка оказалась бы на 20\% ниже истинного значения при положительном р и на 20\% выше его при отрицательном р.
Рисунок 8.1 показывает, как ошибка измерения приводит к появлению смещенных коэффициентов регрессии, если использовать модель, представленную выражениями (8.7) и (8.8). На рис. 8.1 А мы предполагаем, что ошибка измерения отсутствует и что отклонения от линии регрессии вызываются только случайным членом v. На рис. 8.1 Б предполагается, что переменная х подвержена воздействию существенной ошибки измерения, которая сдвигает наблюдения вправо при их положительном значении и влево — при отрицательном. По причине горизонтального рассеяния множество точек наблюдений здесь кажется более пологим, чем на рис. 8.1 А, и оцененная линия регрессии будет иметь тенденцию к занижению угла наклона истинной линии зависимости. Чем больше дисперсия ошибки измерения по отношению к дисперсии х, тем больше окажется эффект уменьшения угла наклона и тем сильнее будет смещение.
Обсуждение Введение в эконометрику
Комментарии, рецензии и отзывы