4.4. спецификация и классификация переменных в уравнениях регрессии

4.4. спецификация и классификация переменных в уравнениях регрессии: Эконометрика, А.И. Новиков, 2007 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Содержит систематическое изложение основ эконометрики, подготовлено в соответствии с требованиями государственного стандарта. Рассмотрены линейная модель парной и множественной регрессии, проверка гипотез, гетероскедастичность и автокорреляция ошибок.

4.4. спецификация и классификация переменных в уравнениях регрессии

Построение экономической модели включает выбор объясняющих переменных. Свойства оценок коэффициентов регрессии в значительной мере зависят от правильной спецификации модели. Рассмотрим два случая:

отсутствие в модели переменной, которая должна быть включена;

наличие в модели переменной, которая не должна быть включена.

1. Влияние отсутствия в модели переменной, которая должна быть включена. Предположим, что переменная у зависит от двух переменных X] и х2 в соответствии с соотношением у а + р^х, + P^2 + є-Однако считается, что модель выглядит как у а + $Х{ + є, и оценивается регрессия у = а + ЬХХ.

В этом случае оценка Ь{ и ее дисперсия являются смещенными. Смещенность оценки Ь связана с тем, что если не учесть х2 в регрессии, то переменная Х будет играть двойную роль: отражать свое прямое влияние и заменять переменную х2 в описании ее влияния.

Коэффициент R2 для данной регрессии отражает общую объясняющую способность переменной хх в обеих ролях и является завышенной оценкой.

2. Влияние включения в модель переменной, которая не должна быть включена. Допустим, что истинная модель представляется в виде у а + + є. Однако считается, что ею является у = а + + р!*] + Р2Х2 + є, и оценивается регрессия у = а + blxl + b2x2.

Оценки коэффициентов регрессии и их дисперсии в этом случае являются несмещенными, но неэффективными. Практически обнаруживается, что коэффициент Ь2 статистически незначим, и переменная х2 исключается из модели.

ЗАМЕЩАЮЩИЕ ПЕРЕМЕННЫЕ

Предположим, что истинной моделью является

у = а + ppq + р2Х2 + ... + Рл + є,

и допустим, что не имеется данных по существенной переменной Х.

Если не включить в модель эту переменную, то регрессия может пострадать от смещения оценок и статистическая проверка будет некорректной.

Если вместо отсутствующей переменной х использовать ее заменитель z, линейно связанный с хь и построить регрессию

у = а + Ъ2х2 + ... + bkxk + cz,

то оценки Ъ2, bk, их стандартные ошибки и коэффициент R2 будут такими же, как и с использованием хх. Единственным недостатком является то, что отсутствует оценка коэффициента при самой величине х, а величина а не является оценкой а.

В качестве замещающей переменной, например, для показателя технического прогресса может использоваться время.

ФИКТИВНЫЕ ПЕРЕМЕННЫЕ

При исследовании влияния качественных признаков в модель можно вводить фиктивные переменные, принимающие, как правило, два значения: единица, если данный признак присутствует в наблюдении, и ну л ь при его отсутствии.

Если включаемый в рассмотрение качественный признак имеет не два, а несколько значений, то используют несколько фиктивных переменных, число которых должно быть на единицу меньше числа значений признака.

При назначении фиктивных переменных исследуемая совокупность по числу значений качественного признака разбивается на группы. Одну из групп выбирают как эталонную (группа 0) и определяют фиктивные переменные для остальных.

Например, если качественный признак имеет три значения, то две фиктивные переменные определяются следующим образом:

группа 0: ^,=^2 = 0, группа 1: Z = , ^ = 0, группа 2: z{ = 0, Z2=U

или

Введение в регрессию фиктивных переменных существенно улучшает качество ее оценивания.

Оценив регрессию между у их, получим выражение у = 3519-12,1 Ix, R2 -0,394

(56,8) (3,5)

(в скобках указаны стандартные ошибки). 72

Пример 4.3. Имеются данные о весе новорожденного у в граммах и количестве сигарет х, выкуриваемых в день будущей матерью во время беременности в случаях первых и непервых родов:

Пер-

у

X

■7

Пер-

у

7

п/п

венец

п/п

венец

1

Нет

3450

8

1

11

Нет

3200

31

1

2

Нет

3300

21

1

12

Нет

3400

13

1

3

Нет

3400

18

1

13

Да

3450

5

0

4

Нет

3300

24

1

14

Да

3400

10

0

5

Нет

3450

6

1

15

Да

3200

19

0

6

Нет

3450

16

1

16

Да

3350

12

0

7

Нет

3100

19

1

17

Да

3000

20

0

8

Нет

3500

7

1

18

Да

3300

8

0

9

Нет

3400

20

1

19

Да

3300

16

0

10

Нет

3500

10

1

20

Да

3400

9

0

Это означает, что ребенок, рожденный некурящей матерью, будет иметь при рождении средний вес около 3500 г, а уменьшение веса новорожденного по причине курения его матери составляет около 12 г на каждую сигарету, выкуриваемую в день.

Для учета качественного фактора (первый или не первый ребенок) введем в модель фиктивную переменную:

Оценив регрессию между у и х, z, получим выражение v — 3480 — 14,56.x + 124 z, Л2 = 0,600

(49,2) (3,0) (42,1)

(в скобках указаны стандартные ошибки).

Коэффициент 124 при фиктивной переменной г, статистически значим.

Это выражение можно переписать в виде двух уравнений: у = 3480 14.56х (для первенца); у = 3604 14,56х (для непервениа).

Параметр сдвига (эффект от фактора «первенец — непервенец») составляет 3604 3480 = 124 г.

Как видим, добавление в регрессию фиктивной переменной существенно улучшило качество оценки.

ЛАГОВЫЕ ПЕРЕМЕННЫЕ

При использовании данных временного ряда на текущие значения зависимой переменной могут влиять не только текущие значения объясняющих переменных, но также их значения с некоторым запаздыванием.

В общем, если какая-то переменная пояшіяется в модели с запаздыванием на х периодов, она записывается с нижним индексом (/-т). например:

Сдвиг т, характеризующий запаздывание в воздействии фактора на результат, называется лагом. Переменная, влияние которой характеризуется некоторым запаздыванием, называется лаговой.

4.5. СТОХАСТИЧЕСКИЕ ОБЪЯСНЯЮЩИЕ ПЕРЕМЕННЫЕ И ОШИБКИ ИЗМЕРЕНИЯ

Обычно в предпосылках регрессионного анализа считается, что объясняющие переменные являются неслучайными. Пусть некоторые объясняющие переменные являются стохастическими (случайными).

Рассмотрим три случая.

Объясняющие переменные распределены независимо от случайного члена. В этом случае оценки, полученные обычным МНК, сохраняют все свои свойства: несмещенность, эффективность и состоятельность.

Объясняющие переменные и случайный член являются зависимыми, но одномоментно некоррелированы. Например, имеется модель с лаговой зависимой переменной в качестве одной из объясняющих переменных:

Л = Ро + Рі*, + р2.>>м +£гВ этом случае у,_{ находится непосредственно под воздействием £,_i и косвенно под воздействием всех предшествующих значений случайного члена. Следовательно, объясняющая переменная ум и случайный член є, зависимы, и МНК не дает несмещенных оценок.

Тем не менее, если ум и є, некоррелированы, МНК-оценки будут состоятельными, хотя и смещенными.

Объясняющие переменные одномоментно коррелированы со случайным членом. В этом случае оценки, полученные обычным МНК, являются смещенными и несостоятельными.

Рассмотрим влияние ошибок измерения.

1. Ошибки в измерениях зависимой переменной. Предположим, что истинной является модель у = а + рх + є, но измеряемое значение зависимой переменной есть у* = у + v, где v — ошибки, имеющие нулевое математическое ожидание и не зависящие от є и х. Следовательно, зависимость между наблюдаемым значением зависимой переменной и х представляется выражением у* = а + fix + + (e + v).

Оценки параметров (а, (3) будут несмещенными и состоятельными, так как М(г + v) = 0 и Cov(x, (є + v)) = 0.

Наличие же ошибки v приводит лишь к увеличению дисперсии регрессии: D(e + v) = cj + а2,.

2. Ошибки в измерениях объясняющих переменных. Пусть истинной моделью является у а + $х + є, но измеряемое значение объясняющей переменной есть х* = х + v, где v — ошибки, имеющие нулевое математическое ожидание и не зависящие от є и х. Реально будет осуществляться регрессия: у а + рх* + є*, где є* = є f5v, в которой объясняющая переменная х* и ошибка є* уже являются коррелированными, так как обе зависят от v. Это означает, что МНК-оценки будут смещенными и несостоятельными.

Таким образом, при наличии ошибок в измерениях зависимой переменной МНК-оценки остаются несмещенными и состоятельными, а наличие ошибок в измерениях независимых переменных приводит к возникновению корреляции между объясняющими переменными и ошибками и, как следствие, к смещенности и несостоятельности МНК-оценок.

Эконометрика

Эконометрика

Обсуждение Эконометрика

Комментарии, рецензии и отзывы

4.4. спецификация и классификация переменных в уравнениях регрессии: Эконометрика, А.И. Новиков, 2007 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Содержит систематическое изложение основ эконометрики, подготовлено в соответствии с требованиями государственного стандарта. Рассмотрены линейная модель парной и множественной регрессии, проверка гипотез, гетероскедастичность и автокорреляция ошибок.