3.4. прогнозирование в регрессионных моделях
3.4. прогнозирование в регрессионных моделях
Под прогнозированием в эконометрике понимается построение оценки зависимой переменной для некоторого набора независимых переменных, которых нет в исходных наблюдениях.
Различают точечное и интервальное прогнозирование. В первом случае оценка — некоторое число, во втором — интервал, в котором находится истинное значение зависимой переменной с заданным уровнем значимости.
Рассмотрим регрессионную модель
y = a + px + e.
Действительное значение зависимой переменной при х = хр
ур = а + $хр + гр,
где М(ер) = 0, В(ер) = а2. Значения а, Р, гр неизвестны.
Предсказанным значением является оценка ур (точечный прогноз):
УР =а + Ьхр.
Ошибка предсказания равна разности между предсказанным и действительным значениями:
ар = Ур~УрОшибка предсказания имеет нулевое математическое ожидание:
Л/(Д„) = 0.
Действительно,
М(Ар) = М(ур) М(ур) = М(а + Ьхр) М(а + $хр + гр) = 0.
Вычислим дисперсию прогноза. Учитывая, что в случае парной регрессии
а2 , yp=y + b(xp-x), D{y) = ^, D{yp) = D{zp) = a
для дисперсии прогноза получим
а2.
п nvar(x)
Из формулы следует, что чем больше хр отклоняется от выборочного среднего х, тем больше дисперсия ошибки предсказания, и чем больше объем выборки я, тем меньше дисперсия.
Заменяя в дисперсии прогноза а2 на ее оценку S2 и извлекая квадратный корень, получим стандартную ошибку предсказания
1 (хх)2
S= SA + + -^ -.
п wvar(x)
Доверительный интервал для действительного значения ур определяется выражением
Ур-'хрЯр <Ур< yP+tKpSp,
где tKp — критическое значение /-статистики при заданном уровне значимости и числе степеней свободы.
На рис. 11 в общем виде показано соотношение между доверительным интервалом предсказания и значением объясняющей переменной. Отрезок, отмеченный на рисунке стрелками, определяет доверительный интервал предсказания в точке хр.
X
Рис. 11
Пример 3.7. По данным о зависимости объема продажу фирмы от затрат на рекламу х оценить объем продаж при затратах на рекламу, равных 5,5 усл. ед. Найти стандартную ошибку предсказания и 99\%-ный доверительный интервал для полученной оценки.
Исходные данные (усл. ед.):
X | 5 | 8 | 6 | 5 | 3 | 9 | 12 | 4 | 3 | 10 |
У | 72 | 76 | 78 | 70 | 68 | 80 | 82 | 65 | 62 | 90 |
Объем продаж фирмы Ур = 71,87 при затратах на рекламу хр = 5,5 можно определить с помощью статистической функции Excel
Ур = ПРЕДСКАЗ(хр; массив х; массив у).
Значения х 6,5, var(x) = 9,61, S4,24, tKp = 3,35 можно получить с помощью функций:
х = СРЗНАЧ(массив х);
var(x) = ДИСПР(массив к);
S = СТОШУХ(массив у; массив х);
tKp = СТЬЮДРАСПОВР (1 а; V),
гдея = 10, v = «-2 = 8, а= 1-0,99 = 0,01.
Вычисляем стандартную ошибку предсказания и доверительный интервал для полученной оценки: , І І (5,5-6,5)2 „ лп
S„ = 4,24. /1 + — + — ~ = 4,47,
" V 10 10-9,61
71,87 3,35 ■ 4,47 <yp < 71,87 + 3,35 • 4,47, или
56.9 <yp< 86,84.
Обсуждение Эконометрика
Комментарии, рецензии и отзывы