1.12. линейные модели с несколькими объясняющими переменными
1.12. линейные модели с несколькими объясняющими переменными
T
DPI
Р
Рассмотрим статистические данные о потреблении текстиля (текстильных изделий) в Голландии в период между двумя
мировыми войнами с 1923 по 1939 годы. В приведенной ниже
таблице T — реальное потребление текстиля на душу населения, DPI — реальный располагаемый доход на душу населения, P — относительная цена текстиля. Все показатели выражены в индексной форме, в процентах к 1925 году.
Год
1923 99.2 96.7 101.0 | 1932 153.6 105.3 | 65.4 |
1924 99.0 98.1 100.1 | 1933 158.5 101.7 | 61.3 |
1925 100.0 100.0 100.0 | 1934 140.6 95.4 | 62.5 |
1926 111.6 104.9 90.6 | 1935 136.2 96.4 | 63.6 |
1927 122.2 104.9 86.5 | 1936 168.0 97.6 | 52.6 |
1928 117.6 109.5 89.7 | 1937 154.3 102.4 | 59.7 |
1929 121.1 110.8 90.6 | 1938 149.0 101.6 | 59.5 |
1930 136.0 112.3 82.8 | 1939 165.5 103.8 | 61.3 |
1931 154.2 109.3 70.1 |
Для объяснения изменчивости потребления текстиля в указанном периоде мы можем привлечь в качестве объясняющей переменной как располагаемый доход DPI, так и относительную цену на текстильные изделия P. Если исходить из предположения о постоянстве эластичностей потребления текстиля по доходу и цене, то тогда следует подбирать линейные модели для логарифмов индексов, а не для самих индексов. Подбор таких моделей методом наименьших квадратов приводит к следующим результатам (использовались десятичные логарифмы):
lg T = 1.442 + 0.348 • lg DPI , R2 = 0.0096, ESS = 0.000959, RSS = 0.099185, TSS = 0.100144, R2 = 0.0096; lg T = 3.564 0.770 • lg P, R2 = 0.8760,
ESS = 0.087729, RSS = 0.012415, TSS = 0.100144, R2 = 0.8760.
Вторая модель, несомненно, лучше описывает наблюдаемую динамику потребления текстиля. Однако, естественно возникает вопрос о том, нельзя ли для объяснения изменчивости переменной Т использовать одновременно и располагаемый доход и относительную цену текстиля, улучшит ли это объяснение изменчивости потребления текстиля.
Чтобы привлечь для объяснения изменчивости потребления текстиля обе переменные DPI и T, мы рассматриваем модель линейной связи логарифмов этих величин
и соответствующую ей модель наблюдений lgT =а + р-lgDPI. + уlgр +st , i = 1,...,n.
Оценки параметров a,/3,у можно опять находить методом наименьших квадратов, путем минимизации по всем возможным значениям а,/3,у суммы квадратов
Q{a,fi,у) = Z(lgT -a-fi lgDPI. -у lgрf .
Минимум этой суммы достигается на некотором наборе а = сс, Р = Р, у = у, так что
Q(a,J3,у) = minQ(a,fi,y) .
R2 = 1
RSS
(и опять, разложение TSS = RSS + ESS справедливо только при включении постоянной составляющей а в правую часть соотношения, определяющего линейную модель связи). При этом также
R2
т. е. коффициент детерминации R2 равен квадрату (обычного) выборочного коэффициента корреляции между переменл
ными lg T и lg T . Разности
У і ~ У,
называются остатками.
По поводу получения явных выражений для оценок наименьших квадратов мы поговорим несколько позднее, а сейчас просто приведем результаты оценивания для нашего примера:
lg T 1.374 + 1.143 • lg DPI 0.829 • lg P ,
ESS = 0.097577, RSS = 0.02567, R2 = 0.9744.
Мы видим, что в результате привлечения для объяснения изменчивости потребления текстиля сразу двух показателей DPI и P произошло заметное увеличение коэффициента детерминации по сравнению с лучшей из двух моделей, использовавших только один показатель — от значения 0.8760 до значения 0.9744.
Коэффициент 1.143 в подобранной модели связи интерпретируется здесь как эластичность потребления текстиля по доходу при неизменном значении относительной цены P на текстиль, а коэффициент -0.829— как эластичность потребления текстиля по относительным ценам при неизменном уровне дохода. Такие значения коэффициентов говорят в пользу того, что потребление текстиля эластично по доходам ине-эластично по ценам. Вопрос о том, в какой степени можно доверять подобным заключениям, мы рассмотрим далее в контексте вероятностных моделей.
Обсуждение Институт экономики переходного периода
Комментарии, рецензии и отзывы