Глава 12 эконометрические компьютерные пакеты 12.1. оценивание модели с помощью компьютерных программ
Глава 12 эконометрические компьютерные пакеты 12.1. оценивание модели с помощью компьютерных программ
На практике союкупность выборочных данных содержит большое количество наблюдений (иногда несколько тысяч). Разумеется, «вручную» производить вычисления такого объема невозможно.
Компьютерные эконометрические (их также называют регрессионными) пакеты содержат в качестве готовых подпрограмм основные, наиболее часто встречающиеся вычисления, которые приходится выполнять исследователю.
В последние годы появились десятки эконометрических пакетов1, в том числе и разработанные в России. В настоящем учебнике мы рассмотрим в качестве примера пакет «Econometric Views», который используется, например, для обучения в Российской Экономической Школе.
Перечислим основные возможности, предоставляемые пакетом «Econometric Views».
1. Анализ данных.
Первым этапом эконометрического моделирования является анализ экспериментальных (выборочных) данных, которые предварительно должны быть введены в рабочий файл («Workfile»). Там они хранятся в виде последовательностей чисел, причем каждая выборка имеет свое имя.
Имеется возможность представить данные графически, получить значения основных количественных характеристик выборочных данных.
В качестве примера рассмотрим моделирование формирования цены на автомобили на вторичном рынке в зависимости от года выпуска машины и ее пробега. Пусть Х — срок эксплуата
О возможностях некоторых из них см., например, [13], [14].
279
ции автомобиля — разность между текущим годом и годом выпуска автомобиля, Х2 — пробег (в тыс. км), Y — цена (в у.е.). Рабочий файл пакета содержит основные числовые данные — выборочные значения всех перечисленных переменных. Чтобы получить экспериментальные данные в виде столбцов чисел, надо выполнить команду «Ореп». Экспериментальные данные могут быть получены на экране в виде столбцов:
Obs | Xi | х2 | У |
1 | 6,000000 | 91,00000 | 14800,00 |
2 | 7,000000 | 116,0000 | 14200,00 |
3 | 2,000000 | 34,00000 | 17000,00 |
48 | 5,000000 | 90,00000 | 15300,00 |
49 | 14,00000 | 217,0000 | 10400,00 |
50 | 4,000000 | 64,00000 | 15800,00 |
Графическое изображение данных представлено на рис. 12.1.
При желании можно получить все графики на одном рисунке.
Регрессионные программы допускают преобразования экспериментальных данных. Так, например, имеется команда, позволяющая упорядочить выборочные наблюдения по возрастанию какой-либо переменной. Обычно это имеет смысл в случае пространственной выборки. Также имеется возможность «редактировать» экспериментальные данные: например, исследователь может удалить слишком «нетипичные» наблюдения, которые могут неадекватно исказить модель.
Более подробное представление о распределении выборочных данных дают гистограммы.
В «Econometric Views» имеются команды, с помощью которых сразу получаются основные количественные характеристики выборочных распределений. Вот как выглядит соответствующий результат для нашего примера:
Xj | x2 | У | |
Mean | 7,560000 | 117,9400 | 13918,00 |
Median | 6,500000 | 103,5000 | 14450,00 |
Maximum | 24,00000 | 373,0000 | 17500,00 |
Minimum | 1,000000 | 15,00000 | 5000,000 |
Std. Dev. | 5,107657 | 78,26470 | 2783,530 |
Skewness | 1,127798 | 1,157630 | -1,123340 |
Kurtosis | 3,994277 | 4,115747 | 3,973437 |
Jarque-Bera | 12,65896 | 13,76109 | 12,48990 |
Probability | 0,001783 | 0,001028 | 0,001940 |
Observations | 50 | 50 | 50 |
281
Выдается математическое ожидание (mean), максимум, минимум и медиана распределения, стандартное отклонение (Std. Dev.), асимметрия (Skewness), эксцесс (Kurtosis). Статистика Jar-que-Bera — это статистика проверки гипотезы о том, что соответствующая выборка взята из нормально распределенной совокупности. Ниже приводится соответствующее значение вероятности (Probability). В строке Observations (наблюдения) указывается число наблюдений п,
2. Оценивание модели.
После того, как анализ данных завершен, можно приступать к собственно моделированию. Допустим, мы хотим оценить зависимость Y от Х и Xi с помощью метода наименьших квадратов. Для этого в «Econometric Views» имеется специальная команда, результат выполнения которой имеет следующий вид:
LS // Dependent Variable is Y
Sample: 1 50
Variable | Coefficient | Std. Error | /-statistic | Prob. |
С | 18046,09 | 14,98877 | 1203,974 | 0,0000 |
X | -483,3643 | 32,93229 | -14,67752 | 0,0000 |
Хг | -4,017735 | 2,149205 | -1,869406 | 0,0678 |
В столбце «Coefficient» находятся значения оценок соответствующих параметров регрессии, в столбце «Std. Еггог» — их стандартные отклонения, в столбце «t-statistic» — значения t-критерия Стьюдента при проверке гипотезы о незначимости соответствующих регрессоров. В последнем столбце приводится
ВерОЯТНОСТЬ Р (t > /набл)Ниже основной таблицы помещаются некоторые количественные характеристики регрессионной модели: коэффициент детерминации Я2 (R-squared), скорректированный коэффициент детерминации R2 (Adjusted R-squared), стандартная ошибка регрессии — оценка а в предположении, что выполняются условия классической модели Гаусса—Маркова (S.E. of regression), сумма квадратов остатков (sum squared resid), логарифм функции правдоподобия (log likelihood).
Регрессионная программа имеет дело с набором чисел, она не может понимать их природу. Поэтому при использовании метода наименьших квадратов выдаются результаты, имеющие смысл, вообще говоря, только для временных рядов. Таковы статистика Дарбина—Уотсона (Durbin—Watson stat.) и еще некоторые характеристики, которые мы не рассматривали в данном учебнике.
В конце выдается значение ^-статистики при проверке гипотезы о незначимости регрессии в целом и значение соответствующей вероятности.
Как видно, на пятипроцентном уровне значимости регрессор Х2 (пробег автомобиля) оказался незначимым (хотя он значим на десятипроцентном уровне, ибо /п,95; 48 = 2,01; /п,9; 48 =Ь67). Причиной этого может быть высокая коррелированность между двумя величинами Х и Х2 и малый объем выборки.
Обычный метод наименьших квадратов является наиболее распространенным, но, как известно, далеко не всегда наилучшим методом оценивания. Регрессионная программа позволяет выбрать метод наиболее отвечающий характеру экспериментальных данных и их взаимозависимости. При этом в одном меню на выбор предлагаются как методы, специфические, как правило, для пространственной выборки (например, взвешенный метод наименьших квадратов), так и применимые исключительно для временных рядов — например, ARMA. Отметим еще раз, что программа не различает характера экспериментальных данных, и ее неосознанное использование может привести к абсолютно бессмысленному результату.
Для оценивания систем регрессионных уравнений предлагается отдельное меню, в которое входят обычный метод наименьших квадратов, двухшаговый и трехшаговый методы наименьших квадратов, а также метод одновременного оценивания уравнений как внешне не связанных. При выборе двухшагового или трехшагового метода программа запросит также ввести имена инструментальных переменных.
3. Анализ модели.
После получения адекватного регрессионного уравнения, удовлетворяющего исследователя на данный момент, наступает этап анализа модели. Обычно при этом проверяются некоторые предположения — гипотезы, описанные в основном тексте пособия. При этом применяются основные тесты — такие, как тест Уайта, тест Чоу, линейный тест и другие. Большинство из них (чтотакже было отмечено в основном тексте) выполняются специальной командой.
Вот как выглядит, например, применение теста Уайта для рассматриваемого примера формирования цены автомобиля:
White Heteroskedasticity Test:
F-statistic 0,146329 Probability 0.963694
Obs^-squared 0,642001 Probability 0.958284
Test Equation:
LS // Dependent Variable is RESIDA2
Sample: 1 50
Included observations: 50
Variable | Coefficient | Std. Error | t-statistic | Prob. |
С | 2027,021 | 2099,532 | 0,965463 | 0,3395 |
X | -3481,328 | 6934,929 | -0,501999 | 0,6181 |
192,2855 | 449,3960 | 0,427875 | 0,6708 | |
x2 | 238,8914 | 451,6586 | 0,528920 | 0,5995 |
0,846622 | 1,871088 | -0,452476 | 0,6531 |
/^-squared | 0,012840 | Mean dependent var | 930,364 |
Adjusted /^-squared | -0,074908 | S.D. dependent var | 4618,038 |
S.E. of regression | 4787,878 | Akaike info criterion | 17,04232 |
Sum squared resid | l,03E+09 | Schwarz criterion | 17,23353 |
Log likelihood | -492,0050 | F-statistic | 0,146329 |
Durbin—Watson stat. | 2,006108 | Prob. (F-statistic) | 0,963694 |
Как видно, низкое значение /"-статистики и соответствующее высокое значение вероятности позволяет принять гипотезу о гомоскедастичности.
Приведем также пример проверки гипотезы о выполнении некоторого условия, задаваемого линейным равенством.
Некоторые дилеры считают, что год «жизни» не слишком дорогого автомобиля уменьшает его стоимость примерно на 500 долларов. Проверим гипотезу о том, что истинное значение (по абсолютной величине) параметра Pi равно 500 (разумеется, значение оценки будет при каждом выборочном наблюдении несколько другим).
Вот как выглядит тестирование гипотезы в компьютерном пакете «Econometric Views».
Null Hypothesis: C(2)=-500
F-statistic 0,255174 Probability 0,615816 Chi-square 0,255174 Probability 0,613455
Гипотезу о выполнении линейного условия можно проверять с помощью /"-теста и А,2-теста. Компьютерная программа приводит значения соответствующих статистик и значения соответствующих вероятностей. Как видно, результаты тестирования позволяют принять соответствующую гипотезу.
Обсуждение Эконометрика
Комментарии, рецензии и отзывы