Глава 13 панельные данные
Глава 13 панельные данные
Задача 13.1
Докажите равенства (13.17)
Г а'2
ІТ —
и (13.18)
а] {Іт~тгтгт)+°2тгтг'т.
Решение
1) Имеем
1 / 2г_ , ( 2 Га4.
ff« V V " сг| + Таї аТТТаї ) \%rlr ) = Ь
2) Для доказательства формулы ґтяї „
Формулы (13.18) достаточно проверить равенство
1 Я*__. 1 а2
Шо делается с помощью элементарной арифметики.
Задача 13.2
Докажите равенство (13.22
0RE = W&B + (J* W)/3W = Wf3B + (Ik W)f3n.
Решение
(Ср. (Greene. 1997, Ch. 14.3).) Сформулируем предложение, которое вытекает из более общего результата, доказанного в упражнении 4.3.
Предложение. Пусть задана классическая линейная модель регрессии со свободным членом
yt =a + x{/3 + £tl V(et) = 9\% Cov(e,,e,4) = 0, t ф s, t\%s = 1, Тогда
71.
л
-1
Г J
Оценка /3RE может быть получена как обычная МНК-оценка преобразованной модели (13.24):
(*)
Уи (1 0)уі = (1 Щ + (хгі (1 еЩУ(Э + г//,, г = 1,..., п, і = 1,..., Г,
еде
I 7" 1 г
2 є
В модели (*) ошибки 7}ц не коррелированы и имеют постоянную дисперс
Vfott) = <ге2.
Из сформулированного выше предложения сле/гует, что МНК-оценк вектора (3 в уравнении (*) может быть получена применением МНК к этому уравнению, записанному в отклонениях от глобальных средних:
**)
Ы Уі) + в(уг у) = ((«« ж») + ж))' /3 + ffti ffc
где
«Г *
Обозначим
і=
Для уравнения (**) соответствующая матрица Х'Х есть
n Г
((хн Ж») + в{хі х)) ((yit Щ + в{Уі у)) = ЯД 4в2Е^. Таким образом,
то
3W = КГ* \% 3B = (sbr/)_1sbrl,,
^xy = ^xx3w> ^xy = ^ххЗв-
Подставляя эти выражения в (***), получаем:
-і
где
и
Задача 13,3
І Покажите, что существует к х к матрица S, такая, что
где /30|jS — МНК-оценка вектора параметров /3 в объединенной регрессии (13.2).
Решение ML
Оценка /3qls является частным случаем оценки 0кЕ, когда crj; = 0, т.е. когда 0 = 1. Поэтому из результатов упражнения 13.2 следует, что
мы сохранили обозначения упражнения 13.2).
Задача 13.4
Докажите равенство (13.23)
Р = А [ 1г
1-0
Решение
Необходимо показать, что Р'Р -----Е . Имеем
Р'Р = Л ( /г
2(1 -в) (1-0)2Т7 ,
^ lT«r + ^2 1 1тгТ
і=і (=i
t=i
Решение Т
Требуемое равенство непосредственно следует из решения упражнения 13.2 и сформулированного в этом упражнении предложения.
Задача 13.6
Докажите, что решение задачи (13.42)
(IЩ ШЩ -тДуД-і))) £ЩЩ _7дУі(-і))
—> nun
задается равенством (13.43)
71
1=1
7GMM = Е Ду',(-і)г, s Е z'Avii-D
1=1
-1
71
г=1
я
Ы 1
Решение
Обозначим для краткости
l-Y.Z'Ayi = a, і£>;ДУі(-1)) = Ь.
1=1 1=1
Тогда левую часть формулы (13.42) можно представить в следующем виде:
/(7) = (а yb)'S(a yb) = a'Sa 27b'So + y2b'Sb. Минимум этой функции (по 7) достигается в точке
Tmin =
b'Sa b'Sb'
что совпадает с формулой (13.43).
Задача 13.7
Постройте функцию правдоподобия для модели (13.47), (13.48)
* / л II. если уТ4 > О,
L [0, еслиу*е<0.
Решение
Предполагая, что ошибки €ц независимы и имеют одинаковое симметричное распределение, по аналогии с обычными моделями бинарного выбора (см.
(12.4) и (12.5)) получаем следующее выражение для функции правдоподобия:
■
U п т
Цаг,... ,ап,(3) = Ц Ц [F(x'a0 + rfV [1 F(x'lt0 -Iat)]1'"" ,
I *=1 t=l
где F(-) ~ функция распределения ошибок єц.
Задача 13.8 # ЖМУ
Рассмотрим модель ■
где ошибки Єц ~ iid(0. о*2) и независимы с при s < £. В уравнении вну-тригрупиовои регрессии (13.35)
Ун ~Уі= тШйІ'ї - + є" ~ £i
ошибки коррелированы с регрессорами. Покажите, что МНК-оценка 7 в последнем уравнении несостоятельна (например, покажите, что при 7 = 0 получаем р lim 7 Ф 0).
п — эс
Решение
Применяя формулу для простейшей регрессии с одной объясняющей переменной, получаем:
7 = 7 +
Ei-i ~ Vi.-x\%*k £i)
Если 7 = 0, то уи~ — уг,_і = Єгі-і ™ є і. — і ■ Таким образом, смещение Д7 оценки 7 есть
Е^1Е;=,(^-1-^,-1)(^-ёо
где
1
Мы предполагаем, что ошибки независимы и одинаково распределены. Тогда С помощью прямых вычислений получаем:
.2
Ё&_Ы= # если^Т-1,
(О, если ( = Т,
—если * > 2, Г
0, если t = 1,
t=l
/.= 1
Случайные величины {&} независимы и одинаково распределены, то же самое справедливо относительно {тц}. Из предыдущих формул следует, что
Е(&) =
- Е(гА) = а\{Т 1).
Следовательно,
р lim Д7 р lim ^pJii = р lim уф^1* = "^^Л #
в силу закона больших чисел. Таким образом, оценка 7 имеет асимптотическое смещение.
Задача 13.9
с. Оценка производственной функции российских предприятий топливно-энергетического комплекса.
В файле fuel.xls содержатся ежегодные данные об объемах выпуска, трудозатратах, капитальных вложениях российских предприятий топ-L ливно-энергетического комплекса за период 1993-2000 гг. (Е. В. Бессонова, I ЦЭФИР). В панель включено около 2400 предприятий, панель не сбаланси-I ровапа (см. таблицу 13.1).
Цель примера — оценить производственную функцию предприятий.
Таблица 13.1
Переменная Описание
I окро номер предприятия по классификации ОКНО
okonh код отрасли ОКОНХ
year год
rout реальный выпуск
етпр численность работников
wor промышленно-производствепный персонал
гк реальные капиталовложения
Вычислите описательные статистики основных переменных.
Оцените производственную функцию Кобба-Дугласа с помощью простой полной регрессии. Выполняется ли условие постоянства отдачи на
масштаб? ^ * ''
Повторите упражнение 13.9.2 для регрессий с фиксированным и случайным эффектами. Сравните результаты.
Является ли влияние индивидуальных эффектов существенным? Проверьте гипотезы:
простая регрессия против регрессии с фиксированным эффектом;
простая регрессия против регрессии со случайным эффектом;
регрессия со случайным эффектом против регрессии с фиксированным эффектом.
13.9.5. Повторите предыдущие упражнения для более сложной модели производственной функции путем включения квадратичных и перекрестных членов. Выберите наиболее адекватную, с вашей точки зрения, модель.i
Решение ^t^^M^*
13.9.1. Описательные статистики основных переменных представлены в таблице 13.2.
Если более детально проанализировать данные, то можно заметить, что распределение всех переменных сильно скошено влево: большинство наблюдений сосредоточено в области средних значений и имеется относительно небольшое число сравнительно больших выбросов.
13.9.2. Рассмотрим производственную функцию Кобба-Дугласа: Output = А • (Capital)0 • (Labor)6, полагая Output == rout, Capital = гй, Lobar = стр. Для оценивания эластичностей а и /5 перейдем к логарифмам и проведем простую регрессию Intout на In г/с, шетпр и константу. Результаты представлены в таблице 13.3. Условие постоянства отдачи на масштаб означает
Таблица 13.3. Простая регрессия
Dependent Variable: rout
Variable Coefficient Std. Error i-Statistic Probability
const -2.488 0.080 -31.08 0.0000
InrA: 0.330 0.016 20.15 0.0000
emp 0.928 0.024 37.66) 0-0000
R2 0.5804
выполнение равенства cv + 0 = 1. Проверяя эту гипотезу с помощью стандартного F-теста, получаем значение соответствующей статистики, равное 359.00, что позволяет уверенно отвергнуть гипотезу о постоянстве отдачи на масштаб.
Заменяя переменную Іп-emp на Inwor, получаем несколько иные результаты (см. таблицу13.4). Однако содержательно эти две регрессии мало от
личаются. Во второй регрессии гипотеза постоянства отдачи на масштаб отвергается сто.чь же уверенно, как и в первой, — значение соответствующей статистики равно 270.40.
13.9.3. Результаты оценивания модели с фиксированным эффектом приведены в таблице 13.5. модели со случайным эффектом — в таблице 13.6. В этой и следующей задачах при оценивании модели с фиксированным эффектом используется нормировка ^JL4 &і = 0, т.е. сумма индивидуальных эффектов равна нулю, поэтому в регрессии присутствует константа.
Можно заметить, что результаты оценивания модели с фиксированным •эффектом значительно отличаются как от простой регрессии,^так и от регрессии со случайным эффектом. В то же время оценки в простой регрессии и в регрессии со случайным эффектом сравнительно близки. Отметим, что в модели со случайным эффектом гипотеза постоянства отдачи на масштаб не отвергается значение соответствующей хп-квадрат статистики равно 1.24 с р-значением 0.265.
13.9.4. Будем использовать обозначения учебника.
Простая регрессия против регрессии с фиксированным эффектом. Проверяем гипотезу Но: а = ci2 — •■■ = Фп = 0 с помощью .Р-теста. Значение соответствующей F-статнстики равно 17.62 с р-значением 0.0000. Гипотеза об отсутствии индивидуальных эффектов уверенно отвергается.
Простая регрессия против регрессии со случайным эффектом. Проверяем гипотезу Но: <ти = 0 с помощью теста множителей Лагранжа. Значение соответствующей хи-квадрат статистики равно 6505.11, и нулевая гипотеза безоговорочно отвергается.
Регрессия со случайным эффектом против регрессии с фиксированным эффектом. Проверяем гипотезу Но: Cov(ai,Xji) = 0 с помощью теста Хаусмана. Значение соответствующей хи-квадрат статистики равно 141.00, что позволяет уверенно отвергнуть модель со случайным эффектом в пользу модели с фиксированным эффектом.
13.9.5. Мы приведем здесь лишь один из возможных результатов. Сравнительно адекватной оказалась модель с фиксированным эффектом, включающая дополнительно квадраты логарифмов капиталовложений и трудозатрат (см. таблицу13.7):
Задача 13.10 f J\%
(Tammo Bijniolt. Ervvin Charlier) В этом упражнении модели панельных данных используются для анализа продаж некоторого сорта тунца (обозначеи-• ного как А) в нескольких магазинах. Использовались данные о продажах консервированного тунца в 28 магазинах Чикаго в течение 104 недель. Данные для этого примера (описание переменных приведено в таблице 13.8) находятся в файле brand_a.xls'.
Таблица 13.8
Переменная Описание
sale зп tot sales
regpva
OCtpTa
feata
displa
ftdpla
regpn actpj'b
гедргс
actprc regprd
actpvd
объем продаж тунца сорта А
общий объем продаж магазина за весь рассматриваемый период
цена тунца сорта А
цена тунца сорта А с учетом скидки
фиктивная переменная (1 если в магазине была реклама рыбы copra А, и рыба сорта А не выкладывалась на витрину, 0 — иначе)
фиктивная переменная (1 — если в магазине рыба сорта А выкладывалась на витрину, и не было рекламы рыбы сорта -4, 0 — иначе)
фиктивная переменная (1 — если в магазине рыба сорта А выкладывалась на витрину, и была реклама рыбы сорта Л, 0 — иначе)
цена тунца сорта В (В, Щ.D — конкурирующие сорта)
цена тунца сорта В с учетом скидки
цена тунца сорта С
цена тунца сорта С с учетом скидки
цена тунца сорта D
цена тупца сорта D с учетом скидки
Исследуйте описательные статистики данных. Проверьте (например, с помощью графиков), как связана зависимая переменная с объясняющими.
Оцените простую (pooled) модель зависимости объема продаж от всех остальных переменных. Ввиду того что розничные цены и цены с учетом скидок сильно коррелироваиы, для каждого сорта г тунца используйте переменные гедрГі и discount = regprj actpr, (і = а, 6, с, d).
'Оригинальный пример доступен на странице Эрвина Чарлиера по адресу :tP: //center. uvt.iil/staff/charlier/paneldata. html
Оцените панельную модель с фиксированными эффектами. Все ли
параметры удалось оценить? Если нет, то почему? (В дальнейшем исключите из модели переменную, вызвавшую проблему.) I ^^^^^^^
Приведите оценки стандартных ошибок коэффициентов в модели упражнения 13.10.3, интерпретируйте результаты, сравните с результатами упражнения 13.10.2.
Вычислите межгрупповую (between-group) оценку для модели. Интерпретируйте результаты, сравните их с результатами модели с фиксированными эффектами.
Оцените панельную модель со случайными эффектами. Интерпретируйте результаты и сравните с результатами упражиеииий 13.10.4 и 13.10.5.
Используя известные вам тесты (тест Хаусмаиа, LM-тест Бреуша-Пагаиа), выберите наиболее подходящую модель.
Считая, что издержки продажи sales а тунца сорта Л равны 0.5 • salesa, выведите из модели, выбранной в упражнении 13.10.7, оптимальную цену данного сорта рыбы.
Решение
13.10.1. В таблице 13.9 представлены описательные статистики переменных, относящихся к тунцу сорта А, и цен одного из конкурирующих сортов В.
Таблица 13.9
salesa regpra actpra feata displa ftdpla гедргь асЬргь
Mean 310.63 0.895 0.793 0.053 0.055 0.149 0.906 0.831
Maximum 5207 1.12 1.12 1 1 1 1.09 1-09
Minimum 7 0.49 0.4 0 0 0 0.56 0.39
Std.Dev. 458.63 0.139 0.169 0.223 0.227 0.356 0.131 0.155
Графически связь между переменными actpra и salesai асіргь и salcsb показана на рис. 13.1 и 13.2.
13.10.2. Результаты простой регрессии объема продаж тунца сорта А на все остальные переменные (с учетом замены actpri на discount и г = a,b,c,d) представлены в таблице 13.10. Мы включили в число объясняющих переменных фактор totsaleS) хотя с содержательной точки зрения это може -г вызывать возражения, ведь она содержит в качестве слагаемого зависиму10
sale а а
1.2
неременную salesa. В данном случае это обстоятельство не играет значительной роли, поскольку выборочный коэффициент корреляции между переменными saleSa и totsales равен 0.175. Переменную totsales следует трактовать как фактор, характеризующий величину магазина.
Видим, что ценовые характеристики сортов С и D незначимы, а у сорта В значимо влияет лишь величина скидки. Знаки коэффициентов (при значимых переменных) соответствуют здравому смыслу.
13.10.3. Результаты оценивания модели с фиксированным эффектом приведены в таблице 13.11.
Как и следовало ожидать, пришлось исключить переменную totsales, поскольку для каждого магазина эта величина не меняется но времени.
Dependent Variable: salesa
Сравнивая результаты двух регрессий (таблицы 13.10 и 13.11), видим, что качественные выводы обеих регрессий совпадают: значимо на объем продаж тунца сорта А влияют его цена и величина скидки, рекламная деятельность. Что касается конкурирующих сортов, то только скидки на рыбу сорта В оказываю] значимое влияние на объем продЯщ^^^^^^г
При проведении межгрупповой регрессии выяснилось, что средние по времени переменных fcata, displa и ftdpl.a линейно зависимы, поэтому их нельзя одновременно (при наличии константы) включать в уравнение межгрупповой регрессии. Поэтому в таблице 13.12 представлены результаты межгрупповой регрессии (between group) без переменной ftdplaРезультаты межгрупповой регрессии значительно отличаются от результатов внутригрупповой (с фиксированным эффектом) регрессии. Объясняется это, по-видимому, тем, что число наблюдений в межгрупповой регрессии (п = 28) слишком небольшое, чтобы можно было надежно оценить 12 параметров. Поэтому прямое сопоставление межгрупповой и внутригрупповой регрессий в данном случае малоипформативно.
13.10.6. Результаты оценивания модели со случайным эффектом представлены в таблице 13.13 Мы видим, что результаты оценивания моделей с фиксированным и со случайным эффектом близки не только качественно, по и количественно. Можно проверить, что удаление из регрессий незначимых
переменных не приводит к существенному изменению оценок коэффициентов при оставшихся переменных.
Поскольку все модели, которые здесь рассматриваются, являются простыми линейными моделями, интерпретация коэффициентов стандартная, и мы рекомендуем читателю проделать это самостоятельно.
13.10.7. Так же, как и в предыдущей задаче, проверим гипотезу «простая регрессия против модели с фиксированным эффектом» с помощью F-'recTa. Значение соответствующей F-статистики равно 14.35, что говорит в пользу модели с фиксированным эффектом.
Проверяя гипотезу «простая регрессия против модели со случайным эффектом» с помощью теста множителей Лагранжа (теста Бреуша-Пагаиа), получаем значение соответствующей хи-квадрат статистики, равное 1730.17. Вновь модель простой регрессии отвергается.
Наконец, воспользуемся тестом Хаусмаиа для проверки гипотезы «модель со случайным эффектом против модели с фиксированным эффектом». Значение соответствующей хи-квадрат статистики равно 8.96. При нулевой гипотезе проверочная статистика имеет хи-квадрат распределение с 12 степенями свободы. Соответствующее р-значение равно 0.706. Таким образом, тест Хаусмана не отвергаег гипотезу о наличии случайного индивидуального эффекта.
Следует отметить, что к выводам относительно выбора модели следует относиться достаточно осторожно. Если из рассмотренной модели удалить незначимые переменные и оценить ее как модель с фиксированным эффектом и как модель со случайным эффектом, то вновь результаты оценивания будут очень схожими, однако, применив тест Хаусмана, получим /^значение, равное 0.024, что говорит в пользу модели с фиксированным эффектом.
13.10.8. Для определенности остановимся на модели со случайным эффектом, результаты оценивания которой представлены в таблице 13.13. Кроме того, для упрощения выкладок будем считать, что продажа тунца сорта А происходит по регулярной цене гедрга. Итак, согласно принятой модели средний объем продаж есть линейная комбинация переменных, включенных в модель, с коэффициентами, приведенными в таблице 13.13. Выделим слагаемое, относящееся к переменной regprQy т. е. представим объем продаж в виде
salesa = 0vegpra + V,
где V — линейная комбинация остальных переменных. Обозначим также для удобства regpra = х, salesa = у. Тогда чистая прибыль netprofit от продажи объемом у равна
netprofit = ху0.5?/ = (х 0.5)у = (х 0.5)(/?ix + V) = 0{х2 + (V 0.5/?i)x 0.5V.
Поскольку 01 < 0, то максимум этой функции достигается при
V 0.5А
Таким образом, оптимальная цена зависит от значений остальных переменных. В подобных случаях можно либо найти значение хтах для среднего (но выборке) значения V, либо вычислить .т1пах по формуле (*) для каждого наблюдения и затем взять среднее (по выборке) значение xmftX. Мы здесь дадим результаты второго подхода, оставляя первый читателю. Итак, проводя необходимые вычисления, получаем, что среднее значение оптимальной регулярной цены тунца сорта А в соответствии с предложенной моделью равно 0.954. Интересно отметить, что среднее значение переменной гедрга равно 0.895. Полученный результат говорит в пользу адекватности построенной модели.
Обсуждение Сборник задач к начальному курсу эконометрики
Комментарии, рецензии и отзывы