Сравнение альтернативных моделей
Сравнение альтернативных моделей
Техника сравнения альтернативных моделей может быть достаточно сложной, и здесь мы ограничимся очень кратким частичным рассмотрением некоторых вопросов. Начнем с введения различия между включенными и невклю-ченными моделями. Одна модель называется включенной в другую, если первая модель может быть получена из второй путем наложения некоторых ограничений. Две модели называются невключенными (друг в друга), если ни одна из них не может быть представлена как ограниченная версия другой. Ограничения могут касаться любого аспекта спецификации модели, но в данном случае мы рассмотрим лишь ограничения, накладываемые на параметры объясняющих переменных в модели, состоящей из одного уравнения. Проиллюстрируем это на примере функции потребления домашних хозяйств, анализируемой в главах 7 и 10. В этих главах рассматривались три динамические модели: модель с лаговой зависимой переменной (обозначим ее как модель В); оценка Прайса—Уин-стена статической модели (модель С); модель с лаговыми значениями всех переменных и без ограничений на ее параметры (модель А). Добавим для полноты картины простую статическую модель (модель D):
у, = Х0 + Х^ + хл + Х3х^ + Xf, + Х^ + uAt (12.8)
y = XQ+ + V, +V, (12.9)
у = Хо + Vr-i + V, - + V, - + исп (12.10)
у = Х0 + ХЛ + X& +uDr (12.11)
Модели В и С включены в А, поскольку, как было отмечено в разделе 7.9, обе являются ее ограниченными версиями: модель В налагает нулевые ограничения на коэффициенты прих^, и р^х (это, конечно, просто другой способ отражения того, что эти переменные исключены из модели), модель С налагает ограничение на общий множитель, объясненное в разделе 7.9. Модель D может рассматриваться в качестве включенной как в модель В, так и в С. Она может быть получена из модели В приравниванием нулю коэффициента при jy_„ а из модели С — наложением ограничения, согласно которому р = 0. Структура включения моделей представлена на рис. 12.2.
Лучше всего начать с самой общей модели — модели А. В случае расходов на жилье, если мы сравним А с С, то обнаружим, что ограничение на общий множитель, присутствующее в модели С, отвергается (см. раздел 7.9). СледоваРис. 12.2. Структура включения моделей А, В, С и D
тельно, модель С находится за пределами списка приемлемых моделей. Если мы сравним модель А с В, то обнаружим, что В является хорошей альтернативой А, поскольку оцененные коэффициенты при и незначимо отличаются от нуля, как это было показано в разделе 7.9. На самом деле вместо использования /-теста для отдельных коэффициентов следовало бы применить /'-тест для их совместной объясняющей способности, и именно это будет сделано. Сумма квадратов отклонений для модели А равна 0,00076 и для модели В — 0,00080. Соответствующая Г-статистика, имеющая 2 и 18 степеней свободы, равна 0,47. Она незначима даже при 5-процентном уровне значимости, поэтому модель В выдерживает данный тест. Наконец, модель D должна быть отвергнута, поскольку ограничение, согласно которому коэффициент при у^х равен нулю, отвергается с помощью простого ґ-теста. (Во всех этих рассуждениях мы предполагали, что процедуры тестов не зависят существенно от использования лаговых зависимых переменных в качестве объясняющих. Как вы знаете, это безусловно верно только для больших выборок.)
Приведенный пример иллюстрирует возможность как успеха, так и неудачи проведения тестов в случае включенной структуры моделей: успех — в отклонении двух из четырех моделей и неудача — поскольку некоторая неопределенность в итоге осталась. Есть ли основания предпочесть модель А модели В или наоборот? Многие авторы (например, Дэвид Хендри — уже упоминавшийся шотландский исследователь) сказали бы, что следует предпочесть модель В как более экономную, но не в смысле экономии денег, а в смысле экономии использования параметров: модель А требует оценки шести параметров, модель В — только четырех. Тем не менее преимущества экономности в данном контексте не до конца ясны. Представляется, что такая экономность связана в основном с принципом максимальной простоты предлагаемого объяснения (принцип KISS — keep it simple, stupid), известного также под названием «бритва Оккама». Поскольку все это с трудом может быть положено в основу четкого императива, постольку здесь остается проблема выбора между эффективностью и возможным смещением при включении и исключении переменных с незначимыми коэффициентами, рассмотренная в главе 6. Пожалуй, самый убедительный аргумент в пользу экономности заключается в том, что обычно нетрудно придумать большое число потенциально подходящих объясняющих переменных, коэффициенты при которых оказываются незначимыми, и сохранение в итоге одной или двух из них в модели будет произвольным. Что делать в случае, когда конкурирующие модели оказываются невключенными моделями? Одна из возможных тактик — построить объединенную модель, включающую эти две модели как свои ограниченные версии, и проверить, имеется ли какой-либо прогресс при оценке каждой из моделей по сравнению с их объединением. Предположим, например, что модели Fw (/одинаковы во всем, кроме спецификации их независимых переменных. Обе модели включают переменные xv..xe как регрессоры. Модель /'содержит также переменныехе+{... ^(подмножество F). Модель G не включает их, но вместо этого содержит переменныех/+1... xg (подмножество (7). Объединенная модель £ будет вмещать все три подмножества независимых переменных. Теперь необходимо провести два теста. Приняв в качестве нулевой гипотезы предположение о том, что модель Е имеет верную спецификацию, проверим совместную объясняющую способность переменных из подмножествами, отдельно от них, из подмножества G Здесь возможны четыре исхода: 1) оба подмножествами (/обладаютзначимой объясняющей способностью. Это довольно неожиданный исход, поскольку он влечет отклонение обеих моделей Ей G в пользу не рассматривавшегося прежде их объединения; 2) подмножество £обладает значимой объясняющей способностью, а (7— нет. Тогда следует отклонить модель G и принять модель F. Модель £ также не может быть принята; 3) результат, противоположный (2), с соответствующими выводами; 4) ни подмножество F, ни G не обладают значимой объясняющей способностью. Обе модели Fw С продолжают рассматриваться, как и модель Е.
Для того чтобы сделать наши рассуждения более конкретными, рассмотрим следующий простой пример, в котором подмножествами (/содержат всего лишь по одной переменной. Модели F w G выглядят следующим образом:
Модель F у = а + р,х, + р2х2 + uF; Модель G у = а + р,х, + р3х3 + uG.
(12.12) (12.13)
Подмножество F совпадает с х2, подмножество G — с х3. Объединенная модель Е имеет следующий вид:
Модель Е
у = а + р,х, + р2х2 + р3х3 + иЕ.
(12.14)
В этом случае F-тест на объясняющую способность подмножеств Ей (/сводится к r-тесту для коэффициентов при х2 и х3 соответственно. После оценки модели £ возможны четыре исхода: 1) оба коэффициента Ь2 и Ьъ значимо отличаются от нуля. Переменные х2 и х3 должны быть включены в модель. Тем самым, модели Fи (/отклоняются, модель Е — принимается; 2) коэффициент Ь2 значимо отличается от нуля, а Ь3 — нет. В этом случае х2 должна быть включена, а х3 может быть включена в модель (тот факт, что коэффициент при переменной оказался незначимым, вовсе не означает, что переменная должна быть обязательно исключена из модели; это может быть действительно объясняющая переменная, но ее воздействие может быть слабым, а размер выборки — очень малым для того, чтобы коэффициент при переменной значимо отличался от нуля). Мы отклоняем модель G и принимаем модели Fh Е; 3) коэффициент Ьъ значимо отличается от нуля, а Ь2 — нет. Такой же вывод, как и в (2), только
Fn G меняются местами; 4) ни b2, ни b3 не отличаются значимо от нуля. Все три модели принимаются, поскольку х2 и х3, несмотря на свои незначимые коэффициенты, могут оказаться действительно объясняющими переменными.
Очевидно, этот подход порождает множество возможных проблем. Во-первых, во всех тестах модель Е используется как нулевая гипотеза, что может оказаться не совсем приемлемым в данном конкретном случае. Если модели Fw G построены на основании различных принципов, их объединение может быть достаточно странным и неприемлемым с точки зрения экономической теории. В этом случае общих рамок для проведения тестов не существует. Во-вторых, четвертый исход, когда остается неопределенность, может появляться довольно часто. Если модели ^и Сбыли построены достаточно аккуратно, то вполне вероятно, что модель £ будет обладать малой дополнительной объясняющей способностью и оба /^теста окажутся незначимыми. Для выхода из этой ситуации были предложены различные процедуры, но они выходят за рамки книги (более развернутый анализ этих проблем и дальнейшие ссылки см. в работе Я. Кменты [Kmenta, 1986, pp. 595-598]).
Применение подхода «от общего к частному» к спецификации модели
Как мы уже убедились, в случае когда мы начинаем с простой модели и в дальнейшем усложняем ее в соответствии с диагностическими тестами, имеется риск в конце концов получить ложную модель, которая удовлетворяет нас постольку, поскольку в процессе последовательной адаптации мы «подогнали» ее к выборке данных (именно подогнали, поскольку все вероятностные тесты оказываются некорректными из-за неправильно сформулированной нулевой гипотезы).
Некоторые авторы настаивают, что было бы лучше принять противоположный подход. Вместо попыток превратить частную начальную модель в более общую следует, считают они, начинать с общей модели и сводить ее к более частной путем последовательного наложения ограничений (после испытания их корректности).
Конечно, подход «от общего к частному» в принципе более предпочтителен. Проблема заключается в том, что в чистом виде он часто оказывается неприменим. Если размер выборки ограничен, а начальная спецификация включает большое число потенциальных объясняющих переменных, то мультиколлине-арность может вызвать незначимость коэффициентов у большинства из них или даже у всех переменных. Появление этой проблемы особенно реально для моделей на временных рядах. В крайнем случае число переменных может превышать число наблюдений, и оценить параметры модели окажется невозможным вообще. Когда оценка модели возможна, незначимость многих коэффициентов дает исследователю большую свободу в принятии решения о том, какие из переменных удалить. Конечная версия модели может оказаться очень чувствительной к такому произвольному начальному решению. Исключенная переменная с начальным незначимым коэффициентом могла бы иметь значимый коэффициент в сокращенной версии модели, если бы она была там оставлена. Добросовестное систематичное применение принципа «от общего к частному» может потребовать исследования необозримого числа возможных путей упрощения модели. И даже если таких путей окажется немного, исследователь в итоге может остаться с большим числом моделей-конкурентов, ни одна из которых не предпочтительнее других. Этот исход напоминает «отпочковавшуюся» версию случая (4) для невключенных гипотез, который рассматривался в предыдущем разделе.
В итоге некоторый компромисс представляется нормальным явлением, и для него нет никаких правил, кроме принципов формирования исходной концепции модели. Более слабой, но действенной версией рассматриваемого подхода может быть осторожность при включении в исходную спецификацию ограничений, которые заранее имеют шанс быть отвергнутыми. Будет правильным, однако, заметить, что способность делать это свидетельствует об опыте исследователя, и в таком случае весь подход сводится к требованию накопления опыта. Скептики могут сравнить этот подход с развешиванием надписей «ПОДУМАЙ!», которые украшали офисы фирмы IBM в первые дни ее существования, и даже Д. Хендри — один из настойчивых защитников этого подхода — признает, что на практике здесь всегда неизбежна поисковая работа (Hendry, 1979, р. 228, ссылки на работы Дж. Дэвидсона и др. [Davidson, 1978]). Как неформальную поддержку данного подхода, полную занимательных едких замечаний о недостатках построения моделей по принципу «от простого к сложному» и иллюстративных примеров, рекомендуем работу Д. Хендри (Hendry, 1979) (с небольшой оговоркой, что у} — тест на несостоятельность прогноза, используемый в данной работе, теперь широко признан недейственным и, как правило, больше не применяется).
Границы статистических выводов
Предыдущий раздел мог породить ощущение, что несколько технических проблем, иногда даже не до конца понятных, стоят между эконометристом и признанием теории, служащей информационной базой для модели. Если это так, то необходимо сделать поправку: даже если технические проблемы будут разрешены, то останутся другие, более глубокие содержательные проблемы, и эко-нометристу нужно их осознавать для того, чтобы не переоценивать, не недооценивать свой вклад.
В то время когда современная наука находилась еще в колыбели, была широко распространена вера в то, что природа подчиняется набору хорошо определенных законов, и задачей ученого является их обнаружение и доказательство их истинности с помощью искусных экспериментов. Научная деятельность представлялась чем-то вроде альпинизма с достижением абсолютной истины на горной вершине. Проблема этой простой идеи заключается в том, что никогда нельзя доказать абсолютную истинность любой теории. Во-первых, теория всегда строится для описания прошлых фактов, и из этого совсем не следует, что так всегда будет и в будущем. В любой момент это может быть нарушено каким-нибудь новым наблюдением. Во-вторых, достаточно часто случается, что один и тот же набор фактов (при некотором воображении) служит основанием для нескольких различных теорий.
Принимая все это во внимание, необходимо заново сформулировать определения прогресса науки и научного знания. Поскольку теории могут быть приняты лишь условно, то знание — собрание таких теорий — должно восприниматься как условная концепция. Научный прогресс определялся как рамена старых условных теорий новыми, более эффективными, обычно появляющимися, когда новое наблюдение противоречит старой теории. Дальнейший прогресс произойдет, когда эта новая теория в свою очередь также будет заменена. Нужно признать, что «горная вершина» в науке не будет достигнута никогда. Лучшее, что можно делать, — это выбираться постепенно из долины невежества.
К сожалению, даже этот усложненный подход не до конца удовлетворителен. Поскольку нет строгих подходов к доказательству истинности теории, то нет и строгих подходов к доказательству ее ложности. Если теория вдруг стала противоречить результатам новых наблюдений, то защитник этой теории обычно может спасти ее, лишь слегка изменив. Он может сказать, что до этого теория была слишком упрощенной и происшедшие изменения эволюционны. Обладая воображением, всегда можно найти оправдание теории и примирить ее с возникшим противоречием (неважно, насколько неуклюже). Другими словами, нельзя даже определенно утверждать, что мы продвигаемся вверх.
Все это оставляет нас в весьма неуютном положении. Поскольку нет строгих критериев для определения как истинности, так и ложности теории, то как мы можем утверждать, что происходит прогресс науки? И какой смысл на самом деле имеют понятия «наука» и «ученый»?
Одна из школ науковедов утверждает, что ответы на эти вопросы являются в высшей мере субъективными и социально детерминированными и что наука состоит из всего, во что верят, — правильного или неправильного. Они отмечают, что, хотя и нельзя сразу отвергнуть теорию, некоторые теории становятся бесполезными с накоплением слишком большого количества неправдоподобных поправок, необходимых для спасения этих теорий от явно противоречащих им фактов. Согласно такому подходу, научное знание состоит из запаса принятых ранее правдоподобных теорий, а субъективность этого определения заключается в отсутствии абсолютного стандарта правдоподобности. Достаточно любопытно, что в своих рассуждениях о том, что такое знание, науковеды предпочитают брать примеры из естественных наук, а не из поведенческих, где эти проблемы являются гораздо более острыми.
Ученые обычно решают две задачи: наблюдение закономерностей и формулировка гипотез, позволяющих предсказать их. Ученые в естественных науках — может быть, за исключением астрономии — находятся в лучшем положении относительно наблюдений, чем эконометристы. Они, как правило, могут поставить и повторить специально построенный контролируемый эксперимент для обнаружения существования и установления природы закономерности. Эконометристы, напротив, обычно с трудом могут провести какой-либо эксперимент и никогда не могут осуществить контролируемый эксперимент. Вместо этого они должны удовлетвориться ограниченным набором несовершенных данных, и проблемы наблюдения обостряются двумя свойствами экономических моделей. Во-первых, экономические процессы являются, как правило,чрезвычайно сложными, и любая приемлемая теория может быть только их приближением, достаточно часто — весьма грубым.
Хорошая модель упростит наиболее важные анализируемые процессы, содержащиеся в наблюдениях, плохая же модель их просто проигнорирует. Во-вторых, поскольку экономика — поведенческая наука, часто случается, что наиболее важные предпосылки экономической теории берутся из области психологии, и поэтому их трудно или невозможно проверить. Примерами здесь могут служить предпосылки о максимизации прибыли или о максимизации полезности.
В попытке преодолеть все эти трудности эконометристы используют статистический анализ. В лучшем случае, когда эконометрист удачлив и опытен, он достигнет лишь начальной точки исследования с позиции представителя естественных наук. Более вероятно, что туман наблюдений в итоге не рассеется и науковедческие проблемы станут еще более сложными.
Отсюда следует, что если субъективность является принципиальной проблемой в естественных науках, то она еще более важна в экономике. Если вы скажете биохимику, который занят исследованием работы нервной системы, что вопрос о том, добавляет ли это исследование что-нибудь нового в научное знание, полностью субъективен, и выразите сомнение, можно ли вообще биохимика назвать ученым, то он, скорее всего, решит, что вам необходима помощь психиатра. Что касается биохимика, то он знает, что такое наука, в которой он работает, а если вы — нет, то это уже ваша проблема. Наоборот, в поведенческих науках имеются действительно яркие примеры субъективности. Например, в экономике наблюдается существенное разделение между монетаристами, неоклассиками и кейнсианцами, сторонниками экономической теории предложения, неорикардианцами, марксистами и пр., причем каждая из групп имеет свой набор теорий, не зависящих от подхода в эконо-метрическом анализе.
К счастью, наша повседневная жизнь мало зависит от обладания научным знанием, и часто даже от его существования. Фермер, вносящий удобрения, по опыту знает, что это повысит урожай при нормальном поливе и хорошей погоде. Выводы научного исследования о том, как химические соединения из удобрений распространяются в растениях и как они воздействуют на рост клеток, не очень заинтересуют фермера. Все, что ему необходимо, — это рабочее правило, сколько удобрения класть на акр земли для получения наилучших результатов.
В экономике также, к счастью, достаточно много примеров подобных рабочих правил, однако большинство из них касается микроэкономических связей. В макроэкономике до сих пор трудно найти рабочие правила, обладающие существенной прогнозной силой. Поэтому в предвидимом будущем останется огромный простор для субъективности и сосуществования различных школ и направлений.
Цель эконометрика — установить рабочие правила в своей области специализации. Очевидно, что есть предел тому, что может быть продемонстрировано с помощью эконометрики. Известно, что ничего нельзя доказать даже с помощью правильно примененной сложнейшей техники, поскольку другой исследователь всегда сможет по-иному интерпретировать те же самые результаты. Лучшее, что можно сделать, — это показать, что данная теория более правдоподобна, а другая — нет.
Неужели все это обесценивает эконометрический анализ? Конечно, нет. Политик так или иначе должен принимать решения, и если теоретическое совершенство недостижимо, то лучше, если эти решения будут основываться на правдоподобной теории, чем не основываться ни на какой теории вообще.
Обсуждение Введение в эконометрику
Комментарии, рецензии и отзывы