Сущность регрессионного анализа

Сущность регрессионного анализа: Эконометрика : учебное пособие в схемах и таблицах, С. А. Орехов, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В настоящем пособии в схемах и таблицах с комментариями по всем темам курса «Эконометрика» изложены общие теоретические положения, которые подготовлены в соответствии с требованиями Государственного образовательного стандарта высшего профессиональног...

Сущность регрессионного анализа

Регрессионный анализ заключается в определении аналитической формы связи, в которой изменение результативного признака обусловлено влиянием ВАЖНО! )| одного или нескольких факторных признаков, а

множество всех прочих факторов, также оказывающих влияние на результативный признак, принимается за постоянные и средние значения

Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака от факторных признаков.

Основной предпосылкой регрессионного анализа является то, что только результативный признак подчиняется нормальному закону распределения, а факторные признаки — произвольному закону распределения. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным и факторными признаками.

Уравнение регрессии

Уравнение регрессии, или модель связи социально-экономических явлений, выражается функцией

І

ух = /(*,, х2, хк), где к — число факторных признаков

I

Множественная регрессия

(характеризует связь между результативным признаком и двумя и более факторными признаками)

Уравнение адекватно реальному моделируемому явлению или процессу в случае соблюдения требований его построения.

Требования к построению уравнения регрессии

Совокупность исходных данных должна быть однородной и математически описываться непрерывными функциями

Наличие достаточно большого объема исследуемой выборочной совокупности

Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей

Причинно-следственные связи между явлениями и процессами, по возможности, следует описывать линейной (или приводимой к линейной) формой зависимости

Отсутствие количественных ограничений на параметры модели

Количественное выражение факторных признаков

Постоянство территориальной и временной структуры изучаемой совокупности

Теоретическая обоснованность моделей

Теоретическая обоснованность моделей взаимосвязи явлений обеспечивается соблюдением определенных условий.

Форма связи может быть выражена как линейной функцией (уравнение прямой), так и нелинейными функциями (полиномы разных порядков, гипербола, степенная функция и др.).

Подбор функции для выражения формы связи между признаками проходит несколько этапов: графический, логический, экономический, а также математическую проверку близости эмпирических данных к теоретическим.

Часто для выражения формы корреляционной связи подходит одновременно несколько функций, поэтому желательно дать окончательное обоснование выбора функции для выражения формы связи на альтернативной основе.

Наиболее простой с точки зрения понимания, интерпретации и техники расчетов является линейная форма регрессии.

Уравнение линейной парной регрессии

Уравнение линейной парной регрессии

— это )

ух = а0 — а[х1 — є,,

где а0, at — параметры модели;

є/ — случайная величина (величина остатка)

Параметры модели и их содержание

Параметр

Содержание параметра

Свободный коэффициент (член) регрессионного уравнения. Не имеет экономического смысла и показывает значение результативного признака у, если факторный признак х = 0

Коэффициент регрессии показывает, на какую величину в среднем изменится результативный признак у, если переменную х увеличить на единицу измерения. Знак при коэффициенте регрессии показывает направление связи: при а{ > 0 — связь прямая; при а, < 0 — связь обратная

Независимая, нормально распределенная случайная величина, остаток с нулевым математическим ожиданием (Л/ = 0) и постоянной дисперсией (Dr = а2). Отражает тот факт, что изменение у будет неточно описываться изменением х, так как присутствуют другие факторы, не учтенные в данной модели

Оиенка параметров модели а() и а1 осуществляется методом наименьших квадратов. Сущность метода наименьших квадратов заключается в том, что отыскиваются такие значения параметров модели (о0 и о,), при которых сумма квадратов отклонений фактических значений результативного признака уі от вычисленных по уравнению регрессии у, будет наименьшей из всех возможных:

X (у і у і) = L (уі -а"" fli х< У -*min •

Система нормальных уравнений для нахождения параметра линейной парной регрессии методом наименьших квадратов

Система

нормальных

уравнении

/--і (=i

І! П П

i=i /.=i /.-.і

Формулы для определения значения параметров я0 и а1

Расчет

г

параметров

i::J-T ; a0 = у atx

Параметр а, нельзя использовать для непосредственной оценки влияния факторного признака па результативный признак из-за различия единиц измерения исследуемых показателей. Для этих целей вычисляют коэффициент эластичности и бета-коэффициент.

Формула определения коэффициента эластичности

Подпись:

Коэффициент эластичности

ВЖНО'

Коэффициент эластичности показывает, на сколько процентов изменяется результативный признак v при изменении факторного признака х на олин процент

Формула определения бета-козффициента

Бета' коэффициент

где а и аг — средние кнадратическис отклонения случайных величин х и v

ВАЖНО!

Бета-коэффициент показывает, на какую часть своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину своего среднего квадратического отклонения

Проверка адекватности и точности уравнения регресии

После того как уравнение регрессии построено, выполняется проверка его адекватности и точности. Эти свойства модели исследуются на основе анализа ряда остатков е (отклонений расчетных значений от фактических).

Уровень ряда остатков

1=>

^ = У, ~ Уіv' = 2, п)

Корреляционный и регрессионный анализ (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объему совокупности. В связи с этим показатели регрессии, корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенной модели.

Проверка адекватности модели

Определение значимости модели

Установление наличия или отсутствия систематической ошибки

Значения уг соответствующие данным х при теоретических значениях о„ и аг случайные. Случайными будут и рассчитанные по ним значения коэффициентов а() и аг

Проверка значимости отдельных коэффициентов регрессии проводится по t-критерию Стьюдента путем проверки гипотезы о равенстве нулю каждого коэффициента регрессии. При этом выясняют, насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатом действия случайных величин. Для соответствующих коэффициентов регрессии применяют соответствующие формулы.

"I

Формулы для определения /-критерия Стьюдента

Расчетные значения /-критерия сравнивают с табличным значением критерия /ц„, которое определяется при (п к — 1) степенях свободы и соответствующем уровне значимости а.

Если расчетное значение /-критерия превосходит его табличное значение /,,, то параметр признается значимым. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями

Для проверки значимости уравнения регрессии в целом используют F-кршперий Фишера. В случае парной линейной регрессии значимость модели регрессии определяется по следующей формуле:

Формула определения ^-критерия Фишера

= -г^т-(л-*-0

1 Гп

Если при заданном уровне значимости расчетное значение F-критерия с у = А, у, = п — А — 1 степенями свободы больше табличного, то модель считается значимой, гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность

Проверка наличия или отсутствия систематической ошибки (выполнения предпосылок метода наименьших квадратов — МНК) осуществляется на основе анализа ряда остатков.

— Требования, при которых модель считается адекватной

 

Уровни ряда остатков имеют случайный характер

 

Математическое ожидание уровней ряда остатков равно нулю

Дисперсия кажтого отклонении Т:. одинакова дія всех значений х{

" ►

Значения уровней ряда остатков независимы друг от друга (отстутствует автокорреляция)

Уровни ряда остатков распределены по нормальному закону

^

 

Соблюдение требований, которым должен удовлетворять ряд остатков

Подпись: аниеТребов:

Метод проверки требований

Первое

Для проверки свойства случайности ряда остатков можно использовать критерий поворотных точек (пиков). Точка считается поворотной, если выполняются следующие условия:

< є, > е.

или єм > е, < е.+1.

Далее подсчитывается число поворотных точек р.

Критерием случайности с 5\%-ным уровнем значимости, т.е. с доверительной вероятностью 95\%, является выполнение неравенства:

Р >

(п -2) -1,96,

16я 29

90

Квадратные скобки означают, что берется целая часть числа, заключенного в скобки.

Если неравенство выполняется, то модель считается адекватной

Второе

Для проверки равенства математического ожидания остаточной последовательности нулю вычисляется среднее значение ряда остатков:

Если є = 0, то считается, что модель не содержит постоянной систематической ошибки и адекватна по критерию нулевого среднего.

Если є *■ 0, то проверяется нулевая гипотеза о равенстве нулю математического ожидания. Для этого вычисляют /-критерий Стьюдента по формуле:

0

где S — стандартное отклонение остатков модели (стандартная ошибка).

Значение /-критерий сравнивают с табличным /ц . Если выполняется неравенство / > / , то модель неадекватна по данному критерию

Индекс

корреляции

(корреля-

ционное

отношение)

я 1

S— сумма квадратов отклонений, объясненная регрессией. Определяется по формуле:

5-2 =

и-]

5; — остаточная сумма квадратов отклонений. Вычисляется по формуле:

и 1

Уравнение .У2 = 5"j + 52 можно представить следующим образом:

Подпись: Индекс корреляции принимает значение от 0 до I. Чем выше значение индекса, тем ближе расчетные значения результативного признака к фактическим. Индекс корреляции используется при любой форме связи переменных; при парной линейной регрессии он равен парному коэффициенту корреляции

В качестве меры точности модели применяют точностные характеристики.

Определение меры точности модели

Точностные характеристики

Расчет и содержание характеристики

Максимальная ошибка

Соответствует максимальному отклонению расчетных значений от фактических

Средняя

абсолютная

ошибка

1 А.

«**■ = -2>.1-

" 1=1

Ошибка показывает, насколько в среднем отклоняются фактические значении от модели

Дисперсия ряда остатков (остаточная дисперсия)

5;='='

и1

где £ — среднее значение ряда остатков. Определяется по формуле:

Средняя квадратиче-ская ошибка

Представляет собой корень квадратный из дисперсии:

ІІ>.-*)2

s = -—1—■

1 п 1

Чем меньше значение ошибки, тем точнее модель

Если модель регрессии признана адекватной, а параметры модели значимы, то переходят к построению прогноза.

Прогнозируемое значение переменной у получается при подстановке в уравнение регрессии ожидаемой величины независимой переменной х

Прогнозируемое значение переменной у и доверительные интервалы прогноза

Прогнозируемое значение переменной у

Данный прогноз называется точечным. Вероятность реализации точечного прогноза практически равна нулю, поэтому рассчитывается доверительный интервал прогноза с большой надежностью.

Доверительные интервалы прогноза зависят от стандартной ошибки, удаления -V и от своего среднего значения х, количества наблюдений п и уровня значимости прогноза а.

Доверительные

интервалы

прогноза

" V (х,

2>

4

и(к)

где определяется по таблице распределения Сгьюденіа для уровня значимось и с/ и числа аепеней свободы у = п к 1

Нелинейные модели и их линеаризация

Соотношение между социально-экономическими явлениями и процессами далеко не всегда можно выразить линейными функциями. Так, нелинейными оказываются производственные функции (зависимости между объемом произведенной продукции и основными факторами производства — трудом, капиталом и т.д.), функции спроса (зависимость между спросом на товары, услуги и их ценами или доходом) и др.

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.

Нелинейность может проявляться как относительно переменных, так и относительно входящих в функцию коэффициентов (параметров).

Различают два класса нелинейных регрессий.

Классы нелинейных регрессий

Регрессии, нелинейные по переменным, включенным в анализ, но линейные по оцениваемым параметрам (различные полиномы, гипербола)

Регрессии, нелинейные по оцениваемым параметрам (степенная, показательная, экспоненциальная функции)

Для оценки параметров нелинейных моделей используют два подхода.

Первый подход основан на линеаризации модели и заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными.

Второй подход обычно применяют в случаях, когда подобрать соответствующее линеаризующее преобразование не удается. Тогда используют методы нелинейной оптимизации на основе исходных переменных.

Применяемые чаще всего в экономическом анализе виды Нелинейных регрессий следующие: полином второго порядка, гипербола, степенная функция и показательная функция.

Оценка параметров нелинейной регрессии по переменным, включенным в анализ, но линейным по оцениваемым параметрам, проводится с помощью МНК путем решения нормальных уравнений.

Регрессии, нелинейные по переменным, но линейные по оцениваемым параметрам

Наименование регрессии

Уравнение регрессии

Нормальные уравнения

Полином

второго

порядка

у = щ + + а-,х;

»"о + 1| X Х: + al X Xi = X >'<;

;=! / = 1 Ы

и п П /1

1о X х> + ЙХ ХІ + агХ Х: = X хг

1=1 1-1 /=1 1-І

/7 /1 Л /1

«оХ х< + °i X Л'< + °гХ xt = X

і=і /-і /.л i-i

Гипербола

1

У у = йо + а —

паг, +fl,X— = Х>''; 1-і х; ;=1

«<Х7 + аХтл = І7-

Или заменим /х на новую переменную X. В результате получим линейное уравнение:

у = а0 + ахХ.

Параметры определяются из следующих формул:

ух-у-х _ v fli = —- , _.і 'ап У ахХ

Xі-(ху

Линеаризация регрессий, нелинейных по оцениваемым параметрам

Наименование регрессии

Уравнение регрессии

Линеаризация

Степенная

функция

Для определения параметров степенной функции с помощью МНК необходимо привести се к линейному виду путем логарифмирования обеих частей уравнения:

In у = In fl0 + о. In xr

Это уравнение представляет собой прямую линию на графике, по осям которого откладываются не сами числа, а их логарифмы (так называемая логарифмическая шкала или логарифмическая сетка).

Пусть У In >'v, Х = lnx, А = 1гш0.

Тогда уравнение примет вид

У = А + 0]Х.

Параметры модели определяются по следующим формулам:

УХ — УХ . Г7 Т}

а, -= г; А = Y а, X

x>-(xf

Показательная функция

у>,=а0-а?

Линеаризацию переменных проведем путем логарифмирования обеих частей уравнения:

In ух = In au + х, In я,.

Уравнение изображается прямой линией на полулогарифмической сетке, которая получается как сочетание натуральной шкалы для значений независимой переменной х и логарифмической шкалы — для значений зависимой переменной у.

Пусть У In у,, А = 1па(1, В= 1паг Тогда уравнение примет вид

Y= А + Вх.

При использовании любой формы криволинейной корреляционной зависимости теснота связи между переменными может быть измерена с помощью индекса корреляции, который определяется аналогично коэффициенту корреляции для линейной формы связи.

Уравнение корреляционной связи должно быть по возможности более простым, чтобы сущность изучаемой зависимости между переменными проявлялась достаточно четко, а параметры уравнения поддавались определенному экономическому толкованию. Вопрос выбора соответствующего уравнения связи решается в каждом случае отдельно.

Пример. Имеются следующие выборочные данные — выборка 20\% случайная бесповторная (табл. А).

Таблица А

Необходимо построить уравнение регрессии, оценить его адекватность и точность, сделать выводы.

Решение. Для определения тесноты связи между признаками и построения уравнения сформируем табл. Б.

1. Теснота связи между признаками определяется по формуле

X (*,■ Щу, у)

J2>,-3f)2X07-j)2

Средние значения факторного и результативного признаков равны

Подпись: 2>,

3395 (руб.);

5>

54 321 16

У

32 825

2052 (руб.).

п 16

Парный коэффициент корреляции равен 2 590 08

= 0,706.

л/4 070 771-3 299 601

Величина коэффициента корреляции свидетельствует о тесной связи между среднедушевым денежным доходом и средне-Душевым оборотом розничной торговли.

Парный коэффициент детерминации (г,; = 0,498) показывает, что на 49,8\% изменение оборота розничной торговли объясняется изменениями денежных доходов населения.

Значимость коэффициента корреляции проверяется с помощью /-критерия Стьюдента по формуле

Табличное значение /-критерия Стьюдента при доверительной вероятности 0.95 и числе степеней свободы у = (« — к — 1) = 14 составляет 2,14.

Так как t > /тай1, значение коэффициента корреляции признается значимым и делается вывод о том, что между среднедушевым денежным доходом и среднедушевым оборотом розничной торговли есть тесная статистическая взаимосвязь.

Уравнение парной линейной регрессии имеет вид

Параметры модели определим по формулам

п

*UW) 2 590 081

й|= л = 4 07о77Га636'

о„ = у я,х = 2052 0,636 ■ 3395 = -108,59.

Коэффициент регрессии а1 = 0,636 показывает, что е увеличением среднедушевого денежного дохода на 1 руб. среднедушевой розничный оборот возрастает на 63,6 коп.

Уравнение парной регрессии имеет вид

v = -108.59 + 0,636*,..

Подставляя в полученное уравнение регрессии значения х, можно определить условные средние (расчетные) значения уг

Проверка адекватности (значимости) модели осуществляется на основе анализа ряда остатков е. (отклонений расчетных значений у от фактических у). Расчеты приведены в табл. В.

Значимость параметров модели оценивается с помощью г-кри-терия Стьюдента по формулам

а,

•расчЯ(| ,-, > 'расчв| г-«О

где S , Sa] — стандартные отклонения свободного члена и коэффициента регрессии.

Они определяются по формулам

1-І

Стандартное отклонение остатков модели (стандартная ошибка) определяется по формуле

¥

~n-k-l

14

652 180

34153.

Значения стандартных отклонений следующие:

SaQ . 343,53J-^i^61-= 584,41; S0 =^53 = 0,17.

ао Л/16 4 070 771 01 2017,6

Расчетные значения /-критерия равны:

, =d^=_01a,, = М^=374

Табличное значение /-критерия с у — (и — к 1) = 14 степенями свободы при доверительной вероятности 0,95 (а = 0,05) равно 2,14.

Значит, имеются следующие результаты:

< ?габл => параметр а0 незначим; параметр а значим.

Для проверки значимости уравнения регрессии в целом используется Г-критерий Фишера:

Подпись: Fрасч

1 г;

■ (и-*-!)=--

0,498 1-0,498

14= 13,89.

Табличное значение /•'-критерия с у, = к = 1 и у, = п — к — 1 = = 14 степенями свободы при доверительной вероятности 0,95 (а = 0,05) равно 4,60.

Так как F > Fn6:t, уравнение парной линейной регрессии с вероятностью 0,95 в целом статистически значимое.

4. Проверка выполнения предпосылок МНК (на основе результатов табл. Б).

4.1. Проверка свойства случайности ряда остатков.

Число поворотных точек {р) равно 8.

Критерием случайности с 5\%-ным уровнем значимости, т.е. с доверительной вероятностью 95\%, является выполнение неравенства

Р >

|(Я-2)-l,96jl^

3V V 90

З V 90

= [6,22] = 6;

Неравенство выполняется (8 > 6), следовательно, модель может быть признана адекватной по критерию случайности.

Эконометрика : учебное пособие в схемах и таблицах

Эконометрика : учебное пособие в схемах и таблицах

Обсуждение Эконометрика : учебное пособие в схемах и таблицах

Комментарии, рецензии и отзывы

Сущность регрессионного анализа: Эконометрика : учебное пособие в схемах и таблицах, С. А. Орехов, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В настоящем пособии в схемах и таблицах с комментариями по всем темам курса «Эконометрика» изложены общие теоретические положения, которые подготовлены в соответствии с требованиями Государственного образовательного стандарта высшего профессиональног...