Тема 2 парная регрессия и корреляция план лекции
Тема 2 парная регрессия и корреляция план лекции
Статистическая зависимость (независимость) случайных переменных.
Анализ линейной статистической связи экономических данных.
Нелинейные модели и их линеаризации.
Экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. Эти признаки изменяются (варьируются) во времени и пространстве. Нередко изменения признаков взаимозависимы и взаимообусловлены. В одних случаях связь (зависимость) между признаками оказывается очень тесной (например, часовая выработка и заработная плата), а в других случаях связь между признаками вовсе не обнаруживается или выражается очень слабо (например, пол студентов и их успеваемость). Чем теснее связь между признаками, тем точнее принимаемые решения и легче управление системами.
Среди многих форм связей явлений важнейшую роль играет причинная, определяющая все другие формы. Сущность причинности состоит в порождении одного явления другим. В любой конкретной связи одни признаки выступают в качестве факторов, воздействующих на другие и обусловливающие их изменение, другие — в качестве результатов действия этих факторов. Иными словами, одни представляют собой причину, другие — следствие. Признаки, характеризующие следствие, называются результативными (зависимыми, объясняемыми переменными у), признаки, характеризующие причины — факторными (независимыми, объясняющими переменными х).
Различают два типа зависимости между явлениями и их признаками: функциональную, или жестко детерминированную (на-
пример, зависимость выработки продукции на одного рабочего от объема выпушенной продукции и численности рабочих), и статистическую, или стохастически детерминированную (например, зависимость между производительностью труда и себестоимостью единицы продукции).
Понятие функциональной и статистической зависимости
Функцио- | |
налышя | — это |
зависимость |
связь, при которой каждому значению независимой переменной х соответствует точно определенное значение зависимой переменной у
Функциональная зависимость чаще всего встречается в естественных науках. Реже подобные связи наблюдаются в общественной жизни, в частности в экономических процессах.
Для социально-экономических явлений характерно то, что наряду с существенными факторами на них оказывают воздействие многие другие, в том числе случайные факторы. В связи с этим существующая зависимость не проявляется здесь в каждом отдельном случае, как при функциональных связях, а лишь «в общем и среднем» при большом числе наблюдений. В этом случае говорят о статистической зависимости.
Статис- | |
тическая | — это |
зависимость |
связь, при которой каждому значению независимой переменной х соответствует множество значений зависимой переменной у, причем неизвестно заранее, какое именно значение примет у
Частным случаем статистической зависимости является корреляционная зависимость.
Корреля- | 1 |
ционная | — это |
зависимость |
связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у
Корреляционная связь является «неполной» зависимостью, которая проявляется не в каждом отдельном случае, а только в средних величинах при достаточно большом числе случаев.
Известно, например, что повышение квалификации работника ведет к росту производительности труда. Это положение подтверждается в массе явлений и не означает, что у двух или более рабочих одного разряда, занятых ан&чогичным процессом, будет одинаковая производительность труда. Уровни их выработки будут различаться, хотя и незначительно, так как у этих рабочих могут быть различными стаж работы, техническое состояние станка, состояние здоровья и т.д.
Из этого следует, что статистическая зависимость — свойство совокупности в целом, а не отдельных ее единиц.
Особенности зависимости
£
£
Функциона.шшя
Корреляционная
Всегда выражается формулами, что в большей степени присуще точным наукам (математике, физике) С одинаковой силой проявляется у всех единиц совокупности Является полной и точной, так как обычно известен перечень всех факторов и механизм их воздействия на переменную в виде уравнения
Разнообразие факторов, их взаимосвязи и противоречивые действия вызвают широкое варьирование переменной у Обнаруживается не в единичных случаях, а в массе и требует для своего исследования массовых наблюдений Связь между переменными х и у неполная и проявляется лишь в средних величинах
Виды функциональной и корреляционной зависимости
Функциональная и корреляционная связь в зависимости от направления действия бывает прямая и обратная.
Функциональная и корреляционная зависимость
£
Прямая
£
£
С увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака
С увеличением (уменьшением) значений факторного признака происходит уменьшение (увеличение) результативного признака
По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной).
Функциональная и корреляционная зависимость | |||
Прямолинейная | Криволинейная | ||
* < | |||
С возрастанием величины факторного признака происходит равномерное возрастание (или убывание) величин результативного признака (выражаются уравнением прямой линии) | С возрастанием величины факторного признака возрастание (или убывание) результативного признака происходит неравномерно (выражаются уравнениями кривых линий) |
В зависимости от количества признаков, включенных в модель, корреляционные связи делят на однофакторные и многофакторные.
Корреляционные связи | ||
V | ||
Однофакторные (парные) | Многофакторные (множественные) | |
V | ||
Связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других) | Связь между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи) |
Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализа.
Корреляционно-регрессионный анализ
Корреляционно-регрессионный анализ проводится поэтапно в определенной логической последовательности.
'Этапы проведения комплексного корреляционно-регрессионного анализа
J
Предварительный анализ явлений и выявление причин возникновения взаимосвязей между признаками, характеризующими эти
явления
*
Разделение признаков на факторные и результативные, выбор наиболее существенных признаков для их исследования на предмет включения в корреляционно-регрессионные модели
I
Построение матрицы коэффициентов парной корреляции и оценка возможных вариантов группировки признаков корреляционно-регрессионных моделей
Предварительная оценка формы уравнения регрессии
I
Решение уравнения регрессии, вычисление коэффициентов регрессии и их смысловая интерпретация
I
Расчет теоретически ожидаемых (воспроизведенных по уравнению регрессии) значений результативного признака
Определение и сравнительный анализ дисперсий: обшей, факторной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель
Общая оценка качества модели, отсев несущественных (или включение дополнительных) факторов, построение модели, т.е. повторение п. 1—7
I
Статистическая оценка достоверности параметров уравнения регрессии, построение доверительных границ для теоретически ожидаемых по уравнению регрессии значений функции
10. Практические выводы из анализа
Наиболее разработанной в эконометрике является методология парной линейной корреляции, рассматривающая влияние вариации переменной х на переменную у и представляющая собой однофакторный корреляционный и регрессионный анализ.
Понятие корреляционного анализа
раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами. Применяется тогда, когда данные наблюдений можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону
Корреляционный анализ заключается в количественном определении тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи)
Понятие корреляции
Корреляция
статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой
Варианты корреляции
Теснота связи количественно выражается величиной коэффициентов корреляции. Построение коэффициентов корреляции основано на сумме произведений отклонений индивидуальных значений признаков х и у: от их средних значений х и у:
х)(Уі ?)уЭта величина, деленная на число единиц совокупности п, называется ковариацией. Она характеризует сопряженность вариации двух признаков и представляет собой статистическую меру взаимодействия двух случайных переменных.
Формула определения ковариации
Х(х,-х)(у,у)
cov(_y, х) = — ,
п
где п — объем исследуемой совокупности; х. — /-е значение независимой переменной (;' = 1, 2, я); yt — г'-е значение зависимой переменной = 1, 2, .... и);
х — среднее значение независимой переменной. Определяется по формуле
у — среднее значение зависимой переменной. Определяется по формуле
_ 1 "
При наличии прямой связи большие значения х должны сочетаться с большими значениями у, следовательно, отклонения (х,х) и (у; у) будут положительными.
Для малых значений х и у эти отклонения будут отрицательными, а их произведения — положительными. Значит, при прямой связи ковариация будет величиной положительной.
При наличии обратной связи отклонения (х, х) и (у, у) будут иметь разные знаки (большие значения х сочетаются с меньшими значениями у и наоборот). Ковариация будет отрицательной величиной.
Наконец, при отсутствии связи сочетание знаков отклонений (х, х) и (уі у) будет беспорядочным, при суммировании отрицательные и положительные произведения (х, х) и (уі у) будут взаимно погашаться и ковариация будет близка к нулю.
Размер ковариации зависит от масштаба признаков х и у. Для получения относительной характеристики связи ковариа-цию делят на максимально возможное значение, равное произведению средних квадратических отклонений двух признаков ах, ау. В результате получают линейный коэффициент корреляции.
Формула линейного коэффициента корреляции
_ cov(y, х) _ f-[
Линейный | |
коэффициент | |
корреляции |
где о,, о — средние квадратические отклонения случайных величин хну.
Определяются по формулам
low)2
Для расчета линейного (парного) коэффициента корреляции можно воспользоваться также следующими формулами:
1)
•ух
*х<*у
ху X ■ у
где ху — средняя арифметическая произведения двух величин.
Определяется по формуле
] "
3)
ВАЖНО!
Коэффициент корреляции принимает значение от — 1 до +1. Положительное значение коэффициента свидетельствует о наличии прямой связи, отрицательное — обратной. Если г = + 1, корреляционная связь представляется линейной функциональной зависимостью. При г = 0 линейная корреляционная связь отсутствует
Коэффициенты корреляции как статистические величины подвергаются в анализе оценке на достоверность. Это объясняется тем, что любая совокупность наблюдений представляет собой некоторую выборку, следовательно, значение любого показателя, вычисленное на основе выборки, не может рассматриваться как истинное, а является только более или менее точной его оценкой. В связи с этим возникает необходимость проверки существенности (значимости) показателей.
Для оценки значимости коэффициента корреляции используют t-критерий Стьюдента (1-статистику), который применяется при /-распределении, отличном от нормального. При этом выдвигается и проверяется нулевая гипотеза (Н{)) о равенстве rv нулю, т.е. Hf) : rvx = 0. Если нулевая гипотеза отвергается, то коэффициент корреляции признается значимым, а связь между переменными существенной.
Формула расчета ^-критерия Стьюдента
(-критерий | і |
Стьюдента | |
(1-статис- | |
тша) |
In-к-]
где к — число факторных признаков, включенных в модель
Значение /-критерия сравнивают с табличным /и.,, где а — заданный уровень значимости (обычно принимается равным 0,05 или 0,01); у = (п — к — 1) — число степеней свободы.
Если выполняется неравенство / > ta , то значение коэффициента корреляции признается значимым, . т.е. нулевая гипотеза, утверждающая равенство ВАЖНО! у| нулю коэффициента корреляции, отвергается и делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь
Зная линейный коэффициент корреляции, можно определить парный коэффициент детерминации, он представляет собой .
Парный коэффициент детерминации
'ух
$1
показывает, какая доля вариации переменной у учтена в модели и обусловлена влиянием на нее переменной х
Обсуждение Эконометрика : учебное пособие в схемах и таблицах
Комментарии, рецензии и отзывы