3.2. линейная парная регрессия
3.2. линейная парная регрессия
Рассмотрим в качестве примера зависимость между сменной добычей угля на одного рабочего Y(t) и мощностью пласта Дм) по следующим (условным) данным, характеризующим процесс добычи угля в п = 10 шахтах.
Изобразим полученную зависимость графически точками координатной плоскости (рис. 3.1). Такое изображение статистической зависимости называется полем корреляции.
S = £(&-Уі)2 = Z(*o -Л)' -> min . (3.4)
Следует отметить, что для оценки параметров и Ь возможны и другие подходы. Так, например, согласно методу наименьших модулей следует минимизировать сумму абсолютных
п
величин отклонений 21-й ".У/1* Однако метод наименьших
/=і
квадратов существенно проще при проведении вычислительной
процедуры и дает, как мы увидим далее, хорошие по статистическим свойствам оценки. Этим и объясняется его широкое применение в статистическом анализе.
На основании необходимого условия экстремума функции двух переменных S=S(bo, b) (3.4) приравниваем к нулю ее частные производные, т. е.
^ = 22(АЬ+М/-Л) = 0;
^ = 2]Г(бо + bxxt-Уі)хі=09 ,obx ых
откуда после преобразований получим систему нормальных уравнений для определения параметров линейной регрессии:
/=і
(3.5)
, /=і /=і /=і
Теперь, разделив обе части уравнений (3.5) на я, получим систему нормальных уравнений в виде:
(3.6)
(b0+bxx = y;
[b0x + Ьгх2 = ху, где соответствующие средние определяются по формулам:
i=j
(3.7)
ху
(3.9)
2>?
(3.8)
xі = -^L
Подставляя значение
Ь0 = у-Ъхх
из первого уравнения системы (3.6) в уравнение регрессии (3.3), получим
у = y-bxx + bxx,
или
у у Ъх (х jc). (3.12)
х = 94/10 = 9,4 (м); у = 68/10=6,8 (т); s2x = 908/109,42= 2,44; Cdv(X, Y) = 664/10 9,4 • 6,8 = 2,48; Ьх =2,48/2,44= 1,016. Итак, уравнение регрессии Y по X:
j>-6,8 = 1,016(jc-9,4) или j> = 2,75 +1,06х.
Из полученного уравнения регрессии (см. рис. 3.1) следует, что при увеличении мощности пласта X на 1 м добыча угля на одного рабочего Y увеличивается в среднем на 1,016 т (в усл. ед.) (отметим, что свободный член в данном уравнении регрессии не имеет реального смысла). ►
Замечание. Значения переменных xt и у-г могут быть измерены в отклонениях от средних значений, т. е. как х = Xj х, у у і у . Начало координат при этом переместится в точку (Зс, у), а линией регрессии будет та же прямая на плоскости, что и для исходных данных х/, yt. Следовательно, х = 0, у' = 0, и уравнение регрессии (3.12) в отклонениях примет вид
Л Г if
У =о]х ,
а формула (3.13) того же коэффициента регрессии Ь упростится:
ху
1*У
/=1
П
(3.16)
ибо
х'у' =
Zx'y'i
In,
'2 _
(п
2>'2
i=] J
In.
Обсуждение Эконометрика
Комментарии, рецензии и отзывы