15.4. дисперсионный анализ
15.4. дисперсионный анализ
Дисперсионный анализ является одним из методов статистической обработки наблюдений и служит для оценки влияния на наблюдаемую величину различных факторных признаков.
418
Пусть производится п измерений случайной величины у. Каждое измерение у. (j = 1, 2,и) зависит от некоторого числа параметров Ху, которые могут принимать или дискретные, или непрерывные значения. Эту зависимость обычно представляют в виде линейной комбинации параметров х~ с коэффициентами рг.:
У і=Pi*v + Р2*2/+ + РЛу+ег <15-21)
где е. — случайная ошибка измерения.
Величины Рр Р2, Рот называются факторами. Уравнение (15.21) называется линейной многофакторной моделью.
Параметры х.. в дисперсионном анализе обычно принимают равными нулю или единице, что указывает на то, какие из факторов учитываются при таком анализе.
Для оценки влияния факторных признаков Xj. на наблюдаемую величину у. (результативный признак) значения этой величины разбивают на несколько уровней, соответствующих определенному значению факторного признака.
Пусть, например, наблюдаются значения производительности труда на разных предприятиях. Требуется оценить влияние концентрации производства на производительность. По признаку концентрации производства предприятия можно разделить на следующие уровни (группы): мелкие, средние и крупные. В каждый из уровней будут входить предприятия с некоторыми конкретно наблюдаемыми значениями производительности. В этом случае наблюдаемые значения записывают с двумя индексами: у^, где г — номер уровня,./ — номер измерения на каждом уровне. В данном случае г = 1, 2, 3. В общем случае г = 1, 2,р, гдер — число уровней.
Для однофакторного дисперсионного анализа наблюдаемые значения можно представить в виде
У» = $г + е4 (r= l> 2> ->P'>J= Ь 2> °), где Рг — среднее значение наблюдаемой величины на уровне г. Находят групповые (уровневые) средние:
419
Среднее всех наблюдаемых значений определяют по формуле
Р ч
XX>v
р = ^—.
ЯР
Далее находят факторную дисперсию и остаточную дисперсию:
ІЖ-Р)2
Р-1
2
вф =r=l. , ,
Р 9
^"^т; (^ = М). (15.23)
N р
Для проверки гипотезы о влиянии фактора используется критерий Фишера. Составляют отношение FH = которое характеризует
влияние факторного признака. Чем больше влияние факторного признака на результативный, тем больше значение F .
В знаменателях выражений (15.22) и (15.23) находятся значения чисел степеней свободы k1=p-l, k2 = N-p.
Например, для уровня значимости, равного 0,05, и значений кх = 2, к2= 10 значение F =4,1 (см. Приложение 5). Пусть в результате расчетов с использованием выражений (15.22) и (15.23) получено значение FH, равное 3,2. А так как 3,2 < 4,1, то только с вероятностью не выше чем 0,05 случайные значения величины F будут превосходить расчетное значение. Следовательно, с малой вероятностью факторный признак будет оказывать влияние на результативный признак, и это влияние можно не учитывать.
Обсуждение Справочник по математике для экономистов
Комментарии, рецензии и отзывы