4.4.2. регрессионный анализ
4.4.2. регрессионный анализ
Регрессионный анализ — это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется результативный (зависимый) показатель у при изменении любого из независимых показателей (факторов) х,-, и имеет вид: у =f(x,, х2, ..., х„),
где у ~ зависимая переменная (следствие); х, — независимая переменная (фактор).
Если зависимая переменная одна, имеет место простой регрессионный анализ. Если же их несколько, т.е. п > 2, такой анализ называется многофакторным.
В ходе регрессионного анализа решаются две основные задачи:
построение уравнения регрессии, т. е. нахождение вида зависимости между результатным показателем и независимыми факторами
X/, х2 хп ;
оценка значимости полученного уравнения, т. е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.
Применяется регрессионный анализ главным образом для прогнозирования, планирования, а также для разработки нормативной базы.
В отличие от корреляционного анализа, который только отвечает на вопрос, существует ли связь между анализируемыми признаками, регрессионный анализ дает и ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный — причинно-следственную зависимость, т.е. одностороннюю, показывающую, каким образом изменение факторных признаков влияет на признак результативный.
Регрессионный анализ — один из наиболее разработанных методов математической статистики. Строго говоря, для реализации регрессионного анализа необходимо выполнение ряда специальных требований (в частности, хі,Х2,...х№ у должны быть независимыми, нормально распределенными случайными величинами с постоянными дисперсиями). В реальной жизни строгое соответствие требованиям регрессионного и корреляционного анализа встречается очень редко, однако оба эти метода весьма распространены в экономических исследованиях.
Зависимости в экономике могут быть не только прямыми, но и обратными, и нелинейными. Регрессионная модель может быть построена при наличии любой зависимости, однако в многофакторном анализе чаще всего используют линейные модели вида.
у = а0 + + а2х2 +... + апх„ Построение уравнения регрессии осуществляется, как правило, методом наименьших квадратов, суть которого состоит в минимизации суммы квадратов отклонений фактических значений результатного признака от его расчетных значений, т.е.: где т — число наблюдений,
У =а0+а}х{ +а2х{+—+а„х'„ — расчетное значение результатного показателя.
Уравнения регрессии легко строятся с помощью персонального компьютера или специализированного финансового калькулятора. При отсутствии технических средств коэффициенты регрессии для простейшего случая — однофакторного линейного уравнения регрессии вида у = а + Ьх — можно найти по формулам:
т т
т
X У} ь1 х> Iх j X Уі "X *іУ}
а=м м , ь = і={ м м ■
( * *
пЪх)~ Х-*,-
/=1
ч"1 /
После построения уравнения регрессии необходимо сделать проверку его значимости: с помощью специальных критериев установить, не является ли полученная зависимость, выраженная уравнением регрессии, случайной, т.е. можно ли ее использовать в прогнозных целях и для факторного анализа. В статистике разработаны методики строгой проверки значимости коэффициентов регрессии с помощью дисперсионного анализа и расчета специальных критериев (например, ґ-критерия). Нестрогая проверка может быть выполнена путем расчета среднего относительного линейного отклонения (є), называемого средней ошибкой аппроксимации:
л*-і Ук
где ук — к-е фактическое значение результативного показателя;
ук — выравненное, т.е. рассчитанное по уравнению регрессии, fc-e значение результативного показателя.
Модель считается адекватной, т.е. пригодной для практического использования, если средняя ошибка аппроксимации не превосходит 15\%.
Распространенность линейных моделей объясняется относительной легкостью их интерпретации.
Уравнение регрессии может быть представлено двумя способами:
а) в натуральном масштабе:
у = а0+а,х] + а2хг+... + аяхп ; (4.14)
б) в стандартизованном масштабе:
/0 = /V'1+pV'2+«.+pVv (4-15)
В первом случае факторы входят в модель в виде исходных показателей, имеющих собственные единицы измерения; во втором случае они представлены в модели в виде относительных показателей, имеющих одинаковую размерность.
Факторы и коэффициенты регрессии в приведенных представлениях (4.14) и (4.15) связаны между собой с помощью соответствующих средних и дисперсий следующими соотношениями:
Коэффициент множественной корреляции можно найти через коэффициенты парной корреляции между факторами и результативным показателем и бета-коэффициенты по формуле
«2=pVr0l+... + A,-rte.
Интерпретация коэффициентов и статистик: Оо — как правило, не интерпретируется;
коэффициент регрессии ак выражает средний прирост результативного показателя, обусловленный приростом факторного признака Хк на единицу (имеются в виду единицы измерения, в которых измерены показатели в модели);
квадрат коэффициента множественной корреляции (D = R1) называется коэффициентом детерминации и характеризует долю вариации зависимой переменной у, которая объясняется действием включенных в модель факторных признаков (например, D = 0,64 означает, что 64\% вариации объясняется включенными в модель факторами, а 36\% — другими причинами, т.е. факторами, не представленными в модели);
бета-коэффициент характеризует степень влияния вариации соответствующего фактора на вариацию результативного показателя; он является относительным показателем, и его абсолютное значение не превосходит единицу.
В анализе активно применяется коэффициент эластичности, показывающий, на сколько процентов изменяется в среднем результативный показатель у при изменении фактора хь на один процент, и рассчитываемый по формуле
Хк
у
Коэффициенты регрессии в (4.14) несопоставимы между собой, а ^-коэффициенты уже сопоставимы. Поэтому для аналитика именно стандартизованное представление уравнения регрессии имеет особую значимость, поскольку позволяет дать сравнительную характеристику значимости факторов: чем больше значение ^-коэффициента, тем более существен фактор с позиции влияния его на результативный показатель. Бета-коэффициенты могут использоваться для установления нормативов, разработки весовых коэффициентов при конструировании различных сложных аналитических показателей (например, уровень научно-технического прогресса).
Для примера приведем последовательность расчетных формул при построении линейной двухфакторной зависимости, если имеется « наблюдений результативного признака у и факторных признаков х и xf.
а) в натуральном масштабе:
у = а0 + щх, + а2х2 (4.16)
б) в стандартизованном масштабе:
'„ = А-ч + А-'2(417)
Коэффициенты регрессии для представления (4.16) находятся с помощью системы нормальных уравнений (чтобы не загромождать запись, индекс к , по которому идет суммирование у результативного и факторных признаков, подразумевается, но не приводится; к = 1,2, и).
к к к
"UoX*! +я,Х-*і2 +а2хЦх2х{ =^ух1;
к к к к
о«1іх2+а]'^хіх2+а2'£х^='^ух2.
к к к к
Бета-коэффициенты могут быть найдены из следующей системы:
где rot — коэффициент парной корреляции между у и х ; г02 — коэффициент парной корреляции между у и х2; г2 — коэффициент парной корреляции между Х и х2.
Напомним, что можно ограничиться решением лишь одной из приведенных систем уравнений, поскольку переменные и параметры в (4.16) и (4.17) связаны следующими соотношениями:
Ц , I] , t2 "I . Р ~а~Г- Р2~а2 '
оу ач о-,2 о-^ иу
где среднее квадратическое и средняя арифметическая, например, для у находятся по формулам:
ау = j-XCv-y)2; y = -*LyВ качестве упражнения предлагаем читателю составить условный пример нахождения зависимости между выработкой в целом по предприятию (результативный показатель) и двумя факторными признаками — фондовооруженностью (величина основных средств на одного оперативного работника) и долей оперативных работников в обшей численности, если имеются данные по п предприятиям.
Необходимо отметить, что в экономических исследованиях корреляционный и регрессионный анализы нередко объединяются в один — корреляционно-регрессионный анализ. Подразумевается, что в результате такого анализа будет построена регрессионная зависимость (т.е. проведен регрессионный анализ) и рассчитаны коэффициенты ее тесноты и значимости (т.е. проведен корреляционный анализ). В известном смысле корреляционная связь носит более общий характер, поскольку она не предполагает наличия зависимости «причина — следствие».
Практическая реализация корреляционно-регрессионного анализа включает следующие этапы:
а) качественный анализ (постановка задачи и выбор результативного
и факторных признаков);
б) сбор информации и ее первичная обработка (группировки, исключение аномальных наблюдений, проверка нормальности одномерных распределений);
в) определение вида модели (по возможности строятся аналитические
группировки и графики; чаще всего предпочтение изначально отдается
линейной модели; при наличии персонального компьютера могут быть
построены несколько видов моделей);
г) проверка однородности совокупности (наиболее простой вариант
действий таков: по каждому признаку рассчитывается коэффициент вариации; совокупность признается однородной по данному признаку, если
значение коэффициента вариации не превосходит 33\%; если данное условие не выполнено, следует повторить процедуру отсеивания наблюдений
с аномальными значениями признака);
д) проверка нормальности распределений признаков (например, путем расчета показателей асимметрии и эксцесса);
е) отбор факторов в модель, имея в виду, что число наблюдений должно, как минимум, в 6—8 раз превосходить число факторов в модели;
ж) устранение мультиколлинеарности (взаимозависимости) факторов
и уточнение набора показателей (наиболее простой вариант действий таков: рассчитываются парные коэффициенты корреляции по всем анализируемым признакам; любые два фактора не могут одновременно включаться в модель, если они связаны между собой теснее, чем каждый из них
с результативным показателем; иными словами, два фактора включаются
в модель, если для абсолютных значений парных коэффициентов корреляции одновременно выполнены неравенства roi > r-,j и r0j > r,y , где г у —
коэффициент корреляции между факторными признаками, г0, — коэффициент коррелляции между /-м фактором и результативным показателем;
в противном случае в модель включается лишь один из этих двух факторов — тот, который более тесно связан с результативным признаком);
з) построение уравнения регрессии с помощью системы нормальных
уравнений;
и) проверка значимости полученного уравнения (расчет коэффициента множественной корреляции и других статистик);
к) оценка результатов анализа и подготовка рекомендаций по их практическому использованию.
Мы привели достаточно подробное изложение процедуры действий в том случае, если построение уравнения регрессии осуществляется без применения технических средств. Если имеется в наличии персональный компьютер или специализированный калькулятор, то большая часть приведенных действий возлагается на техническое средство. Следует отметить, что в среде персональных компьютеров имеются специализированные пакеты, которые выполняют большую часть приведенных действий в полном объеме (например, пошаговый регрессионный анализ позволяет автоматически отсеивать незначимые факторы). Что касается специализированных финансовых калькуляторов, то в этом случае происходит лишь «механический» расчет коэффициентов регрессии и статистик в соответствии с заданными алгоритмами; никаких проверок мультиколлинеарности и отсеивания факторов не делается, т.е. эти процедуры возлагаются на исследователя.
Каким бы способом ни строилось уравнение регрессии, исследователь должен понимать логику его построения и те условности, которые сопровождают этот процесс. Нередко условия проведения корреляционно-регрессионного анализа в полном объеме не выполняются, поэтому следует помнить, что чем существеннее нарушение формальных требований анализа, тем менее приложима полученная модель на практике. Аналитик не должен вводить в заблуждение пользователей результатами своего анализа, поэтому в случае невозможности более или менее обоснованного применения корреляционно-регрессионного анализа следует отказаться от него и воспользоваться другими методами, даже если они выглядят слишком простыми. Сложность — не всегда гарантия качества. Безусловно, многое зависит от цели и условий анализа; достаточно строгое следование формальным предписаниям должно иметь место, например, при тематическом анализе, выполняемом однократно и/или нерегулярно и предполагающем наличие достаточного ресурса по временному, информационному, техническому и другим параметрам. Что касается использования корреляционно-регрессионного анализа для текущего планирования, то в этом случае требования в отношении формальных предпосылок могут быть менее жесткими.
' 4.4.3.
Методы современного факторного анализа
В эту группу входят методы анализа многофакторных зависимостей в условиях, когда факторы существенно коррелируют между собой. Дело в том, что практическое применение классических регрессионных моделей в экономическом анализе сопряжено с необходимостью преодоления ряда трудностей, основная из которых — мультиколлинеарность факторов. Особенность экономического анализа заключается в тесной взаимосвязи и взаимообусловленности показателей, поэтому бездумное и необоснованное включение в регрессионную модель бессистемно отобранных показателей нередко приводит к искусственности модели, невозможности ее использования на практике. Если пытаться следовать формальным требованиям регрессионного анализа в полном объеме, то, например, устранение мультиколлинеарности нередко сводится к отбрасыванию существенно коррелирующих факторов. В этом случае, во-первых, имеет место потеря информации и, во-вторых, анализ чаще всего выхолащивается, в некотором роде теряет смысл, поскольку модель сводится к одноили двухфакторной.
Предположим для примера, что анализируется влияние различных факторов на изменение производительности труда. Среди этих факторов — показатели, связанные с техническим обеспечением производственной деятельности, технологическим уровнем производства, уровнем организации производства, уровнем квалификационной и общеобразовательной подготовки работников и т.п. Все факторы влияют на изменение производительности труда, но вместе с тем они, без сомнения, не являются независимыми друг от друга. В рамках классического корреляционно-регрессионного анализа методом пошаговой регрессии можно отбросить коррелирующие и незначимые факторы, однако не исключено, что модель существенно упростится, причем значимые (по логике) направления (например, факторы, связанные с технологией производства) могут вообще быть не представлены в модели.
Особенность современного факторного анализа заключается в том, что он дает возможность совместной обработки большого числа взаимосвязанных (коррелирующих) факторов. Аппарат современного факторного анализа позволяет свести десятки исходных признаков (факторов) к нескольким обобщенным, которые не наблюдаются непосредственно при исследовании, но, тем не менее, появляются в модели как линейные комбинации исходных признаков и поддаются определенной интерпретации. Важная особенность подобных обобщенных факторов состоит в том, что они не коррелируют между собой и потому их удобно использовать для построения уравнения регрессии.
В зависимости от того, какие исходные признаки входят в обобщенные факторы, последние можно интерпретировать как обобщенные характеристики сложных факторов, каждый из которых, с одной стороны, имманентно присущ изучаемому явлению или процессу, а, с другой стороны, с позиции количественной оценки не сводится к какому-то одному экономически понятному показателю. В качестве примера подобных обобщенных факторов можно привести размер предприятия, его технический уровень, уровень организации труда и т.п. Очевидно, что каждое из приведенных понятий чрезвычайно емко в содержательном плане и вряд ли может быть охарактеризовано каким-то конкретным, очевидным показателем. Например, можно ли отдать предпочтение какому-то одному показателю (величина основных средств, уставный капитал, число работников, объем производимой продукции и т.п.) как характеристике величины предприятия? Ответ вряд ли будет утвердительным.
Методы современного факторного анализа предназначены для решения следующих задач:
отыскание скрытых, но объективно существующих закономерностей между факторами и оценка их влияния на результативные показатели;
описание изучаемого явления значительно меньшим числом обобщенных факторов (например, исходных факторов было 20, а обобщенных — 3—4, но они объемлют информацию всех или почти всех исходных факторов);
выявление стохастической связи между исходными и обобщенными факторами (например, зависимость между обобщенным фактором «технический уровень предприятия» и частными факторами, его образующими: фондовооруженность, фондообеспеченность и др.);
построение уравнения регрессии на обобщенных факторах (в качестве результатного показателя может использоваться, например, некоторый показатель эффективности финансово-хозяйственной деятельности).
Наибольшее распространение среди методов данной группы получили два: метод главных компонент и собственно современный факторный анализ. Различие между ними заключается в следующем:
современный факторный анализ дает возможность свести исходные факторные признаки к меньшему числу обобщенных факторов (было п исходных факторных признаков, а в результате преобразований получается к обобщенных факторов, каждый из которых представляет собой линейную комбинацию исходных признаков, причем к < я);
в методе главных компонент число обобщенных факторов (они и называются главными компонентами) в точности равно числу исходных факторных признаков, но они упорядочены по убыванию вклада каждой компоненты в исходную дисперсию факторов (например, первая компонента учитывает 38\% общей дисперсии, вторая — 26\%, третья — 17\%, четвертая — 9\% и т.д.; для построения уравнения регрессии аналитик может ограничиться первыми тремя обобщенными факторами, которые в сумме покрывают 81\% дисперсии, т.е. эти факторы в значительной степени объясняют вариацию результативного признака).
Основными недостатками описанных методов являются существенная сложность математического аппарата, необходимость использования для расчетов специализированных пакетов, сложность интерпретации обобщенных факторов и др. Поэтому методы применяются лишь в тематическом анализе. Подробную характеристику и опыт приложения данных методов можно найти в эконометрической литературе и соответствующих узкоспециализированных монографиях.
Обсуждение Финансовый анализ: методы и процедуры
Комментарии, рецензии и отзывы