15.2. основные статистические распределения

15.2. основные статистические распределения: Математические методы в экономике, Замков Олег Олегович, 2001 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В учебнике дано систематическое изложение основных базовых математических методов, используемых в экономике. Он содержит не только инструментарий математического анализа, знание которого необходимо любому грамотному экономисту..

15.2. основные статистические распределения

При обработке выборочных данных, в силу случайной природы процесса получения выборки, важно знать, каким вероятностным законам подчиняются выборочные значения исследуемого экономического показателя. Существует целый ряд распределений вероятности, которые играют роль эталона в статистических выводах. Это прежде всего равномерное распределение, нормальное распределение (распределение Гаусса) и распределение Стьюдента (/-распределение).

15.2.1. Равномерное распределение

Если значения случайной величины из некоторого интервала можно считать равновероятными, то мы приходим к равномерному распределению случайной величины. Равномерное распределение -это такое распределение вероятности, плотность которого постоянна в заданном интервале изменения случайной величины X. а < Х< Ь. Равномерно распределенная случайная величина обозначается R(a,b). Там, где встречается R без указания параметров, подразумевается стандартное равномерное распределение на интервале 0 < Х< 1: Ж0.1).

Плотность вероятности равномерного распределения на интервале [а, Ь постоянна на этом интервале:

Подпись: 1

Ъ а О,

т =

а функция распределения:

О, х а

1,

а <>х <. Ь х < а, х > Ь

х <> а

а < х <. b

х > Ь

а?

Для равномерного распределения М[Х = а * b, D[X = ^

2 ' 1 J 12

Соответствующие этим функциям графики приведены на рисунке 15.1.

На примере равномерного распределения проще всего показать как графически и аналитически рассчитывать вероятность попадания в заданный интервал, т.е. РгоЬЦ <Х< х2}, используя соотношение между плотностью распределения и функцией распределения. Подобно тому, как масса физического тела, равномерно распреде-

Подпись: ДхД/>=РгоЬ(х:>.У<х+Дх)« ^

ленная по объему, находится как произведение плотности (массы в единице объема) на объем, так и вероятность попадания равномерно распределенной случайной величины в заданный интервал равна произведению плотности вероятности на длину интервала, и, таким образом, величина вероятности линейно растет с увеличением длины интервала (внутри области определения [а,Ь]).

В общем случае, разбивая интервал значений непрерывной величины (-оо, х,) на два интервала (-оо, х,) и [хр х2) (одновременные попадания случайной величины в которые являются взаимоисключающими событиями), мы имеем

Prob{-oo < X < х,} + Prob{x, < X < х,} = Prob{-oo < X < х2}.

Отсюда находим, что искомая вероятность попадания непрерывной случайной величины в интервал х, < X < х, равна разности функций распределения этой случайной величины:

Prob{x, < X < х,} = Prob{-oo < X < x,}-Prob{-a> < X < х.) = Fix,) Проводя такие же рассуждения, мы можем найти вероятность попадания непрерывной случайной величины в бесконечно малый интервал х < X < х + dx :

?оЪ{х < X < х + dx} = Prob{-oo <Х< x+dx} Prob{-oo < X< х} = = FJ,x + dx) Fx(x) = dFx(x) = Fp)dx.

В последних двух равенствах мы использовали определение бесконечно малого изменения функции распределения (или дифференциала этой функции). Из найденного соотношения видно, что вероятность попадания непрерывной случайной величины в бесконечно малый интервал х < Х< х + dx бесконечна мала и пропорциональна величине этого интервала dx. Отношение этой бесконечно малой вероятности к бесконечно малой величине интервала имеет конечное значение и характеризует плотность вероятности в точке х.

Итак, плотность распределения вероятности

f(Y, = dFx(x) W + dx) W

И, наоборот,

FJix) = fx(z)dz.

На рис. 15.2a приведен характерный график плотности вероятности, а на рис. 15.26 график соответствующей функции распределения.

Используя выведенную нами взаимосвязь плотности вероятности и функции распределения, несложно показать, что наклон графика функции распределения характеризует плотность вероятности (чем больше плотность вероятности, тем быстрее меняется функция распределения) (точнее/(х) = tg(a)), а площадь под графиком фун-

кции плотности вероятности на интервале х < X < х,

x)dx

характеризует вероятность попадания непрерывной случайной величины в соответствующий интервал.

При этом суммарная площадь под графиком функции плотности вероятности на всем интервале -оо < Х< +оо равна по определению единице:

fx(x)dx = і.

15.2.2. Нормальное распределение

Если случайная величина формируется под действием большого количества независимых факторов, вклад каждого из которых в значение случайной величины мал, то в силу центральной предельной теоремы эта случайная величина будет иметь нормальное распределение. В роли таких величин могут выступать: объем продаж в конкурентной отрасли или в промышленности в целом, суммарные инвестиции, суммарное потребление домашних хозяйств и тому подобные величины, имеющие аддитивную природу, то есть складывающиеся из многих малых взаимно независимых величин.

Основная особенность случайной величины состоит втом, что нельзя предвидеть, какое значение она примет в результате испытания. Однако при достаточно большом числе испытаний поведение суммы независимых случайных величин почти утрачивает случайный характер и становится почти закономерным. При увеличении числа слагаемых в сумме противоположные случайные колебания отдельных величин сглаживаются и распределение вероятностей суммы становится весьма простым, приближаясь при определенных условиях к нормальному распределению.

Рассмотрим основные свойства нормального распределения. Главное из них если ряд случайных величин (Xv Xv ... , Хп) имеет нормальное распределение, то их сумма (Х{ + X +...+ Xt) или любая линейная комбинация (а, Хх + а2 Х2 + ... + ая XJ также'будет иметь нормальное распределение.

Нормальное распределение одной случайной величины Охарактеризуется лишь двумя параметрами: средним значением, обычно обозначаемым ц, и стандартным отклонением, обычно обозначаемым а. Это обычно обозначают так: Х= N(n,a).

Распределение величины Х= £ ckXk, представляющей собой взве-шенную сумму п независимых нормально распределенных случайных величин = N(xt,ak) с параметрами цк и с^, также будет иметь нормальное распределение с параметрами |д = £ ск'Ик и о= Е с*

*•> N 4-І

г. 1

В частности, если все ск = -, все и ак одинаковы и равны и, и о,

а - 1 "

соответственно, то 1.1=111., а о = ~1=. Обозначая X = имеем,

о[Х]

таким образом, М[Х = М[Х], о[Х| = ^. Отсюда видно, что разброс среднего арифметического независимых нормально распределенных случайных величин стремится к нулю при неограниченном увеличении числа этих величин. Если, например, взята достаточно большая репрезентативная выборка населения, то средний доход в выборке почти наверняка окажется близким к действительному средг нему доходу населения.

График плотности вероятности нормального распределения имеет типичный колоколообразный види показан нарис. 15.3. Максимум этой функции находится в точке х = ц, а "растянутость" вдоль оси А"определяется параметром а. Чем меньше значение этого параметра, тем более острый и высокий максимум имеет плотность нормального распределения. Аналитически плотность вероятности нормального распределения на интервале (-со, +а>)

U с)1

а функция распределения

FN(x) = -j=e~1^*. (2)

ГГ. If ТС jL,

МХ = и, D[X = о2, У[Х = -щ. Плотность вероятности нормального распределения (1) пропор-

циональна величине ехр

г21

, где z безразмерная величина, оп-

ределяемая выражением z = ^ 1* Поэтому плотность нормального распределения достаточно быстро (экспоненциально) убывает при удалении х от среднего значения ц. Случайная величина z имеет нулевое математическое ожидание и единичную дисперсию; это вы

текает из их определений и свойств, учитывая, что z — ———. Она,

а

как и исходная случайная величинах, нормально распределена, но уже не зависит от каких-либо параметров. Поэтому ее распределение может быть протабулировано, то есть значения её плотности вероятности могут быть представлены в виде таблиц. Эта функция называется плотностью стандартного нормального распределения. Стандартное нормальное распределение это нормальное распределение с параметрами ц = 0 и о = 1 (Z« /V(0,1)).

На практике чаще используют таблицы значений не плотности, а функции распределения стандартной нормальной величины F(z). Интересуясь, например, вероятностью того, что нормально распределенная случайная величина xпопадает в интервал х, <x<xv мы вначале находим соответствующий интервал для нормально распрех. р.

деленной стандартной случайной величины Z(z, <Z< z,)' Z, —

хг Ц

и і2 — —-—• Затем по таблице находим значения функции распределения F(z,) и Fiz,) и определяем вероятность попадания случайной величины Zb заданный интервал РгоЬ{г, <Zz,} = F(Zj) F(zt), совпадающую с искомой вероятностью попадания случайной величины x в заданный интервал РгоЬ{х, < x < хЛ. Геометрически эта вероятность изображается площадью под графиком функции плотности вероятности в интервале от х, до х2.

Аналогично можно решать и обратную задачу нахождения интервала, в который нормально распределенная случайная величина попадает с заданной вероятностью. Эта процедура часто используется в задачах теории оценивания и проверки гипотез. Так, например, пусть мы хотим проверить гипотезу о равенстве среднего значения нормально распределенной случайной величины ц (для генеральной совокупности) нулю, допуская вероятность ошибки 0,05 в случае, если эта гипотеза верна. В этом случае выборочное значение стандартной нормально распределенной случайной величины Zдолжно попадать в такой интервал, что вероятность РгоЬ{г, < Z< іЛ = = 0,95. Из этого условия и соображений симметрии можно найти границы интервала критические значения z^ = £, = -z{, такие,

что вероятность РгоЬ{г, <Z] = Prob{Z< z{) = = 0,025. Сравнивая

выборочное значение величины z = ———, называемое г-статистиа

кой с критическим значением мы принимаем (если г, ^ г < ^) или отвергаем (если z < z{ или z2 ^ z) проверяемую гипотезу с точностью (уровнем значимости) є = 0,05 (5\%).

Естественно, что вышеописанную процедуру можно применять, только если известно стандартное отклонение о или дисперсия о2 исследуемой случайной величины, что редко имеет место на практике. Поэтому при оценивании параметров и проверке гипотез чаще применяют другое распределение, являющееся по сути выборочным аналогом нормального распределения и переходящее в него при бесконечно большом числе наблюдений. Это распределение называют распределением Стьюдента или /-распределением.

15.2.3. Распределение Стьюдента

Рассмотрим основные свойства распределения Стьюдента. Во-первых, аналогом безразмерной величины г-статистики, определяемой выражением z = ^ ^ служит также безразмерная величина

/-статистика, определяемая выражением ґ = * В этом выражении вместо стандартного отклонения для генеральной совокупности у стоит выборочное стандартное отклонение s, являющееся, по сути, случайной величиной (меняющейся от выборки к выборке) и определяемое по данным наблюдений хк с помощью выражения:

Здесь выборочное среднее обозначено х = хк, а через п обозначено число наблюдений.

Во-вторых, в отличие от стандартного нормального распределения, являющегося функцией лишь одной переменной z, /-распределение является не только функцией переменной t, но также зависит от еще одного параметра числа степеней свободы v. Число степеней свободы равно общему числу наблюдений, уменьшенному на число линейных связей между ними. Если п выборочных наблюдений связаны s линейными уравнениями, то их распределение имеет v = n-s степеней свободы. Линейной связью является, например,

1 "

формула расчета выборочного среднего х = — и если выборочПкное среднее входит в формулу какой-либо статистики, то это уменьшает число степеней свободы на единицу.

Распределение Стьюдента имеет случайная величина, равная отношению двух независимых случайных величин: стандартной нормально распределенной величины Z(c нулевым средним значением

и единичной дисперсией) и величины

п

выражающейся через

случайную величину, имеющую распределение yf с п степенями свободы. Распределение х2 (хи квадрат, или распределение Пирсона), имеет сумма квадратов п независимых стандартных нормально распределенных случайных величин (с нулевыми средними значениями и единичными дисперсиями). Вводя новую случайную величину

х2(1)

х2(»)'

мы получим для нее /-распределение Стьюдента с п степенями

свободы с плотностью вероятности f[x,n) В

1 + X2

График

функции плотности вероятности распределения Стьюдента (рис. 15.4), как и стандартного нормального распределения, имеет симметричный колоколообразный вид, но является более "сплюснутым" по вертикали.

Из симметричности распределения Стьюдента вытекает важное соотношение между критическими точками этого распределения: tin) = t.Jn).

На практике обычно используют не таблицы функции распределения Стьюдента F(z), а таблицы критических точек функции распределения Стьюдента, то есть точек с заданной вероятностью попадания в начинающиеся от них "хвосты" распределения.

Распределение Стьюдента используется, например, при проверке гипотез:

о среднем значении нормальной генеральной совокупности при неизвестной дисперсии;

о линейной независимости двух случайных величин (равенстве нулю коэффициента корреляции) см. ниже в этой главе;

о статистической значимости коэффициента линейной регрессии.

Математические методы в экономике

Математические методы в экономике

Обсуждение Математические методы в экономике

Комментарии, рецензии и отзывы

15.2. основные статистические распределения: Математические методы в экономике, Замков Олег Олегович, 2001 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон В учебнике дано систематическое изложение основных базовых математических методов, используемых в экономике. Он содержит не только инструментарий математического анализа, знание которого необходимо любому грамотному экономисту..