2.3. числовые характеристики случайных величин и их свойства
2.3. числовые характеристики случайных величин и их свойства
Случайные величины, с которыми мы имеем дело в данном курсе, полностью определяются заданием их функции плотности, указывающей на зоны более вероятных и менее вероятных значений случайной величины. Часто, однако, интересуются более сжатыми характеристиками распределений случайных величин, выраженными отдельными числами. К таким характеристикам, в первую очередь, относятся математическое ожидание и дисперсия случайной величины.
Пусть случайная величина X имеет функцию плотности p(x). График функции p(x) ограничивает вместе с осью абсцисс Ox полосу переменной ширины. Если рассматривать эту полосу как материальный объект определенной (постоянной) толщины, изготовленный из однородного материала и имеющий массу, равную единице, то абсцисса центра тяжести этого материального объекта называется математическим ожиданием (expectation) случайной величины X, обозначается E (X) и вычисляется по формуле
со
E(X) = Jx p(x)dx .
—со
Если график функции плотности симметричен относительно оси ординат (так что p(x) — четная функция), то E (X) = 0.
Довольно часто о E(X) говорят как о среднем значении случайной величиныX. Это связано с тем, что если X1,...,Xn — независимые копии случайной величины X (т. е. случайные величины X1,..., Xn независимы в совокупности и имеют
то же распределение, что и X), то тогда при больших n для наблюдаемых значений x1,..., xn случайных величин
X1,..., Xn имеет место приближенное равенство
тем более точное, чем больше значение n. Иными словами, с увеличением n значение E(X) сколь угодно точно приближается значением среднеарифметического наблюдаемых величин x1,..., xn.
Обратимся опять к упомянутому ранее гауссовскому (нормальному) распределению с функцией плотности
и пусть случайная величина X1 имеет такое распределение с а 1, а случайная величина X2 имеет такое распределение с а 2 . Сравним графики соответствующих функций плотности (сплошной линией представлен график функции плотности
случайной величины X1):
т. е. математические ожидания случайных величин Xj и
X2 совпадают. Однако, распределение случайной величины
X2 более рассредоточено, и это означает, что для любого
a > 0
P{|X| > a}< P{X2 > a] .
При этом говорят, что распределение случайной величины X2 имеет более тяжелые (heavy), или более длинные
(long) хвосты (tails). Соответственно,
P{|X| < a} = P§XX > a] > 1P{|X2| > a] = P§X2 < a} .
В рассмотренном случае в качестве числовой характеристики степени рассредоточенное™ распределения можно было бы принять параметр а: чем больше значение этого параметра, тем более рассредоточено распределение. В общем случае, сравнивать степени рассредоточенное™ распределений случайных величин можно, привлекая для этой цели понятие дисперсии.
Дисперсией (variance) случайной величины X называют число
E (X,) = E (X 2) = 0 ,
D(X) = E(X E(X))2
равное математическому ожиданию квадрата отклонения
случайной величины X от ее математического ожидания E(X) .
1 Зная функцию плотности p(x) случайной величины X, дисперсию этой случайной величины можно вычислить по формуле
D(X) = j"(x E(X))2 p(x)dx .
—OJ
Таким образом, математическое ожидание E(X) можно интерпретировать как взвешенное среднее возможных значений x случайной величины X, с весами, пропорциональными p(x), а дисперсию D(X)— как взвешенное среднее (с теми же весами) квадратов отклонений возможных значений x случайной величины X от ее математического ожидания.
Если случайная величина X имеет нормальное распределение с функцией плотности
p(x)
то для нее
E(X) = ц , D(X) = а7
Таким образом, случайная величина, имеющая нормальное распределение, полностью определяется (в отношении ее распределения) заданием значений ее математического ожидания и дисперсии.
В литературе по эконометрике математическое ожидание случайной величины X обозначают иногда символом M(X), а для дисперсии случайной величины X используют также обозначения Var(X) и V(X).
В связи с частым использованием нормально распределенных случайных величин в дальнейшем изложении, мы будем обозначать нормальное распределение, имеющее математическое ожидание іл и дисперсию а2, символом N(//, а2). Вслу-чае, когда /и = 0, сг2 1, говорят о стандартном нормальном распределении N(0,1) . Имеются весьма подробные таблицы значений функции распределения и функции плотности стандартного нормального распределения.
Для дальнейшего нам, в первую очередь, понадобятся следующие простые свойства математического ожидания и дисперсии.
Если a некоторая постоянная, отличная от нуля, а X некоторая случайная величина, то тогда сумма X + a и произведение aX также являются случайными величинами; при этом,
E (X + a) = E (X) + a E(aX) aE ( X)
D( X + a) = D( X) D(aX) a2D(X).
Два свойства, касающиеся математического ожидания, непосредственно следуют из определения математического ожидания. При выводе первого из них учитываем, что по самому определению функции плотности распределения,
J p( x )dx
1
Из этих двух свойств математического ожидания легко получаем указанные два свойства дисперсии. Действительно,
D(X + a) = E((X + a)E(X + a))2
= E(X + a E(X) a)2 = E(X E(X))2 = D(X) , D(aX) = E(aX E(aX))2 = E(aX aE(X))2
= E[a2(XE(X))2) = a2E(X E(X))2 = a2D(X) .
Таким образом, изменение случайной величины на некоторую постоянную вызывает такое же изменение математического ожидания, но не отражается на дисперсии. Изменение случайной величины в a раз приводит к такому же изменению математического ожидания и изменяет значение дисперсии в a2 раз.
с фиксированными x^...,xn и взаимно независимыми га-уссовскими ошибкамиєх,...,єп, мы имеем:
єі ~ n(0,<j2 ) =^> Yi =a + /3xt +st ~ N(a + /3 xi ,a2).
Соответственно,
E(є і) = 0, D(e і) = a2; E(Y) ^a + Pxt , D(s .) = a2. Заметим, наконец, что если Z^..., Zn — случайные величины и Z Z1 +...+Zn, то
E (Z ) = E (Zx)+...+E (Zn)
и если случайные величины Z^..., Zn попарно некоррелированы, т. е.
Cov{Zj, Zk ) = E((Zj E(Zj))(Zk E (Zk ))) = 0,
то тогда
D(Z ) = D(ZX)+...+D(Zn).
В применении к последней линейной модели наблюдений это означает, что рассматриваемая как случайная величина
оценка наименьших квадратов /?, которую мы представили ранее в виде
Р =Zc.Y, ,
i=1
В применении к линейной модели наблюдений |у.. =а + р xi +st , i = 1,...,n,
где
С. = Wj w ,
T,ixJ -x )2
так что Cj'...'cn — фиксированные величины, имеет нормальное распределение с математическим ожиданием
e ф) = £ cE y )
и дисперсией
D{fi) = £ с2 D(Y ) .
i=i
Обсуждение Институт экономики переходного периода
Комментарии, рецензии и отзывы