14.2. вариационный ряд
14.2. вариационный ряд
Обычно объекты выборки характеризуются некоторыми числовыми значениями. При этом в выборке могут появляться и одинаковые значения. Например, xL может появиться п1 раз, хг — пг раз, xk—nk раз. Тогда
*
і-1
где п — объем выборки.
Наблюдаемые значения х, (і—і, 2, к) называются вариантами, а последовательность вариантов, записанных в возрастающем порядке, — вариационным рядом.
Числа наблюдений п, называются частотами (частостями), а их отношения к объему выборки — относительными частотами.
Статистическим распределением выборки называется пере-! чень вариант и соответствующих им частот или относительных j частот
*1 | *1 | ** | ||
*1 | я1 | »1 | "к |
14.3. Полигон и гистограмма
Полигоном частот называют ломаную, отрезки которой соединяют точки (xh tii), где Xj — варианты, щ — соответствующие частоты, или точки (xit w), где и», — относительные частоты.
В случае непрерывности значений генеральной совокупности строят не полигон, а гистограмму частот. Для этого весь интервал, в котором заключены наблюдаемые значения, разбивают на несколько частичных интервалов длиной h. Пусть п, — сумма частот вариант, попавших в г-й интервал. Гистограммой частот называют ступенчатую функцию, состоящую из прямоугольников, в основании которых лежит интервал А, а высота равна njh (рис. 14.1).
Рис. 14.1
14.4. Эмпирическая функция распределения
Пусть пх — число наблюдений, при которых появились значения величин, меньшие х, п — общее число наблюдений. Относительная частота события Х<х, где X— случайное значение величины, равна njn.
Эмпирической функцией распределения называется функция
«і
л
О Пример. Дан вариационный ряд: 2, 3, 4, 5, 8, 10. Составить эмпирическую функцию распределения.
Так как при 2<х^3 случайная величина встретилась один раз (*! =2), то F* (х) = 1/6 (2 < дг< 3). При 3<случайная величина встретилась два раза (->с1 = 2, х2 = 3). Поэтому /"*(*)=2/6 =1/3 (3<Ж4). Далее имеем
F* (х) = 3/6 =1/2, 4<х^5,
(л:)=4/6 = 2/3, 5<х<8,
F*(x) = 5/6, 8<*<10,
F*(x)=l, х>10
(рис. 14.2).
Г(х) 1,0 0,8 0,6 0,4 0,2
! і
О 234 5 8 Ю
Рис. 14.2
14.5. Выборочная средняя и выборочная дисперсия
Выборочной средней хш называется среднее арифметическое значений выборочной совокупности.
Если все значения xt выборочной совокупности различны, то
л
Если значения выборочной совокупности имеют частоты nt,
nz пк, то
*
1-і
Выборочной дисперсией а называется среднее арифметическое квадратов отклонений значений выборочной совокупности от выборочной средней.
Если все значения х{ различны, то
л
(Xi-x.fln.
i-1
Если значения xt выборочной совокупности имеют частоты л„ то
* _
4,= £ л, (х,-*„)/"■ •-і
Выборочным средним квадраттеским отклонением называется выражение а^^[а.
14.6. Начальные н центральные эмпирические моменты
Начальным эмпирическим моментом k-ro порядка называется среднее значение к-х степеней выборочной совокупности
і
(-1
. Начальный эмпирический момент первого порядка равен выборочной Средней а,.
Центральным эмпирическим моментом к-го порядка называется среднее значение к~х степеней разностей jc(—xt:
" -к
іI
Центральный эмпирический момент второго порядка равен выборочной дисперсии а.
14.7. Оценки параметров распределения
В ряде задач статистики вид закона распределения генеральной совокупности считается известным. Требуется по данным выборки ху, х2, .... хя оценить значения параметров данного закона распределения.
Найти статистическую оценку в* параметра б — это значит найти некоторую функцию от наблюдаемых значений выборки.
Несмещенной называется статистическая оценка в*, математическое ожидание которой равно оцениваемому параметру:
М[в*] = в.
Смещенной называется статистическая оценка, математическое ожидание которой не равно оцениваемому параметру.
Выборочная средняя является несмещенной оценкой, а выборочная дисперсия — смещенной.
Эффективной называется статистическая оценка, которая имеет наименьшую возможную дисперсию.
Состоятельной называется статистическая оценка, которая при увеличении объема выборки (л->оо) стремится по вероятности к оцениваемому параметру:
Р(в* =в)=1.
Л-*со
14.8. Точечная в интервальная оценки
Точечной называется оденка, определяемая одним числом.
Выборочная средняя и выборочная дисперсия являются точечными оценками.
При выборке малого объема точечная оценка может существенно отличаться от оцениваемого параметра. В этом случае обычно пользуются интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами — концами интервала.
Вычисленная по данным выборки оценка 9* является случайной величиной. Случайной величиной является и разность в — в* = ос. Таким образом, при определенном значении в* величина в будет отклоняться от оценки на случайную величину а. Зная распределение величины в*, а соответственно и а, можно вычислить верятность попадания разности В—в* в заданный интервал ] — 5, 8[, где 8 — некоторое положительное число. Обратно, задавая вероятность попадания этой разности в интервал, можно определить величину интервала. Указанная вероятность называется надежностью или доверительной вероятностью оценки параметра в.
Доверительным интервалом называется интервал ]в* — 8, 6* + 8[, который покрывает неизвестный параметр в с заданной надежностью у.
Обсуждение Справочник по математике для экономистов
Комментарии, рецензии и отзывы