Математическая статистика
Описательная статистика
Эмпирическая функция распределения. Числовые характеристики выборки
Для выборки из Примера 1* построить эмпирическую функцию распределения.
Решение
По построенному статистическому ряду (решение Примера 1*) запишем распределение выборки:
zj |
1 |
2 |
3 |
5 |
6 |
pj |
0,1 |
0,3 |
0,2 |
0,3 |
0,1 |
ЭФР претерпевает разрыв в точках 1,2,3,5,6, а величина скачка равна соответствующей вероятности.
Таким образом, ЭФР имеет вид:
$F_{{}}^{*}(x)= \begin{cases} 0,\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ x\le 1, \\ 0+0,1=0,1,\ \ \ \ \ \ \ 1<x\le 2, \\ 0,1+0,3=0,4,\ \ \ \ 2<x\le 3, \\ 0,4+0,2=0,6,\ \ \ \ 3<x\le 5, \\ 0,6+0,3=0,9,\ \ \ \ 5<x\le 6, \\ 0,9+0,1=1,\ \ \ \ \ \ \ x>6. \end{cases}$
Для выборки из Примера 1* рассчитать выборочные математическое ожидание и среднеквадратичное отклонение.
Решение
Вариантами z1,…, zk являются числа 1; 2; 3; 5; 6, встречающиеся с частотами 1; 3; 2; 3; 1 соответственно. Число вариантов k = 5. Рассчитаем выборочные математическое ожидание и дисперсию на основе построенного статистического ряда выборки, используя взвешенные формы записи (5) и (7):
$m_{X}^{*}=\bar{x}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{z}_{i}}{{n}_{i}}}=\frac{1}{10}(1\cdot 1+2\cdot 3+3\cdot 2+5\cdot 3+6\cdot 1)=3,4$;
$d_{X}^{*}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{({{z}_{i}}-\bar{x})}^{2}}{{n}_{i}}}=\frac{1}{10}\left( {{2,4}^{2}}\cdot 1+{{1,4}^{2}}\cdot 3+\right.{{0,4}^{2}}\cdot 2+$
$\left. \ \ \ \ \ \ \ \ \ \ \ \ \ +{{1,6}^{2}}\cdot 3+{{2,6}^{2}}\cdot 1 \right)=2,64;$
$\sigma _{X}^{*}=\sqrt{d_{X}^{*}}=\sqrt{2,64}\approx 1,63$.
Для выборки из Примера 2* рассчитать выборочные математическое ожидание и среднеквадратичное отклонение.
Решение
Запишем группированный статистический ряд для выборки.
Середины интервалов, ci |
910 |
930 |
950 |
970 |
990 |
1010 |
Частоты, ni |
8 |
15 |
22 |
36 |
12 |
7 |
Для расчёта выборочных математического ожидания и дисперсии используем формулы (9) при r = 1 и (10) при r = 2 соответственно:
$m_{X}^{*}=\bar{x}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{c}_{i}}{{n}_{i}}}=\frac{910\cdot 8+930\cdot 15+...+1010\cdot 7}{100}=960$;
$d_{X}^{*}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{({{c}_{i}}-\bar{x})}^{2}}{{n}_{i}}}=\frac{{{50}^{2}}\cdot 8+{{30}^{2}}\cdot 15+...+{{50}^{2}}\cdot 7}{100}=676$;
$\sigma _{X}^{*}=\sqrt{d_{X}^{*}}=\sqrt{676}=26$.
Для выборки из Примера 1* рассчитать выборочные медиану, верхний и нижний квартили, интерквартильный интервал и квантиль на уровне 0,88.
Решение
Так как объём выборки n = 10 чётный, то медиану рассчитываем по формуле (11):
$x_{0,5}^{*}=\frac{{{x}_{(5)}}+{{x}_{(6)}}}{2}=\frac{3+3}{2}=3$.
Элементы вариационного ряда 1; 2; 2; 2; 3; 3; 5; 5; 5; 6 являются выборочными квантилями на уровнях 0,05; 0,15; …; 0,95 соответственно. Таким образом, выборочные нижняя и верхняя квартили равны $x_{0,25}^{*}=2$ и $x_{0,75}^{*}=5$ (выделены в вариационном ряду). Интерквартильный интервал Δ = 5–2 = 3.
Для расчёта $x_{0,88}^{*}$ используем интерполяционную формулу. Ближайшие к 0,88 уровни, которым соответствуют квантили из вариационного ряда – это 0,85 и 0,95. Соответствующие им квантили – 5 и 6. Абсциссу точки, лежащей на прямой, проходящей через точки (5; 0,85) и (6; 0,95), с ординатой 0,88 находим из пропорции
$\frac{x_{0,88}^{*}-5}{6-5}=\frac{0,88-0,85}{0,95-0,85}$;
$x_{0,88}^{*}=5,3$.