Математическая статистика

Описательная статистика

Эмпирическая функция распределения. Числовые характеристики выборки


Пример 1

Для выборки из Примера 1* построить эмпирическую функцию распределения.

Решение

По построенному статистическому ряду (решение Примера 1*) запишем распределение выборки:

zj

1

2

3

5

6

pj

0,1

0,3

0,2

0,3

0,1

ЭФР претерпевает разрыв в точках 1,2,3,5,6, а величина скачка равна соответствующей вероятности.

Таким образом, ЭФР имеет вид:

$F_{{}}^{*}(x)= \begin{cases} 0,\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ x\le 1, \\ 0+0,1=0,1,\ \ \ \ \ \ \ 1<x\le 2, \\ 0,1+0,3=0,4,\ \ \ \ 2<x\le 3, \\ 0,4+0,2=0,6,\ \ \ \ 3<x\le 5, \\ 0,6+0,3=0,9,\ \ \ \ 5<x\le 6, \\ 0,9+0,1=1,\ \ \ \ \ \ \ x>6. \end{cases}$



Пример 2

Для выборки из Примера 1* рассчитать выборочные математическое ожидание и среднеквадратичное отклонение.

Решение

Вариантами z1,…, zk являются числа 1; 2; 3; 5; 6, встречающиеся с частотами 1; 3; 2; 3; 1 соответственно. Число вариантов k = 5. Рассчитаем выборочные математическое ожидание и дисперсию на основе построенного статистического ряда выборки, используя взвешенные формы записи (5) и (7):

$m_{X}^{*}=\bar{x}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{z}_{i}}{{n}_{i}}}=\frac{1}{10}(1\cdot 1+2\cdot 3+3\cdot 2+5\cdot 3+6\cdot 1)=3,4$;

$d_{X}^{*}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{({{z}_{i}}-\bar{x})}^{2}}{{n}_{i}}}=\frac{1}{10}\left( {{2,4}^{2}}\cdot 1+{{1,4}^{2}}\cdot 3+\right.{{0,4}^{2}}\cdot 2+$

$\left. \ \ \ \ \ \ \ \ \ \ \ \ \ +{{1,6}^{2}}\cdot 3+{{2,6}^{2}}\cdot 1 \right)=2,64;$

$\sigma _{X}^{*}=\sqrt{d_{X}^{*}}=\sqrt{2,64}\approx 1,63$.



Пример 3

Для выборки из Примера 2* рассчитать выборочные математическое ожидание и среднеквадратичное отклонение.

Решение

Запишем группированный статистический ряд для выборки.

Середины интервалов, ci

910

930

950

970

990

1010

Частоты, ni

8

15

22

36

12

7

Для расчёта выборочных математического ожидания и дисперсии используем формулы (9) при r = 1 и (10) при r = 2 соответственно:

$m_{X}^{*}=\bar{x}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{c}_{i}}{{n}_{i}}}=\frac{910\cdot 8+930\cdot 15+...+1010\cdot 7}{100}=960$;

$d_{X}^{*}=\frac{1}{n}\sum\limits_{i=1}^{k}{{{({{c}_{i}}-\bar{x})}^{2}}{{n}_{i}}}=\frac{{{50}^{2}}\cdot 8+{{30}^{2}}\cdot 15+...+{{50}^{2}}\cdot 7}{100}=676$;

$\sigma _{X}^{*}=\sqrt{d_{X}^{*}}=\sqrt{676}=26$.



Пример 4

Для выборки из Примера 1* рассчитать выборочные медиану, верхний и нижний квартили, интерквартильный интервал и квантиль на уровне 0,88.

Решение

Так как объём выборки n = 10 чётный, то медиану рассчитываем по формуле (11):

$x_{0,5}^{*}=\frac{{{x}_{(5)}}+{{x}_{(6)}}}{2}=\frac{3+3}{2}=3$.

Элементы вариационного ряда 1; 2; 2; 2; 3; 3; 5; 5; 5; 6 являются выборочными квантилями на уровнях 0,05; 0,15; …; 0,95 соответственно. Таким образом, выборочные нижняя и верхняя квартили равны $x_{0,25}^{*}=2$ и $x_{0,75}^{*}=5$ (выделены в вариационном ряду). Интерквартильный интервал Δ = 5–2 = 3.

Для расчёта $x_{0,88}^{*}$ используем интерполяционную формулу. Ближайшие к 0,88 уровни, которым соответствуют квантили из вариационного ряда – это 0,85 и 0,95. Соответствующие им квантили – 5 и 6. Абсциссу точки, лежащей на прямой, проходящей через точки (5; 0,85) и (6; 0,95), с ординатой 0,88 находим из пропорции

$\frac{x_{0,88}^{*}-5}{6-5}=\frac{0,88-0,85}{0,95-0,85}$;

$x_{0,88}^{*}=5,3$.