Математическая статистика
Критерии согласия и однородность выборок
Критерий "хи-квадрат"
Проведено n = 1502 наблюдений работы системы обмена данными в некоторый промежуток времени в часы «пик». В течение контролируемого промежутка времени фиксировалось число передач ошибочных данных из-за перегруженности канала связи. Данные наблюдений приведены в таблице.
Число ошибочных передач, xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
Число наблюдений, ni |
322 |
511 |
370 |
200 |
75 |
20 |
4 |
Используя критерий согласия Пирсона, проверить гипотезу на уровне значимости α = 0,05 о том, что случайная величина X – число ошибочных передач данных в единицу времени – распределена по закону Пуассона.
Решение
Закон распределения Пуассона имеет единственный неизвестный параметр λ, следовательно, r = 1. МП-оценкой параметра λ является среднее арифметическое:
$\tilde{\lambda }=\bar{x}=\frac{1}{1502}(0\cdot 322+...+6\cdot 4)\approx 1,51$.
Таким образом, задача сводится к проверке статистической гипотезы:
${{H}_{0}}:X\sim{\ }Poisson(1,51)$,
$H':X{\nsim}Poisson(1,51)$.
По формуле вероятностей распределения Пуассона ${{p}_{i}}=P(X=i)=\frac{{{{\tilde{\lambda }}}^{i}}}{i!}{{e}^{-\tilde{\lambda }}}$ находим ожидаемые при условии истинности основной гипотезы H0 вероятности p0,…,p6:
${{p}_{0}}=\frac{1}{1!}{{e}^{-1,51}}\approx 0,220$,
${{p}_{1}}=\frac{1,51}{1!}{{e}^{-1,51}}\approx 0,333$,
…
${{p}_{6}}=\frac{{{(-1,51)}^{6}}}{6!}{{e}^{-1,51}}\approx 0,005$.
Рассчитанные значения сведены в таблицу:
xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
ni |
322 |
511 |
370 |
200 |
75 |
20 |
4 |
pi |
0,220 |
0,333 |
0,252 |
0,127 |
0,048 |
0,015 |
0,005 |
npi |
330,1 |
500,2 |
378,8 |
191,4 |
72,4 |
21,9 |
7,2 |
Найдём выборочное значение статистики Пирсона:
$z=\sum\limits_{i=0}^{6}{\frac{(n_i-np_i)^2}{np_i}=\frac{{{(322-330,1)}^{2}}}{330,1}+...+\frac{{{(4-7,2)}^{2}}}{7,2}\approx 2,7$.
При условии истинности основной гипотезы статистика $Z\sim{\ }{{\chi }^{2}}(7-1-1)={{\chi }^{2}}(5)$.
По таблице квантилей распределения «хи-квадрат» с пятью степенями свободы находим квантиль на уровне 1–α:
${{z}_{0,95}}=11,1$.
Таким образом, критическая область $\Omega '=(11,1;+\infty )$. Поскольку $z=2,7\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Отвергать, что число передач ошибочных данных из-за перегруженности канала связи имеет распределение Пуассона, нельзя.