Математическая статистика

Критерии согласия и однородность выборок

Критерий "хи-квадрат"




Пример 1

Проведено n = 1502 наблюдений работы системы обмена данными в некоторый промежуток времени в часы «пик». В течение контролируемого промежутка времени фиксировалось число передач ошибочных данных из-за перегруженности канала связи. Данные наблюдений приведены в таблице.

Число ошибочных передач, xi

0

1

2

3

4

5

6

Число наблюдений, ni

322

511

370

200

75

20

4

Используя критерий согласия Пирсона, проверить гипотезу на уровне значимости α = 0,05 о том, что случайная величина X – число ошибочных передач данных в единицу времени – распределена по закону Пуассона.

Решение

Закон распределения Пуассона имеет единственный неизвестный параметр λ, следовательно, r = 1. МП-оценкой параметра λ является среднее арифметическое:

$\tilde{\lambda }=\bar{x}=\frac{1}{1502}(0\cdot 322+...+6\cdot 4)\approx 1,51$.

Таким образом, задача сводится к проверке статистической гипотезы:

${{H}_{0}}:X\sim{\ }Poisson(1,51)$,

$H':X{\nsim}Poisson(1,51)$.

По формуле вероятностей распределения Пуассона ${{p}_{i}}=P(X=i)=\frac{{{{\tilde{\lambda }}}^{i}}}{i!}{{e}^{-\tilde{\lambda }}}$ находим ожидаемые при условии истинности основной гипотезы H0 вероятности p0,…,p6:

${{p}_{0}}=\frac{1}{1!}{{e}^{-1,51}}\approx 0,220$,

${{p}_{1}}=\frac{1,51}{1!}{{e}^{-1,51}}\approx 0,333$,

${{p}_{6}}=\frac{{{(-1,51)}^{6}}}{6!}{{e}^{-1,51}}\approx 0,005$.

Рассчитанные значения сведены в таблицу:

xi

0

1

2

3

4

5

6

ni

322

511

370

200

75

20

4

pi

0,220

0,333

0,252

0,127

0,048

0,015

0,005

npi

330,1

500,2

378,8

191,4

72,4

21,9

7,2

Найдём выборочное значение статистики Пирсона:

$z=\sum\limits_{i=0}^{6}{\frac{(n_i-np_i)^2}{np_i}=\frac{{{(322-330,1)}^{2}}}{330,1}+...+\frac{{{(4-7,2)}^{2}}}{7,2}\approx 2,7$.

При условии истинности основной гипотезы статистика $Z\sim{\ }{{\chi }^{2}}(7-1-1)={{\chi }^{2}}(5)$.

По таблице квантилей распределения «хи-квадрат» с пятью степенями свободы находим квантиль на уровне 1–α:

${{z}_{0,95}}=11,1$.

Таким образом, критическая область $\Omega '=(11,1;+\infty )$. Поскольку $z=2,7\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Отвергать, что число передач ошибочных данных из-за перегруженности канала связи имеет распределение Пуассона, нельзя.