Математическая статистика
Критерии согласия и однородность выборок
Критерий "омега-квадрат"
Из вида метрики Колмогорова (1*) следует, что она хорошо различает функции распределения $F_{n}^{*}(x)$ и G(x), отличающиеся друг от друга достаточно сильно пусть даже в одной единственной точке x. Если же $F_{n}^{*}(x)$ отличается от G(x) на довольно широком интервале (или на всей числовой оси), но везде не очень сильно, то величина Dn будет невелика, и критерий Колмогорова может ложно принять основную гипотезу H0, в то время как на самом деле распределения FX(x, θ) и G(x) различны. Этот факт свидетельствует о высокой вероятности ошибки второго рода при проверке статистической гипотезы о равенстве распределений, что делает критерий Колмогорова маломощным.
Этот недостаток критерия Колмогорова может быть устранён при использовании другой метрики для расчёта рассогласования между двумя распределениями, называемой метрикой «омега-квадрат», – в непрерывном случае:
$\Delta \left( F_{n}^{*}(x),G(x) \right)=\omega _{n}^{2}=\int\limits_{-\infty }^{\infty }{{{\left| F_{n}^{*}(x)-G(x) \right|}^{2}}dx}$,
в дискретном случае:
$\Delta \left( F_{n}^{*}(x),G(x) \right)=\omega _{n}^{2}=\frac{1}{n}\sum\limits_{i=1}^{n}{{{\left| F_{n}^{*}({{x}_{i}})-G({{x}_{i}}) \right|}^{2}}}$. |
Статистика критерия, основанная на данной метрике, называется статистикой Крамера-Мизеса (Harald Cramer, Richard Edler von Mises, 1930), или статистикой «омега-квадрат»:
${{Z}_{n}}=n\omega _{n}^{2}$,
для которой показано, что при условии истинности основной гипотезы H0 при $n\to \infty $ её закон распределения не зависит от вида функции G(x) и стремится к распределению «омега-квадрат».
Приближённо полагая при больших n (n > 40), что ${{Z}_{n}}\sim{\ }{{\omega }^{2}}$, для статистики критерия может быть рассчитан любой квантиль, используя таблицу. Некоторые критические точки распределения «омега-квадрат» и соответствующие им уровни значимости приведены в табл. 5.2.
Таблица 5.2
Таблица квантилей распределения «омега-квадрат»
α |
0,005 |
0,01 |
0,025 |
0,05 |
0,10 |
0,15 |
0,20 |
0,25 |
z1–α |
0,87 |
0,75 |
0,58 |
0,46 |
0,35 |
0,28 |
0,24 |
0,21 |
Аналогично критерию Колмогорова, в критерии «омега-квадрат» критическая область выбирается правосторонней.
На практике для вычисления рассогласования $\omega _{n}^{2}$ между ЭФР $F_{n}^{*}(x)$ и G(x) по выборке x1,…,xn удобно использовать формулу
$\omega _{n}^{2}=\frac{1}{n}\sum\limits_{i=1}^{n}{{{\left( G({{x}_{(i)}})-\frac{2i-1}{2n} \right)}^{2}}}$, |
где ${{x}_{(1)}},...,{{x}_{(n)}}$ – вариационный ряд выборки.