Математическая статистика

Критерии согласия и однородность выборок

Проверка гипотез о виде распределения. Критерий Колмогорова




Пример 1

Используя критерий Колмогорова, проверить на уровне значимости 10% гипотезу о том, что выборка

0,90; 0,56; 0,05; 0,21; 0,97; 0,80; 0,04; 0,12; 0,73; 0,49

является выборкой наблюдений равномерно распределённой случайной величины X ~ R(0, 1).

Решение

Сформулируем основную и альтернативную статистические гипотезы:

${{H}_{0}}:{{F}_{X}}(x)=R(x)$,

$H':{{F}_{X}}(x)\ne R(x)$.

Предполагаемая функция распределения R(x) имеет вид:

$R(x)=\begin{cases} 0,\ \ \ \ x<0, \\ x,\ \ \ \ 0\le x\le 1, \\ 1,\ \ \ \ otherwise. \end{cases}$

Составим вариационный ряд выборки:

0,04; 0,05; 0,12; 0,21; 0,49; 0,56; 0,73; 0,80; 0,90; 0,97.

Значения ЭФР $F_{n}^{*}(x)$ в этих точках:

0; 0,1; 0,2; 0,3; 0,4; 0,5; 0,6; 0,7; 0,8; 0,9.

Графики эмпирической функции распределения $F_{n}^{*}(x)$ и функции распределения R(x) приведены на рис. 5.1.

Рис. 5.1. Функция распределения R(0, 1) и эмпирическая функция распределения

Найдём рассогласования между $F_{n}^{*}(x)$ и R(x) в этих точках:

0,06; 0,15; 0,18; 0,19; 0,09; 0,06; 0,13; 0,10; 0,10; 0,07.

По формуле (1) находим значение Dn = 0,19. Выборочное значение статистики критерия $z=\sqrt{10}*0,19\approx 0,6$.

По таблице находим квантиль распределения Колмогорова на уровне 1–α:

${{z}_{0,9}}=1,22$.

Таким образом, критическая область $\Omega '=(1,22;+\infty )$. Поскольку $z=0,6\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Отвергать, что данная выборка могла быть получена из равномерного распределения R(0, 1), нельзя.



Пример 2

В условиях Примера 1 проверить на уровне значимости 10% гипотезу о том, что выборка получена из равномерно распределённой генеральной совокупности, используя критерий Колмогорова.

Решение

Найдём МП-оценки параметров a и b равномерного распределения R(a, b):

$\tilde{a}={{x}_{(1)}}=0,04$,

$\tilde{b}={{x}_{(n)}}=0,97$.

Таким образом, задача сводится к проверке статистической гипотезы:

${{H}_{0}}:{{F}_{X}}(x)=R(x)$,

$H':{{F}_{X}}(x)\ne R(x)$,

где R(x) – равномерное распределение с параметрами 0,04 и 0,97:

$R(x)=\begin{cases} 0,\ \ \ \ x<0,04, \\ (x-0,04)/0,93,\ \ \ \ 0,04\le x\le 0,97, \\ 1,\ \ \ \ otherwise. \end{cases}$

Найдём рассогласования между $F_{n}^{*}(x)$ и R(x) в точках вариационного ряда:

0,10; 0,19; 0,22; 0,22; 0,09; 0,05; 0,14; 0,12; 0,12; 0,10.

По формуле (1) находим значение Dn = 0,22. Выборочное значение статистики критерия $z=\sqrt{10}\cdot 0,22\approx 0,7$.

Критическая область $\Omega '=(1,22;+\infty )$ (из решения Примера 1). Поскольку $z=0,7\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Отвергать, что данная выборка могла быть получена из генеральной совокупности с равномерным распределением, нельзя.