Математическая статистика
Критерии согласия и однородность выборок
Проверка гипотез о виде распределения. Критерий Колмогорова
Используя критерий Колмогорова, проверить на уровне значимости 10% гипотезу о том, что выборка
0,90; 0,56; 0,05; 0,21; 0,97; 0,80; 0,04; 0,12; 0,73; 0,49
является выборкой наблюдений равномерно распределённой случайной величины X ~ R(0, 1).
Решение
Сформулируем основную и альтернативную статистические гипотезы:
${{H}_{0}}:{{F}_{X}}(x)=R(x)$,
$H':{{F}_{X}}(x)\ne R(x)$.
Предполагаемая функция распределения R(x) имеет вид:
$R(x)=\begin{cases} 0,\ \ \ \ x<0, \\ x,\ \ \ \ 0\le x\le 1, \\ 1,\ \ \ \ otherwise. \end{cases}$
Составим вариационный ряд выборки:
0,04; 0,05; 0,12; 0,21; 0,49; 0,56; 0,73; 0,80; 0,90; 0,97.
Значения ЭФР $F_{n}^{*}(x)$ в этих точках:
0; 0,1; 0,2; 0,3; 0,4; 0,5; 0,6; 0,7; 0,8; 0,9.
Графики эмпирической функции распределения $F_{n}^{*}(x)$ и функции распределения R(x) приведены на рис. 5.1.
Рис. 5.1. Функция распределения R(0, 1) и эмпирическая функция распределения
Найдём рассогласования между $F_{n}^{*}(x)$ и R(x) в этих точках:
0,06; 0,15; 0,18; 0,19; 0,09; 0,06; 0,13; 0,10; 0,10; 0,07.
По формуле (1) находим значение Dn = 0,19. Выборочное значение статистики критерия $z=\sqrt{10}*0,19\approx 0,6$.
По таблице находим квантиль распределения Колмогорова на уровне 1–α:
${{z}_{0,9}}=1,22$.
Таким образом, критическая область $\Omega '=(1,22;+\infty )$. Поскольку $z=0,6\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Отвергать, что данная выборка могла быть получена из равномерного распределения R(0, 1), нельзя.
В условиях Примера 1 проверить на уровне значимости 10% гипотезу о том, что выборка получена из равномерно распределённой генеральной совокупности, используя критерий Колмогорова.
Решение
Найдём МП-оценки параметров a и b равномерного распределения R(a, b):
$\tilde{a}={{x}_{(1)}}=0,04$,
$\tilde{b}={{x}_{(n)}}=0,97$.
Таким образом, задача сводится к проверке статистической гипотезы:
${{H}_{0}}:{{F}_{X}}(x)=R(x)$,
$H':{{F}_{X}}(x)\ne R(x)$,
где R(x) – равномерное распределение с параметрами 0,04 и 0,97:
$R(x)=\begin{cases} 0,\ \ \ \ x<0,04, \\ (x-0,04)/0,93,\ \ \ \ 0,04\le x\le 0,97, \\ 1,\ \ \ \ otherwise. \end{cases}$
Найдём рассогласования между $F_{n}^{*}(x)$ и R(x) в точках вариационного ряда:
0,10; 0,19; 0,22; 0,22; 0,09; 0,05; 0,14; 0,12; 0,12; 0,10.
По формуле (1) находим значение Dn = 0,22. Выборочное значение статистики критерия $z=\sqrt{10}\cdot 0,22\approx 0,7$.
Критическая область $\Omega '=(1,22;+\infty )$ (из решения Примера 1). Поскольку $z=0,7\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Отвергать, что данная выборка могла быть получена из генеральной совокупности с равномерным распределением, нельзя.