Математическая статистика
Критерии согласия и однородность выборок
Модифицированные критерии Колмогорова, "омега-квадрат", "хи-квадрат"
В условиях Примера 1* определить, является ли действие тренинга на уровень тревожности статистически значимым при уровне значимости α = 10%, используя критерий Колмогорова.
Решение
Графики эмпирических функций распределения $F_{{{n}_{X}}}^{*}(\xi )$ и $G_{{{n}_{Y}}}^{*}(\xi )$ приведены на рис. 5.2.
Рис. 5.2. Эмпирические функции распределения, построенные по двум выборкам
Максимальное рассогласование между эмпирическими функциями распределения во всех точках объединённого вариационного ряда ${{D}_{{{n}_{X}},{{n}_{Y}}}}=0,21$. Выборочное значение статистики критерия:
${{z}_{{{n}_{X}},{{n}_{Y}}}}=\sqrt{\frac{14\cdot 14}{14\cdot 2}}\cdot 0,21\approx 0,56$.
По таблице находим квантиль распределения Колмогорова на уровне 1–α:
${{z}_{0,9}}=1,22$.
Таким образом, критическая область $\Omega '=(1,22;+\infty )$. Поскольку $z=0,56\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Утверждать, что психологический тренинг оказал значимое действие на уровень тревожности испытуемых, нельзя.
Исследуются произведения американских писателей XIX века: «Всадник без головы» Майн Рида и «Зверобой» Фенимора Купера. Пусть случайные величины X и Y – количества слов в предложении в этих произведениях. Проверить на уровне значимости α = 5% гипотезу о том, что случайные величины X и Y имеют одинаковые законы распределения, если по результатам выборочного подсчёта количества слов в 100 предложениях из каждого произведения получены следующие результаты.
№ п/п |
Количество слов в предложении |
Число предложений |
|
«Всадник без головы» |
«Зверобой» |
||
1 |
от 1 до 3 |
8 |
7 |
2 |
от 4 до 6 |
15 |
8 |
3 |
от 7 до 9 |
25 |
13 |
4 |
от 10 до 12 |
21 |
13 |
5 |
от 13 до 15 |
9 |
16 |
6 |
от 16 до 18 |
4 |
6 |
7 |
от 19 до 21 |
3 |
19 |
8 |
от 22 до 24 |
7 |
7 |
9 |
от 25 до 27 |
2 |
4 |
10 |
от 28 до 30 |
5 |
1 |
2 |
свыше 31 |
1 |
6 |
Решение
Для расчёта статистики критерия Пирсона рассчитаем относительные частоты встречаемости предложений с различным количеством слов и представим их в виде таблицы.
№ п/п |
$m_{i}^{(X)}/{{n}_{X}}$ |
$m_{i}^{(Y)}/{{n}_{Y}}$ |
$m_{i}^{(X)}+m_{i}^{(Y)}$ |
1 |
0,08 |
0,07 |
15 |
2 |
0,15 |
0,08 |
23 |
3 |
0,25 |
0,13 |
38 |
4 |
0,21 |
0,13 |
34 |
5 |
0,09 |
0,16 |
25 |
6 |
0,04 |
0,6 |
10 |
7 |
0,03 |
0,19 |
22 |
8 |
0,07 |
0,07 |
14 |
9 |
0,02 |
0,04 |
6 |
10 |
0,05 |
0,01 |
6 |
2 |
0,01 |
0,06 |
7 |
Используя формулу (1), рассчитываем выборочное значение статистики Пирсона: ${{z}_{{{n}_{X}},{{n}_{Y}}}}\approx 28,77$. При условии истинности основной гипотезы статистика ${{Z}_{{{n}_{X}},{{n}_{Y}}}}\sim{\ }{{\chi }^{2}}(11-1)={{\chi }^{2}}(10)$.
По таблице квантилей распределения «хи-квадрат» с десятью степенями свободы находим квантиль на уровне 1–α:
${{z}_{0,95}}=18,3$.
Таким образом, критическая область $\Omega '=(18,3;+\infty )$. Поскольку $z=28,77\in \Omega '$, то основная гипотеза H0 не согласуется с экспериментальными данными и должна быть отвергнута. Количества слов в предложениях, встречающихся в рассматриваемых произведениях, имеют значимо различные законы распределения.