Математическая статистика

Критерии согласия и однородность выборок

Модифицированные критерии Колмогорова, "омега-квадрат", "хи-квадрат"




Пример 1

В условиях Примера 1* определить, является ли действие тренинга на уровень тревожности статистически значимым при уровне значимости α = 10%, используя критерий Колмогорова.

Решение

Графики эмпирических функций распределения $F_{{{n}_{X}}}^{*}(\xi )$ и $G_{{{n}_{Y}}}^{*}(\xi )$ приведены на рис. 5.2.

Рис. 5.2. Эмпирические функции распределения, построенные по двум выборкам

Максимальное рассогласование между эмпирическими функциями распределения во всех точках объединённого вариационного ряда ${{D}_{{{n}_{X}},{{n}_{Y}}}}=0,21$. Выборочное значение статистики критерия:

${{z}_{{{n}_{X}},{{n}_{Y}}}}=\sqrt{\frac{14\cdot 14}{14\cdot 2}}\cdot 0,21\approx 0,56$.

По таблице находим квантиль распределения Колмогорова на уровне 1–α:

${{z}_{0,9}}=1,22$.

Таким образом, критическая область $\Omega '=(1,22;+\infty )$. Поскольку $z=0,56\in {{\Omega }_{0}}$, то оснований считать, что гипотеза H0 не согласуется с экспериментальными данными, нет. Утверждать, что психологический тренинг оказал значимое действие на уровень тревожности испытуемых, нельзя.



Пример 2

Исследуются произведения американских писателей XIX века: «Всадник без головы» Майн Рида и «Зверобой» Фенимора Купера. Пусть случайные величины X и Y – количества слов в предложении в этих произведениях. Проверить на уровне значимости α = 5% гипотезу о том, что случайные величины X и Y имеют одинаковые законы распределения, если по результатам выборочного подсчёта количества слов в 100 предложениях из каждого произведения получены следующие результаты.

№ п/п

Количество слов в предложении

Число предложений

«Всадник без головы»

«Зверобой»

1

от 1 до 3

8

7

2

от 4 до 6

15

8

3

от 7 до 9

25

13

4

от 10 до 12

21

13

5

от 13 до 15

9

16

6

от 16 до 18

4

6

7

от 19 до 21

3

19

8

от 22 до 24

7

7

9

от 25 до 27

2

4

10

от 28 до 30

5

1

2

свыше 31

1

6

Решение

Для расчёта статистики критерия Пирсона рассчитаем относительные частоты встречаемости предложений с различным количеством слов и представим их в виде таблицы.

№ п/п

$m_{i}^{(X)}/{{n}_{X}}$

$m_{i}^{(Y)}/{{n}_{Y}}$

$m_{i}^{(X)}+m_{i}^{(Y)}$

1

0,08

0,07

15

2

0,15

0,08

23

3

0,25

0,13

38

4

0,21

0,13

34

5

0,09

0,16

25

6

0,04

0,6

10

7

0,03

0,19

22

8

0,07

0,07

14

9

0,02

0,04

6

10

0,05

0,01

6

2

0,01

0,06

7

Используя формулу (1), рассчитываем выборочное значение статистики Пирсона: ${{z}_{{{n}_{X}},{{n}_{Y}}}}\approx 28,77$. При условии истинности основной гипотезы статистика ${{Z}_{{{n}_{X}},{{n}_{Y}}}}\sim{\ }{{\chi }^{2}}(11-1)={{\chi }^{2}}(10)$.

По таблице квантилей распределения «хи-квадрат» с десятью степенями свободы находим квантиль на уровне 1–α:

${{z}_{0,95}}=18,3$.

Таким образом, критическая область $\Omega '=(18,3;+\infty )$. Поскольку $z=28,77\in \Omega '$, то основная гипотеза H0 не согласуется с экспериментальными данными и должна быть отвергнута. Количества слов в предложениях, встречающихся в рассматриваемых произведениях, имеют значимо различные законы распределения.