Математическая статистика

Проверка статистических гипотез

Проверка гипотез о параметрах нормально распределённой генеральной совокупности


Пример 1

Точность работы станка-автомата проверяется по среднеквадратичному отклонению контролируемого размера деталей, которое не должно превышать ${{\sigma }_{0}}=0,15$ мм. Взята проба из n = 25 случайно отобранных деталей, получены следующие результаты измерений:

Размер деталей, мм

3,0-3,3

3,3-3,6

3,6-3,9

3,9-4,2

4,2-4,5

Частоты

3

5

10

6

1

Предполагая, что размер деталей имеет нормальное распределение, проверить на уровне значимости 10%, обеспечивает ли станок требуемую точность.

Решение

Сформулируем основную и альтернативную статистические гипотезы:

${{H}_{0}}:\sigma _{0}^{{}}=0,15,$
$H':\sigma _{0}^{{}}>0,15.$

Если основная гипотеза H0 будет отвергнута в пользу альтернативной H’, это будет означать, что выборочные наблюдения противоречат утверждению о точности работы станка-автомата. Если же основная гипотеза H0 будет принята, то оснований считать, что станок не обеспечивает требуемую точность, не будет.

Статистика критерия для данной гипотезы $Z=\frac{(n-1)S_{{}}^{2}}{\sigma _{0}^{2}}$.

Рассчитаем её выборочное значение:

$\bar{x}=\frac{1}{25}\left( 3,15*3+...+4,35*1 \right)\approx 3,71$;

${{s}^{2}}=\frac{1}{25}\left( {{(3,15-3,71)}^{2}}*3+...+{{(4,35-3,71)}^{2}}*1 \right)\approx 0,036$;

$s=\sqrt{0,036}\approx 0,19$;

$z=\frac{24*0,036}{0,0225}\approx 38,4$;

Гипотеза H0 должна отвергаться в пользу альтернативной гипотезы H’, если дисперсия σ > 0,15. В этом случае с высокой вероятностью оценка дисперсии S > 0,15, т.е. статистика критерия будет принимать большие значения Z > 1. Это означает, что критическая область должна выбираться в области больших маловероятных при условии истинности H0 значений, т.е. являться правосторонней.

Критическая точка при правосторонней критической области – квантиль распределения χ2(24) на уровне (1 – α) – находим по таблице:

${{z}_{0,9}}\approx 33,2$.

Таким образом, область допустимых значений ${{\Omega }_{0}}=(-\infty ;33,2)$, критическая область $\Omega '=[33,2;+\infty )$. Поскольку $z=38,4\in \Omega '$, то гипотеза H0 должна быть отвергнута. Делаем вывод, что экспериментальные данные противоречат гипотезе о том, что станок-автомат обладает требуемой точностью.

Экспериментальное исследование



Пример 2

В условиях Примера 2* выдвигается предположение о том, что элементы микросхем, выпускаемые на первой технологической линии, имеют положительную систематическую погрешность в размере по сравнению с элементами, выпускаемыми на второй линии. Проверить эту гипотезу на уровне значимости α = 0,05.

Решение

Сформулируем основную и альтернативную статистические гипотезы:

${{H}_{0}}:{{m}_{1}}={{m}_{2}},$
$H':{{m}_{1}}>{{m}_{2}}.$

Если основная гипотеза H0 будет отвергнута в пользу альтернативной H’, это будет означать, что выборочные наблюдения размеров элементов противоречат утверждению об отсутствии систематического превышения размеров элементов, выпущенных на первой линии. Если же основная гипотеза H0 будет принята, то оснований считать, что размер элементов, выпущенных на первой технологической линии, имеет систематическую положительную погрешность, не будет.

В связи с тем, что дисперсии размеров элементов не известны проверим предварительно гипотезу о равенстве дисперсий на том же уровне значимости α:

${{G}_{0}}:{{\sigma }_{1}}={{\sigma }_{2}},$
$G':{{\sigma }_{1}}\ne {{\sigma }_{2}}.$

Статистика критерия $Z=\frac{S_{1}^{2}}{S_{2}^{2}}$, выборочное значение которой $z\approx \frac{0,0061}{0,0064}\approx 0,95$.

Объёмы выборок n1 = 70, n2 = 70. При условии истинности G0 статистика $Z{{|}_{{{G}_{0}}}}\sim{\ }F(69,69)$.

Поскольку альтернативная гипотеза G’ содержит знак неравенства, критическая область для статистики Z является двусторонней. Критические точки – квантили распределения Фишера $F(69,69)$ на уровнях α/2 и (1 – α/2) – находим по таблице:

${{z}_{0,025}}\approx 1/1,67\approx 0,6,$
${{z}_{0,975}}\approx 1,67.$

Таким образом, область допустимых значений ${{\Omega }_{0}}=(0,6;1,67)$. Поскольку $z=0,95\in {{\Omega }_{0}}$, то оснований считать, что гипотеза G0 не согласуется с экспериментальными данными, нет.

При проверке гипотезы H0 будем считать, что дисперсии размеров элементов микросхем, производимых на двух технологических линиях равны $\sigma _{1}^{2}=\sigma _{2}^{2}=\sigma _{{}}^{2}$. Считая, что дисперсия является мерой точности технологической линии, это статистическое решение означает, что нет оснований утверждать, что какая-либо из технологических линий более точна по сравнению с другой.

Рассчитаем объединённую оценку дисперсии σ2 по двум выборкам:

${{s}^{2}}=\frac{({{n}_{1}}-1)s_{1}^{2}+({{n}_{2}}-1)s_{2}^{2}}{{{n}_{1}}+{{n}_{2}}-2}\approx \frac{69*0,0061+69*0,0064}{70+70-2}=\frac{0,0061+0,0064}{2}=0,00625$

и выборочное значение статистики критерия

$z=\frac{{{{\bar{x}}}_{1}}-{{{\bar{x}}}_{2}}}{s\sqrt{{1}/{{{n}_{1}}}\;+{1}/{{{n}_{2}}}\;}}\approx \frac{0,251-0,249}{0,08*0,17}\approx 0,147.$

При условии истинности H0 статистика Z имеет распределение Стьюдента T(138), которое с высокой точностью может быть аппроксимировано стандартизованным нормальным распределением N(0; 1).

Альтернативная гипотеза H’ должна приниматься, если m1 > m2. В этом случае с высокой вероятностью выполнится неравенство ${{\bar{x}}_{1}}>{{\bar{x}}_{2}}$, т.е. статистика Z примет положительные значения, причём тем большие, чем больше разница между ${{\bar{x}}_{1}}$ и ${{\bar{x}}_{2}}$. Таким образом, критическая область должна выбираться в области положительных, маловероятных при условии истинности H0, значений, т.е. являться правосторонней.

Критическая точка при правосторонней критической области – квантиль стандартизованного нормального распределения на уровне 1 – α находим по таблице:

${{z}_{0,95}}\approx 1,65$.

Таким образом, область допустимых значений ${{\Omega }_{0}}=(-\infty ;1,65)$. Поскольку $z=0,147\in {{\Omega }_{0}}$, то гипотеза H0 должна приниматься. Делаем вывод, что экспериментальные данные не противоречат гипотезе о том, что положительного смещения в размере элементов микросхем, выпускаемых на первой технологической линии, нет. Иными словами, по данной выборке наблюдений нет оснований считать, что имеется положительное смещение.



Пример 3

В условиях Примера 2 проверить гипотезу о равенстве размеров элементов микросхем, выпускаемых на двух технологических линиях, методом доверительных интервалов на уровне значимости α = 0,05.

Решение

Правосторонний доверительный интервал для разности математических ожиданий m1m2 на уровне значимости α имеет вид:

$\left( ({{{\bar{X}}}_{1}}-{{{\bar{X}}}_{2}})-{{t}_{1-\alpha }}({{n}_{1}}+{{n}_{2}}-2)S\sqrt{\frac{1}{{{n}_{1}}}+\frac{1}{{{n}_{2}}}};+\infty \right)$.

Рассчитаем границу:

${{\bar{x}}_{1}}-{{\bar{x}}_{2}}=0,251-0,249=0,002$;

${{t}_{1-\alpha }}(138)*S\sqrt{\frac{1}{{{n}_{1}}}+\frac{1}{{{n}_{2}}}}\approx 1,65*0,08*0,17\approx 0,022$;

$(0,002-0,022;+\infty )=(-0,020;+\infty )$.

Так как доверительный интервал накрывает 0, то основная гипотеза H0 должна приниматься. Оснований считать, что есть положительное смещение размеров элементов, выпускаемых на первой технологической линии, нет, что совпадает с результатом, полученным в Примере 2.