Математическая статистика

Анализ статистических взаимосвязей

Однофакторный дисперсионный анализ


Пример 1

Исследуется производительность трёх процессоров при выполнении специальных тестов. Результаты измерений представляются в баллах. В таблице приведены средние баллы и среднеквадратичные отклонения, рассчитанные по результатам многократных тестирований.

Тип процессора

Средняя
производительность

С.к.о

Количество тестов

Intel Core 2 Duo E6600

1582

24

10

Intel Core 2 Duo E6700

1663

32

8

Intel Core 2 Extreme X6800

1716

27

12

Предполагая, что результаты измерения производительности каждого процессора имеют нормальное распределение с равными дисперсиями, проверить, имеется ли значимое различие в средних производительностях исследуемых процессоров на уровне значимости α = 0,01.

Решение

Сформулируем проверяемую гипотезу:

${{H}_{0}}:{{m}_{1}}={{m}_{2}}={{m}_{3}}$,

$H':\neg {{H}_{0}}$.

Число групп K = 3, общее количество тестов n = 10+8+12 = 30.

Общая средняя производительность:

$\bar{x}=\frac{1}{30}\left( 10\cdot 1582+8\cdot 1663+12\cdot 1716 \right)=1657,2$.

Внутригрупповая дисперсия:

${{D}_{w}^*}=\frac{1}{30}\left( 10\cdot {{12}^{2}}+8\cdot {{32}^{2}}+12\cdot {{27}^{2}} \right)\approx 756,7$.

Межгрупповая дисперсия:

${{D}_{b}^*}=\frac{1}{30}\left[ 10\cdot {{(1582-1657,2)}^{2}}+8\cdot {{(1663-1657,2)}^{2}}+ \right.$

$\left. \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,+12\cdot{{(1716-1657,2)}^{2}} \right]\approx 3277$.

Выборочное значение статистики Фишера:

${{f}_{}}=\frac{3277/(3-1)}{756,7/(30-3)}\approx 60,6$.

По таблицам математической статистики находим квантиль распределения Фишера с 2 и 27 степенями свободы в числителе и знаменателе соответственно на уровне 1–α:

${{f}_{0,99}}(2;27)=5,48$.

Таким образом, область допустимых значений ${{\Omega }_{0}}=(0;5,48)$. Поскольку ${{f}_{}}\in \Omega '$, то основная гипотеза H0 должна быть отвергнута, т.е. различие в средних производительностях процессоров значимо.



Пример 2

В условиях Примера 1 определить, в каких именно средних производительностях процессоров имеются значимые различия.

Решение

Проверим три гипотезы о попарном равенстве математических ожиданий производительности процессоров на уровне значимости α.

$H_{0}^{12}:{{m}_{1}}={{m}_{2}}, \ \ \ \ \ \ \ \ \ \ H':{{m}_{1}}\ne {{m}_{2}}$.

$H_{0}^{13}:{{m}_{1}}={{m}_{3}}, \ \ \ \ \ \ \ \ \ \ H':{{m}_{1}}\ne {{m}_{3}}$.

$H_{0}^{23}:{{m}_{2}}={{m}_{3}}, \ \ \ \ \ \ \ \ \ \ H':{{m}_{2}}\ne {{m}_{3}}$.

Для линейных контрастов ${{C}_{12}}={{m}_{1}}-{{m}_{2}}$, ${{C}_{13}}={{m}_{1}}-{{m}_{3}}$, ${{C}_{23}}={{m}_{2}}-{{m}_{3}}$ рассчитаем выборочные значения и оценки дисперсий:

${{{\tilde{c}}}_{12}}={{{\bar{x}}}_{1}}-{{{\bar{x}}}_{2}}=1582-1663=-81$,

${{{\tilde{c}}}_{13}}={{{\bar{x}}}_{1}}-{{{\bar{x}}}_{3}}=1582-1716=-134$,

${{{\tilde{c}}}_{23}}={{{\bar{x}}}_{2}}-{{{\bar{x}}}_{3}}=1663-1716=-53$,

$\tilde{\sigma }_{12}^{2}=\frac{30\cdot 756,7}{27}\left( \frac{1}{10}+\frac{1}{8} \right)\approx 189,2$,

$\tilde{\sigma }_{13}^{2}=\frac{30\cdot 756,7}{27}\left( \frac{1}{10}+\frac{1}{12} \right)\approx 154,1$,

$\tilde{\sigma }_{12}^{2}=\frac{30\cdot 756,7}{27}\left( \frac{1}{8}+\frac{1}{12} \right)\approx 175,1$.

Квантиль распределения Фишера ${{f}_{0,99}}(2;27)=5,48$.

Границы доверительных интервалов для линейных контрастов:

${{C}_{12}}:\,\,\,\,\,-81\pm \sqrt{189,2\cdot 2\cdot 5,48}\approx -81\pm 45,5=\left( -126,5;-35,5 \right)$,

${{C}_{12}}:\,\,\,\,\,-134\pm \sqrt{154,2\cdot 2\cdot 5,48}\approx -134\pm 41,1=\left( -175,1;-92,9 \right)$,

${{C}_{23}}:\,\,\,\,\,-53\pm \sqrt{175,2\cdot 2\cdot 5,48}\approx -53\pm 43,8=\left( -96,8;-9,2 \right)$.

Ни один из доверительных интервалов не накрыл нулевое значение, следовательно, все выдвинутые гипотезы должны быть одновременно отклонены на уровне значимости α = 0,01. Таким образом, значимое различие в средних производительностях имеется для каждой пары исследуемых процессоров.