Математическая статистика
Интервальные оценки
Законы распределения некоторых статистик нормальной выборки
Пусть X1,…,Xn – случайная выборка объёма n из нормально распределённой генеральной совокупности N(m, σ). Для вывода выражений для доверительных интервалов найдём законы распределения некоторых статистик, которые могут быть выбраны как центральные.
1. Статистика $\bar{X}=\frac{1}{n}\sum\limits_{i=1}^{n}{{{X}_{i}}}$ (среднее арифметическое).
В силу композиционной устойчивости нормального распределения статистика $\bar{X}$ имеет распределение $N\left( m,\frac{\sigma }{\sqrt{n}} \right)$.
2. Статистика $U=\frac{\bar{X}-m}{{\sigma }/{\sqrt{n}}\;}$ (стандартизованное среднее арифметическое при известной дисперсии).
Статистика имеет распределение $U\sim{\ }N\left( 0,1 \right)$.
3. Статистика $S_{0}^{2}=\frac{1}{n}\sum\limits_{i=1}^{n}{{{({{X}_{i}}-m)}^{2}}}$ (оценка дисперсии при известном математическом ожидании).
Для вывода закона распределения домножим и разделим каждое слагаемое на σ2:
$S_0^2=\frac{1}{n}{\sigma^2}\sum\limits_{i=1}^n{{{\left( \frac{X_i-m}{\sigma } \right)}^2}}=\frac{1}{n}{{\sigma}^{2}}\sum\limits_{i=1}^n{U_i^2}$,
где случайные величины Ui, $i=\overline{1,n}$, независимы и имеют стандартизованное нормальное распределение N(0, 1). По определению закона распределения хи-квадрат, случайная величина $\frac{n}{{{\sigma }^{2}}}S_{0}^{2}\sim{\ }{{\chi }^{2}}(n)$. Далее будем записывать, что статистика $S_{0}^{2}\sim{\ }\frac{{{\sigma }^{2}}}{n}{{\chi }^{2}}(n)$.
4. Статистика ${{S}^{2}}=\frac{1}{n-1}\sum\limits_{i=1}^{n}{{{({{X}_{i}}-\bar{X})}^{2}}}$ (оценка дисперсии при неизвестном математическом ожидании).
Теорема Фишера. Пусть X1,…, Xn – независимые случайные величины, имеющие нормальное распределение N(m, σ). Тогда случайные величины $\bar{X}$ и S2 независимы, и случайная величина ${{S}^{2}}\sim{\ }\frac{{{\sigma }^{2}}}{n-1}{{\chi}^{2}}(n-1)$.
5. Статистика $T=\frac{\bar{X}-m}{{S}/{\sqrt{n}}\;}$ (стандартизованное среднее арифметическое при неизвестной дисперсии).
Применяя выражение для статистики U, запишем
$T=\frac{\sigma }{S}\frac{\bar{X}-m}{{\sigma }/{\sqrt{n}}\;}=\frac{\sigma U}{S}=\frac{\sigma U}{\sigma \sqrt{{}^{{{\chi}^{2}}(n-1)}/{}_{n-1}}}=\frac{U}{\sqrt{{}^{{{\chi }^{2}}(n-1)}/{}_{n-1}}}$.
По определению закона распределения Стьюдента статистика $T\sim{\ }T(n-1)$.
Запишем теперь законы распределения некоторых статистик, связанных с двумя случайными выборками. Пусть ${{X}_{11}},...,{{X}_{1,{{n}_{1}}}}$ и ${{X}_{21}},...,{{X}_{2,{{n}_{2}}}}$ – случайные выборки объёмов n1 и n2 из нормально распределённых генеральных совокупностей N(m1, σ1) и N(m2, σ2) соответственно.
6. Статистика $\bar{X}=\frac{{{n}_{1}}{{{\bar{X}}}_{1}}+{{n}_{2}}{{{\bar{X}}}_{2}}}{{{n}_{1}}+{{n}_{2}}}$ (агрегированное среднее).
Средние арифметические выборок имеют нормальные распределения ${{\bar{X}}_{1}}\sim{\ }N\left( {{m}_{1}},\frac{{{\sigma }_{1}}}{\sqrt{{{n}_{1}}}} \right)$ и ${{\bar{X}}_{2}}\sim{\ }N\left( {{m}_{2}},\frac{{{\sigma }_{2}}}{\sqrt{{{n}_{2}}}} \right)$. В связи с композиционной устойчивостью нормального распределения статистика $\bar{X}$ также будет иметь нормальное распределение. Применяя свойства операторов математического ожидания и дисперсии, находим его параметры:
$\text{M}[\bar{X}]=\frac{1}{{{n}_{1}}+{{n}_{2}}}\left( {{n}_{1}}\text{M}[{{{\bar{X}}}_{1}}]+{{n}_{2}}\text{M}[{{{\bar{X}}}_{2}}]\right)=\frac{{{n}_{1}}{{m}_{1}}+{{n}_{2}}{{m}_{2}}}{{{n}_{1}}+{{n}_{2}}}$,
$\text{D}[\bar{X}]=\frac{1}{{{({{n}_{1}}+{{n}_{2}})}^{2}}}\left( n_{1}^{2}\text{D}[{{{\bar{X}}}_{1}}]+n_{2}^{2}\text{D}[{{{\bar{X}}}_{2}}]\right)=\frac{{{n}_{1}}\sigma _{1}^{2}+{{n}_{2}}\sigma _{2}^{2}}{{{({{n}_{1}}+{{n}_{2}})}^{2}}}$.
7. Статистика $U=\frac{{{n}_{1}}({{{\bar{X}}}_{1}}-{{m}_{1}})+{{n}_{2}}({{{\bar{X}}}_{2}}-{{m}_{2}})}{\sqrt{{{n}_{1}}\sigma _{1}^{2}+{{n}_{2}}\sigma_{2}^{2}}}$ (стандартизованное агрегированное среднее арифметическое при известной дисперсии).
Статистика имеет распределение $U\sim{\ }N\left( 0,1 \right)$.
8. Статистика $S_{0}^{2}=\frac{{{n}_{1}}S_{01}^{2}+{{n}_{2}}S_{02}^{2}}{{{n}_{1}}+{{n}_{2}}}$ (агрегированная оценка дисперсии при известном математическом ожидании).
Если ${{\sigma }_{1}}={{\sigma }_{2}}=\sigma $, то статистика имеет распределение $S_{0}^{2}\sim{\ }\frac{{{\sigma }^{2}}}{{{n}_{1}}+{{n}_{2}}}{{\chi}^{2}}({{n}_{1}}+{{n}_{2}})$.
9. Статистика ${{S}^{2}}=\frac{({{n}_{1}}-1)S_{1}^{2}+({{n}_{2}}-1)S_{2}^{2}}{{{n}_{1}}+{{n}_{2}}-2}$ (агрегированная оценка дисперсии при неизвестном математическом ожидании).
Если ${{\sigma }_{1}}={{\sigma }_{2}}=\sigma $, то статистика имеет распределение ${{S}^{2}}\sim{\ }\frac{{{\sigma}^{2}}}{{{n}_{1}}+{{n}_{2}}-2}{{\chi }^{2}}({{n}_{1}}+{{n}_{2}}-2)$.
10. Статистика $\Delta ={{\bar{X}}_{1}}-{{\bar{X}}_{2}}$ (разность средних при известных дисперсиях).
В связи с композиционной устойчивостью нормального распределения статистика Δ будет иметь нормальное распределение. Применяя свойства операторов математического ожидания и дисперсии, находим его параметры:
$\text{M}[\Delta ]=\text{M}[{{\bar{X}}_{1}}]-\text{M}[{{\bar{X}}_{2}}]={{m}_{1}}-{{m}_{2}}$,
$\text{D}[\Delta ]=\text{D}[{{\bar{X}}_{1}}]+\text{D}[{{\bar{X}}_{2}}]=\frac{\sigma _{1}^{2}}{{{n}_{1}}}+\frac{\sigma _{2}^{2}}{{{n}_{2}}}$.
11. Статистика $U=\frac{({{{\bar{X}}}_{1}}-{{{\bar{X}}}_{2}})-({{m}_{1}}-{{m}_{2}})}{\sqrt{\frac{\sigma _{1}^{2}}{{{n}_{1}}}+\frac{\sigma_{2}^{2}}{{{n}_{2}}}}}$ (стандартизованная разность средних при известных дисперсиях).
Статистика имеет распределение $U\sim{\ }N\left( 0,1 \right)$.
В частном случае, если ${{\sigma }_{1}}={{\sigma }_{2}}=\sigma $, то
$U=\frac{({{{\bar{X}}}_{1}}-{{{\bar{X}}}_{2}})-({{m}_{1}}-{{m}_{2}})}{\sigma \sqrt{\frac{1}{{{n}_{1}}}+\frac{1}{{{n}_{2}}}}}$.
12. Статистика $T=\frac{({{{\bar{X}}}_{1}}-{{{\bar{X}}}_{2}})-({{m}_{1}}-{{m}_{2}})}{S\sqrt{\frac{1}{{{n}_{1}}}+\frac{1}{{{n}_{2}}}}}$ (стандартизованная разность средних при неизвестных дисперсиях).
Если ${{\sigma }_{1}}={{\sigma }_{2}}=\sigma $, то
$T=\frac{\sigma }{S}\frac{({{{\bar{X}}}_{1}}-{{{\bar{X}}}_{2}})-({{m}_{1}}-{{m}_{2}})}{\sigma\sqrt{\frac{1}{{{n}_{1}}}+\frac{1}{{{n}_{2}}}}}=\frac{\sigma U}{S}=$
$=\frac{\sigma U}{\sqrt{\frac{\sigma^2}{n_1+n_2-2}\chi^2(n_1+n_2-2)}}=\frac{U}{\sqrt{\frac{\chi^2(n_1+n_2-2)}{n_1+n_2-2}}}$.
По определению закона распределения Стьюдента статистика $T\sim{\ }T({{n}_{1}}+{{n}_{2}}-2)$.
13. Статистика ${{F}_{0}}=\frac{S_{01}^{2}/\sigma _{1}^{2}}{S_{02}^{2}/\sigma _{2}^{2}}$ (стандартизованное отношение дисперсий при известном математическом ожидании).
Применяя выражение для статистики $S_{0}^{2}$, запишем:
${{F}_{0}}=\frac{\frac{\sigma _{1}^{2}}{{{n}_{1}}}{{\chi }^{2}}({{n}_{1}})/\sigma _{1}^{2}}{\frac{\sigma _{2}^{2}}{{{n}_{2}}}{{\chi}^{2}}({{n}_{2}})/\sigma _{2}^{2}}=\frac{{{\chi }^{2}}({{n}_{1}})/{{n}_{1}}}{{{\chi }^{2}}({{n}_{2}})/{{n}_{2}}}$ .
По определению закона распределения Фишера статистика ${{F}_{0}}\sim{\ }F({{n}_{1}},{{n}_{2}})$.
14. Статистика $F=\frac{S_{1}^{2}/\sigma _{1}^{2}}{S_{2}^{2}/\sigma _{2}^{2}}$ (стандартизованное отношение дисперсий при не известном математическом ожидании).
Применяя выражение для статистики $S_{{}}^{2}$ (см. п.4), запишем:
$F=\frac{\frac{\sigma _{1}^{2}}{{{n}_{1}}-1}{{\chi }^{2}}({{n}_{1}}-1)/\sigma _{1}^{2}}{\frac{\sigma _{2}^{2}}{{{n}_{2}}-1}{{\chi}^{2}}({{n}_{2}}-1)/\sigma _{2}^{2}}=\frac{{{\chi }^{2}}({{n}_{1}}-1)/({{n}_{1}}-1)}{{{\chi }^{2}}({{n}_{2}}-1)/({{n}_{2}}-1)}$ .
По определению закона распределения Фишера статистика $F\sim{\ }F({{n}_{1}}-1,{{n}_{2}}-1)$.