Математическая статистика
Интервальные оценки
Понятие доверительного интервала
Точечная оценка $\tilde{\theta }$ неизвестного параметра θ является случайной величиной, определяемой как некоторая функция случайной выборки X1,…,Xn. Это означает, что для каждой новой реализации x1,…,xn этой выборки точечная оценка $\tilde{\theta }$ каждый раз будет иметь новое значение. Использование точечных оценок не даёт ответа на вопрос, насколько для данной выборки x1,…, xn рассчитанная реализация точечной оценки $\tilde{\theta }$ близка к значению оцениваемого параметра θ. Ответ на этот вопрос могут дать интервальные оценки. Интервальная оценка позволяет получить вероятностную характеристику точности оценивания неизвестного параметра θ.
Пусть X1,…,Xn – случайная выборка объёма n из генеральной совокупности X с функцией распределения FX(x; θ), зависящей от параметра θ, значение которого неизвестно. Доверительным интервалом для параметра θ называется интервал (θ1; θ2), содержащий (накрывающий) истинное значение θ с заданной вероятностью γ, т.е.
где ${{\theta }_{1}}={{\theta }_{1}}({{X}_{1}},...,{{X}_{n}})$ и ${{\theta }_{2}}={{\theta }_{2}}({{X}_{1}},...,{{X}_{n}})$ – некоторые статистики. Вероятность γ называется доверительной вероятностью, а вероятность $\alpha =1-\gamma $ – уровнем значимости. Доверительный интервал с доверительной вероятностью γ называют также γ-доверительным интервалом, или γ-доверительной интервальной оценкой параметра θ. Статистики θ1 и θ2 называются нижней и верхней границами доверительного интервала соответственно.
Доверительный интервал – это интервал со случайными границами θ1 и θ2. Для каждой новой реализации x1,…,xn случайной выборки X1,…,Xn эти случайные величины, а следовательно, и случайные величины θ1, θ2 будут принимать новые значения. Однако, согласно определению, для данной реализации x1,…,xn рассчитанная реализация доверительного интервала (θ1; θ2) накроет истинное значение неизвестного параметра θ с заданной вероятностью γ. Это означает, что доля реализаций случайной выборки X1,…,Xn, для которых доверительный интервал (θ1; θ2) накроет θ, в среднем равна доверительной вероятности γ.
Пример. Исследуется качество партии выпускаемых предприятием изделий. Пусть θ – доля бракованных изделий в партии, которую оценивают независимо друг от друга в N различных лабораториях по результатам обследования нескольких случайно выбранных деталей из партии. Иначе говоря, долю бракованных изделий в партии в каждой лаборатории оценивают по «своей» выборке деталей из партии, и в каждой лаборатории получают свои значения верхней и нижней границ γ-доверительного интервала.
Возможны случаи, когда γ-доверительный интервал не накрывает истинного значения θ. Если M – число таких случаев, то их доля будет стремиться к уровню значимости α при увеличении N, т.е. $\frac{M}{N}\to \alpha $ при $N\to \infty $.
Ширина доверительного интервала, характеризующая точность интервального оценивания, зависит от объёма выборки n и доверительной вероятности γ: при увеличении объёма выборки ширина доверительного интервала уменьшается. Причина этого состоит в том, что в выборке большего объёма содержится больше информации об оцениваемом параметре, что позволяет более точно определить область, в которой он находится. При увеличении доверительной вероятности предъявляется более «жёсткое» требование к вероятности нахождения неизвестного параметра внутри доверительного интервала, вследствие чего его ширина увеличивается.
Границы доверительного интервала θ1 и θ2 могут быть выбраны множеством способов. Единственное требование, предъявляемое к этим статистикам – это выполнение условия (1). Однако на практике, как правило, эти статистики выбирают, исходя из некоторых соображений симметрии, которые будут рассмотрены далее.
Иногда требуется оценить параметр θ только снизу или только сверху. При этом, если
$P({{\theta }_{1}}<\theta )=\gamma $,
то доверительный интервал (θ1; ∞) называется правосторонним, а статистика ${{\theta }_{1}}={{\theta }_{1}}({{X}_{1}},...,{{X}_{n}})$ – односторонней нижней границей доверительного интервала.
Если же
$P(\theta <{{\theta }_{2}})=\gamma $,
то доверительный интервал (-∞; θ2) называется левосторонним, а статистика ${{\theta }_{2}}={{\theta }_{2}}({{X}_{1}},...,{{X}_{n}})$ – односторонней верхней границей доверительного интервала.