Математическая статистика
Описательная статистика
Понятие выборки
Математическая статистика – наука о математических методах, позволяющих по статистическим данным сформулировать выводы о свойствах изучаемого массового явления.
На практике редко доступна полная информация о модели изучаемого явления, описываемого в терминах некоторой случайной величины X. Чаще о законе распределения X имеется лишь частичная информация либо никакой априорной информации о распределении X вообще нет. В этом случае возникают задачи восстановления параметров или вида неизвестного распределения FX или определения его свойств.
Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Если теория вероятностей позволяет при заданной вероятностной модели вычислить вероятности тех или иных случайных событий, то математическая статистика по результатам проводимых наблюдений (по исходам эксперимента) уточняет структуру вероятностной модели изучаемого явления.
Математическая статистика решает следующие задачи:
1) систематизация полученного статистического материала (этап описания массового явления);
2) выявление свойств и закономерностей изучаемого явления (этап анализа и прогноза).
Первой задачей занимается раздел математической статистики, называемый описательной (дескриптивной) статистикой. Описательная статистика предоставляет методы первичной обработки эмпирических данных, их наглядного представления в форме графиков и таблиц, а также их количественного описания посредством основных статистических показателей. Методы описательной статистики, как правило, не требуют предположений о вероятностной природе данных.
Решению второй задачи посвящены теория оценивания и теория проверки статистических гипотез. В основе этих теорий лежат методы построения математических моделей наблюдений и статистических закономерностей.
Точечное оценивание – вычисление приближённых значений характеристик статистических закономерностей по результатам наблюдений.
Интервальное оценивание – построение случайных множеств, называемых доверительными, которые с заданной вероятностью содержат оцениваемые характеристики.
Проверка статистических гипотез – принятие или отклонение по реализации наблюдений априорного предположения о неизвестных характеристиках статистических закономерностей.
С особенностями различных постановок задач оценивания связаны и различия соответствующих статистических исследований.
Центральным понятием математической статистики является выборка. Выборка понимается следующим образом. Пусть случайная величина X наблюдается в эксперименте с комплексом условий G. Результатом этого эксперимента будет некоторое случайное число x – реализация случайной величины X. Повторим эксперимент n раз с неизменным комплексом условий. Результатом такого эксперимента будет случайный вектор (x1,…,xn), где xj – реализация случайной величины X в j-м эксперименте. С другой стороны, вектор (x1,…,xn) можно рассматривать как единственную реализацию случайного вектора (X1,…,Xn), где случайные величины X1,…,Xn независимы в совокупности и каждая из которых имеет тот же закон распределения, что и случайная величина X.
Совокупность всех наблюдений случайной величины X, которые могли бы быть сделаны при данном комплексе условий, называется генеральной совокупностью случайной величины X, или просто генеральной совокупностью X. Распределение случайной величины X называется распределением генеральной совокупности. Число элементов, входящих в генеральную совокупность, называют объёмом генеральной совокупности. Объём генеральной совокупности может быть как конечным, так и бесконечным.
Совокупность независимых случайных величин X1,…,Xn, каждая из которых имеет то же распределение, что и наблюдаемая случайная величина X, называется случайной выборкой из генеральной совокупности X. При этом число n называют объёмом случайной выборки, а случайные величины X1,…,Xn – элементами случайной выборки. Любую реализацию x1,…,xn случайной выборки X1,…,Xn будем называть выборкой из генеральной совокупности X, или выборочной совокупностью. Выборка из генеральной совокупности X представляет собой некоторое подмножество этой генеральной совокупности.
Пример 1. Эксперимент состоит в подбрасывании правильной игральной кости. Случайная величина X – число очков, выпавшее на верхней грани, возможные значения случайной величины X: 1,…,6. В результате эксперимента получаем случайное число x – реализацию случайной величины X, $x\in\{1,...,6\}$. При повторении эксперимента n раз получаем выборку x1,…,xn наблюдений случайной величины X, $x_i \in \{1,...,6\}$, $i=\overline{1,n}$, или, что то же самое, единственное наблюдение случайной выборки X1,…,Xn объёма n. Генеральная совокупность случайной величины X содержит бесконечное число значений 1,…,6 в равных пропорциях.
Пример 2. Исследуется качество партии выпущенных предприятием изделий. Случайная величина X – индикатор брака в изделии – принимает значение 1, если изделие оказалось бракованным, и 0 – в противном случае. В результате наблюдения случайной величины X (выбирая случайным образом изделие) получаем её реализацию x (0 или 1). Обследуя n изделий, получаем выборку наблюдений x1,…,xn, $x_i \in \{0,1\}$, $i=\overline{1,n}$. Объём генеральной совокупности определяется объёмом партии выпущенных изделий. Объём выборки n не может превышать объём генеральной совокупности.
Понятие выборки может быть обобщено на случай, когда в результате эксперимента с некоторым комплексом условий G наблюдается несколько случайных величин. Например, пусть (x, y) – наблюдение двумерного случайного вектора (X, Y). Тогда случайная выборка объёма n представляет собой последовательность (X1, Y1),…,(Xn, Yn) случайных векторов, а её реализация – последовательность векторов (x1, y1),…,(xn, yn).