3.4. Интервальные - оценки
В статистике имеются два подхода к оцениванию неизвестных параметров распределений: точечный и интервальный. В соответствии с точечным оцениванием, которое рассмотрено в предыдущем разделе, указывается лишь точка, около которой находится оцениваемый параметр. Желательно, однако, знать, как далеко может отстоять в действительности этот параметр от возможных реализаций оценок в разных сериях наблюдений.
Ответ на этот вопрос – тоже приближенный – дает другой способ оценивания параметров – интервальный. В соответствии с этим способом оценивания находят интервал, который с вероятностью, близкой к единице, накрывает неизвестное числовое значение параметра.
Понятие интервальной оценки
Точечная оценка является случайной величиной и для возможных реализаций выборки принимает значения лишь приближенно равные истинному значению параметра . Чем меньше разность , тем точнее оценка. Таким образом, положительное число , для которого , характеризует точность оценки и называется Ошибкой оценки (или предельной ошибкой).
Доверительной вероятностью (или надежностью) называется вероятность β, с которой осуществляется неравенство , т. е.
. (3.20)
Заменив неравенство равносильным ему двойным неравенством , или , получим
. (3.21)
Интервал , накрывающий с вероятностью β, , неизвестный параметр , называется Доверительным интервалом (или интервальной оценкой), соответствующим доверительной вероятности β.
Случайной величиной является не только оценка , но и ошибка : ее значение зависит от вероятности β и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (3.21) следует читать так: “Интервал накроет параметр с вероятностью β ”, а не так: “Параметр попадет в интервал с вероятностью β ”.
Смысл доверительного интервала состоит в том, что при многократном повторении выборки объема в относительной доле случаев, равной β, доверительный интервал, соответствующий доверительной вероятности β, накрывает истинное значение оцениваемого параметра. Таким образом, доверительная вероятность β характеризует Надежность доверительного оценивания: чем больше β, тем вероятнее, что реализация доверительного интервала содержит неизвестный параметр.
Следует, однако, иметь в виду, что с ростом доверительной вероятности β в среднем растет длина доверительного интервала, то есть уменьшается точность доверительного оценивания. Выбор доверительной вероятности определяется конкретными условиями; обычно используются значения β, равные 0,90; 0,95; 0,99.
Вероятность (3.22)
называется Уровнем значимости и характеризует относительное число ошибочных заключений в общем числе заключений.
В формуле (3.21) границы доверительного интервала симметричны относительно точечной оценки. Однако не всегда удается построить интервал, обладающий таким свойством. Более общим является следующее определение.
Доверительным интервалом (или Интервальной оценкой) параметра с доверительной вероятностью β, 0< β <1, называется интервал со случайными границами , , накрывающий с вероятностью β неизвестный параметр , т. е.
. (3.23)
Иногда вместо двусторонних доверительных интервалов рассматривают односторонние доверительные интервалы, полагая или .
Построение интервальных оценок
Доверительный интервал задается своими концами и . Однако найти функции и из условия (3.23) невозможно, поскольку закон распределения этих функций зависит от закона распределения ξ и, следовательно, зависит от неизвестного параметра . Используют следующий прием, позволяющий в ряде случаев построить доверительный интервал. Подбирается такая функция , чтобы:
- ее закон распределения был известен и не зависел от неизвестного параметра ;
- функция Была непрерывной и строго монотонной по .
Тогда для любого β можно выбрать два числа и так, чтобы выполнялось равенство
. (3.24)
Отсюда находят и как квантили функции распределения . Границы искомого доверительного интервала выражают через найденные квантили и выборочные данные, используя для этого соотношения, связывающие новую и старую случайные величины.
Если плотность распределения случайной величины Симметрична, то доверительный интервал симметричен относительно точечной оценки , и для нахождения границ доверительного интервала вместо условия (3.23) можно использовать соотношение (3.21).
Основные статистические распределения
Построение разного рода оценок и статистических критериев часто основывается на использовании ряда специальных распределений случайных величин.
Нормальное распределение. Случайная величина имеет нормальное распределение с параметрами и , что обозначается как , если плотность вероятности этой случайной величины имеет вид
. (3 .25)
График плотности вероятности случайной величины, имеющей нормальное распределение, представлен на рисунке 3.5, на котором видно, что максимум функции находится в точке .
Поскольку нормальное распределение подробно изучается в курсе теории вероятностей, напомним свойства нормальной случайной величины, которые будут использоваться в дальнейшем.
Рис. 3.5
1) , .
2) Случайная величина называется Центрированной, если ее математическое ожидание равно нулю. Для того чтобы центрировать случайную величину, надо вычесть из нее математическое ожидание:
.
3) Случайная величина называется Нормированной, если ее дисперсия равна единице, а математическое ожидание равно нулю.
Для того чтобы нормировать случайную величину, надо ее поделить на среднее квадратическое отклонение:
.
Центрированная и нормированная нормальная случайная величина называется стандартной. Таким образом, стандартной будет случайная величина
~ . (3.26)
Вероятность попадания случайной величины в интервал (α,β) вычисляется по формуле
, (3.27)
Где - интеграл вероятности, представляющий собой функцию распределения стандартной нормально распределенной случайной величины. Интеграл вероятности табулирован. Его значения приведены в таблице В Приложения.
Для стандартной нормальной случайной величины и симметричного промежутка формула (3.27) принимает следующий вид:
. (3.28)
Распределение (хи-квадрат). Если , независимые стандартные нормальные случайные величины, то говорят, что случайная величина
(3.29)
Имеет распределение хи-квадрат с степенями свободы, что обозначается как . Графики плотности вероятности для двух значений степени свободы приведены на рис.3.6.
Рис. 3.6
С увеличением числа степеней свободы плотность вероятности стремится к нормальной. При плотность вероятности постоянно убывает, а при имеет единственный максимум , , .
Распределение Стьюдента. Пусть , , , - независимые стандартные нормальные случайные величины. Тогда случайная величина
(3.30)
Имеет распределение Стьюдента с степенями свободы, что обозначается как , при этом
, .
На рис.3.7 приведены кривые стандартного нормального распределения (кривая 1) и плотности распределения Стьюдента (кривая 2).
Рис. 3.7
При плотность распределения Стьюдента стремится к плотности стандартной нормальной случайной величины.
На практике, как правило, используется не плотность вероятности, а Квантиль Распределения. Напомним, что квантилью порядка (или уровня) непрерывной случайной величины называется такое ее значение , которое удовлетворяет равенству ,
Где - функция распределения, а - заданное значение вероятности. Рис.3.8 поясняет понятие квантили порядка .
Рис. 3.8
Следующая теорема устанавливает свойства основных выборочных характеристик, вычисленных по выборке, соответствующих нормальному распределению.
Теорема Фишера. Пусть - случайная выборка из генеральной совокупности , тогда выборочное среднее и несмещенная выборочная дисперсия независимы, и при этом
1) случайная величина имеет распределение ;
2) случайная величина имеет распределение ;
3) случайная величина имеет распределение .
Доказательство теоремы приведено в [2].
Интервальные оценки математического ожидания нормального распределения
Интервальная оценка математического ожидания при известной дисперсии. Построим доверительный интервал для математического ожидания наблюдаемой случайной величины при известной дисперсии по выборке .
Образуем вспомогательную случайную величину , где - точечная оценка математического ожидания . Согласно утверждению 1 теоремы Фишера, случайная величина имеет нормальное распределение и ее функция распределения не зависит от неизвестного параметра.
Доверительный интервал, соответствующий надежности β, определяется из условия (3.20), которое в нашем случае имеет вид
. (3.31)
Неравенства и являются равносильными, то есть для любой выборки они выполняются или не выполняются одновременно, поэтому соотношение (3.31) можно записать в виде
. (3.32)
Поскольку случайная величина имеет стандартное нормальное распределение, вероятность в левой части формулы (3.32) можно выразить через нормальную стандартную функцию распределения по формуле (3.7):
. (3.33)
Приравняв правую часть формулы (3.33) заданной доверительной вероятности β, получим уравнение . Решение этого уравнения является квантилью порядка стандартного нормального распределения и определяется по таблице значений стандартной нормальной функции распределения (см. табл. В Приложения). Предельная ошибка вычисляется по формуле . Таким образом, доверительным интервалом математического ожидания, соответствующим надежности β, является интервал
. (3.34)
Интервальная оценка математического ожидания при неизвестной дисперсии. По выборке из нормального распределения требуется построить доверительный интервал для неизвестного математического ожидания при неизвестной дисперсии D=σ2.
Введем новую случайную величину , где - несмещенная выборочная дисперсия.
Статистика согласно утверждению 3 теоремы Фишера имеет распределение Стьюдента с степенями свободы. Рассуждая аналогично случаю, когда дисперсия известна, получим следующий доверительный интервал для математического ожидания:
, (3.35)
Где - квантиль порядка распределения Стьюдента. В отличие от доверительного интервала (3.34) длина интервала (3.35) случайна и зависит от случайной величины . Поскольку с увеличением числа степеней свободы распределение Стьюдента быстро приближается к нормальному, то для больших выборок интервалы (3.34) и (3.35) практически совпадают.
Пример 3.2. По результатам 9 измерений напряжения батареи получено среднее арифметическое значение 30,6В. Точность вольтметра характеризуется средним квадратическим отклонением 0,2В. Требуется найти доверительный интервал для истинного значения напряжения батареи, соответствующий доверительной вероятности β=0,95, предполагая, что контролируемый признак имеет нормальный закон распределения.
Решение. Для нахождения доверительного интервала воспользуемся формулой (3.34). Квантиль порядка 0,975 найдем по таблице А Приложения: .Поскольку предельная ошибка , то доверительный интервал имеет вид
.
Интервальная оценка дисперсии нормального распределения
Построим доверительный интервал для дисперсии D=σ2 наблюдаемой случайной величины ~ по случайной выборке при неизвестном математическом ожидании.
Введем случайную величину (статистику) , (3.36)
Которая согласно утверждению 2 теоремы Фишера имеет распределение с степенями свободы. Поскольку плотность распределения этого закона асимметрична, доверительный интервал, соответствующий надежности β, найдем из формулы (3.31) в виде:
. (3.37)
Обычно доверительный интервал для случайной величины выбирают так, чтобы вероятность ее попадания за пределы этого интервала влево и вправо была одинаковой ( рис. 3.9):
.
Тогда условия для определения значений и будут иметь вид:
, . (3.38)
По таблице квантилей - распределения ( табл. С Приложения) найдем
, . (3.39)
Рис. 3.9.
Неравенства эквивалентны неравенствам , поэтому
.
Следовательно, интервал
(3.40)
Является доверительным интервалом дисперсии, соответствующим доверительной вероятности β.
Пример 3.3. По данным выборочного контроля найти выборочное математическое ожидание и несмещенную оценку дисперсии нормальной случайной величины ξ. Найти доверительные интервалы для них, соответствующие доверительной вероятности β=0,98.
Таблица 3.4
42 |
43 |
45 |
46 |
48 |
51 |
52 |
54 | |
1 |
2 |
3 |
6 |
4 |
3 |
1 |
1 |
Решение. Выборочное математическое ожидание найдем по формуле (3.14), используя табл.3.4
При .
Несмещенную выборочную дисперсию вычислим по формуле (3.19):
, .
Доверительный интервал для математического ожидания определим по формуле (3.35). При из таблицы А Приложения находим квантиль распределения Стьюдента . Вычислив предельную ошибку ,
Получим искомый доверительный интервал для математического ожидания:
.
Границы доверительного интервала для дисперсии определим по формуле (3.20). По таблице квантилей распределения χ2 (см. табл. С Приложения) при определим квантили:
, .
Подставив эти значения, а также и в формулу (3.20), получим искомый доверительный интервал для дисперсии
.
Вопросы для самопроверки
2. Что называется выборкой?
3. Как произвести оценку выборочного математического ожидания и выборочной дисперсии?
4. Как найти функцию распределения для дискретной случайной величины?
5. Что такое несмещенная оценка параметра?
6. Дайте определение состоятельной оценки.
7. Что такое интервальная оценка?
< Предыдущая | Следующая > |
---|