3.4. Интервальные - оценки
В статистике имеются два подхода к оцениванию неизвестных параметров распределений: точечный и интервальный. В соответствии с точечным оцениванием, которое рассмотрено в предыдущем разделе, указывается лишь точка, около которой находится оцениваемый параметр. Желательно, однако, знать, как далеко может отстоять в действительности этот параметр от возможных реализаций оценок в разных сериях наблюдений.
Ответ на этот вопрос – тоже приближенный – дает другой способ оценивания параметров – интервальный. В соответствии с этим способом оценивания находят интервал, который с вероятностью, близкой к единице, накрывает неизвестное числовое значение параметра.
Понятие интервальной оценки
Точечная оценка является случайной величиной и для возможных реализаций выборки принимает значения лишь приближенно равные истинному значению параметра
. Чем меньше разность
, тем точнее оценка. Таким образом, положительное число
, для которого
, характеризует точность оценки и называется Ошибкой оценки (или предельной ошибкой).
Доверительной вероятностью (или надежностью) называется вероятность β, с которой осуществляется неравенство , т. е.
. (3.20)
Заменив неравенство равносильным ему двойным неравенством
, или
, получим
. (3.21)
Интервал , накрывающий с вероятностью β,
, неизвестный параметр
, называется Доверительным интервалом (или интервальной оценкой), соответствующим доверительной вероятности β.
Случайной величиной является не только оценка , но и ошибка
: ее значение зависит от вероятности β и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (3.21) следует читать так: “Интервал
накроет параметр
с вероятностью β ”, а не так: “Параметр
попадет в интервал
с вероятностью β ”.
Смысл доверительного интервала состоит в том, что при многократном повторении выборки объема в относительной доле случаев, равной β, доверительный интервал, соответствующий доверительной вероятности β, накрывает истинное значение оцениваемого параметра. Таким образом, доверительная вероятность β характеризует Надежность доверительного оценивания: чем больше β, тем вероятнее, что реализация доверительного интервала содержит неизвестный параметр.
Следует, однако, иметь в виду, что с ростом доверительной вероятности β в среднем растет длина доверительного интервала, то есть уменьшается точность доверительного оценивания. Выбор доверительной вероятности определяется конкретными условиями; обычно используются значения β, равные 0,90; 0,95; 0,99.
Вероятность (3.22)
называется Уровнем значимости и характеризует относительное число ошибочных заключений в общем числе заключений.
В формуле (3.21) границы доверительного интервала симметричны относительно точечной оценки. Однако не всегда удается построить интервал, обладающий таким свойством. Более общим является следующее определение.
Доверительным интервалом (или Интервальной оценкой) параметра с доверительной вероятностью β, 0< β <1, называется интервал со случайными границами
,
, накрывающий с вероятностью β неизвестный параметр
, т. е.
. (3.23)
Иногда вместо двусторонних доверительных интервалов рассматривают односторонние доверительные интервалы, полагая или
.
Построение интервальных оценок
Доверительный интервал задается своими концами и
. Однако найти функции
и
из условия (3.23) невозможно, поскольку закон распределения этих функций зависит от закона распределения ξ и, следовательно, зависит от неизвестного параметра
. Используют следующий прием, позволяющий в ряде случаев построить доверительный интервал. Подбирается такая функция
, чтобы:
- ее закон распределения был известен и не зависел от неизвестного параметра ;
- функция Была непрерывной и строго монотонной по
.
Тогда для любого β можно выбрать два числа и
так, чтобы выполнялось равенство
. (3.24)
Отсюда находят и
как квантили функции распределения
. Границы искомого доверительного интервала выражают через найденные квантили и выборочные данные, используя для этого соотношения, связывающие новую и старую случайные величины.
Если плотность распределения случайной величины Симметрична, то доверительный интервал симметричен относительно точечной оценки
, и для нахождения границ доверительного интервала вместо условия (3.23) можно использовать соотношение (3.21).
Основные статистические распределения
Построение разного рода оценок и статистических критериев часто основывается на использовании ряда специальных распределений случайных величин.
Нормальное распределение. Случайная величина имеет нормальное распределение с параметрами
и
, что обозначается как
, если плотность вероятности этой случайной величины имеет вид
. (3 .25)
График плотности вероятности случайной величины, имеющей нормальное распределение, представлен на рисунке 3.5, на котором видно, что максимум функции находится в точке .
Поскольку нормальное распределение подробно изучается в курсе теории вероятностей, напомним свойства нормальной случайной величины, которые будут использоваться в дальнейшем.
![]() |
Рис. 3.5
1) ,
.
2) Случайная величина называется Центрированной, если ее математическое ожидание равно нулю. Для того чтобы центрировать случайную величину, надо вычесть из нее математическое ожидание:
.
3) Случайная величина называется Нормированной, если ее дисперсия равна единице, а математическое ожидание равно нулю.
Для того чтобы нормировать случайную величину, надо ее поделить на среднее квадратическое отклонение:
.
Центрированная и нормированная нормальная случайная величина называется стандартной. Таким образом, стандартной будет случайная величина
~
. (3.26)
Вероятность попадания случайной величины в интервал (α,β) вычисляется по формуле
, (3.27)
Где - интеграл вероятности, представляющий собой функцию распределения стандартной нормально распределенной случайной величины. Интеграл вероятности табулирован. Его значения приведены в таблице В Приложения.
Для стандартной нормальной случайной величины и симметричного промежутка формула (3.27) принимает следующий вид:
. (3.28)
Распределение (хи-квадрат). Если
,
независимые стандартные нормальные случайные величины, то говорят, что случайная величина
(3.29)
Имеет распределение хи-квадрат с степенями свободы, что обозначается как
. Графики плотности вероятности для двух значений степени свободы приведены на рис.3.6.
![]() |
Рис. 3.6
С увеличением числа степеней свободы плотность вероятности стремится к нормальной. При
плотность вероятности постоянно убывает, а при
имеет единственный максимум
,
,
.
Распределение Стьюдента. Пусть ,
,
,
- независимые стандартные нормальные случайные величины. Тогда случайная величина
(3.30)
Имеет распределение Стьюдента с степенями свободы, что обозначается как
, при этом
,
.
На рис.3.7 приведены кривые стандартного нормального распределения (кривая 1) и плотности распределения Стьюдента (кривая 2).
![]() |
Рис. 3.7
При плотность распределения Стьюдента стремится к плотности стандартной нормальной случайной величины.
На практике, как правило, используется не плотность вероятности, а Квантиль Распределения. Напомним, что квантилью порядка (или уровня) непрерывной случайной величины
называется такое ее значение
, которое удовлетворяет равенству
,
Где - функция распределения, а
- заданное значение вероятности. Рис.3.8 поясняет понятие квантили порядка
.
![]() |
Рис. 3.8
Следующая теорема устанавливает свойства основных выборочных характеристик, вычисленных по выборке, соответствующих нормальному распределению.
Теорема Фишера. Пусть - случайная выборка из генеральной совокупности
, тогда выборочное среднее
и несмещенная выборочная дисперсия
независимы, и при этом
1) случайная величина имеет распределение
;
2) случайная величина имеет распределение
;
3) случайная величина имеет распределение
.
Доказательство теоремы приведено в [2].
Интервальные оценки математического ожидания нормального распределения
Интервальная оценка математического ожидания при известной дисперсии. Построим доверительный интервал для математического ожидания наблюдаемой случайной величины при известной дисперсии
по выборке
.
Образуем вспомогательную случайную величину , где
- точечная оценка математического ожидания
. Согласно утверждению 1 теоремы Фишера, случайная величина
имеет нормальное распределение
и ее функция распределения
не зависит от неизвестного параметра.
Доверительный интервал, соответствующий надежности β, определяется из условия (3.20), которое в нашем случае имеет вид
. (3.31)
Неравенства и
являются равносильными, то есть для любой выборки
они выполняются или не выполняются одновременно, поэтому соотношение (3.31) можно записать в виде
. (3.32)
Поскольку случайная величина имеет стандартное нормальное распределение, вероятность в левой части формулы (3.32) можно выразить через нормальную стандартную функцию распределения по формуле (3.7):
. (3.33)
Приравняв правую часть формулы (3.33) заданной доверительной вероятности β, получим уравнение . Решение этого уравнения
является квантилью порядка
стандартного нормального распределения и определяется по таблице значений стандартной нормальной функции распределения (см. табл. В Приложения). Предельная ошибка
вычисляется по формуле
. Таким образом, доверительным интервалом математического ожидания, соответствующим надежности β, является интервал
. (3.34)
Интервальная оценка математического ожидания при неизвестной дисперсии. По выборке из нормального распределения
требуется построить доверительный интервал для неизвестного математического ожидания
при неизвестной дисперсии D=σ2.
Введем новую случайную величину , где
- несмещенная выборочная дисперсия.
Статистика согласно утверждению 3 теоремы Фишера имеет распределение Стьюдента с
степенями свободы. Рассуждая аналогично случаю, когда дисперсия известна, получим следующий доверительный интервал для математического ожидания:
, (3.35)
Где - квантиль порядка
распределения Стьюдента. В отличие от доверительного интервала (3.34) длина интервала (3.35) случайна и зависит от случайной величины
. Поскольку с увеличением числа степеней свободы распределение Стьюдента быстро приближается к нормальному, то для больших выборок
интервалы (3.34) и (3.35) практически совпадают.
Пример 3.2. По результатам 9 измерений напряжения батареи получено среднее арифметическое значение 30,6В. Точность вольтметра характеризуется средним квадратическим отклонением 0,2В. Требуется найти доверительный интервал для истинного значения напряжения батареи, соответствующий доверительной вероятности β=0,95, предполагая, что контролируемый признак имеет нормальный закон распределения.
Решение. Для нахождения доверительного интервала воспользуемся формулой (3.34). Квантиль порядка 0,975 найдем по таблице А Приложения:
.
Поскольку предельная ошибка
, то доверительный интервал имеет вид
.
Интервальная оценка дисперсии нормального распределения
Построим доверительный интервал для дисперсии D=σ2 наблюдаемой случайной величины ~
по случайной выборке
при неизвестном математическом ожидании.
Введем случайную величину (статистику) , (3.36)
Которая согласно утверждению 2 теоремы Фишера имеет распределение с
степенями свободы. Поскольку плотность распределения этого закона асимметрична, доверительный интервал, соответствующий надежности β, найдем из формулы (3.31) в виде:
. (3.37)
Обычно доверительный интервал для случайной величины
выбирают так, чтобы вероятность ее попадания за пределы этого интервала влево и вправо была одинаковой ( рис. 3.9):
.
Тогда условия для определения значений и
будут иметь вид:
,
. (3.38)
По таблице квантилей - распределения ( табл. С Приложения) найдем
,
. (3.39)
![]() |
Рис. 3.9.
Неравенства эквивалентны неравенствам
, поэтому
.
Следовательно, интервал
(3.40)
Является доверительным интервалом дисперсии, соответствующим доверительной вероятности β.
Пример 3.3. По данным выборочного контроля найти выборочное математическое ожидание и несмещенную оценку дисперсии нормальной случайной величины ξ. Найти доверительные интервалы для них, соответствующие доверительной вероятности β=0,98.
Таблица 3.4
|
42 |
43 |
45 |
46 |
48 |
51 |
52 |
54 |
|
1 |
2 |
3 |
6 |
4 |
3 |
1 |
1 |
Решение. Выборочное математическое ожидание найдем по формуле (3.14), используя табл.3.4
При
.
Несмещенную выборочную дисперсию вычислим по формуле (3.19):
,
.
Доверительный интервал для математического ожидания определим по формуле (3.35). При из таблицы А Приложения находим квантиль распределения Стьюдента
. Вычислив предельную ошибку
,
Получим искомый доверительный интервал для математического ожидания:
.
Границы доверительного интервала для дисперсии определим по формуле (3.20). По таблице квантилей распределения χ2 (см. табл. С Приложения) при определим квантили:
,
.
Подставив эти значения, а также и
в формулу (3.20), получим искомый доверительный интервал для дисперсии
.
Вопросы для самопроверки
2. Что называется выборкой?
3. Как произвести оценку выборочного математического ожидания и выборочной дисперсии?
4. Как найти функцию распределения для дискретной случайной величины?
5. Что такое несмещенная оценка параметра?
6. Дайте определение состоятельной оценки.
7. Что такое интервальная оценка?
< Предыдущая | Следующая > |
---|