08.1. Схема испытаний Бернулли
Вероятности событий при гипотезе. Обратимся к описанному выше тройному тесту. Мы выяснили, что статистической моделью этого теста является схема испытаний Бернулли, и выдвинули несколько статистических гипотез, которые были сформулированы так: , , Н : р = 0.9, где Р — вероятность правильного правильного ответа в одном испытании.
Пусть для определенности число испытаний П = 10. (Вообще-то десяти испытаний для серьезных выводов недостаточно. Мы выбралИ П = 10 только ради простоты изложения, чтобы сделать последующие расчеты легко обозримыми.) В качестве наблюдения Х В этой Cxeме эксперимента должны выступать результаты этих 10 испытаний т. е. последовательность длины 10 вида Успех, неудача, неудача, Успех И т. д. Соответственно пространство Х состоит из ВсевозМожных таких последовательностей. Вероятность любой из них равна , где S — число правильных ответов. Можно показать, что статистические решения, основанные на S, не будут менее точными, Чем решения, основанные на полной записи результатов. (Это очень интересная математическая особенность, на которой мы не можем остаНавливаться. Скажем лишь, что это означает, что вся информация, Необходимая для принятия решений о величине Р, заключена в числе успехов S, а сведения о конкретном чередовании успехов и неудач не важны.) Поэтому проверку гипотез мы будем проводить, основываясь на числе успехов S, которое имеет биномиальное распределение.
Для проверки первой гипотезы надо выбрать такое событие, вероятность которого, вычисленная согласно гипотетическому распределению вероятностей, была бы малой. Обозначим это событие через А. Выберем некоторое число E, и все события, вероятность которых меньше E, будем считать маловероятными. Пусть, например, . Вероятность А, которую мы обыкновенно обозначаем через Р(А), сейчас удобно записать , отмечая, что эта вероятность вычислена при гипотезе Н. Рассмотрим некоторые примеры событий и вычислим их вероятности. В табл. 2 приведены вероятности событий вида {S = K} при .
Таблица 2
K |
0 |
1 |
2 |
3 |
4 |
5 |
0.0173 |
0.0868 |
0.1950 |
0.2602 |
0.2276 |
0.1365 | |
K |
6 |
7 |
8 |
9 |
10 | |
0.0569 |
0.0163 |
0.0030 |
0.0004 |
0.0000 |
Легко видеть, что половина этих событий маловероятна согласно выбранному нами критерию.
В табл. 3 приведены вероятности событий, заключающихся в том, что правильных ответов больше или равно заданному числу, т. е. событий вида , K = 0,1, 2,..., 10. Таблица 3
K |
0 |
1 |
2 |
3 |
4 |
5 |
1.000 |
0.9872 |
0.8959 |
0.7009 |
0.4407 |
0.2131 | |
K |
6 |
7 |
8 |
9 |
10 | |
0.0766 |
0.0197 |
0.0034 |
0.0004 |
0.0000 |
Здесь тоже несколько событий имеют вероятность меньше 0.02. Как видим, для выбора маловероятного при Н события А имеется довольно много возможностей. Как мы говорили в п. 3.2, надо выбрать А так, чтобы была малой, но при нарушении Н становилась бы большой. То есть выбрать такое А, которое неправдоподобно при Н и естественно, (обыкновенно, не удивительно) при рассматриваемой альтернативе к Н. Как мы установили в п. 3.3, альтернативой к гипотезе может быть совокупность распределений, для которых . Таким образом, с простой гипотезой Н конкурирует сложная альтернатива . Эту альтернативу называют односторонней (правосторонней), чтобы отличить от двусторонней альтернативы .
Можно, разумеется, рассматривать и простые альтернативы к гипотезе Н. Рассмотрим, например, альтернативу , и разберем в этой ситуации, как осуществить выбор множества А, руководствуясь изложенным выше принципом.
Вероятности событий при альтернативе. Посмотрим, как изменяются вероятности событий, приведенных в таблице 3, когда они вычисляются при альтернативе P = 0.9. Соответствующие значения даны в таблице 4.
Анализируя табл. 2, видим, что события S = 7, S = 8, S = 9, S = 10 маловероятны как каждое в отдельности, так и все вместе взятые, т. е. объединение этих событий, которое можно записать в виде S ³ 7, имеет вероятность, равную 0.0197 (см. табл. 3). Из табл. 4 видно, что вероятность события S ³ 7, вычисленного при альтернативе, равна 0.9872, т. е. событие S ³ 7 при справедливости альтернативы практически достоверно. Поэтому в качестве критического для гипотезы при ее проверке против конкурирующей гипотезы Н3 : Р = 0.9 можно взять событие {S³7}.
Может возникнуть следующий вопрос: почему мы не включили событие S = 0 в выбираемое нами маловероятное (при первой гипотезе) событие А, вместо, например, событий S = 7 и S = 8? Ответ дает расчет вероятности события при альтернативе. Действительно, , т. е. это событие менее вероятно при альтернативе, чем выбранное выше.
Разобранный пример характеризует в некотором смысле идеальную ситуацию, когда удается найти такое событие А, которое практически невозможно при Н и практически достоверно при альтернативе. В этом случае по результатам эксперимента, в зависимости от того, произошло или нет А, мы уверенно можем судить, имеем ли дело с Н или с альтернативой. Таблица 4
K |
0 |
1 |
2 |
3 |
4 |
5 |
1.000 |
1.000 |
1.000 |
1.000 |
1.000 |
0.9999 | |
K |
6 |
7 |
8 |
9 |
10 | |
0.9984 |
0.9872 |
0.9298 |
0.7361 |
0.3487 |
Сложная альтернатива. С точки зрения экспериментатора, разумной альтернативой к гипотезе является сложная альтернатива . Эта альтернатива не задает конкретного распределения вероятностей в схеме Бернулли. Вероятности событий при альтернативе H1 зависят от конкретного значения параметра Р, . Они изменяются вместе с изменением этого параметра, и мы можем судить о тенденции изменения этой вероятности. Очевидно, что чем больше значение Р, тем больше вероятность появления большого числа успехов S. Это наглядно показывает сравнение таблиц 2 и 4. Выше было установлено, что событие при справедливости первой гипотезы маловероятно. В то же время, чем больше значение Р, тем больше вероятность этого события. Так, при Р = 0.9 . Поэтому разумно именно с помощью этого события судить о справедливости Н — если альтернативой к Н выступает .
Предположим, что мы провели обсуждаемый эксперимент и получили для S конкретное значение. Обозначим это наблюденное значение как чтобы отличать случайную величину S от ее реализации . Пусть, к примеру, . Тем самым осуществилось событие . Поэтому мы отвергаем гипотезу на уровне значимости 0.02 в пользу альтернативы .
Упоминание уровня значимости в заключительном решении существенно — от его величины зависит, отвергаем мы гипотезу или нет. Пусть, например, E = 0.005. Тогда критическое множество есть , И опыт, в котором не отвергает гипотезу на уровне значимости 0.005 против альтернативы .
Выбор уровня значимости всегда произволен. Неприятно, что от этого произвола зависит решение — отвергнуть или нет гипотезу. В данном примере (и во многих других случаях) есть более гибкий способ действий — указать Минимальный уровень значимости, на котором можно отвергнуть гипотезу.
Критическое событие в нашей задаче имеет вид , где С — некоторое критическое значение. Чем больше число С, тем менее вероятно при гипотезе Н событие . Тем больше поэтому уверенность, что Н надо отвергнуть, если . Наибольшей достижимой уверенности соответствует наименьший возможный уровень значимости, который в нашей задаче есть .
Наименьший уровень значимости полезно вычислять во всех случаях, так как он характеризует, насколько сильно наблюденное значение противоречит гипотезе Н.
Виды альтернатив. В примере испытаний Бернулли, которые обсуждались выше, разумный класс альтернатив к гипотезе был определен как . Такие альтернативы называют Односторонними (в данном случае, правосторонними). Встречаются статистические задачи и с левосторонними альтернативами. Основную гипотезу в этом случае приходится отвергать, если успехов в опыте зарегистрировано неестественно мало с точки зрения гипотезы Н. Иначе говоря, критическое множество А имеет вид , а число С выбирается так, чтобы была малой.
Наиболее общими альтернативами являются Двусторонние альтернативы. Пусть основная (нулевая, как часто говорят) гипотеза имеет вид , где р — некоторое определенное число. Если невозможно заранее указать направление изменения Р при отступлении от Н0, приходится рассматривать альтернативу вида . Руководствуясь изложенными принципами проверки статистических гипотез и характером изменения распределения вероятностей между возможными значениями S (числом успехов) при разных Р, мы заключаем, что в данном случае следует отвергнуть гипотезу Н0 и тогда, когда неправдоподобно велико, и тогда, когда оно неправдоподобно мало. Напомним, что все эти вероятности вычисляются так, как это предписывает проверяемая гипотеза Н0.
Следовательно, надо выбрать два критических значения для S, а именно верхнее и нижнее, скажем, Х и У. Выбрать их необходимо так, чтобы была малой. Гипотеза Н0 Отвергается, если , либо . Уровень значимости этого критерия есть .
Замечание. Обычно описанное правило оформляют несколько иначе, следя за отклонением наблюдаемого S от его ожидаемого значения Пр0. Напомним, что математическое ожидание числа успехов в схеме Бернулли равно MS = Пр0. С помощью таблиц выбирают число Z так, что вероятность Оказывается малой. Гипотезу Н0 : р = р0 отвергают, если . В этом случае статистикой критерия служит уже не S, a . Здесь также можно вычислять минимальный уровень значимости, на котором можно отвергнуть Н0 : Р = р0 против двусторонней альтернативы . Он равен .
< Предыдущая | Следующая > |
---|