37. Критерий Манна-Уитни
Область применения критерия Манна-Уитни — анализ двух независимых выборок. Размеры этих выборок могут различаться.
Назначение критерия — проверка гипотезы о статистической однородности двух выборок. Иногда эту гипотезу называют гипотезой об отсутствии эффекта обработки (имея в виду, что одна из выборок содержит характеристики объектов, подвергшихся некоему воздействию, а другая — характеристики контрольных объектов).
Данные. Рассматриваются две выборки (выборка Х) и (выборка У) объемов M и П. Обозначим закон распределения первой выборки через F, а второй — через G.
Допущения. 1. Выборки и должны быть независимы.
2. Законы распределений F и G непрерывны. Отсюда следует, что с вероятностью 1 среди чисел и нет совпадающих.
Гипотеза. Утверждение об однородности выборок и в введенных выше обозначениях можно записать в виде H : F = G.
Альтернативы. В качестве альтернатив к H могут выступать все возможности F ¹ G. Однако критерий Манна-Уитни способен обнаруживать отнюдь не все возможные отступления от Н : F = G. Этот критерий предназначен, в первую очередь, для проверки Н против альтернативы (правосторонняя альтернатива, "перетекание" вероятностей вправо) или альтернативы (левосторонняя альтернатива, т. е. уход вероятностей влево). Можно рассматривать и объединение обеих возможностей (двусторонняя альтернатива).
Метод. Критерий Манна-Уитни повторяет основные идеи критерия знаков и в определенном смысле является его продолжением. Он оснОван на Попарном сравнении результатов из первой и второй выборок.
Условимся, что всякое событие обозначает «успех», а всякое событие — «неудачу». Смысл такой терминологии может быть связан с тем, что мы предполагаем, что вторая группа лучше первой, и рады подтверждению наших представлений. Изменяя I от 1 до M и J от 1 до П, получаем Тп парных сравнений элементов выборок Х и У. Обозначим число успехов в этих парных сравнениях через U. Ясно, что U может принимать любое целое значение от 0 до Тп.
Определение. Введенная выше случайная величина U НазываЕтся статистикой Манна — Уитни
Вычислив значение , мы можем приступить к проверке гипотезы Н:
1. Зададим уровень значимости A или выберем метод, связанный с определением наименьшего уровня значимости статистики U, Который Описан ниже.
2. Для правосторонних альтернатив найдем по таблицам Такое Критическое значение , что
.
При этом критическая область для гипотезы Н против правосторонниЙ Альтернатив будет иметь вид:
.
При проверке Н против левосторонних альтернатив надо Найти Критическое значение , такое, что
Здесь критическая область примет вид
В таблицах обычно приводятся критические значения, соответствующие числам A из ряда 0.05, 0.025, 0.01, 0.005, 0.001. Ввиду дискретного характера распределения вероятностей между возможными значениями случайной величины U, приведенные выШе уравнения не всегда имеют точное решение, и в таблицах они ПривоДятся приближенно. Для вычисления по таблицам значении Можно воспользоваться соотношением
+= Mn,
Вытекающим из симметрии распределения статистики U Относительно Своего центра .
3. Отвергнем гипотезу Н против правосторонних (левосторонних) альтернатив при попадании в соответствующую критическую область.
4. При проверке Н против двусторонних альтернатив в качестве критического множества можно взять объединение
,
Т. е. отвергнуть Н, если происходит одно из двух ранее упомянутых критических событий. Ввиду уже отмеченной симметрии этому критерию можно дать вид
При таком выборе критического множества уровень значимости удваивается. Теперь он равен 2A (с теми же оговорками насчет дискретности распределения U, что были сделаны выше). Если мы желаем сохранить и здесь уровень значимости A, надо взять и .
Приближение для больших выборок. Смотри п. 5.2 и связь между статистикой Манна-Уитни и статистикой Уилкоксона, указанную там же в разделе «обсуждение».
Обсуждение. Укажем некоторые свойства статистики U и соображения, приводящие к описанному выше методу проверки гипотезы.
Распределение вероятностей U при гипотеЗЕ Н. Хотя статистика Манна-Уитни является суммой одинаково распределенных случайных величин, принимающих значения 0 и 1, она не имеет биномиального распределения, так как эти величины являются зависимыми (например, зависимы результаты сравнения с Y1 и с У2). Поэтому распределение статистики U приходится рассчитывать, используя специальныЕ таблицы или асимптотические приближения.
Однако расчет распределения статистики U значительно упрощается тем, что при выполнении гипотезы Н это распрЕДеление не зависит от закона распределения выборок (если эти распределения непрерывны). Распределение U при гипотЕЗе Н зависит только от объемов выборок — M и N. В справочниках приводятся таблицы, по которым можно найти вероятность для различных K при небольших значениях M и П.
Заметим, что при справедливости гипотезы H (т. е. при совпадении законов распределения F и G) выполняется . Поэтому при Н количества успехов и неудач должны быть приблизительно равны, т. е. U Не должно значительно отклоняться от .
РаспредеЛЕние статистики U при нарушении гипотезы. Рассмотрим, как может вести себя U при различных альтернативах. В отличие от поведения U при гипотезе, здесь распределение U зависит от F и G, поэтому мы можем описать его свойства лишь для отдельных типов альтернатив. Проще всего указать свойства U для односторонних альтернатив: правосторонних (Если F ³ G), или левосторонних (если F £ G). Легко видеть, что для правосторонних альтернатив выполняется , поэтому значение U, т. е. общее число успехов , скорее всего, должно превосходить и тем значительнее, чем больше . Для левосторонних альтернатив соотношение обратное: , поэтому общее число успехов, как правило, должно быть меньше , и тем меньше, чем меньше .
Итак, для односторонних альтернатив статистика Манна-Уитни имеет ясные свойства, поэтому на ее основе можно построить критерий для проверки гипотезы Н против таких альтернатив.
Метод проверки гипотезы. В связи с таким поведением статистики U для проверки гипотезы Н против указанных выше возможных альтернатив разумно предложить следующее правило: отвергнуть Н, если наблюденное U (в дальнейшем ) значительно отклоняется от — значения, ожидаемого от U при гипотезе Н (от математического ожидания U при гипотезе Н). Чем больше отклоняется от наблюденное значение U, т. е. , тем сильнее мы сомневаемся в том, что H верна. Разумеется, U может значительно отклоняться от и за счет действия случая, когда Н выполняется, но чем больше отклонение, тем оно при Н менее вероятно, и тем труднее объяснить это отклонение случайностью. Скорее всего, если отклонение велико, оно вызвано не случаем, а закономерной причиной — тем, что распределения G и F не совпадают.
Силу таких доводов против Н : F = G в пользу, например, правосторонней альтернативы можно выразить количественно, вычислив . Это вероятность того, что при независимом повторении эксперимента мы получим такое же или еще более сильное свидетельство против Н (в пользу правосторонней альтернативы), как уже имеющееся . Если Велико, то вышеназванная вероятность мала, и наоборот. Если эта вероятность столь мала, что подобное событие кажется практически невозможным при Н, гипотезу Н следует отвергнуть (по имеющемуся наблюдению ), в пользу правосторонней альтернативы.
Рекомендация изменяется очевидным образом, если с Н конкурируют левосторонние альтернативы. Наконец, в случае двусторонних альтернатив надо вычислить вероятность
И в зависимости от того, насколько она мала, отвергнуть гипотезу.
Описанный способ действий имеет определенные ПреимуЩества перед стандартной процедурой проверки статистических гипотеЗ, КАк она описана в пункте 2. Главное то, что здесь не приходится заранее выбирать, Уровень значимости, что всегда выглядит несколько произвольнО. ОписаНный Подход Автоматически доставляет нам тот наименьший уровень ЗнАчимОсти, на котором (по имеющимся наблюдениям) можно отвергнуть гипотезу Н в пользу соответствующей альтернативы. В данном случае есть и еще одно дополнительное преимущество: как мы уже отмечали выше, из-за дискретности распределения U традиционные номинальные уровни значимости типа 0.05, 0.025, 0.001 и т. д. могут быть достигнуты лишь приближенно. В обсуждаемом методе проверки приближение исчезает: мы получаем точное значение вероятности, если обращаемся к достаточно подробным таблицам распределений U.
Совпадения. Выше отмечалось, что из условия непрерывности распределений F и G следует отсутствие повторений в выборках. На практике же такие повторения встречаются часто. Во многих случаях причиной этого является не нарушение исходных предположений, а ограниченная точность при записи наблюдений.
Допустим, что некоторые элементы выборки икс совпали с некоторыми элементами из выборки игрек, т. е. для некоторых . В этом случае статистику U вычисляют так: к числу успехов прибавляют уменьшенное вдвое число событий вида (). Таким образом, каждое совпадение икса и игрека считается за половину успеха. Далее с так подсчитанным числом успехов поступают так, как описано выше.
При наличии совпадающих наблюдений получаемые при использовании описанных критериев выводы имеют приближенный характер, и эти приближения тем хуже (и выводы тем сомнительнее), чем больше среди наблюдений совпадающих, т. е. чем сильнее отступление от исходных математических предположений. В тех случаях, когда результаты (X и Y) могут принимать лишь ограниченное число значений (что влечет за собой большое количество совпадений), этот метод применять не следует. К сожалению, четкого разграничения в этом вопросе сделать нельзя.
< Предыдущая | Следующая > |
---|