05.1. Генеральная совокупность и выборка
В процессе статистического наблюдения обследованию могут подвергаться все элементы данной совокупности или некоторая часть их. В соответствии с этим наблюдения бывают сплошными или несплошными. Наиболее совершенный и научно обоснованный способ несплошного наблюдения—это выборочное наблюдение.
Оно рассчитано на то, чтобы на основе обследования некоторой части совокупности судить о всей данной совокупности.
Например, если требуется обследовать большой коллектив рабочих одной и той же профессии в отношении распределения бюджета, то из-за значительной трудоемкости всей работы практикуется выборочное обследование небольшой части этого коллектива.
Весь коллектив при этом называется Генеральной совокупностью, А выделенная для обследования часть коллектива называется Выборочной соВОкупностью.
Наиболее простой способ образования «случайной» выборки состоит в следующем.
Предварительно все члены генеральной совокупности нумеруются, и каждый номер записывается на отдельной карточке. Получившаяся пачка содержит столько же карточек, сколько членов имеет вся генеральная совокупность. Затем после тщательного перемешивания из пачки наугад берутся отдельные карточки, и ноМЕра каждой Нз Них фиксируются. Перечень номеров этих карточек указывает, какие члены генеральной совокупности случайно попали в состав выборочной совокупности. При этом существуют два принципиально различных вида случайной выборки.
1. Если каждая карточка, вынутая наугад из всей пачки, после фиксирования ее номера возвращается обратно в обЩУю пачку, то зафиксированные номера карточек определят состав Собственно случайной повторной выборки.
2. Если каждая наугад вынутая карточка не возвращаетсЯ в общую пачку, то зафиксированные номера карточек определят состав Собственно случайной бесповторной выборки.
Заметим, что случайная бесповторная выборка имеет место и тогда, когда из тщательного перемешанной пачки сразу берется нужное количество карточек.
Отношение объема выборочной совокупности П к объему генеральной совокупности N, т. Е. , называется Относительным Показателем выборки. Если в нашем примере N=20000 и П=1000, то в данном случае относительный показатель выборки Равен .
Любое выборочное наблюдение независимо от относИТельного показателя выборки, как правило, не дает точной характеристики всей генеральной совокупности. Поэтому каждый результат, вычисленный по данным выборки, имеет некоторую погрешность. Эта погрешность называется ОшибкоЙ репрезентативности (или представИТельности). Ошибка репрезентативности показывает величину расхождения между показателями по данным выборочного обследования и соответствующими показателями всей статистической (генеральной) сОВокупности.
Особенностью выборочного наблюдения является то, что отбор единиц (объектов наблюдения) выполняется в случайном порядке. Поэтому к выборочному наблюдению применимы положения и теоремы теории вероятностей, дающие возможность определять границы возможных ошибок. Случайный характер отбора объектов обследования в выборке приводит к случайному же характеру ошибок репрЕЗентативности. Поэтому здесь можно на основе закона больших чисел, увеличивая объем выборки, регулировать пределы возможной ошибки репрезентативности и, наоборот, по заданному пределу допустимой ошибки определить необходимую численность выборки.
Ошибка репрезентативности имеет важное значение в применении результатов выборочного обследования. При вычислЕНии средней, она определяется как разность между выборочной средней и генеральной средней.
Заметим, что Генеральной средней называется среднее значение изучаемого признака в генеральной совокупности
.
Это — средняя взвешенная при наличии в совокупности ПовтоРяюЩИхся значений признака.
При отсутствии повторений применяется формула средней Арифметической
.
Аналогично Выборочной средней называется среднее значение того же признака в выборочной совокупности. Здесь соответственно применяются формулы
Или
(П — Объем выборочной совокупности).
Обозначая ошибку репрезентативности символом D, будем иметь
.
Приведем конкретный пример.
Пусть в коллективе из 20 000 рабочих СРедняя месячная Заработная плата рабочего (генеральная средняя) составляет 95,9 Руб. При выборочном обследовании 1000 рабочих средняя заработнаЯ Плата рабочего (выборочная средняя) оказалась равной 96 руб.
Отсюда ошибка репрезентативности при выборочном обследованиЯ определяется так: Руб.
Аналогично проводится вычисление ошибки репрезентативностЬ При определении доли изучаемого признака в некоторой генеральноЙ Совокупности. Если N — Численность генеральной совокупности, А М — Количество единиц, обладающих данным признаком в ее составе, то доля (Р) единиц, обладающих этим признаком в генеральной совокупности
Называется Генеральной долей.
Если для выборочной совокупности П обозначает численность выборки, Т — Количество единиц, обладающих изучаемым признаком в составе выборочной совокупности, то обозначим буквой W — Долю соответствующих единиц в составе выборки.
Это — выборочная доля .
Разность определяет ошибку репрезентативности. Пусть в рассматриваемом коллективе из N = 20000 рабочих имеется 1250 учеников, т. Е. М = 1250. Этим определяется генеральная доля учеников в объеме генеральной совокупности
В выборочной совокупности из П=1000 человек оказалось M=64 ученика. Этим определяется Вьборочная доля .
Ошибка репрезентативности, ТакИм образом, составляет
,
Или .
Нахождение параметров распределения по выборочным данным (случай нормальНОго распределения).
Если ставится вопрос об установлении закона распределения случайной величины Х по ее частным значениям , полученным в результате выборки, то возникает необходимость отыскания значений тех параметров, которые характеризуют этот закон распределения. Наиболее распространенным является нормальное распределение, которое задается плотностью вероятности
Или функцией распределения ,
Где параметр А — математическое ожидание случайной величины X, а — Ее дисперсия.
Значения случайной величины Х , являющиеся независимыми результатами опыта (в порядке выборки), можно рассматривать как значения П независимых случайных величин, имеющих равные математические ожидания А. Для таких случайных величин справедливо следствие из теоремы Чебышева в виде
Это означает, что математическое ожидание случайной величины X, т. е. генеральная средняя, приближенно выражается средней арифметической (или средней взвешенной при наличии повторяющихся значений Х) ее значений, полученных в порядке выборки, т. е. .
Переходя к определению , т. е. дисперсии случайной величины Х По выборочным данным, следует отметить, что переход в формуле к значениям по данным выборки приводит к РезульТату (вывод его мы опускаем) .
Это — формула так называемоЙ Выборочной ДИсперсии. При больШой численности П выборки дроби и мало отличаются МеждУ собой, и поэтому значения и почти совпадают. При неболь Шой же численности П эти значения дают заметное расхождение.
В соответствии с указанным результатом для и среднее Квадратическое отклонение по выборочным данным принимается в вид .
Пример 1. Наблюдение в контрольной лаборатории за сроком годности 50 электроламп одинаковой мощности, взятых наудачу из большой партии выпущенных заводом ламп этой же мощности, привело к следующим данным о нарушении установленного гарантийНого срока горения:
Отклонение в Ч |
-30 |
-20 |
-10 |
0 |
10 |
20 |
30 |
Частоты |
5 |
6 |
8 |
10 |
9 |
8 |
4 |
Требуется по этим выборочным данным найти параметры норМального распределения, которое отражает отклонение фактическоГо Срока горения лампочек от гарантийного.
Решение. Среднее отклонение
.
Выборочная дисперсия
Таким образом, искомое нормальное распределение Характеризуется следующими значениями параметров: А » 0,4, И . Отсюда плотность вероятности
.
Соответствующая этой плотности функция Распределения выразится так:
.
< Предыдущая | Следующая > |
---|