1.2. Общие параметры выборки

Определение общих параметров выборки осуществляется после завершения полевых работ (когда собраны все анкеты). Данный этап состоит из ряда взаимосвязанных ша­гов. Это:

■ определение реального количества опрошенных респондентов;

■ определение структуры выборки;

■ распределение по месту опроса;

■ установление доверительного уровня статистической надежности выборки;

■ расчет статистической ошибки и определение репрезентативности выборки. Первое, что должно интересовать исследователя после получения заполненных анкет, — это количество респондентов. Оно может быть либо больше, либо мень­ше запланированного количества анкет. При этом первый вариант лучше с точки зрения статистического анализа, но хуже с точки зрения руководства фирмы, так как дополнительные анкеты являются незапланированными расходами на оплату работы интервьюеров. Второй вариант обычно хуже и с точки зрения анализа (вы­борка менее представительна), и с точки зрения руководства (заказчик будет не­доволен несоблюдением требований, оговоренных в ТЗ).

При оценке разницы между реальным и плановым размером выборки следует при­нимать в расчет разницу в статистической ошибке (см. ниже). Если она невелика (в ту или другую сторону), репрезентативность всей выборки существенно не стра­дает. Но если разница достаточно значима, выборка может оказаться непредстави­тельной. Кроме того, при определении общего размера выборки необходимо иметь в виду, что статистическая ошибка всей выборки относится только к общим распределениям. Разрезы существенно увеличивают статистическую ошибку. Поэто­му еще до начала опроса следует определить, какая численность каждой из инте­ресующих целевых групп респондентов является достаточной для построения ста­тистически значимых заключений и выводов.

Структура выборки может быть случайной (респонденты отбирались в случайном порядке) или неслучайной (респонденты отбирались на основании заранее извест­ных критериев, например методом квотирования). Эта информация важна при ин­терпретации результатов статистического анализа. Случайные выборки априори являются репрезентативными, так как на попадание/непопадание каждого респон­дента в выборку не влияют никакие факторы, кроме случайных. Представитель­ность неслучайных выборок не следует из их определения. Иногда они специально делаются нерепрезентативными относительно генеральной совокупности, однако могут являться весьма представительными относительно какой-либо одной инте­ресующей целевой группы (например, исследуется только мнение мужчин в воз­расте после 40 лет).

При анализе структуры выборки необходимо также изучить фильтрационные во­просы анкеты, то есть вопросы, специально предназначенные для отсеивания не подходящих под требования выборки респондентов. Несмотря на то, что такие вопросы позволяют исключить не нужные для конкретного исследования целе­вые группы, знание доли исключенных категорий позволит впоследствии соста­вить общее представление о параметрах всей генеральной совокупности.

Приведем пример. Методом телефонного опроса исследуется потребительский спрос на московском рынке творожной массы. При этом опрашиваются только лица, покупающие данный продукт, — для чего в анкету добавлен соответствующий фильтрационный вопрос. Однако в дальнейшем потребуется рассчитать емкость рынка исследуемого продукта. Решением данной задачи будет подсчет количества отсеянных респондентов (лиц, не покупающих творожную массу). Таким образом, впоследствии мы сможем определить долю покупателей творожной массы от об­щей численности населения Москвы.

Еще одна важная для исследователя характеристика выборки — это распределе­ние респондентов по месту опроса (личные интервью). Позже эти данные могут помочь при определении различий между респондентами, опрошенными в разных местах. (Очевидна разница в доходах между посетителями рынков и бутиков.)

Имея в своем распоряжении указанную выше информацию, можно приступать к определению представительности (или репрезентативности) выборки. Прежде всего необходимо установить уровень доверия к результатам опроса. Обычно в маркетинговых исследованиях используется уровень доверия 95 % и 99 %. Мы рекомендуем остановиться именно на первом варианте как на наиболее релевант­ном по отношению к маркетинговым исследованиям.

В зависимости от выбранного доверительного уровня определяется специфиче­ская константа г, участвующая в формуле расчета статистической ошибки выбор­ки. Константы доверительных уровней, наиболее часто используемых в маркетин­говых исследованиях, представлены в табл. 1.1.

Таблица 1.1. Константы доверительных уровней

Доверительный уровень

Константа z

90 %

95 %

99 %

±1,64

±1,96

±2,58

Максимальная статистическая ошибка выборки рассчитывается по следующей формуле:

Где — статистическая константа для соответствующего доверительного уровня; p= q = 50 % — вероятность наступления/ненаступления исследуемого события (то есть попадания/непопадания респондента в выборку); для случайных выборок данная ве­роятность равна 1/2 или 50 %; N — размер выборки (общее количество опрошенных).

Таким образом, для выборки в 1000 респондентов и при уровне доверия к резуль­татам опроса 95 % статистическая ошибка выборки будет равна:

Эта же статистическая ошибка используется для характеристики всех значений в вы­борке, выраженных в относительных величинах. То есть если в дальнейшем при по­строении линейных распределений по вопросам анкеты мы выясним, что 32 % рес­пондентов покупают газеты в киосках на улице, — это будет означать, что данное значение варьируется в пределах от 28,9 % (32 % - 3,1 %) до 35,1 % (32 % + 3,1 %).

Для расчета статистической ошибки значений переменных, выраженных в абсо­лютных величинах, применяется другая формула. При этом ошибка варьируется в зависимости от конкретной анализируемой величины. Ее расчет основан на по­строении линейных распределений и показан в разделе 2.1.

© 2011-2024 Контрольные работы по математике и другим предметам!