4.2.2. Частные корреляции. Выявление ложных корреляций
На практике иногда возникают ситуации, когда в результате корреляционного анализа обнаруживаются логически необъяснимые, противоречащие объективному опыту исследователя корреляции между двумя переменными (например, оказывается, что между уровнем дохода респондентов и количеством детей в семье существует статистически значимая зависимость). В этом случае говорят о так называемой ложной корреляции, исследовать которую помогают частные коэффициенты корреляции.
Рассмотрим процедуру исследования частных корреляций на следующем примере из маркетингового исследования поведения посетителей залов игровых автоматов. В результате обработки анкет респондентов были, в частности, получены три интервальные переменные:
■ q47 — возраст;
■ q49 — количество членов семьи;
■ q50 — среднемесячный доход на 1 члена семьи.
Над данными переменными был проведен корреляционный анализ (Пирсона), который выявил логически необъяснимую, но статистически значимую зависимость между переменными: Доход и Количество членов семьи (рис. 4.23).
|
Как видно из таблицы, обе рассматриваемые переменные коррелируют с третьей переменной Возраст. В такой ситуации корреляция между уровнем дохода респондентов и численностью их семей может объясняться влиянием третьей переменной: возраста респондентов. То есть связанными (коррелирующими), на самом деле, являются пары возраст/уровень дохода и возраст/количество членов семьи. Проверим данную гипотезу при помощи частных коэффициентов корреляции.
Откройте диалоговое окно Partial Correlations (меню Analyze ► Correlate ► Partial). В левом списке всех доступных переменных выберите переменные, между которыми обнаружена странная корреляция (q50 Доход и q49 Количество членов семьи), и поместите их в область Variables. Переменную, с которой коррелируют обе исследуемые переменные (q47 Возраст), поместите в область Controlling for (рис. 4.24). В этом диалоговом окне больше ничего не изменяйте — просто запустите программу на исполнение, щелкнув на кнопке ОК.
|
В окне SPSS Viewer появятся результаты расчетов частных коэффициентов корреляции (рис. 4.25). В данной таблице первая строка каждой ячейки содержит коэффициент корреляции Пирсона, а третья — статистическую значимость данного коэффициента. Из таблицы вы видите, что между количеством членов семьи (q49) и уровнем дохода (q50) больше не наблюдается статистически значимой корреляции (Р = 0,520), а коэффициент Пирсона сильно уменьшился (0,0256). Следовательно, корреляция, представленная на рис. 4.23, объясняется влиянием третьей переменной Возраст и, таким образом, является ложной.
|
< Предыдущая | Следующая > |
---|