5.2. Факторный и кластерный анализ

Кластерный и факторный анализы преследуют ту же цель, что и рассмотренные в предыдущем разделе методы логистической регрессии и дискриминантного анализа: классифицировать переменные и/или категории респондентов по однород­ным группам (сегментам, кластерам). Однако между этими методами существует одно серьезное различие. При дискриминантном анализе и логистической регрес­сии у нас заранее есть некая зависимая (результирующая) переменная с двумя или более вариантами ответа (уровнями, категориями). Задача анализа в данном слу­чае состоит в классификации имеющихся категорий респондентов (возрастных, половых и других) по этим уровням результирующей переменной. Эти два стати­стических метода позволяют сегментировать выборку на заранее известные целе­вые группы. При кластерном и факторном анализе ситуация иная: кластеры (сег­менты, категории), на которые следует разделить выборку, заранее не известны. Задачей статистического анализа в данном случае будет не только формирование максимально однородных сегментов, но и выделение кластеров, по которым будет производиться сегментирование. Приведем пример релевантного задания для фак­торного (кластерного) анализа.

Исходные данные:

Респондентам (пассажирам международных рейсов авиакомпании X) в ходе опроса пред­лагалось 24 утверждения, по которыми они должны были выразить степень своего согла­сия либо несогласия по десятибалльной шкале — от 1 (совершенно не согласен) до 10 (абсолютно согласен). Предложенные утверждения описывают текущую конкурентную по­зицию рассматриваемой компании на международном рынке авиаперевозок. В результа­те опроса и последующих подготовительных этапов к статистическому анализу (см. раз­дел 3) был получен массив из 24 одновариантных переменных (ql-q24) с кодами ответов соответственно от 1 до 10 (интервальная шкала).

Ql. Авиакомпания X обладает репутацией компании, превосходно обслуживающей пассажиров.

Q2. Авиакомпания X может конкурировать с лучшими авиакомпаниями мира.

Q3. Я верю, что у авиакомпании X есть перспективное будущее в мировой авиации.

Q4. Я знаю, какой будет стратегия развития авиакомпании X в будущем.

Q5. Я горжусь тем, что работаю в авиакомпании X.

Q6. Внутри авиакомпании X хорошее взаимодействие между подразделениями.

Q7. Каждый сотрудник авиакомпании прикладывает все усилия для того, чтобы обес­печить ее успех.

Q8. Сейчас авиакомпания X быстро улучшается.

Q9. Нам предстоит долгий путь, прежде чем мы сможем претендовать на то, чтобы

Называться авиакомпанией мирового класса.

QlO. Авиакомпания X действительно заботится о пассажирах.

Qll. Среди сотрудников авиакомпании имеет место высокая степень удовлетворен­ности работой.

Ql2. Я верю, что менеджеры высшего звена прикладывают все усилия для достиже­ния успеха авиакомпании.

Ql3. Мне нравится, как в настоящее время авиакомпания X представлена визуально широкой общественности (в плане цветовой гаммы и фирменного стиля).

Ql4. Авиакомпания X — лицо России.

Ql5. Мы выглядим «вчерашним днем» по сравнению с другими авиакомпаниями.

Ql6. Обслуживание авиакомпании Х является последовательным и узнаваемым во всем мире.

Ql7. Я бы не хотел, чтобы авиакомпания X менялась.

Ql8. Авиакомпании X необходимо меняться для того, чтобы использовать в полной мере имеющийся потенциал.

Ql9. Я думаю, что авиакомпании X необходимо представить себя в визуальном плане более современно.

Q20. Изменения в авиакомпании X будут позитивным моментом. q21. Авиакомпания X — эффективная авиакомпания.

Q22. Я бы хотел, чтобы имидж авиакомпании X улучшился с точки зрения иностран­ных пассажиров.

Q23. Авиакомпания X — лучше, чем многие о ней думают.

Q24. Важно, чтобы люди во всем мире знали, что мы — российская авиакомпания. Требуется:

Выявить схожие (то есть тесно коррелирующие между собой) утверждения и разделить их на несколько однородных групп, описывающих различные аспекты (макропараметры)

Конкурентной позиции авиакомпании X на рынке. Другими словами, выделить группы схо­жих по значению параметров авиакомпании, характеризующих ее состояние на рынке с различных сторон.

Данную задачу невозможно решить методами логистической регрессии или дискриминантного анализа, так как у нас нет зависимой (результирующей) перемен­ной: есть только массив, на первый взгляд, независимых равнозначных парамет­ров. Поставленную цель можно достичь при помощи либо факторного анализа, либо кластерного. Однако прежде, чем мы приступим к решению, следует сказать несколько слов об основных характерных чертах и различиях между этими двумя статистическими методами, предназначенными для решения схожих задач.

Факторный анализ позволяет разделить массив переменных на малое число групп, которые называются факторами. Классификация производится на основании кри­терия корреляции между переменными. В один фактор объединяются несколько переменных, тесно коррелирующих между собой и не коррелирующих или слабо коррелирующих с другими переменными, составляющими другие факторы. Таким образом, в результате факторного анализа мы получаем из несистематизирован­ного массива данных несколько макропеременных, описывающих различные ха­рактеристики продукта компании (или другого исследуемого объекта). Основная сложность при проведении факторного анализа заключается в необходимости ра­ционально интерпретировать полученные макрокатегории с точки зрения здраво­го смысла (применительно к целям и специфике конкретного исследования). Дан­ная проблема не имеет универсального решения и подлежит отдельному анализу в каждом конкретном случае. Ниже мы продемонстрируем пример интерпретации результатов факторного анализа. Именно сложность интерпретации результатов является существенным ограничением рассматриваемой статистической методи­ки, так как из-за невозможности логического описания полученных категорий иногда приходится вообще отказаться от ее использования.

Еще одним ограничением применения факторного анализа является ситуация, когда одна и та же переменная относится сразу к двум или более факторам, то есть перемен­ную нельзя однозначно классифицировать. В таком случае следует либо отказаться от использования факторного анализа и попытаться применить другие статистические методики (например, кластерный анализ), либо заново пересчитать факторную мо­дель без данной переменной, а затем вручную отнести неоднозначную переменную к тому или иному фактору на основании логических соображений.

Далее приведены основные примеры использования факторного анализа в марке­тинговых исследованиях.

Сегментирование рынка. Факторный анализ применяется для выявления агрегат­ных переменных, являющихся основанием для сегментирования потребителей. Например, потребители плавленых сыров могут характеризоваться различной степенью значимости, которую они видят в исследуемых характеристиках данного продукта (респондентов просят оценить по пятибалльной шкале важность несколь­ких характеристик плавленых сыров: срок хранения, калорийность, процент жир­ности и т. д.). Здесь факторный анализ позволит выявить целевые сегменты по­требителей на основании значимости для них различных групп факторов:

■ покупатели, ориентирующиеся при выборе плавленого сыра преимущественно на ценовые факторы (стоимость, скидки);

■ покупатели, ориентирующиеся на качество исследуемого продукта (срок хра­нения, состав ингредиентов, вкус);

■ покупатели, выбирающие сыр в основном по внешнему виду (дизайн упаковки).

В целом следует отметить, что в настоящее время все большую популярность сре­ди исследователей приобретают методы сегментирования потребителей на осно­вании их психографических характеристик. Для этого в анкету включается доста­точно большое количество высказываний (порядка 100-150), характеризующих различные стороны жизненного стиля респондентов. Респонденты должны выра­зить свое согласие или несогласие с данными высказываниями по шкале Лайкерта (согласен — скорее согласен — ни то ни другое — скорее не согласен — не согласен). В дальнейшем на основании ответов респондентов формируются однородные це­левые сегменты (обычно порядка 10).

Изучение продукта и бенчмаркинг продукта. В данном случае факторный анализ помогает выявить агрегатные параметры продукта, влияющие на выбор потреби­теля. Например, различные марки шоколадных конфет могут быть оценены по следующим макрокатегориям: качество (ингредиенты, вкус), полезность для здо­ровья (наличие сахара, калорийность) и цена.

Рекламные и медиа-исследования. Факторный анализ может использоваться для выявления скрытых мотивов поведения потребителей при восприятии рекламы.

Ценообразование. Факторный анализ используется для выявления особенностей поведения потребителей, чувствительных к цене. Например, данная категория рес­пондентов может характеризоваться повышенным вниманием к ценовым факто­рам при выборе продукта, низкими доходами, большой численностью семьи и т. д.

Кластерный анализ является аналогом факторного анализа в том-смысле, что он так же, как и факторный анализ, позволяет выделить факторы (кластеры), объеди­няющие статистически схожие переменные. Однако в данном случае переменные классифицируются не на основании степени тесноты корреляционной связи, а на основании более сложных статистических процедур (наиболее часто использует­ся метод исследования расстояний между переменными в кластерах). Ниже мы продемонстрируем действие обеих анализируемых статистических методик на одном массиве данных (см. выше).

Несмотря на имеющуюся возможность классифицировать переменные кластерный анализ чаще всего применяется для кластеризации групп респондентов (то есть уровней или категорий переменных)1. Данная возможность позволяет, например,

Провести пробное (при неизвестных целевых группах) сегментирование целевых покупателей какого-либо продукта. Сформированные в результате кластерного ана­лиза целевые группы респондентов обладают схожим поведением (то есть взаи­мозависимостями) своих характеристик. В качестве примера успешной кластери­зации можно привести разбиение респондентов на две группы:

■ женщины в возрасте старше 45 лет;

■ все мужчины и женщины младше 45 лет.

При использовании рассматриваемой статистической методики для кластериза­ции респондентов можно совмещать кластерный и факторный анализ, причем в данном случае факторный анализ будет предшествовать кластерному. Часто это делается для того, чтобы сократить количество переменных, участвующих в клас­терном анализе (при большом числе этих переменных). Так, можно сначала выде­лить среди большого числа переменных макропараметры, а затем сегментировать респондентов уже на основании данных факторов.

Теперь у вас сложилось общее представление о методах факторного и кластерного анализа, и мы можем приступить к описанию их практического применения. Вос­пользуемся условием задачи про анализ текущей конкурентной позиции авиаком­пании X. Эта задача поможет нам также сравнить действие данных статистических методик на одной и той же выборке. Для описания кластерного анализа, применя­емого для кластеризации респондентов, мы будем использовать другой пример из практики маркетинговых исследований. Так как для классификации переменных факторный анализ все же применяется чаще, чем кластерный (это сложилось ис­торически и, кроме того, оправдано меньшими усилиями, затрачиваемыми на про­ведение факторного анализа), в разделе 5.2.2 основное внимание будет уделено описанию действия кластерного анализа для классификации респондентов (выде­ления целевых групп потребителей). Сравнение действия двух статистических методов при классификации переменных мы предложим уже в заключении разде­ла 5.2.2.

В качестве примеров практического применения кластерного анализа в маркетин­говых исследованиях можно указать все те же случаи, что и при факторном анали­зе (если кластерный анализ используется для классификации переменных). В слу­чае применения кластерного анализа для классификации конкретных групп респондентов он предоставляет исследователю гораздо более гибкие возможности и в большем числе областей маркетинговых исследований по сравнению с фактор­ным анализом. Это преимущество кластерного анализа обусловлено тем, что он анализирует не переменные в целом, а конкретные категории респондентов (на­пример, различные половозрастные, доходные и другие группы покупателей). Та­ким образом, можно сделать важный вывод относительно факторного и кластер­ного анализов. Целью факторного анализа является сокращение числа переменных, участвующих в анализе (выделение релевантных макрокатегорий переменных), а целью кластерного — классификация респондентов на целевые группы на основа­нии их существенных характеристик.

Из всего сказанного становится понятно, почему оба типа статистического ана­лиза иногда используются в паре: факторный анализ определяет состав макро­переменных (например, для сегментирования потребителей), а кластерный на основании выделенных существенных характеристик респондентов производит формирование целевых сегментов. Применение факторного и кластерного анализов в паре оправдано в основном в тех случаях, когда изначально респон­денты оцениваются по большому числу параметров и проведение кластерного анализа непосредственно над данным (большим) набором переменных пред­ставляется затруднительным или даже практически невозможным. Отметим, что для проведения факторного и кластерного анализов в паре следует сначала провести факторный анализ, сохранив полученные факторные рейтинги, а за­тем проводить кластерный анализ на основании полученных групп перемен­ных. Более подробно парное использование факторного и кластерного анали­зов будет показано в разделе 5.2.2.

В табл. 5.3 представлены основные характеристики переменных, участвующих в факторном и кластерном анализах.

Таблица 5.3. Основные характеристики переменных, участвующих в факторном и кластерном анализах

Факторный анализ

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

Нет

-

Любое

Любой

Кластерный анализ

Зависимые переменные

Независимые переменные

Количество

Тип

Количество

Тип

Нет

-

Любое

Любой


© 2011-2024 Контрольные работы по математике и другим предметам!