Главная страница

факторный анализ. Факторный анализ


Скачать 4.52 Mb.
НазваниеФакторный анализ
Анкорфакторный анализ
Дата18.05.2022
Размер4.52 Mb.
Формат файлаpdf
Имя файлаLection_8.pdf
ТипДокументы
#537008

УТВЕРЖДАЮ:
ФИО
должность
Для свободного использования в образовательных целях
Copyright
© Академия НАФИ. Москва
Все права защищены nafi.ru
ФАКТОРНЫЙ АНАЛИЗ
ТЕМА 8

1.
Факторный анализ: понятие и назначение
2.
Основные этапы факторного анализа
2.1.
Вычисление корреляционной матрицы
2.2.
Извлечение факторов
2.3.
Выбор и вращение факторов
2.4.
Интерпретация факторов
2.5.
Вычисление значений факторов
2.6.
Оценка качества модели
ОГЛАВЛЕНИЕ
2

1.
ФАКТОРНЫЙ АНАЛИЗ:
ПОНЯТИЕ
И НАЗНАЧЕНИЕ

4
1. Факторный анализ: понятие и назначение
Факторный анализ
– это процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называемых факторами:

в один фактор объединяются переменные, сильно коррелирующие между собой.

переменные из разных факторов слабо коррелируют между собой.
Факторный анализ классифицирует признаки (переменные), описывающие наблюдения.
Фактор (Factor)
– латентная (скрытая) переменная, конструируемая таким образом, чтобы можно было объяснить корреляцию между набором имеющихся переменных.
Концепция факторного анализа
заключается в «сжатии» информации.

5
1. Факторный анализ: понятие и назначение
Цель факторного анализа

сокращение числа переменных на основе их классификации и определения структуры взаимосвязей между ними.
Благодаря
сокращению числа переменных
вместо исходного набора переменных появляется возможность анализировать данные по выделенным факторам, число которых значительно меньше исходного числа взаимосвязанных переменных.
Социологический смысл анализа
измеряемые эмпирические показатели считаются следствием других, глубинных, скрытых от непосредственного измерения характеристик (латентных переменных).

1.
В экономике:

Расчет прибыли от продаж компании. Прибыль зависит от четырех основных факторов: объема продаж, ассортимента реализованной продукции, себестоимости продукции и цены реализации продукции. С помощью факторного анализа можно рассчитать, как каждый из перечисленных факторов влияет на величину прибыли компании, и, исходя из полученных результатов, выработать пути максимизации прибыли.

Аналогичным образом можно рассчитать и проанализировать затраты на производство продукции.
2.
В социологии:

Факторный анализ является одним из наиболее распространенных и используемых в социологических исследованиях. Самым известным примером является анализ Института Социологии Маргбургского университета об отношении работников металлургических предприятий к иностранцам.
6
Примеры применения факторного анализа
1. Факторный анализ: понятие и назначение

7
F
общие факторы, каждый из которых влияет на определенную совокупность переменных
X
переменные, фиксируемые на основании ответов
U
уникальные факторы, каждый из которых влияет только на одну переменную
F
1
F
2
F
3
Схема факторного анализа
1. Факторный анализ: понятие и назначение
X
1
X
2
X
3
X
4
X
5
X
6
X
7
U
1
U
2
U
3
U
4
U
5
U
6
U
7

8
1. Факторный анализ: понятие и назначение
Обязательные условия проведения факторного анализа

Все признаки должны быть количественными переменными (интервальными либо метрическими).

Число наблюдений должно быть минимум в два раза больше числа переменных.

Выборка должна быть однородна.

Исходные переменные должны быть распределены симметрично.

Номинальные переменные должны быть переведены в дихотомические
(переменные, имеющие только две категории).

2.
ОСНОВНЫЕ ЭТАПЫ
ФАКТОРНОГО
АНАЛИЗА

Процедура факторного анализа состоит из четырех основных стадий:
1.
Вычисление корреляционной матрицы для всех переменных, участвующих в анализе.
2.
Извлечение факторов.
3.
Выбор факторов и вращение факторов для создания упрощенной структуры.
4.
Интерпретация факторов.
10
Порядок выполнения факторного анализа
2. Основные этапы факторного анализа

2.1
ВЫЧИСЛЕНИЕ
КОРРЕЛЯЦИОННОЙ
МАТРИЦЫ


Первая операция, которая производится при выполнении факторного анализа —
вычисление корреляционной матрицы для переменных, участвующих в анализе.

Для проведения факторного анализа совсем не обязательно специально строить корреляционную матрицу: при необходимости программа SPSS создаст ее сама на основе данных файла.

Иногда не нужны даже исходные данные — достаточно иметь корреляционную матрицу, которая в этом случае вводится в командный файл SPSS.
12
2.1 Вычисление корреляционной матрицы


«Анализ» →
«Снижение размерности» →
«Факторный анализ».

На панели нажать на
«Описательные». В разделе
«Корреляционная матрица» отметить
«Коэффициенты».

Нажать продолжить.
13
2.1 Вычисление корреляционной матрицы

14
2.1 Вычисление корреляционной матрицы
Корреляционная матрица

2.2
ИЗВЛЕЧЕНИЕ
ФАКТОРОВ

Извлечение фактора начинается с подсчета суммарного разброса значений всех участвующих в анализе переменных. Для этого «суммарного разброса» непросто подобрать логическую интерпретацию, однако он является вполне строго определенной математической величиной.
Извлечение факторов может производится несколькими методами.
1.
Извлечение факторов заключается в выборе взаимодействующих переменных, чья взаимная корреляция обусловливает наибольшую долю общей дисперсии. Эти переменные образуют
первый фактор
2.
Затем первый фактор исключается и из оставшегося множества переменных снова выбираются те, чье взаимодействие определяет наибольшую долю оставшейся общей дисперсии. Эти переменные образуют
второй фактор
3.
Процедура извлечения факторов продолжается до тех пор, пока не будет исчерпана вся общая дисперсия переменных.
4.
После того как процедура извлекает каждый фактор, напротив его номера появляется
собственное значение
, которое пропорционально доле общей дисперсии, определяемой данным фактором.
16
Извлечение факторов
2.2 Извлечение факторов

17
Методы факторного анализа различаются в зависимости от подходов для нахождения коэффициентов значения факторов.
Извлечение факторов: выбор метода
Наиболее популярным методом является метод
главных компонент
2.2 Извлечение факторов

«Анализ» →
«Снижение размерности» →
«Факторный анализ».

На панели нажать на «Извлечение».
В разделе «Метод» выбрать нужный метод.

Нажать продолжить.

18
Анализ главных компонент (АГК)
– наиболее простой метод, однако именно оставшиеся 6 методов относятся к факторному анализу. Однако следует помнить, что АГК дает более грубое приближение к реальной структуре взаимосвязей, чем другие методы факторного анализа.
Извлечение факторов: выбор метода
2.2 Извлечение факторов
Методы:

Главные компоненты

Невзвешенный МНК

Обобщенный МНК

Максимум правдоподобия

Факторизация главной оси

Альфа факторизация

Анализ образов

19
Первое собственное значение всегда является наибольшим и превышает единицу.
Факторы извлекаются в порядке убывания их влияния на дисперсию переменных.
Извлечение факторов
2.2 Извлечение факторов
Значение общности равен доле дисперсии переменной, обусловленной совокупным влиянием факторов.
Если равно 0 – фактор не влияет на переменную.
Если равно 1 – дисперсия переменной целиком определяется выделяемым фактором.

20
Метод главных компонент
(Principal Components Analysis)
основан на определении минимального числа факторов, вносящих наибольший вклад в дисперсию данных. Они называются главными компонентами.

Метод основан на допущении, что характерности всех признаков равны нулю, а число общих факторов F равно числу исходных признаков Х.

Главные компоненты независимы, т.е. в геометрическом плане ортогональны. Выделение первой главной компоненты по максимальному вкладу в дисперсию признаков означает, что мы находим такое направление в пространстве признаков, которому соответствует максимальная дисперсия, т.е. наибольшая дифференциация, разброс объектов. Затем находится вторая главная компонента, ортогональная первой и дающая вновь наибольшую дифференциацию объектов, не объясненную первой компонентой и т.д.

После построения всех главных компонент (число которых равно числу признаков Х) остаточная дисперсия равна 0, т.е. задача имеет точное математическое решение. Обычно суммарная дисперсия признаков раскладывается таким образом, что первые несколько компонент уже объясняют большую долю этой дисперсии, а остальные почти ничего не добавляют, поэтому совсем не обязательно выделение всех компонент.
Метод главных компонент
2.2 Извлечение факторов

2.3
ВЫБОР И ВРАЩЕНИЕ
ФАКТОРОВ

1.
Если факторов окажется столько же, сколько исходных переменных, факторный анализ теряет смысл, поскольку его целью является сокращение исходного набора переменных.
2.
Необходимо принять решение, какие из факторов следует оставить для дальнейшего анализа. Для этого исследователи пользуются следующими критериями:

формальные критерии - все факторы, чьи собственные значения превышают единицу, сохраняются для дальнейшего анализа

критерий «каменистой осыпи» Р. Кеттелла - состоит в поиске точки, где убывание собственных значений замедляется наиболее сильно.
3.
В любом случае, окончательное решение о числе факторов обычно принимается после интерпретации факторов, следовательно, факторный анализ предполагает неоднократное выделение различного числа факторов.
22
Выбор факторов
2.3 Выбор и вращение факторов

23
Собственные
значения
Количество
факторов
Количество
выбранных
факторов
Суммарная
объясненная
дисперсия
2.3 Выбор и вращение факторов
Семь собственных факторов имеют значения, превосходящие 1. Следовательно для анализа отобрано только семь факторов. Первая главная компонента объясняет 9,2% общей дисперсии, вторая 17,9% и т.д. Всего в модели отобрано семь факторов, которые объясняют
55,2%
общей дисперсии.


Чтобы получить график «каменистой осыпи», необходимо в «Извлечение» выбрать «График собственных значений».

С помощью данного графика также можно определять количество факторов.
Там, где начинается резкий спад – на том количестве факторов стоит остановиться.
24
2.3 Выбор и вращение факторов
Метод «каменистой осыпи»

25
Метод «каменистой осыпи»
2.3 Выбор и вращение факторов
Далее идет резкий спад
Останавливаемся на 7 факторах

26
Вращение факторов
Целью вращения является получение простой структуры, которой соответствует большое значение нагрузки каждой переменной только по одному фактору и малое по всем остальным факторам.
Нагрузка отражает связь между переменной и фактором, являясь подобием коэффициента корреляции. Значение нагрузки лежит в пределах (–1; 1).

До вращения точки, соответствующие переменным, расположены на удалении от осей факторов.

После поворота осей переменные оказываются вблизи осей, что соответствует максимальной нагрузке каждой переменной только по одному фактору.
2.3 Выбор и вращение факторов

27

Вариант вращения «Варимакс» является ортогональным, поскольку при таком вращении оси сохраняют свое взаимное расположение под прямым углом.

Иногда можно получить более предпочтительную простую структуру, если изменить угол между осями. Для этого предназначены варианты косоугольного вращения «Прямой облимин» и «Промакс». Наличие непрямого угла между осями факторов означает, что они не являются полностью независимыми друг от друга.
2.3 Выбор и вращение факторов
Вращение факторов

28

Необходимо попытаться объяснить отобранные факторы. Для этого в
каждой строке повёрнутой факторной матрицы необходимо отметить ту факторную нагрузку, которая имеет
наибольшее абсолютное значение.

Эти факторные нагрузки следует понимать как корреляционные
коэффициенты между переменными и факторами. Так переменная a1 сильнее всего коррелирует с фактором 6, а именно, величина корреляции составляет 0,720, переменная а2 с фактором 1 (0,663), переменная а3 коррелирует сильнее всего с фактором
5 (0,569) и т.д.
Повернутая матрица компонентов
a
Компонент
1 2
3 4
5 6
7
Я слушаю музыку каждый день
-,018
,050
,139
,117
-,044
-,720
,178
Мои музыкальные предпочтения однообразны. Я слушаю музыку одного стиля
,663
,285
,059
,101
,073
-,077
-,018
Современная музыка лучше, чем классическая
,197
-,008
,397
-,005
-,569
,103
-,232
Зарубежная музыка мне нравится больше, чем отечественная
-,143
-,065
,746
-,017
-,085
-,057
-,066
Прослушивание музыки требует концентрации, ее нельзя слушать находу
-,074
-,044
,196
,092
,049
,663
,207
Мои друзья слушают примерно такую же музыку, как и я
-,095
-,053
-,060
,776
,119
-,105
,071
Фоновая музыка помогает мне лучше работать, учиться, делать повседневные дела
,151
,754
-,102
-,205
,025
-,072
-,097
Я люблю музыкантов, которые могут выступать без фонограммы
-,232
,217
-,155
-,173
-,212
,197
,590
В последнее время я слушаю музыку чаще чем раньше
-,235
,611
,123
,311
-,004
-,043
,108
Мне больше нравится живая музыка, чем студийная
,200
-,138
,046
,108
,054
-,097
,710
Обычно я скачиваю музыку с платных ресурсов
,053
,020
,089
,041
,735
,134
-,179
Мне интересна жизнь исполнителей, их биграфия, новости
,289
,083
,502
-,129
,335
,113
,196
В одежде и поведении я стараюсь соответствовать стилю музыки, которую слушаю
,320
,081
-,115
,527
-,274
,225
-,175
2.3 Выбор и вращение факторов
Вращение факторов

29

На панели нажать «Параметры». В разделе «Формат вывода коэффициентов» выбрать «Отсортировать по величине». Нажать «Продолжить».

Это позволит отсортировать переменные в соответствии с величиной их нагрузок по соответствующим факторам.

Например, если 3 переменные нагружают фактор 1, то эти переменные будут перечисленны в порядке убывания их нагрузок в столбце с названием
«Фактор 1».
2.3 Выбор и вращение факторов
Вращение факторов

30

Обычно предполагается, что Х – стандартизированы , а факторы F… - независимы
(ортогональны).

Коэффициент взаимосвязи между некоторым признаком (Х) и общим фактором (F), выражающий меру влияния фактора на признак –
факторная нагрузка
данного признака по данному общему фактору.

Матрица, состоящая из факторных нагрузок и имеющая число столбцов, равная числу общих факторов, и число строк равное числу исходных признаков, называется
факторной
матрицей.
Факторная матрица фиксирует степень линейной связи каждого признака с каждым общим фактором.

Величина факторной нагрузки не превышает по модулю 1, а знак говорит о положительной/отрицательной связи признака с фактором. Значение факторной нагрузки, близкое к нулю – фактор практически не влияет на данный признак.

Можно вычислить
вклады факторов в общую дисперсию
всех признаков (путем вычисления суммы квадратов факторных нагрузок для каждого фактора по всем признакам).
Чем выше доля этого вклада в общей дисперсии, тем более значимым является данный фактор.
2.3 Выбор и вращение факторов

2.4
ИНТЕРПРЕТАЦИЯ
ФАКТОРОВ

32
2.4 Интерпретация факторов
Возможно графическое изображение переменных, координатами которых служат величины факторных нагрузок. Так, в конце оси расположены переменные, которые имеют большие нагрузки только в связи с этим фактором и, следовательно, характеризуют его. Переменные в начале координат имеют небольшие нагрузки в связи с обоими факторами. Переменные, расположенные вдали от осей, связаны с обоими факторами. Если фактор нельзя четко определить с точки зрения связи с исходными переменными, то его следует пометить как неопределяемый или генеральный (общий для всех переменных).
Интерпретация факторов

2.5
ВЫЧИСЛЕНИЕ
ЗНАЧЕНИЙ ФАКТОРОВ

34
2.5 Вычисление значений факторов
После интерпретации факторов необходимо вычислить их значения. Факторный анализ имеет собственную ценность. Однако если цель факторного анализа заключается в снижении исходного числа переменных до небольшого набора составных переменных (факторов), которые в дальнейшем используются в многомерном анализе, то имеет смысл вычислить для каждого респондента значение фактора. Фактор представляет собой линейную комбинацию исходных переменных. Значение для f-ro фактора можно вычислить по формуле:
Fi = bi1X1 + bi2X2 + ...+ bikXk

35
Отбор переменных-заменителей
Переменные-заменители (Surrogate Variables)
выбираются из исходных переменных для последующего анализа.

Это позволяет проводить анализ с точки зрения исходных переменных, а не значения факторов. Наиболее приемлемо, если одна из факторных нагрузок значительно выше остальных.
2.5 Вычисление значений факторов

2.6
ОЦЕНКА КАЧЕСТВА
МОДЕЛИ

37
Критерий КМО
2.6 Оценка качества модели
Критерий адекватности выборки
Кайзера-Мейера-Олкина
− величина, характеризующая степень применимости факторного анализа к данной выборке.

Правило интерпретации этого критерия:

≥ 0,9 - безусловная адекватность

[0,8; 0,9) - высокая адекватность

[0,7; 0,8) - приемлемая адекватность

[0,6; 0,7) - удовлетворительная адекватность

[0,5; 0,6) - низкая адекватность

< 0,5 - факторный анализ неприменим к выборке.

38
Критерий сферичности Бартлетта
2.6 Оценка качества модели
Критерий сферичности Бартлетта
− критерий многомерной нормальности для распределения переменных.

Помимо нормальности критерий проверяет, отличаются ли корреляции от 0.

Уровень значимости p<0,05 указывает на то, что данные вполне приемлемы для проведения факторного анализа.

39
Воспроизведенные корреляции
Воспроизведенные корреляции

это корреляционная матрица оригинальных пунктов, которая бы получилась, если предположить, что рассчитанные факторы являются правильными и единственными факторами.

Для любой взятой пары переменных репродуцированная корреляция равна произведению их факторных нагрузок на первый фактор плюс произведение таких нагрузок на второй фактор и т.д. по всем факторам.
2.6 Оценка качества модели

40

Остатки воспроизведенных корреляций или «матрица остатков
корреляций» является матрицей разностей между воспроизведенными и реальными корреляциями. Чем ближе такие остатки к нулю (т.е., низкие или незначимые), тем выше уверенность исследователя в своем выборе числа факторов.

В SPSS, в примечаниях к таблице остатков корреляций приводится процент остатков корреляций, чей уровень значимости превышает 0,05. В хорошем факторном анализе такой процент оказывается низким.
2.6 Оценка качества модели

41

Матрица остатков воспроизведенных корреляций помогает исследователю выявить конкретные корреляции, которые плохо воспроизводятся факторной моделью с данным числом факторов. Путем экспериментирования с разными моделями с разным числом факторов, исследователь может оценить, какая модель лучше воспроизводит корреляции, являющиеся наиболее критическими для его исследовательских целей.
2.6 Оценка качества модели

1.
Бююль А., Цеффель П. SPSS: искусство обработки
информации. – М., 2005

Глава 12. Анализ множественных ответов

Глава 19. Факторный анализ.
2.
Наследов А. IBM SPSS Statistics 20 и AMOS:
профессиональный статистический анализ данных. – СПб.,
2013

Глава 20. Факторный анализ

Глава 17. Простая линейная регрессия
3.
Электронный учебник по статистике StatSoft. Главные
компоненты и факторный анализ. URL:
http://www.statsoft.ru/home/textbook/modules/stfacan.html
42
Литература по Теме 8

УТВЕРЖДАЮ:
ФИО
должность
Для свободного использования в образовательных целях
Copyright 2017
© Академия НАФИ. Москва
Все права защищены www.nafi.ru


написать администратору сайта