9_факторный анализ. 9 факторный анализ

Название	9 факторный анализ
Анкор	9_факторный анализ.doc
Дата	12.02.2018
Размер	0.79 Mb.
Формат файла
Имя файла	9_факторный анализ.doc
Тип	Документы #15473
страница	2 из 10

1 2 3 4 5 6 7 8 9 10

Сущность факторного анализа

Пусть для каждого конкретного объекта измерены четыре характеристики, которые обусловлены действием двух факторов

. Фактор

действует на все четыре характеристики объекта, а фактор

действует лишь на два признака

Рисунок 9.2 Схема модели факторного анализа
Значит, значения признаков

определяются только фактором

, а признаки

определяются совокупным действием фактором

. Но вначале неизвестно ни количество действующих факторов, ни их взаимосвязь с измеренными признаками. Необходимо исследовать интенсивность влияния факторов

на признаки

и выделить в значениях

те части, которые обусловлены действием каждого из факторов

в отдельности.

Для решения этой задачи предполагают, что

линейно зависят от

. Для рассматриваемого случая имеем

где

(1)

- коэффициенты, называемые факторными нагрузками.

Если рассмотреть метод на основании приведенного выше примера, когда имеется

рассматриваемых объектов, для каждого из которых определено значение четырех признаков, то в четырехмерном графическом пространстве с осями координат

это может быть представлено как облако из

точек. Для Если это четырехмерное пространство рассечь плоскостью, в которой находятся координатные оси, отвечающие признакам

, то в сечении мы увидим облако точек, которое в условиях взаимосвязи признаков

друг с другом представляет собой эллипс рассеяния.

Перед проведением факторного анализа исходные значения признаков выборочной совокупности необходимо стандартизировать (центрировать и нормировать) с помощью преобразования

где

- исходное значение j-го признака t-того объекта;

-среднее значение j-ого признака;

–стандартное отклонение j-ого признака.

Центр эллипса рассеяния стандартизированных значений будет находиться в точке начала координат, как показано на рисунке 9.3.

Рисунок 9.3 Эллипсы рассеянья в пространстве двух стандартизированных переменных
Форма этого эллипса (сжатость – вытянутость) будет определяться величиной коэффициента корреляции

, т.е.

, Чем больше

, тем более вытянут эллипс и при

он превращается в прямую линию, а при

- в круг. Если провести оси эллипса

, то по мере увеличения

происходит уменьшение степени разброса точек наблюдений вдоль одной оси эллипса (на рисунке – ось

) и увеличение разброса вдоль другой оси эллипса (на рисунке – ось

).

Если перейти от исходной координатной системы

к новой

, оси которой ориентированы вдоль осей эллипса рассеяния, то, очевидно, что в новой системе координат значения переменной

вдоль оси

будут иметь меньшую дисперсию, чем в исходной системе вдоль оси

, а значения этой переменной вдоль оси

, наоборот, будут иметь большую дисперсию, чем в исходной системе вдоль оси

.

Поэтому переменная

несет в себе больше информации о выборке, чем

. При этом, чем сильнее связаны между собой признаки

, тем большим становится удельный вес той из новых переменных, которая ориентируется вдоль главной оси эллипса рассеяния.

Следовательно, в случае многомерного пространства появляется возможность ранжирования переменных (признаков) по их дисперсии в соответствии с их вкладом (значимостью) в общую характеристику изучаемого объекта, т.е. по уменьшению дисперсии значений признаков вдоль новых координатных осей

.

Трудно представить, как выглядит в многомерном пространстве облако точек выборочной многомерной совокупности. По аналогии с рассмотренным выше двумерным случаем можно предполагать, что оно представляет собой эллипсоид с несколькими разновеликими ортогональными осями. Поэтому в условиях взаимозависимости признаков для более компактного представления информации переходят к новой ортогональной системе координат (ориентированной по главным осям этого эллипсоида). Переменные этой новой системы – главные компоненты