Главная страница

9_факторный анализ. 9 факторный анализ


Скачать 0.79 Mb.
Название9 факторный анализ
Анкор9_факторный анализ.doc
Дата12.02.2018
Размер0.79 Mb.
Формат файлаdoc
Имя файла9_факторный анализ.doc
ТипДокументы
#15473
страница2 из 10
1   2   3   4   5   6   7   8   9   10

Сущность факторного анализа


Пусть для каждого конкретного объекта измерены четыре характеристики, которые обусловлены действием двух факторов и . Фактор действует на все четыре характеристики объекта, а фактор действует лишь на два признака и .



Рисунок 9.2 Схема модели факторного анализа
Значит, значения признаков и определяются только фактором , а признаки и определяются совокупным действием фактором и . Но вначале неизвестно ни количество действующих факторов, ни их взаимосвязь с измеренными признаками. Необходимо исследовать интенсивность влияния факторов и на признаки и выделить в значениях те части, которые обусловлены действием каждого из факторов и в отдельности.

Для решения этой задачи предполагают, что линейно зависят от . Для рассматриваемого случая имеем

где (1)

- коэффициенты, называемые факторными нагрузками.

Если рассмотреть метод на основании приведенного выше примера, когда имеется рассматриваемых объектов, для каждого из которых определено значение четырех признаков, то в четырехмерном графическом пространстве с осями координат это может быть представлено как облако из точек. Для Если это четырехмерное пространство рассечь плоскостью, в которой находятся координатные оси, отвечающие признакам и , то в сечении мы увидим облако точек, которое в условиях взаимосвязи признаков и друг с другом представляет собой эллипс рассеяния.

Перед проведением факторного анализа исходные значения признаков выборочной совокупности необходимо стандартизировать (центрировать и нормировать) с помощью преобразования



где - исходное значение j-го признака t-того объекта;

-среднее значение j-ого признака;

–стандартное отклонение j-ого признака.

Центр эллипса рассеяния стандартизированных значений будет находиться в точке начала координат, как показано на рисунке 9.3.



Рисунок 9.3 Эллипсы рассеянья в пространстве двух стандартизированных переменных
Форма этого эллипса (сжатость – вытянутость) будет определяться величиной коэффициента корреляции с , т.е. , Чем больше , тем более вытянут эллипс и при он превращается в прямую линию, а при - в круг. Если провести оси эллипса и , то по мере увеличения происходит уменьшение степени разброса точек наблюдений вдоль одной оси эллипса (на рисунке – ось ) и увеличение разброса вдоль другой оси эллипса (на рисунке – ось ).

Если перейти от исходной координатной системы , к новой , , оси которой ориентированы вдоль осей эллипса рассеяния, то, очевидно, что в новой системе координат значения переменной вдоль оси будут иметь меньшую дисперсию, чем в исходной системе вдоль оси , а значения этой переменной вдоль оси , наоборот, будут иметь большую дисперсию, чем в исходной системе вдоль оси .

Поэтому переменная несет в себе больше информации о выборке, чем . При этом, чем сильнее связаны между собой признаки и , тем большим становится удельный вес той из новых переменных, которая ориентируется вдоль главной оси эллипса рассеяния.

Следовательно, в случае многомерного пространства появляется возможность ранжирования переменных (признаков) по их дисперсии в соответствии с их вкладом (значимостью) в общую характеристику изучаемого объекта, т.е. по уменьшению дисперсии значений признаков вдоль новых координатных осей .

Трудно представить, как выглядит в многомерном пространстве облако точек выборочной многомерной совокупности. По аналогии с рассмотренным выше двумерным случаем можно предполагать, что оно представляет собой эллипсоид с несколькими разновеликими ортогональными осями. Поэтому в условиях взаимозависимости признаков для более компактного представления информации переходят к новой ортогональной системе координат (ориентированной по главным осям этого эллипсоида). Переменные этой новой системы – главные компоненты ( и ) – концентрируют в себе основную информацию об исходной выборке и снижают размерность исходного признакового пространства (). Эта процедура перехода к новой системе координат ().

Указанный переход не затрагивает геометрической структуры взаимного расположения точек наблюдений. Характер их распределения сохраняется. Поэтому суммарная дисперсия остается прежней, т.е.

или в общем, виде

Факторные нагрузки в уравнении представляют собой коэффициенты корреляции между исходными и новыми переменными .
    1. 1   2   3   4   5   6   7   8   9   10


написать администратору сайта