Главная страница
Навигация по странице:

  • Из неортогональных

  • Главные факторы в сравнении с главными компонентами.

  • Данные для проведения факторного анализа (учебный пример)

  • Факторные значения

  • 3. Примеры факторного анализа Пример 1.


  • 9_факторный анализ. 9 факторный анализ


    Скачать 0.79 Mb.
    Название9 факторный анализ
    Анкор9_факторный анализ.doc
    Дата12.02.2018
    Размер0.79 Mb.
    Формат файлаdoc
    Имя файла9_факторный анализ.doc
    ТипДокументы
    #15473
    страница6 из 10
    1   2   3   4   5   6   7   8   9   10

    Проблема вращения и интерпретации


    Чаще всего результаты факторизации не подлежат интерпретации. Для решения вопроса о распределении переменных по факторам нужно произвести вращение факторов относительно признаков. Соотношение признаков в осях факторов при этом никак не изменятся.

    Сущностью факторного анализа является процедура вращения факторов, то есть перераспределения дисперсии по определённому методу.

    Вращение бывает ортогональным и косоугольным. Цель ортогональных вращений — определение простой структуры факторных нагрузок, целью большинства косоугольных вращений является определение простой структуры вторичных факторов, то есть косоугольное вращение следует использовать в частных случаях. Поэтому ортогональное вращение предпочтительнее.

    Существует более 10 методов вращения в обоих видах. Чаще других используется ортогональные методы вращения:

    • Варимакс – критерий – индекс сложности каждого фактора, который пропорционален числу переменных, связанных с этим фактором. Метод «варимакс» максимизирует разброс квадратов нагрузок для каждого фактора, что приводит к увеличению больших и уменьшению малых значений факторных нагрузок. В результате простая структура получается для каждого фактора в отдельности;

    • Квартимакс - – критерий – факторная сложность переменной, пропорциональна числу факторов, связанных с ней;

    • Эквимакс - Метод вращения, объединяющий методы варимакс, упрощающий факторы, и квартимакс, упрощающий переменные. Минимизируется число переменных с большими факторными нагрузками и число факторов, требуемых для объяснения переменной.

    Из неортогональных методов вращения достаточно популярными являются:

    • облимин – Метод косоугольного (неортогонального) вращения. Самое косоугольное решение соответствует дельте, равной 0 (по умолчанию). По мере того, как дельта отклоняется в отрицательную сторону, факторы становятся более ортогональными. Чтобы изменить задаваемое по умолчанию дельта (равное 0), введите число, меньшее или равное 0,8;

    • Промакс-вращение. Косоугольное вращение в предположении, что факторы могут коррелировать между собой. Оно производится быстрее, чем вращение типа прямой облимин, поэтому оно полезно для больших наборов данных.
      1. Главные факторы в сравнении с главными компонентами.


    Основное различие двух моделей факторного анализа состоит в том, что в анализе главных компонент предполагается, что должна быть использована вся изменчивость переменных, тогда как в анализе главных факторов вы используете только изменчивость переменной, общую и для других переменных. В большинстве случаев эти два метода приводят к весьма близким результатам. Однако анализ главных компонент часто более предпочтителен как метод сокращения данных, в то время как анализ главных факторов лучше применять с целью определения структуры данных.

      1. Данные для проведения факторного анализа (учебный пример)


    Респондентам, обратившимся в турагенство с целью приобретения путевки на морской курорт, были заданы вопросы о значимости для них четырех условий отдыха (переменных). Большая значимость соответствует большему значению переменной. Исследовательская задача состоит в изучении модели взаимосвязей между переменными и выявлении глубинных причин, обуславливающих выбор курорта.

    Туристы

    Переменные

    Стоимость путевки

    Уровень комфорта

    Температура воздуха

    Температура воды

    Т1

    32

    64

    65

    67

    Т2

    61

    37

    62

    65

    Т3

    59

    40

    45

    43

    Т4

    36

    62

    34

    35

    Т5

    62

    46

    43

    40



    Критическое значение коэффициента корреляции на уровне значимости 5% при 5 коррелирующих парах равна 0.878. Высокие корреляции в левом верхнем и правом нижнем квадрантах показывают, что взаимосвязаны оценки по стоимости и комфортабельности и оценки по температуре воздуха и температуре воды.

    Собственные вектора и собственные значения:



    Анализ собственных значений, равных соответственно 0.038; 0.004; 1.942; 2.016 показывает, что только для двух факторов значения достаточно велики, чтобы стать предметом дальнейшего рассмотрения.

    Доля этих факторов в общей дисперсии составляет соответственно 50,4% и 48,5% общей дисперсии, а накопленная дисперсия – 98,9%.



    Матрица факторных нагрузок отражает взаимосвязь между факторами и переменными:



    Очевидно, что существенные значения факторных нагрузок наблюдаются только для двух факторов: третий столбец – это корреляции между первым значимым фактором и каждой переменной по очереди, четвертый столбец - корреляции между вторым значимым фактором и каждой переменной. Фактор интерпретируется на основе сильно связанных с ним (имеющих по нему высокие факторные нагрузки) переменных. Так первый фактор – «экономический» (цена+комфорт), а второй - «климатический» (температуры). При этом переменные, имеющие высокие факторные нагрузки по «климатическому» фактору взаимосвязаны положительно (униполярный фактор), а по «экономическому» - отрицательно (биполярный фактор).

    Необходимо отметить, что выбор знака во время вычислений происходит случайным образом, и знаки не важны сами по себе, а используются для идентификации групп.




    Ф1

    Ф2

    Ф3

    Ф4

    П1

    0.129

    0.016

    0.856

    0.5

    П2

    0.131

    0.013

    -0.925

    -0.357

    П3

    0.054

    -0.043

    0.449

    -0.891

    П4

    -0.033

    0.046

    0.39

    -0.919

    Однако, в данном примере, все переменные в значительной степени коррелируют с обоими факторами. Обычно фактор легче интерпретируется, если с ним связана только часть переменных.

    Вращение

    Вращение применяется после выделения факторов для максимизации высоких корреляций и для минимизации малых. Существует несколько методов вращения, один из наиболее популярных – метод варимакс, который представляет собой процедуру максимизации дисперсий. Математически это достигается путем умножения матрицы факторных нагрузок на матрицу преобразования: .

    Матрица преобразования – это матрица функций угла , на который выполняется поворот. В двумерном случае



    После получения окончательной матрицы факторных нагрузок можно получить воспроизведенную матрицу взаимосвязей исходя из формулы

    .

    Разница между исходной и воспроизведенной матрицами называется остаточной матрицей взаимосвязей. При хорошем факторном решении элементы остаточной матрицы должны быть очень малы.

    Факторные значения

    После вычисления факторных нагрузок можно вычислить значения факторов для каждого наблюдения. Один из способов – при помощи матрицы коэффициентов факторных значений . Элементы матрицы – весовые коэффициенты соответствующих значений стандартизированных переменных для расчета значений факторов .

    Иначе значения факторов можно рассчитать по формуле.

    Высокие отрицательные значения по климатическому фактору свидетельствуют о важности климатического фактора, а высокие отрицательные значения по экономическому фактору означают, что комфорт для респондента важнее фактора стоимости. Так, например, первый респондент получил по первому фактору -0.586, по второму фактору -1.533. Высокое отрицательное значение по «экономическому» фактору свидетельствует о том, что респонденту комфортность важнее, чем низкая стоимость, а высокое отрицательное значение климатического фактора – что климатические условия для него очень важны. Для третьего респондента более привлекательна невысокая цена, чем комфортность, а климатические условия для него не очень важны.




    «Экономический фактор»

    «Климатический фактор»

    Респондент 1

    -0.586

    -1.533

    Респондент 2

    1.233

    -0.5

    Респондент 3

    0.465

    0.665

    Респондент 4

    -1.363

    0.578

    Респондент 5

    0.251

    0.789



    3. Примеры факторного анализа
    Пример 1.
    В одном из районов развития гранитоидного магматизма было отобрано 70 проб из грейзенизированных гранитов. В пробах было определено содержание пяти компонент (признаков): SiO2, Na2O, K2O, Li, Be.

    Результат анализа каждой пробы представляет собой случайную пятикомпонентную величину , где t- номер пробы; X1,X2, X3, X4, X5 – содержания компонентов SiO2, Na2O, K2O, Li, Be соответственно.

    Необходимо произвести факторный анализ с целью выяснения геохимических и генетических особенностей объекта.
    Решение
    На первом шаге факторного анализа методом главных компонент по выборочной совокупности были вычислены: корреляционная матрица системы используемых признаков (табл.1), её собственные значения, факторные нагрузки и веса факторов (табл.2).
    1   2   3   4   5   6   7   8   9   10


    написать администратору сайта