9_факторный анализ. 9 факторный анализ
Скачать 0.79 Mb.
|
Проблема числа факторовПроцедура факторного анализа предполагает предварительное задание числа факторов. Поэтому на первом, поисковом, этапе имеет смысл использовать анализ главных компонент. Для выбора числа факторов обычно применяют следующие подходы:
Предполагается, что справа от этой точки находится только «факториальная осыпь» — «осыпь» является геологическим термином, обозначающим обломки горных пород, скапливающиеся в нижней части скалистого склона. Однако этот критерий отличается высокой субъективностью и, в отличие от предыдущего критерия, статистически необоснован. Недостатки обоих критериев заключаются в том, что первый иногда сохраняет слишком много факторов, в то время как второй, напротив, может сохранить слишком мало факторов; однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных. На практике возникает важный вопрос: когда полученное решение может быть содержательно интерпретировано. В этой связи предлагается использовать ещё несколько критериев.
Факторный и компонентный анализ в большинстве случаев проводятся совместно. Компонентный анализ является методом определения структурной зависимости между случайными переменными. В результате его использования получается сжатое описание малого объема, несущее почти всю информацию, содержащуюся в исходных данных. Главные компоненты получаются из исходных переменных путем целенаправленного вращения, т.е. как линейные комбинации исходных переменных. Вращение производится таким образом, чтобы главные компоненты были ортогональны и имели максимальную дисперсию среди возможных линейных комбинаций исходных переменных X. При этом переменные не коррелированы между собой и упорядочены по убыванию дисперсии (первая компонента имеет наибольшую дисперсию). Кроме того, общая дисперсия после преобразования остается без изменений. Факторный анализ является более общим методом преобразования исходных переменных по сравнению с компонентным анализом. Как правило, применение методов факторного анализа включает три этапа:
Наиболее часто факторный анализ используется для выявления в наблюдаемых признаках некоторых латентных (скрытых) переменных, называемых факторами. Гипотеза о наличии этих факторов основана на предположении о существовании чего-то общего в наблюдаемых признаках. Выводимые гипотетические факторы обладают следующими свойствами: 1. Они образуют линейно независимый набор переменных, т.е. ни один из факторов (компонент) не выводится как линейная комбинация остальных. 2. Переменные, являющиеся гипотетическими факторами, можно разделить на два основных вида – общие и характерные факторы. Они отличаются структурой весов в линейном уравнении, которое выводит значение наблюдаемой переменной из гипотетических факторов. Общий фактор имеет несколько переменных с ненулевым весом или факторной нагрузкой, соответствующей этому фактору. При этом фактор называется общим, если хотя бы две его нагрузки значительно отличаются от нуля. Характерный фактор имеет только одну переменную с ненулевым весом (т.е. только одна переменная от него зависит). 3. Всегда предполагается, что общие факторы не коррелируют с характерным фактором, также характерные факторы не коррелированы между собой. 4. Обычно предполагается, что число общих факторов меньше, чем число наблюдаемых переменных, однако число характерных факторов принимают равным числу наблюдаемых переменных. Естественно, факторы не будут содержать всю дисперсию переменных; они будут содержать только ту часть, которая принадлежит общим факторам и распределена по нескольким переменным. На языке факторного анализа доля дисперсии отдельной переменной, принадлежащая общим факторам (и разделяемая с другими переменными) называется общностью. С общей точки зрения в качестве оценки общности следует использовать множественный коэффициент корреляции выбранной переменной со всеми. Основной результат факторного анализа – выявление факторной структуры, элементами которой являются факторные нагрузки. Факторные нагрузки вычисляются таким образом, чтобы восстановленные коэффициенты корреляции минимально отличались от исходных корреляций. Алгоритмы факторного анализа обеспечивают максимально возможное приближение восстановленных коэффициентов корреляции к исходным. Это достигается варьированием числа факторов и диагональных элементов корреляционной матрицы, на которой располагаются общности. Алгоритмы факторного анализа – это различные способы получения факторной структуры при заданном числе факторов. За исключением метода главных компонент все процедуры факторного анализа являются итеративными и эмпирическими. Они направлены на получение оценок общностей и факторных нагрузок. В процессе итераций воспроизведенная корреляционная матрица должна быть максимально приближена к исходной. Таблица 9.1 Алгоритмы факторного анализа
Анализ главных компонент дает наиболее грубое решение. Метод максимального правдоподобия позволяет статистически оценить минимально возможное число факторов. При этом наиболее предпочтительно, чтобы каждая переменная после вращения находилась вблизи оси фактора, то есть имела бы максимальную нагрузку по одному фактору и минимальные по остальным. В этом случае каждая переменная будет соотнесена только с одним фактором. |