Методическое пособие для студентов высших учеб заведений О. В. Кожевникова, С. А. Вьюжанина. Ижевск Издательский центр Удмуртский университет
Скачать 3.01 Mb.
|
View – Variables (либо одновременное нажатие клавиш CTRL и T) и вносим названия оценочных шкал в столбец Name. Важно: названия необходимо вносить без пробелов, для разделения слов можно использовать нижнее подчеркивание. Рис 13. Внесение названий шкал В итоге получаем следующий вид анализируемой матрицы: 58 Рис 14. Матрица оценивания в SPSS с названиями анализируемых шкал Осуществляем процедуру факторного анализа. Во вкладке Analyze выбираем раздел Dimension Reduction, затем Factor. Рис 15. Осуществление факторного анализа Дальнейшие действия производятся в появившемся окне Factor Analysis. 59 Рис 16. Осуществление факторного анализа Во-первых, выделяем все анализируемые переменные и переносим их в поле Variables. Рис 17. Осуществление факторного анализа Во-вторых, изменяем ряд заданных по умолчанию параметров факторного анализа. В разделе Descriptives ничего не меняем. В разделе Extraction, если это необходимо, можно задать желаемое количество факторов. Как отмечает И.Л. Соломин, чем больше номер фактора, тем меньше показателей в него входит, количество факторов ограничивается номером фактора, в который еще входит более одного признака. Таким образом, как правило, для интерпретации результатов психосемантического исследования бывает достаточно первых двух-трех факторов, объединяющих наибольшее количество признаков. Поэтому для упрощения можно ограничиться вычислением нагрузок признаков лишь на первые несколько факторов. В этом случае о размерности семантического пространства 60 косвенно можно судить по информативности первого фактора. Чем больше признаков он включает, тем меньше их в оставшихся факторах, и тем меньше размерность семантического пространства 73 Рис 18. Осуществление факторного анализа В разделе Rotation задаем метод вращения Varimax. Данная процедура позволяет преобразовать матрицу факторных коэффициентов в более простую за счет уменьшения числа переменных с высокими значениями нагрузок, усиливая тем самым, интерпретируемость факторов. Рис 19. Осуществление факторного анализа 73 Соломин И.Л. Указ. соч. С. 16 61 В разделе Factor Scores выбираем опцию сохранения значений факторов в файле данных Save as Variables. Рис 20. Осуществление факторного анализа В разделе Options определяется формат представления таблицы факторных нагрузок. Для удобства интерпретации факторные нагрузки рекомендуется пересортировать (Sorted by size) таким образом, чтобы в начале были расположены исходные переменные, которые сильнее всего коррелируют с первым фактором, отсортированные по убыванию значений коэффициентов по модулю. Затем аналогичным образом будут расположены исходные переменные, сильнее всего коррелирующие со вторым фактором и т.д. Кроме того, рекомендуется задать наименьшее значение факторных нагрузок (факторная нагрузка тем больше, чем сильнее коррелирует тот или иной признак с фактором), отображаемое в итоговой таблице (например, 0,5 по модулю – Suppress small coefficients). Рис 21. Осуществление факторного анализа 62 После этого нажимаем на ОК в окне факторного анализа (Рис. 17) Появляется новый документ – Output, – содержащий результаты осуществленного факторного анализа. Рис 22. Файл с результатами факторного анализа Кроме того, в исходном файле с данными появляются дополнительные столбцы, содержащие значения факторов. Именно эти значения мы будем использовать для построения семантических пространств исследуемых объектов (см. параграф 2.9). Рис 23. Файл с результатами факторного анализа Для дальнейшего анализа понадобятся таблицы Total Variance Explained и Rotated Component Matrix из файла Output. Эти данные будут 63 использоваться в процессе интерпретации полученных результатов (см. параграф 2.10). Рис 24. Файл с результатами факторного анализа Рис 25. Файл с результатами факторного анализа 2.9. Графическое представление данных И.Л. Соломин отмечает, что поскольку факторы соответствуют действительно независимым субъективным признакам, их можно представить как прямоугольные оси координат. Тогда каждому объекту соответствует некоторая точка, проекции которой на оси координат выражают значение факторных оценок данного объекта. Графическое представление объектов в виде точек в пространстве двух независимых признаков называется двумерной диаграммой рассеивания, или 64 скатерграммой 74 . Для построения скатерграмм семантических пространств рекомендуется использовать программу STATISTICA 75 Сначала скопируем в STATISTICA значения факторов из таблицы с данными в SPSS: Рис 26. Значения факторов в SPSS Рис 27. Данные, перенесенные в STATISTICA Дважды кликнув по строкам и столбцам, переименуем их (далее 74 Соломин И.Л. Указ. соч. С. 16. 75 Подробнее о программе STATISTICA: Боровиков В.П. Популярное введение в современный анализ данных в системе STATISTICA. М.: Горячая линия-Телеком, 2013. 288 с. Официальный сайт: http://www.statsoft.ru/ 65 приводится пример: строки в реальном исследовании переименовываются в соответствии с изучаемыми объектами, например «Я сам», «Радость», «Профессиональный психолог» и т.п.; столбцы – в соответствии с названиями факторов – см. параграф 2.10). Рис 28. Данные, перенесенные в STATISTICA Переходим в раздел Graphs – Scatterplot. Рис 29. Построение скатерграммы в STATISTICA 66 Выбираем переменные для построения графика. Рис 30. Построение скатерграммы в STATISTICA Рис 31. Построение скатерграммы в STATISTICA Во вкладках Advanced, Appearance, Categorized ничего не меняем. Во вкладке Options 1 снимаем галочку c Title и отмечаем галочкой Display case labels. 67 Рис 32. Построение скатерграммы в STATISTICA Во вкладке Options 2 меняем Display fit expression с In title на Off Рис 33. Построение скатерграммы в STATISTICA В итоге получаем следующее изображение: 68 Рис 34. Построение скатерграммы в STATISTICA Наведем мышку на символ (маркер), обозначающий точку расположения объекта на графике, дважды кликнем по нему и войдем в меню Graph Options. Рис 35. Построение скатерграммы в STATISTICA 69 В меню Graph options изменим значок маркера на более отчетливый. Рис 36. Построение скатерграммы в STATISTICA Полученный график через функцию копирования можно перенести в любую другую программу. Рис 37. График, построенный в STATISTICA 70 Дальнейшее редактирование изображение (рисование осей, выделение зон и объектов) можно осуществлять в любом графическом редакторе (например, MS Paint). Рис. 38. Итоговое графическое отображение семантического пространства 2.10. Интерпретация результатов исследования Как отмечает И.Л. Соломин, интерпретация результатов экспериментального психосемантического исследования представляет собой наиболее эвристический, наименее алгоритмизированный этап, зависящий от содержания исследуемой области сознания 76 Первым этапом интерпретации является наименование и определение числа анализируемых факторов. И.Л. Соломин выделяет два более или менее формальных принципа, универсальных для любого психосемантического метода и используемых для обозначения факторов – это принципы общего смысла и маркировки. Принцип общего смысла основан на поиске смысла, который является общим для кластера или фактора. Этот общий смысл необходимо обозначить некоторым термином, который так или иначе обобщал бы входящие в группу 76 Соломин И.Л. Указ. соч. С. 17. 71 объекты или признаки и мог бы служить их заместителем при дальнейшем анализе результатов. Для этого по каждому фактору выписываются наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору. При этом обязательно учитывается знак факторной нагрузки переменной: если знак отрицательный, это отмечается как противоположный полюс фактора (см. Рис. 39). Rotated Component Matrix Component 1 2 3 4 5 грубый - нежный -,968 опасный - безопасный -,966 приятный - неприятный ,962 светлый - темный ,961 красивый - безобразный ,951 теплый - холодный ,948 веселый - грустный ,940 здоровый - болезненный ,935 полезный - бесполезный ,933 тяжелый - легкий -,884 живой - безжизненный ,841 осознанный - неосознанный ,731 движущийся - неподвижный ,853 сильный - слабый ,823 тихий - громкий -,811 пассивный - активный -,773 быстрый - медленный ,766 устойчивый - изменчивый -,750 большой - маленький ,745 яркий - тусклый ,632 ,645 кратковременный - длительный -,862 сложный - простой -,564 ,623 таинственный - обычный ,834 упорядоченный - хаотичный ,613 конкретный - абстрактный ,897 Рис. 39. Таблица с факторными нагрузками, перенесенная из SPSS в текстовый редактор, на первом этапе интерпретации После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные. Так, в рассматриваемом примере первый фактор может быть обозначен как «Оценка» (грубый, опасный, неприятный, темный, безобразный, холодный, грустный, болезненный, бесполезный, тяжелый, безжизненный, 72 неосознанный, тусклый, сложный), второй – «Активность» (неподвижный, слабый, тихий, пассивный, устойчивый, маленький, тусклый) и т.д. Кроме того, в рассматриваемом случае оба фактора отражают отрицательный полюс обозначаемых ими явлений. В связи с этим при построении графических отображений семантических пространств рекомендуется изменить значения факторов на противоположные по модулю с тем, чтобы график имел традиционный, привычный для восприятия вид, когда в левой части отмечаются отрицательные, а в правой – положительные значения фактора. 77 Принцип маркировки используется тогда, когда трудно подобрать термин, обобщающий вошедшие в фактор характеристики: допускается наименование фактора по имени переменной, имеющей по сравнению с другими наибольшую нагрузку по этому фактору. Так, в рассматриваемом примере третий фактор может быть обозначен как «Длительность», а четвертый – как «Таинственность». Другой не менее важный расчетный показатель значимости каждого фактора – процент объясняемой дисперсии переменных, содержащейся в корреляционной матрице. Естественно, что все 100% дисперсии будут объясняться только всеми выделенными факторами. Однако считается, что ряд выделенных факторов отражает влияние случайных процессов, никак не связанных с оценкой наблюдаемых переменных. Таким образом, формально задача заключается в том, чтобы, с одной стороны, выбрать некоторое минимальное количество факторов, которые бы, с другой стороны, объясняли достаточно большой процент всей дисперсии переменных. Принято считать, что при хорошем факторном решении выбирают столько факторов, чтобы они в сумме объясняли не менее 70-75%. В хорошо спланированных исследованиях с установленной факторной структурой этот суммарный процент может достигать 85-90 % 78 . В ряде случаев допустимым считается даже 60% объяснимой дисперсии. В рассматриваемом примере выделено пять значимых факторов, совокупно объясняющих 90,3% общей дисперсии (см. Рис. 40: рассматривается крайняя правая часть таблицы Total Variance Explained: Rotation Sums of Squared Loadings столбец % of Variance (процент по каждому фактору) и Cumulative % (совокупный процент). На наш взгляд, в ходе дальнейшего анализа вполне допустимо опустить пятый фактор, в который входит только одна шкала «конкретный- абстрактный». 77 Подробнее: Серкин В.П. Указ. соч. С. 94-95.: «Это происходит потому, что заложенные в современные статпрограммы процедуры факторного анализа позволяют выделять только факторную ось, а не полноценный (однонаправленный) вектор. Учитывая это, экспериментатор произвольно меняет названия некоторых факторов на обратные (антонимичные), более соответствующие результатам первичного оценивания. Формально исследователь имеет на это право, так как направление вектора не определено». 78 Гусев А. Н., Измайлов Ч.А., Михалевская М.Б. Указ. соч. С. 229-230. 73 Рис. 40. Фрагмент таблицы из итогового файла SPSS с результатами факторного анализа, содержащий данные о проценте объяснимой дисперсии По мнению В.П. Серкина указанные процедуры вносят еще больший элемент субъективности в процедуру факторного анализа: «Результаты факторного анализа часто представляются интересными для качественного анализа, но необходимо помнить, что чаще всего названия факторов выбраны самим исследователем, имеющим свое развернутое представление о стимуле и о предполагаемых результатах. Для некоторого снятия элемента субъективности можно предложить обработку матрицы результатов независимому специалисту, а выбор обобщающих названий факторов группе независимых экспертов. Несмотря на описанные недостатки факторного анализа, этот метод редукции данных получил широкое распространение, благодаря одному своему несомненному достоинству: факторный анализ позволяет приблизиться к интегративной структуре данных сразу по совокупности нескольких шкал оценки стимула испытуемыми. Другими словами, факторный анализ позволяет выявить скрытую от экспериментатора (имплицитную) структуру больших матриц данных. Предполагается также, что названные факторы показывают экспериментатору именно те категории (или шкалы), которые значимы для группы испытуемых при оценки именно избранной группы стимулов» 79 Второй этап интерпретации – это анализ расположения оцениваемых объектов в семантическом пространстве. Анализируя способы обработки данных биполярного семантического дифференциала, использованные Е.Ю. Артемьевой, В.П. Серкин приводит следующее правило: простейшая обработка результатов сводится к выбору признаков оцениваемого объекта, которые названы не менее чем 75% испытуемых (для группы не менее 25 человек). Совокупность таких признаков является семантической универсалией оцениваемого объекта 80 Иными словами, если среднегрупповая оценка по какой-либо шкале семантического дифференциала сдвигается к какому-либо максимальному значению оценки, это значит, что и индивидуальные оценки большинства 79 Серкин В.П. Указ. соч. С. 96-97. 80 Серкин В.П. Указ. соч. С. 91. 74 членов группы сдвигаются к этому максимальному значению. На этом основании Е.Ю. Артемьева сформулировала следующий прикладной алгоритм выделения семантических универсалий оценок стимулов с использованием шкалированного семантического дифференциала: на отрезке числовой оси (-3; +3) выстраивается интервал размаха среднегрупповых оценок по всем шкалам (от максимальной по модулю отрицательной средней оценки для всех шкал до максимальной положительной). Для выделения 75% (квартильной) универсалии от концов интервала размаха отступается 25% (четверть) его длины. Все полюса (качества) шкал, средние оценки по которым располагаются на числовой оси ближе к концам интервала размаха, чем четверть его длины, записываются как составляющие квартильной универсалии. Сама величина интервала (размах) среднегрупповых оценок по всем шкалам служит косвенным показателем групповой сплоченности оценивания. Так, например, если испытуемые оценивают стимул, используя полярные значения, то размах интервала оценивания будет близок к 6 (от – 3 до + 3). Если же разные испытуемые приписывают стимулу то положительную, то отрицательную оценку, средняя оценка приближается к нулевой, размах интервала оценивания уменьшается 81 Принимая во внимание указанную закономерность, при анализе размещения объектов в семантическом пространстве мы рекомендуем рассматривать лишь те из них, которые не входят в зону средних значений по шкале (см. Рис. 41) – интервал, охватывающий 50% размаха по анализируемому фактору (обозначен серой заливкой). Рис. 41. Графическое отображение семантического пространства 81 Серкин В.П. Указ. соч. С. 90. 75 Третий этап – это обобщение всех результатов, полученных в ходе факторного анализа, и соотнесение их с данными других методов и методик, использованных в ходе исследования. С примерами итоговой интерпретации можно познакомиться в Приложении к данному пособию. Практические задания 1. Проанализируйте результаты факторного анализа и дайте названия выделенным факторам. Цель исследования: изучение специфики образа политических деятелей в период предвыборной кампании у избирателей разного возраста. Объекты оценивания: «политик А», «политик В», «политик С», «политик D», «политик Е», «политик F», «Я сам», «мой идеал политика», «политик будущего», «политик прошлого», «лидер», «деловой человек», «трудолюбивый человек», «умный человек», «проходимец», «презираемый мною человек», «президент республики». Шкалы |