Методы. Методы колличест анализа. Методы количественного анализа данных психолого педагогического исследования Качественные и количественные
Скачать 0.53 Mb.
|
1 2 Тема 6. Методы количественного анализа данных психолого - педагогического исследования Качественные и количественные методы психологических и педагогических исследований Цель изучения темы: формирование представлений у обучающихся об особенностях выбора и применения методов качественного анализа данных психолого-педагогического исследования. Задачи изучения темы: 1. Обозначить последовательность этапов количественного анализа. 2. Ознакомить с методами и приемами первичной организации количественных данных, процедурами описательного анализа количественных данных, методами статистического вывода. 3. Рассмотреть процедуру проверки статистических гипотез и ее основные аспекты. 4. Ознакомить с параметрическими и непараметрическими критериями и охарактеризовать процесс выбора конкретных статистических критериев в соответствии с решаемой задачей или группой задач. 5. Дать общее представление о многомерной статистике, охарактеризовать многомерные статистические методы: факторный анализ, кластерный анализ, многомерное шкалирование, регрессионный анализ, дискриминантный анализ, структурное моделирование. В результате изучения данной темы Вы будете Знать: - методологическую и феноменологическую характеристику, критерии выбора, возможности и ограничения и процедуру применения методов количественного анализа данных в научных психологических и психолого-педагогических исследованиях, раскрывающих особенности обучения, воспитания и психического развития детей дошкольного, младшего школьного и подросткового возрастов; - возможности компьютеризации процесса и результатов применения количественных методов на этапах сбора и анализа исследовательских. Уметь: - характеризовать феноменологические и методологические особенности, критерии выбора, возможности, ограничения и процедуру применения методов количественного анализа данных в научных психологических и психолого-педагогических исследованиях, раскрывающих особенности обучения, воспитания и психического развития детей дошкольного, младшего школьного и подросткового возрастов; - анализировать процедуру применения методов количественного анализа данных в научных психологических и психолого-педагогических исследованиях, раскрывающих особенности обучения, воспитания и психического развития детей дошкольного, младшего школьного и подросткового возрастов; - осуществлять обоснованный выбор методов количественного анализа данных об индивидуальных особенностях детей разного возраста, проявляющихся в образовательной деятельности и взаимодействии со взрослыми и сверстниками; - анализировать возможности и подбирать способы применения информационно-коммуникационных технологий при использовании количественных методов на этапах анализа исследовательских данных, представления результатов исследования. Владеть: - навыками анализа процедуры применения методов количественного анализа данных в научных психологических и психолого-педагогических исследованиях, раскрывающих особенности обучения, воспитания и психического развития детей дошкольного, младшего школьного и подросткового возрастов; - навыками обоснованного выбора методов количественного анализа данных об индивидуальных особенностях детей разного возраста, проявляющихся в образовательной деятельности и взаимодействии со взрослыми и сверстниками; - навыками анализа возможностей и способами применения информационно-коммуникационных технологий при использовании качественных и количественных методов на этапах сбора и анализа исследовательских данных, представления результатов исследования. Учебные вопросы темы: 1. Этапы количественного анализа. Количественный анализ и представления об объективности 2. Первичная организация количественных данных. 3. Описательный анализ количественных данных 4. Методы статистического вывода. 5. Многомерная статистика и ее основные задачи. Методы многомерной статистики. Вопрос 1. Этапы количественного анализа. Количественный анализ и представления об объективности. В отличие от качественного исследования работа с числовыми данными имеет строго упорядоченную структуру и предполагает четкую последовательность этапов. В количественных исследованиях данные вначале собираются, потом их подвергают процедурам первичной организации (упорядочиванию, занесению в таблицы, визуальному представлению в виде диаграмм, гистограмм и т.п.), затем – вторичной обработке с использованием статистических методов; наконец, получив результаты всех обработок, исследователь приступает к концептуальной интерпретации. Содержательная работа в такого рода исследованиях производится только на этапах планирования (замысла) и интерпретации, между которыми работа исследователя носит характер формального следования алгоритму. Для сбора данных используются стандартизованные методики, а для обработки данных – одинаковые для всех методические приемы. Может показаться, что применение количественных методов страхует исследователя от субъективизма, так как четкий алгоритм процедуры сбора и анализа данных, которому он подчиняет свои действия, делает получаемые результаты независимыми от его личного взгляда: каждый, кто проделает ту же самую процедуру, получит такие же результаты. На самом деле объективность количественных исследований так же проблематична, как и объективность исследований качественных– и в тех, и в других исследователь стоит перед необходимостью обоснований собственных действий. Четкий алгоритм работает только на этапах непосредственно сбора количественных данных и подсчетов. На всех других этапах требуется личностная включенность исследователя - на этапе планирования процедуры исследования при решении вопроса о способах операционализации переменных; - при переходе от теоретических взглядов к проверке гипотез; - при обосновании использования методического инструментария для решения поставленных задач; - при концептуальной интерпретации результатов обработки данных, особенно полученных с помощью многомерных статистических методов, поскольку исследователь вынужден работать в условиях весьма обедненного контекста (в отличие от случая интерпретации качественных данных), например, при поиске смыслового инварианта, присутствующего в отдельных словах или показателях методик, объединившихся в один кластер или фактор после проведения соответствующих математических процедур. Таким образом, с точки зрения объективности количественные методы, так же как качественные, опираются на рациональную аргументацию и логику проверок исследователем собственных суждений (за исключением статистическими процедурами). Существует множество хороших учебников по работе с числовыми данными (в отличие от работы с качественными данными, которая в отечественной психологической литературе пока представлена весьма скудно). Мы представим лишь краткий обзор способов и методов количественной обработки, не погружаясь в детали каждого метода. Наша задача – систематизировать наиболее важные с практической точки зрения действия исследователя, которые необходимо предпринять, когда он приступает к анализу количественных данных. Вопрос 2. Первичная организация количественных данных. Анализ количественных данных начинается с группировки. Наиболее распространенной формой группировки являются таблицы. В психолого-педагогических исследованиях данные, как правило, представляются в виде итоговых таблиц, в первом столбце которых стоят номера (имена) испытуемых, а в следующих – показатели каждого испытуемого по соответствующей методике (табл.1). При занесении таких таблиц в статистические пакеты обработки данных (например, в SPSS) имена испытуемых, как правило, опускаются (при вводе в SPSS оставляют лишь нумерацию, поэтому имена необходимо сохранять в Excel), названия столбцов лучше обозначить так, чтобы можно было легко узнать, о показателях по какой методике идет речь. Таблицы, содержащие фамилии испытуемых в соответствии с этическими принципами предназначены исключительно для исследователя. В таблицах может быть представлена и более сложная информация. Например, для представления данных в исследованиях, нацеленных на проверку причинно-следственных гипотез между варьирующимися переменными, часто используются многопольные таблицы, которые позволяют увидеть тенденцию изменения одних переменных под действием других. В табл. 2 приведены классические данные Ф. Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей и детей. Таблица 2. Данные Ф. Гальтона, показывающие зависимость роста детей от роста родителей Рост родителей Рост детей в дюймах Всего в дюймах 60,7 62,7 64,7 66,7 68,7 7,7 72,7 74,7 74 4 4 72 1 4 11 17 20 6 62 70 1 2 21 48 83 66 22 8 251 68 1 15 56 130 148 69 11 430 66 1 15 19 56 41 И 1 144 64 2 7 10 14 4 37 Всего 5 39 107 255 387 163 58 14 928 В ячейках таблицы – количество случаев в выборке Гальтона, в которых наблюдается указанное соотношение роста родителей и ребенка. Как можно видеть, у родителей более высокого роста дети более высокие, у низкорослых родителей дети также низкого роста. Таблица имеет не только иллюстративное, но и аналитическое значение – она позволяет обнаруживать связи между варьирующимися признаками. Особую форму группировки данных представляют статистические ряды. Числовые значения показателей расположены в них в определенном порядке. Очень часто данные упорядочивают в восходящем (от меньших значений к большим) или нисходящем (от больших значений к меньшим) порядке. Вариационный ряд – это двойной ряд чисел, состоящий из значений самих признаков (вариант) и их частот. Ряд показывает, с какой частотой встречается то или иное значение (распределение частот). Например: Варианты xi 12 16 20 24 28 32 36 40 Частоты вариант fi 3 6 10 11 6 5 3 1 Это ранжированный вариационный ряд, поскольку в нем значения признака упорядочены по возрастанию. Такой ряд иллюстрирует закономерность варьирования признака. Его можно отобразить на графике, где по оси абсцисс откладываются значения данных, а по оси ординат – частота каждого значения. Именно так строится гистограмма – наиболее популярный тип столбчатого графика, иллюстрирующий распределение частот какого- либо признака. Однако число значений может быть большим (более 20 единиц), и их будет трудно представить на оси абсцисс. Обычно в таких случаях диапазон значений делят на равные разрядные или классные интервалы и затем строят график. Сегодня все расчеты частот вариационного ряда, процентов, кумулятивных частот, процентилей - процент общего количества значений, лежащих ниже данного пункта (процентили считаются только для восходящего ряда). производятся с помощью компьютерных программ. В статистических пакетах также есть функция построения гистограмм и других графиков. Вопрос 3. Описательный анализ количественных данных. Для начального, описательного анализа количественных данных большое значение имеет также расчет трех ключевых классов описательных статистик: меры центральной тенденции, меры изменчивости (вариативности или дисперсии) и меры связи (корреляции). Скажем сразу, что все названные показатели можно подсчитывать, используя статистические пакеты. К мерам центральной тенденции относятся среднее арифметическое, медиана и мода. Они дают базовую информацию для множества других статистических процедур, поэтому обязательно нужно определить одну или несколько из этих мер, какой бы тип статистического анализа ни использовался на следующих этапах. В рамках количественного анализа данных среднее арифметическое может быть самым информативным, если все значения данных достаточно сходные и нет экстремальных значений. В противном случае одно или несколько очень больших или, наоборот, очень маленьких по сравнению с другими значений как бы притянут к себе среднее, сделав его гораздо больше или гораздо меньше основного набора значений. Медиана – это позиционное среднее набора данных: половина значений предшествует медианному значению, а половина следует за ним. Медиана – наиболее подходящая мера центральной тенденции для порядковых шкал, а среднее арифметическое – для шкал интервалов и отношений. Нужно учитывать возможное наличие экстремальных показателей. Если они присутствуют, исследователю необходимо тщательно проанализировать, откуда они берутся; если экстремальные значения, скорее всего, случайны, их исключают, если же исключить их невозможно, то лучше ориентироваться на определение сразу двух мер: среднего арифметического и медианы. Мода считается менее информативным показателем, поэтому используется реже, в основном для данных, представленных в номинальной шкале. Это то значение, которое обнаруживается в данных чаще всего. В наборе данных может быть две (бимодальные наборы данных) или большее число мод (полимодальные наборы данных). Вторая группа описательных статистик – это меры изменчивости: разброс (или размах), дисперсия, стандартное отклонение. Они показывают, насколько данные отличаются друг от друга. Разброс – это разница между максимальной и минимальной величинами вариационного ряда. Понятно, что этот показатель подвержен влиянию экстремальных значений в наборе данных. Дисперсия и стандартное отклонение – тесно взаимосвязанные меры изменчивости значений вокруг среднего значения. Дисперсия как статистическая величина характеризует, насколько частные значения отклоняются от средней величины в данной выборке. Чем больше дисперсия, тем больше отклонения или разброс данных. Прежде чем представлять формулу для расчетов дисперсии, рассмотрим пример. Воспользуемся теми первичными данными, которые были приведены ранее и на основе которых вычислялась в предыдущем примере средняя величина. Мы видим, что все они разные и отличаются не только друг от друга, но и от средней величины. Меру их общего отличия от средней величины и характеризует дисперсия. Ее определяют для того, чтобы можно было отличать друг от друга величины, имеющие одинаковую среднюю, но разный разброс. Кроме мер центральной тенденции и изменчивости признака, психолога часто интересует наличие связи между переменными. Чтобы установить, есть ли связь между переменными, в психологии применяют коэффициенты корреляции и строят диаграммы рассеивания. Коэффициент корреляции показывает наличие или отсутствие линейной связи между случайными величинами. Он изменяется в диапазоне от -1 до 1 (рис. 1). Абсолютная величина коэффициента обозначает степень связи (чем больше число по модулю, тем выше связь; близкие к нулю значения говорят об отсутствии линейной связи), а знак коэффициента (+ или -) обозначает направление связи (позитивная или негативная корреляция; при позитивной корреляции увеличение одной переменной сопровождается пропорциональным увеличением другой переменной; при негативной корреляции увеличение одной переменной сопровождается пропорциональным уменьшением другой переменной). Связь между переменными может быть представлена графически на диаграммах рассеивания: на оси абсцисс откладываются значения одной переменной, а на оси ординат – другой. Коэффициенты корреляции и диаграммы рассеивания в ряде случаев могут давать дополнительную информацию о связи между переменными, и поэтому имеет смысл применять их вместе. Например, коэффициент корреляции может быть незначительным по абсолютной величине, но при этом на графике большинство показателей образует конфигурацию, близкую линейной, и только один или несколько показателей отстоят от остальных значений. В таком случае необходимо проанализировать, откуда берутся эти «отдаленные» значения – возможно, сыграли роль какие-то случайные факторы; тогда «отдаленные» значения можно исключить из общего набора данных и еще раз посчитать коэффициенты корреляции. Может встретиться и другая картина: коэффициенты корреляции незначительны, что, вроде бы, свидетельствует об отсутствии линейной связи между переменными, а на графике заметны две параллельные линии, что может говорить о наличии некоторого разделения в наборе данных, как будто есть две подгруппы, в каждой из которых наблюдается интересующая нас связь между переменными. Подчеркнем также, что коэффициент корреляции всегда показывает наличие или отсутствие линейной зависимости; если же зависимость носит нелинейный характер, то считать корреляции бессмысленно. Для более ясного представления числовых данных исследователю необходимо использовать графики. Наиболее распространенные типы графиков – линейные графики (прямая или кривая линия), столбиковые диаграммы и гистограммы, диаграммы рассеивания. Линейные графики используют для визуального представления изменений одной переменной при изменении другой. На оси X отображают значения независимой переменной, а на оси Y – зависимой; набор точек соединяется одной непрерывной линией (прямой или гладкой кривой) либо множеством коротких прямых линий, что придает графику характерный неровный вид. В столбиковых диаграммах данные представляются в виде столбиков, поднимающихся от горизонтальной оси. В виде столбиковой диаграммы можно отобразить, например, различия в средних показателях теста при разных экспериментальных условиях или частоту распределения признака в разных группах. Гистограмма – это тоже вид столбикового графика, предназначенный для визуального представления частоты. От обычных диаграмм гистограмма отличается тем, что на ней ось абсцисс обязательно имеет собственную шкалу и столбики касаются друг друга. Если линейные графики и столбиковые диаграммы используются для представления изменений одной переменной в ответ на изменения (или влияние) другой, то графики рассеивания строятся для анализа взаимоотношений между переменными (как уже отмечалось, они часто используются вместе с подсчетом коэффициентов корреляции). Вопрос 4. Методы статистического вывода. Обработка числовых данных начинается с их описания и представления. Оформление таблиц, расчет описательных статистик, построение графиков являются важной частью количественного анализа. Однако все эти приемы и методы лишь характеризуют данные как таковые и позволяют получить информацию об особенностях тех, кто непосредственно участвовал в исследовании. Психолога же интересует возможность на основании данных, полученных на ограниченной выборке, делать выводы о психических процессах, характерных для популяции в целом. Кроме того, ему необходимо ответить на вопрос, что значат полученные данные в контексте проверяемой им гипотезы и возможен ли переход от данных к некоторым выводам теоретического характера. Методы выводной статистики, или статистического вывода, как раз были созданы для того, чтобы исследователь мог выводить заключения из результатов, полученных на ограниченной выборке. Два основных приложения теории статистического вывода в психологии – это оценка параметров и проверка статистических гипотез. Оценка параметров позволяет ответить на вопрос, касающийся возможности перехода от показателей по выборке к характеристикам популяции. А проверка гипотез дает возможность оценить, действительно ли различия в наборах данных (скажем, различия между экспериментальной и контрольной группами) вызваны экспериментальными условиями, а не случайными влияниями. Оценка параметров В предыдущем вопросе речь шла о ряде статистических показателей (среднем, медиане, разбросе, стандартном отклонении и др.), которые характеризуют выборку. Параметры – это аналогичные значения, но характеризующие не выборку, а популяцию в целом. Обычно даже в тех случаях, когда процедуры случайной выборки проведены с особой тщательностью, выборка не может быть полностью репрезентативной, существует погрешность выборки, а, следовательно, параметры популяции не совпадают с показателями по выборке (например, среднее по популяции будет несколько отличаться от среднего по выборке). Для сглаживания влияния погрешности выборки на точность оценки параметра применяется подход интервальной оценки параметра (вместо его точечной оценки, которая используется при подсчете соответствующего показателя по выборке). Интервальная оценка параметра состоит в том, что определяется диапазон значений, которые может принимать параметр популяции, и определяется вероятность того, что он будет находиться именно внутри указанного диапазона (часто говорят о доверительном интервале, который покрывает некоторый параметр с заданной надежностью). Основана интервальная оценка на модели нормального распределения признака. Напомним, что кривая нормального распределения – это теоретическая модель, представляющая собой абсолютно симметричное и гладкое распределение частот, по форме она напоминает симметричный колокол. Предполагается, что распределение большого числа переменных (в том числе психологических) в реальности очень близко к форме нормального распределения. Как теоретическая модель, нормальное распределение открывает массу возможностей для математических оценок в силу своих уникальных свойств. Предположим, исследователь получил данные по некоторому тесту на случайной выборке, состоящей из п человек. Ему известно среднее по выборке хср и известен параметр стандартного отклонения по популяции σ. Исследователя интересует, каково значение среднего по популяции (можно задавать подобные же вопросы и относительно других параметров – медианы, стандартного отклонения; в качестве примера мы остановимся на оценке среднего). Для ответа на этот вопрос он может определить доверительный интервал, т.е. диапазон возможных значений для среднего по популяции и связанную с ними вероятность. Действия исследователя в этом случае: 1. определить желаемую вероятность (чаще всего это 95 или 99%, т.е. вероятность ошибки либо 5, либо 1%; но, в сущности, выбирать можно любую вероятность); 2. найти значение z-показателя, соответствующее этой вероятности (например, для 95% вероятности в таблице z-показателей необходимо отыскать значение z, соответствующее 0,4750; это значение равно 1,9); 3. определить стандартную погрешность среднего (т.е. стандартное отклонение распределения всех выборочных средних) по формуле; 4. трансформировать значение z-показателя в соответствующее значение первичных значений переменной (умножить найденное по таблице значение z-показателя на стандартную погрешность); 5. определить интервал значений среднего по популяции, связанный с выбранной вероятностью (его границы: среднее по выборке минус найденное на предыдущем шаге трансформированное значение z-показателя; среднее по выборке плюс трансформированное значение z-показателя). В предыдущем примере мы предполагали, что нам известно стандартное отклонение по популяции. Однако чаще всего оно нам неизвестно. В этом случае тоже возможно оценить среднее по популяции. Для определения стандартной погрешности среднего используется показатель стандартного отклонения по выборке (S); формула аналогична приведенной выше: Заметим, что чем более точна оценка параметра (т.е. чем меньше диапазон доверительного интервала), тем меньше вероятность того, что параметр популяции действительно располагается в этом интервале. И наоборот, расширение диапазона дает возможность более уверенно предсказать, что параметр действительно принадлежит этому диапазону. Проверка статистических гипотез Обратимся теперь к следующей задаче, которую можно решать при помощи методов статистического вывода, – это проверка статистических гипотез. Именно это приложение индуктивной статистики наиболее широко используется в психологии и педагогике. После того как собраны данные о показателях зависимой переменной в различных условиях, исследователю необходимо принять обоснованное решение, действительно ли наблюдаемые различия в данных обусловлены действием независимых переменных, а нс просто действием случайных факторов. Исследователь формулирует две взаимосвязанные статистические гипотезы – нулевую и альтернативную. Нулевая гипотеза (Н0) приобретает несколько разный вид в зависимости от конкретной статистической процедуры, но ее суть такова, что это всегда предположение об отсутствии неслучайных различий или связей между переменными. Альтернативная гипотеза (Н1) утверждает нечто прямо противоположное нулевой – например, существование неслучайного различия и неслучайной связи между параметрами популяции. Как можно видеть, нулевая Н0 и альтернативная Н1 гипотезы выражают две взаимоисключающие возможности, так что верной может быть только одна из них. Принято начинать с предположения о верности нулевой гипотезы и затем проводить ее проверку. Только в том случае «если и только если ожидаемое в исследовании событие выражено достаточно сильно, альтернативная гипотеза может быть принята, а нулевая – отвергнута. Во всех других случаях (т.е. если ожидаемое событие выражено недостаточно) альтернативная гипотеза не может быть принята, а нулевая гипотеза не может быть отвергнута». Для принятия решения о гипотезах выработан некий стандарт процедуры, который и используется в подавляющем большинстве психологических исследований. Процесс принятия решения опирается на понятие уровня значимости. Под ним понимается вероятность ошибочного отвержения нулевой гипотезы. В психологических исследованиях в основном используются уровни значимости ρ = 0,05 и ρ = 0,01. Они означают, что допустимая вероятность ошибочного принятия решения об отвержении нулевой гипотезы не выше 5% или 1%. Вообще уровень значимости может принимать любое значение от 0 до 1. Понятно, что исследователь должен ориентироваться на показатели, близкие к 0. В психологии установлена довольно высокая граница приемлемого риска (ρ = 0,05). Однако насколько р должно быть близко к нулю, чтобы в данном конкретном случае можно было отвергнуть нулевую гипотезу, – это решение всегда остается за исследователем. Выделяют два типа ошибок при принятии решений. Ошибка первого рода (ложная позитивная ошибка) возникает, когда принимается решение об отвержении нулевой гипотезы, а она верна (ее называют «ложной позитивной», потому что в этом случае исследователь ложно думает, что получил основания в пользу интересующего его предположения). Ошибка второго рода (ложная негативная ошибка) возникает при принятии нулевой гипотезы, когда на самом деле она должна быть отвергнута (ее называют «ложной негативной», потому что исследователь ложно думает, что интересующее его предположение неверно). Обычно для того чтобы избежать ошибки первого рода, снижают допустимый уровень риска – уровень значимости. Однако понятно, что при этом возрастает возможность совершения ошибки второго рода. Повторное проведение исследования, увеличение выборки и использование статистического критерия большей мощности (т.е. критерия, более чувствительного к неслучайным различиям) минимизируют риск ошибки второго рода. Считается, что именно ошибка первого рода, когда отвергается верная нулевая гипотеза и принимается ложная альтернативная, более опасна для исследователя, потому что в этом случае намечается утверждение некоего положения дел, которого на самом деле нет. Однако и ошибка второго рода тоже может повлечь за собой неприятные для развития определенной предметной области последствия – например, исследователь может отказаться от проведения дальнейших исследований в выбранном направлении, неверно решив, что оно ошибочно. Поэтому необходимо тщательное взвешивание оснований за и против принимаемого решения. Немалую роль в процессе принятия решения играют теоретические размышления и сравнение полученных результатов с имеющимися в литературе. Исследователь может формулировать направленные и ненаправленные гипотезы: в направленных гипотезах отмечается направление предполагаемых изменений (например, гипотезы об увеличении или уменьшении показателей под влиянием экспериментальных воздействий); в ненаправленных гипотезах направление изменений не конкретизируется (например, гипотезы о различиях в формах распределения признака в двух группах). При направленных статистических гипотезах используются односторонние критерии, при ненаправленных – двусторонние. Двусторонние критерии являются более строгими: поскольку они проверяют различия в обе стороны, эмпирическое значение критерия, которое ранее соответствовало бы уровню значимости ρ < 0,05, теперь соответствует лишь уровню ρ < 0,10. Статистическим критериям посвящено огромное множество учебной литературы. Основной объем учебников по математической статистике занимают подробные описания каждого критерия, примеры решения задач с помощью того или иного критерия, алгоритмы подсчета каждого критерия вручную и с помощью статистических пакетов. Именно статистическим критериям уделяется значительное внимание в курсах по математической статистике, входящих в базовую часть подготовки студентов по программам бакалавриата и магистратуры. В данной лекции мы даем лишь краткое перечисление наиболее часто используемых критериев. Наша цель – продемонстрировать общую логику работы с числовыми данными и очертить круг задач, для решения которых исследователь может привлекать те или иные статистические критерии. Конкретные алгоритмы применения того или иного статистического критерия можно найти в специализированной литературе. Статистический критерий – это решающее правило, в соответствии с которым принимается решение об отклонении или принятии статистической гипотезы с известным уровнем значимости. В психологических исследованиях используются параметрические и непараметрические критерии. Параметрические критерии включают в формулу расчета параметры распределения, т.е. средние и дисперсии (t-критерий Стъюдента, критерий F, коэффициент корреляции Пирсона и др.). Непараметрические критерии основаны на оперировании частотами или рангами и не включают в формулу расчета параметры распределения (критерий Манна – Уитни, T- критерий Уилкоксона, критерий χ2 и др.). Параметрические критерии предполагают ряд допущений относительно популяции и процедуры сбора данных. Самые важные из них два: переменная имеет нормальное распределение, что как минимум подразумевает, что она измерена по интервальной шкале; выборка носит случайный характер. Параметрические критерии считаются более мощными, однако в силу отмеченных допущений их применение связано с серьезными ограничениями. В психологии чаще всего данные измерены не по интервальной шкале; выборка не носит строго случайного характера; распределение признака существенно отличается от нормального – при малом размере выборки даже при использовании интервальных шкал распределение признака может значимо отличаться от нормального. Во всех этих случаях (а их в психологии большинство) уместно использование непараметрических критериев, свободных от допущений по поводу свойств распределения популяции. Можно выделить несколько основных групп задач, для решения которых применяются статистические критерии: 1) выявление различий в уровне исследуемого признака; 2) выявление различий в распределении признака; 3) выявление степени согласованности изменений нескольких признаков; 4) анализ изменений признака под влиянием контролируемых условий. В современных психологических исследованиях часто ставятся задачи, связанные со сложной группировкой и классификацией переменных, выявлением статистически значимых различий между группами объектов одновременно по нескольким переменным, установлением функциональных зависимостей между переменными, выявлением латентных переменных, и др. Для решения подобных задач сегодня привлекаются многомерные статистические методы, о которых речь пойдет в следующей главе. Здесь мы остановимся на перечне из четырех отмеченных нами групп задач и кратко охарактеризуем пути их решения, основанные на применении простых статистических критериев. Круг задач на выявление различий в уровне исследуемого признака включает задачи, связанные со сравнением групп по выраженности какой-либо характеристики. Например: есть ли различия между мужчинами и женщинами в уровнях вербального или невербального интеллекта; отличается ли уровень эмоционального благополучия у подростков из семей с разным стилем семейного воспитания; снижается ли выраженность аэрофобии в результате прохождения специального тренинга. Для выявления различий в случае несвязанных выборок используются такие непараметрические критерии, как U-критерий Манна – Уитни, Q-критерий Розенбаума, – все эти критерии применяются, когда в исследовании участвуют две выборки; S- критерий тенденций Джонкира и H-критерий Краскела – Уоллиса применяются для трех и более выборок. Для выявления различий в случае связанных выборок применяются такие непараметрические критерии, как T-критерий Уилкоксона, G-критерий знаков, – все они подходят для двух повторных измерений на одной и той же выборке испытуемых; χ2-критерий Фридмана и L-критерий Пейджа используются для трех и более повторных измерений на одной и той же выборке испытуемых. Критерий Фридмана является непараметрическим аналогом однофакторного дисперсионного анализа для повторных измерений и применяется на выборках малого объема. Кроме того, для проверки наличия значимых различий между двумя средними используется параметрический критерий t Стъюдента. Задачи на выявление различий в распределении признака – это достаточно широкий круг задач, касающихся предпочтения, сравнения, взаимосвязи переменных и пр., когда необходимо сопоставлять частоты. Например: зависит ли выбор кандидата на какой-нибудь пост от его пола; книги какого жанра предпочитают люди с различными ценностно-смысловыми установками; на каком из факультетов университета выше успеваемость студентов; связана ли успешность профессиональной деятельности психотерапевта с его интеллектуальным способностями, уровнем эмпатии или другими личностными качествами. Задачи подобного рода могут предполагать сопоставление эмпирического распределения с теоретическим или сопоставление двух эмпирических распределений. Задачи на выявление степени согласованности изменений нескольких признаков решаются с помощью использования параметрических и непараметрических коэффициентов корреляции. Самый популярный параметрический коэффициент корреляции, подходящий для шкал интервалов или отношений, – коэффициент Пирсона rxy, используются также множественный коэффициент корреляции, корреляционное отношение Пирсона η, коэффициент Фехнера rф. Для порядковых шкал применяется коэффициент ранговой корреляции Спирмена ρxyи коэффициент τ Кендалла. Анализ изменений признака под влиянием контролируемых условий связан с задачами по проверке причинно-следственных гипотез в экспериментальных и квазиэкспериментальных дизайнах. Изменение признака под влиянием одного фактора можно анализировать с использованием параметрических критериев – критерия t Стъюдента и однофакторного дисперсионного анализа Фишера (ANOVA) (для одного фактора они дают идентичные результаты), а также с использованием их непараметрических аналогов –S-критерия тенденций Джонкира, L-критерия тенденций Пейджа. Если психолога интересует анализ влияния двух факторов, используется двухфакторный дисперсионный анализ Фишера, непараметрических аналогов которого нет. Резюмируя, можно сказать, что каждое исследование представляет собой уникальную проблемную ситуацию, и лучшая стратегия – внимательно исследовать эту ситуацию и упражняться в том, что западные авторы называют «осознанной оценкой», вместо того чтобы механически повторять один и тот же алгоритм. 1 2 |