Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ — комплекс методов статистического исследования взаимозависимости между переменными, связанными корреляционными отношениями. Корреляционными (лат. correlatio — соотношение, связь, зависимость) считаются такие отношения между переменными, при которых выступает преимущественно нелинейная их зависимость, т. е. значению любой произвольно взятой переменной одного ряда может соответствовать некоторое количество значений переменной другого ряда, отклоняющихся в ту или иную сторону от среднего. К. а. выступает в качестве одного из вспомогательных методов решения теоретических задач психодиагностики и включает в себя комплекс наиболее широко применяемых статистических процедур при разработке тестовых и других психодиагностических методик, определения их надежности, валидности. К. а. является одним из основных методов статистической обработки эмпирического материала в прикладных психодиагностических исследованиях. Существующие процедуры К. а. позволяют определить степень значимости связи, установить меру и направление влияния одного из признаков (X) на результирующий признак (У) при фиксированном значении отдельных переменных (корреляция частная), выявить степень и направленность связи результирующего признака (Y) с совокупностью переменных jcj, х2, -.- , xk(корреляция множественная). К. а. подлежат как количественные, так и качественные признаки (к первым относятся переменные, измеряемые в интервальной шкале и шкале отно- шений, ко вторым — не имеющие единиц измерения, оцениваемые шкалами наименований и порядковыми шкалами) (см. Шкалы измерительные). Может быть ■также установлена корреляция и для признаков, один из которых является качественным, а другие количественными (корреляция бисериальная, корреляция качественных признаков). Одним из основных принципов определения количественных критериев корреляционной связи — коэффициентов корреляции — является сравнение величин отклонений от среднего значения по каждой группе в сопряженных парах сравниваемых рядов переменных. Другими словами, определяется частота соответствия между шкалами Xи У. Предположим, один и тот же испытуемый получил высокие оценки по тесту вербальных способностей (Х{) и показателям успеваемости по литературе (У^). Тогда произведения отклонений x,Jc и у{у принимают высокие положительные значения. Если же большому х1у другого испытуемого будет соответствовать малое у^, то это произведение будет отрицательным. Абсолютная величина произведения отклонений зависит от степени отклонения переменных от среднего значения в сравниваемых парах. Если А" и У не имеют систематической связи (большие х сочетаются с малыми у и наоборот), различные произведения будут принимать положительные или отрицательные значения. Сумма произведений во в£ех сравниваемых парах будет приближаться к нулю. Сумма произведений в сравниваемых рядах перемен- ных будет иметь большую величину по модулю и положительный знак, если Xи Yсвязаны между собой выраженной прямой зависимостью, и большую величину и отрицательный знак при связи Xи Yсильной обратной зависимости. С целью достижения независимости меры корреляционной связи от числа сравниваемых пар и величин стандартных отклонений в двух группах произведение отклонений делится на число сравниваемых пар и стандартные отклонения в сопоставимых рядах. Такая мера носит название коэффициента корреляции — произведения моментов Пирсона: где Х[ и yi— сравниваемые количественные признаки, п — число сравниваемых наблюдений, ахи ау— стандартные отклонения в сопоставимых рядах. Расчетная формула гхуимеет следующий вид: При вычислении коэффициента Пирсона, особенно при большом количестве наблюдений, целесообразно упрощение за счет различных приемов, сокращающих объем вычислений. В качестве примера приводим расчет результатов двух тестов в группе из 10 обследованных (табл. 9). Определение статистической зависимости коэффициента гхупроводится с помощью критерия Стьюдента (t): где п' — число степеней свободы {п' = п -- 2). По таблице распределения Стьюдента для п'-8 находим £ = 2,896 при а ■ 0,02 и * = 2,306 при а = 0,05. Отсюда статистическая значимость установленного значения корреляции признаков на уровне а > 0,02. При возведении коэффициента корреляции Пирсона в квадрат получаем коэффициент детерминации г2ху, выражающий степень вариации переменных. В нашем примере г2ху - 0,48, что свидетельствует о том, что 48% измерений признаков объясняются их совместным распределением (взаимовлиянием), КОРРЕЛЯЦИЯ БИСЕРИАЛЬНАЯ (лат. bis series — два ряда, две серии) — метод корреляционного анализа отношения переменных, одна из которых измерена в дихотомической шкале наименований, а другая — в интервальной шкале отношений или порядковой шкале. Название метода связано с тем, что сравниваются две альтернативные серии объектов X, имеющие условные значения 0 или 1 по Y. Наиболее характерно применение коэффициентов К. б. в психологической диагностике при анализе дискримина-тивности заданий теста, а также при определении валидности критериальной путем коррелирования значений тестовых оценок с независимыми характеристиками критерия, выраженными в дихотомической шкале (см. Шкалы измерительные). Для описания связи между перечисленными видами переменных используется точечный бисериальный коэффициент корреляции Пирсона: объектов со значением нуль по У; Sx— стандартное отклонение всех значений по X; rtj — число объектов, с единицей по У: щ — число объектов с нулем по У, т. е. п = П[ + п0. Уравнение для вычисления грЬпредставляет собой алгебраическое упрощение формулы коэффициента гху (см. Корреляционный анализ) для случая, когда У— дихотомическая переменная. Можно привести ряд других эквивалентных выражений, удобных для практического применения: Значение грЬварьирует от -1 до +1. В том случае, когда переменные с единицей по Yимеют среднее по X, равное среднему переменных с нулем по У, грЬобращается в нуль. В качестве примера можно привести вычисление г ьпри анализе дискримина-тивностн отдельных пунктов опросника личностного, т. е. корреляции между типичным ответом на отдельный пункт (утверждение—отрицание) с общим результатом по тесту (табл. 10). Вычисленное таким образом значение грЬпоказывает, что проверяемый пункт опросника имеет среднюю диагностическую значимость и слабо коррелирует с общим результатом теста. Достоверность (а) связи, рассчитанной с помощью коэффициента грЬ, может определяться с помощью критерия Я2 для числа степеней свободы df = 2. Другим распространенным методом расчета является определение бисериаль-ного коэффициента корреляции (гш), который применяется в тех случаях, когда есть основания полагать, что дихотомическое распределение близко к нормальному: Элементы уравнения идентичны используемым при вычислении грЬ, за исключением величины U— ординаты Таблица 10 Вычисление точечного бисериального коэффициента корреляции Пирсона КОРРЕЛЯЦИЯ КАЧЕСТВЕННЫХ ПРИЗНАКОВ — метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. Шкалы измерительные). Наиболее час-го такой корреляционный анализ проводят с помощью коэффициентов корреляции ранговой, используемых в случаях, когда обе переменные измеряются ег шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона (см. Критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона: Значение Р всегда положительно и измеряется от нуля до единицы. Особенностью коэффициента сопряженности Пирсона является то, что максимальное его значение всегда меньше +1 и в значительной степени зависит от количества наблюдений (размера таблицы). В случае квадратной таблицы (k x k) где t— число столбцов таблицы, k— число строк таблицы. В психологической диагностике описанные коэффициенты используются относительно редко. КОРРЕЛЯЦИЯ РАНГОВАЯ — метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Наиболее часто К. р. применяется для анализа связи между признаками, измеряемыми в порядковых шкалах (см. Шкалы измерительные), а также как один из методов определения корреляции качественных признаков. Достоинством коэффициентов К. р. является возможность их использования независимо от характера распределения коррелирующих признаков. В практике наиболее часто применяются такие ранговые меры связи, как коэффициенты К. р. Спирмена и Кендалла. Первым этапом расчета коэффициентов К. р. является ранжирование рядов переменных. Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречаются несколько равных по значению переменных, им присваивается усредненный ранг (табл. 12). В табл. 13 приведены данные для расчета коэффициентов К. р. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе — соответствующие им данные теста зрительной памяти-). Коэффициент корреляции рангов Спирмена (rs) определяется из уравнения: ент х более информативен, чем rs, и рассчитывается проще. Поэтому на практике при расчете К. р. отдают предпочтение коэффициенту т. КОСА КУБИКИ — невербальный тест интеллекта. Предложен К. Косом в 1920 г. Испытуемому предлагают составить фигуры из цветных кубиков по рисункам-образцам. Тестовый материал состоит из шестнадцати кубиков с ребром 2,5 см, стороны которых окрашены в красный, белый, желтый и синий цвета. Оставшиеся две противоположные грани разделены по диагонали, причем одна окрашена в белый и красный цвета, а вторая — в синий и желтый (см. Векслера интеллекта измерения шкалы, рис. 13). В набор включены восемнадцать образцов фигур, первый из которых является тренировочным и выполняется совместно с испытуемым. Цвета рисунков-образцов соответствуют цветам кубиков, но размеры образцов вдвое меньше. Образцы размещены посередине картонной карточки, имеющей размер 10 х 7,5 см. Задания следуют в порядке возрастающей трудности, что обеспечивается последовательной комбинацией следующих условий: — фигуру можно построить только из одноцветных сторон кубиков; — для построения фигуры следует использовать несколько двухцветных граней; — фигуру можно сложить только из двухцветных сторон или из сочетания двухцветных и одноцветных, причем на образце не обозначена граница между соседними кубиками; — образец повернут на 45°, т. е. стоит на ребре; — для составления фигур требуется использовать все большее количество кубиков; — образцы постепенно становятся все менее симметричными; — увеличивается количество цветов на образце; — образец не ограничивается рамкой, так что на краях сливается с фоном. Образцы-рисунки испытуемому предъявляются последовательно,тестирование прекращается после пяти последовавших друг за другом неудачных решений. Успешность оценивается с нескольких позиций. Самым важным показателем является время решения отдельных заданий. В протоколе фиксируется и количество попыток при выполнении. Первичные оценки по результатам выполнения заданий переводятся в показатель умственного возраста. В более поздних модификациях оценки переводятся в IQ-показа-тели стандартные. Данные дополняются качественным анализом поведения испытуемого. К. к. принадлежат к часто применяемым тестам и широко используются как в оригинальной, так и в сокращенных модификациях (см., напр., Векслера интеллекта измерения шкалы). Ценность теста определяется особенностями деятельности испытуемого, которая моделирует- -ся его заданиями. Испытуемый начинает выполнение задания с анализа образца, путем сопоставления фрагментов образца с гранями кубиков. Затем осуществляется генерализация выделяемого признака. Вслед за этим осуществляется переход к синтезу—констатация соответствия между образцом и собранной из кубиков фигурой. По мнению К. Коса, в ходе решения заданий задействуются все мыслительные процессы. Имеются сведения о валидности кон-структной К. к. Получена значимая корреляция с Вине—Симона умственного развития шкалой (г = 0,82 у нормальных детей и г = 0,67 у слабоумных детей). Изучались связи показателей К. к. с основными тестами интеллекта, в частности Станфорд—Бине умственного развития шкалой (г = 0,77), Равена прогрессивными матрицами (г = 0,81). Обращается внимание на независимость друг от друга показателей К. к. и тестов арифметических способностей. Наиболее широкое применение К. к. находят в клинической психодиагностике (В. М. Блейхер, И. В. Крук, 1986). По данным Л. Кошча (1976), тест весьма полезен при работе с такими разнообразными контингентами испытуемых, как творческие личности с высоким уровнем способностей и, с другой стороны, умственно отсталые лица; дети с минимальной мозговой дисфункцией, нарушением концентрации внимания, нарушением пространственной ориентировки; дети, страдающие неврозами; дети с задержкой психического развития, педагогически запущенные; больные юношеского и зрелого возраста, страдающие шизофренией. Тест может использоваться и при анализе интеллектуального потенциала здоровых лиц. В отечественной психодиагностике К. к. используются чаще всего в том виде, как они представлены в соответствующем отдельно взятом субтесте Векслера интеллекта измерения шкалы. КОЭФФИЦИЕНТ АЛЬФА (а) — ста тистический показатель, используемый при дисперсионном анализе. Предложен Л. Кронбахом (1971). Наиболее часто применяется при оценке надежности теста. Уравнение К. А. имеет следующий вид: дартных отклонений для отдельных заданий. В том случае, если в методике применяются задания дихотомического типа («да»—«нет», «правильно»—«неправильно»), может быть использована упрощенная формула: где п — количество заданий теста, а;2 — квадрат стандартного отклонения для всего теста, Zct,-2 — сумма квадратов стан- где SPQ = Xcy и Р — доля испытуемых, давших «ключевой» или правильный ответ, а Q = 1 - Р. Дихотомический вариант К. А. является уравнением Кьюдера—Ричардсона (см. Надежность частей теста). Применение К. А. основано на модели, предполагающей наличие большой дисперсии (а стало быть, и дискримина-тивности заданий теста) скорее у надежного, чем у ненадежного теста (см. Надежность факторно-дисперсионная). Таким образом, если при факторном анализе возвести в квадрат и просуммировать нагрузки выявленных факторов, можно определить надежность, поскольку нагрузки факторов представляют корреляцию теста с общими или специфическими факторами. Модель надежности факторно-дисперсионной близка к анализу надежности по внутренней согласованности. Факторно-дисперсионный метод анализа надежности находится в сильной зависимости от выбора переменных, в связи с которыми факторизуется тест. Так, если сопоставлять тест математических способностей с личностными или мотива-ционными переменными, то оценка надежности была бы неадекватной (практически не было бы общих факторов). С другой стороны, если бы тест факторизиро-вался совместно с тестами общих способностей так, чтобы каждый тест мог нагружать соответствующие ему факторы, метод надежности факторно-дисперсионной мог бы быть достаточно точным. Таким образом, эта модель подходит для оценки надежности теста, факторная валидность которого известна или задана прн разработке, а также тестов, связанных с ограниченным числом общих факторов. |