Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
РАША МОДЕЛЬ — теоретическая модель конструирования психологических тестов, предложенная Г. Рашем и лежащая в основе Раша шкал. Разработка Р. м. связана с попыткой создания стандартизированных шкал, нормативные показатели которых были бы независимы от конкретной выборки стандартизации. При этом Г. Раш (1960) ориентировался на обоснование принципиально нового, отличного от нормативного оценивания и ипсативного оценивания подхода к построению психометрической шкалы. Г. Раш в своей модели исходит из того, что каждый человек решает или не решает ту или иную тестовую задачу с определенной степенью вероятности (см. Трудность заданий теста, -«Задание-ответ» зависимость). Исследуемой характеристике личности (X) в этой модели соответствует т. н. «способность индивида», вероятности решения тестовой задачи {D) — «трудность задания». Цель шкалирования по Рашу состоит в измерении характеристики личности с использованием соотношения Xи D. Поскольку Г. Раш стремился к созданию пропорциональных шкал (см. Шкалы измерительные) с наличием абсолютной нулевой точки измерения психологического качества, то для установления отношения Xи Dможет быть выбрана любая популяция. Существует возможность перейти от некоторой эмпирически полученной частоты решения серии задач (отношение Xr/D(tгде г — измеряемая способность, а i— верное решение) к оценке вероятности решения любой из них. Другими слова- можно получить линейное аддитивное отношение разности (xr - dt), которое в терминологии Г. Раша обозначается «Logit». В результате получается простое линейное уравнение для определения вероятностей (eri) решения задачи определенной степени трудности. При этом число неизвестных хги dtв системе уравнений (каждое уравнение соответствует конкретному индивиду) соответствует числу заданий теста. Тем самым создается такой инструмент измерений, который позволяет, исходя из ряда эмпирически установленных отношений, определять психологическое качество, а иногда и оценивать степень его выраженности по отношению к «абсолютному нулю» («полная неспособность X* или «бесконечная простота D»). Таким образом, структурная модель Раша, хотя и исходит из объективной структуры требований, однако независима от популяции в том смысле, что для своего построения не нуждается в последней. Шкалирование по трудности задач (в определенном смысле) всегда предполагает популяцию, которая, однако, непосредственно не определяет шкалу. Так, вероятность решения, выраженная отношением Xr/Ditне зависит от того, какая популяция используется (Г. Витцлак, 1986). РАША ШКАЛЫ — разновидность психодиагностических методик, в которых реализован принцип конструирования шкалы и комплектации набора заданий с учетом «задание—ответ» зависимостей. При построении Р. ш. используется аналитико-статистический аппарат, сформулированный в рамках Раша модели. Если задания в тесте различимы в терминах трудности (см. Трудность задач теста, «Задание—ответ» зависимость), то Р. ш. становится идентичной Гутмена шкалам. Основным содержанием Р. ш. является построение последовательности заданий в тесте по возрастающей трудности. Показатели трудности при этом определяются независимо от случайных особенностей комплектации эмпирической выборки испытуемых. Трудность устанавливается дифференцированно в зависимости от выраженности исследуемого качества и способности к решению задач у испытуемых. Метод шкалирования по Ращу позволяет разрабатывать однородные, высоко дискриминативные тесты (см. Внутренняя согласованность, Надежность по внутренней согласованности, Диск-риминативность заданий теста), эффективно комплектовать эквивалентные наборы заданий (см. Параллельные формы теста). В практической психодиагностике Р. ш. пока не находят широкого распространения. Это связано с тем, что теоретические основы и аналитический аппарат, опирающиеся на модель Раша, находятся еще в стадии разработки. Сложность практической реализации связана и с некоторыми теоретическими допущениями и требованиями модели, практическое выполнение которых затруднено (пренебрежение угадыванием решений, требование принадлежности выборочной совокупности заданий теста только одной генеральной совокупности заданий теста, требование идентичной дискриминативности каждого из заданий). Конструирование Р. ш. технически невозможно без применения специальных компьютерных средств. Существенным недостатком Р. ш. является необходимость использования многочисленных выборок для градуирования заданий. Шкалирование по Рашу может породить бессмысленные шкалы. Так, шкалирование опросника EPQ(см. Айзенка личностные опросники) привело к некоей смеси личностных шкал N, Е, Р и L(П. Клайн, 1988). Несмотря на сказанное выше, построение Р. ш. целесообразно в тех случаях, когда тестирование связано с хорошо описываемой выборочной совокупностью заданий, а также в тех случаях, когда желательна разработка коротких форм тестов и эквивалентных наборов заданий для повторного тестирования и определения надежности. Особенно перспективным представляется реализация принципа построения Р. щ. при конструировании тестов индивидуально ориентированных. РЕВЕРСИВНЫЙ ТЕСТ — тест интеллекта, относящийся к группе невербальных, разработан А. В. Этфельдтом. ч Тест применяется для проверки готовности к обучению, чтению. Методика основана на определении степени реверсивной тенденции, то есть степени затруднений в различении зеркальных образов, которые являются естественной стадией развития* зрительного восприятия у детей. Задания заключаются в сопоставлении двух изображений, находящихся в прямоугольнике, и обнаружении среди них тех, которые не являются одинаковыми. Образы различаются отдельными деталями. Пример заданий приводится на рис. 54. Время выполнения не ограничено, за каждый правильный ответ начисляется 1 балл. Первичные данные переводятся в оценки 4-балльной шкалы, которые интерпретируются следующим образом: от- Рис. 54. Пример заданий реверсивного теста сутствие готовности к обучению, чтению (1 балл), недостаточная готовность, требующая более подробного изучения (2 балла), средний уровень готовности (3 балла), уровень готовности выше среднего (4 балла). Возможно индивидуальное и групповое применение теста. Сведения о надежности и валиднос-ти теста отсутствуют. Данных об использовании в СНГ нет. РЕГРЕССИОННЫЙ АНАЛИЗ (лат. regressio — движение назад), область статистического анализа, изучающая зависимость изменений значений переменных от одной или нескольких независимых переменных (факторов). < Р. а. применим только по отношению к количественно выраженным переменным, измеряемым в интервальных шкалах (см. Шкалы измерительные). Основными процедурами Р. а. являются построение линий и нахождение уравнений регрессии. Под линией регрессии понимается линия, соединяющая точки средних значений сгруппированных признаков-факторов (т. е. тех признаков, влияние которых на переменную изучается). Построенные таким образом линии в общем виде определяют взаимодействие изучаемого пока- Рис. 55. Эмпирическая и выровненная линии регрессии средних оценок По тесту при лонгитюдном обследовании группы испытуемых зателя и одного (или группы) из объясняющих факторов, позволяют дать предварительную наглядную оценку воздействия фактора на результирующий признак (рис. 65). Уравнение регрессии (упрощенно-уравнение парной регрессии, описывающее воздействие одного фактора на результирующий признак)строится следующим образом. Линейная зависимость признака описывается уравнением у = a+ bx, где a— свободный член уравнения, Ъ — коэффициент регрессии. С т. з. аналитической геометрии Ь — угловой коэффициент, определяющий наклон линии регрессии по отношению к осям X, У. В аспекте Р. а. этот параметр показывает, насколько в среднем величина признака У изменяется при соответствующем изменении на единицу меры признака X. Наглядное представление об этом параметре и о положении линий регрессии У по А' и Xпо У в системе прямоугольных координат дает рис. 56. Показано, что линии регрессии пересекаются в точке 0(х,у), соответствующей средним арифметическим корреляционно связанных друг с другом признаков У и X. Линия АВ, проходящая через эту точку, изображает полную функциональную зависимость между переменными У и А" (коэффициент корреляции г = 1). Чем сильней связь между У и X, тем ближе линии регрессии к АВ, и на- Рис. 56. Линии регрессии Xпо У и У по Xв системе прямоугольных координат оборот, чем слабее эта связь, тем более удаленными оказываются линии регрессии от АВ. При отсутствии связи между признаками (г = 0) линии регрессии оказываются под прямым углом по отношению друг к другу. Для нахождения рассмотренных выше параметров {а, Ь) решается система уравнений: Таблица 22 Определение параметров линейной регрессии в зависимости от ошибок и скорости выполнения заданий теста К примеру, даны два ряда оценок успешности выполнения теста. Пусть X— скорость выполнения; У — количество ошибок. Расчет уравнения регрессии в данном случае приведен в табл. 22. Подставив полученные при расчете в таблицу значения, получаем уравнение регрессии: у= 1,78 + 0,52*. Проверка расчетэв может быть осуществлена путем сопоставления эмпирических и теоретических значений {у{и yt), которые должны быть близкими по величинам. Квадрат коэффициента корреляции (в примере г = 0,86, г2 = 0,75) показываем что 75% общей дисперсии У объясняются влиянием переменной X, остальные 25% обусловлены влиянием неучтенных в уравнении факторов. При оценке зависимости результирующего признака от нескольких факторов строится уравнение множественной регрессии. Интерпретация коэффициентов регрессии аналогична случаю парной регрессии. Коэффициент регрессии находится в тесной связи с коэффициентами корреляции (см. Корреляционный анализ). Коэффициент корреляции представляет собою среднее геометрическое из коэффициентов регрессии признаков: Благодаря этому имеется возможность определения неизвестной величины по значениям коэффициентов регрессии и контроля правильности расчета коэффициента корреляции. Стандартная ошибка выборочного коэффициента регрессии может быть рассчитана при помощи следующих уравнений: Достоверность выборочного коэффициента регрессии проверяется с помощью критерия Стьюдента с k = п - 2 числом степеней свободы и принятым уровнем значимости (а). Нулевая гипотеза (см. Оценка типа распределения) сводится к предположению, что в генеральной совокупности коэффициент регрессии равен нулю. Различные способы Р. а. широко применяются в эмпирических психодиагностических исследованиях для выявления влияния отдельных факторов на результирующие показатели теста, анализа надежности, внутренней и внешней валид-ности методики и др. РЕПРЕЗЕНТАТИВНОСТЬ (франц. ге-presentatif — показательный) свойство выборочной совокупности представлять характеристики генеральной совокупности. Р. означает, что с некоторой наперед заданной или определенной статистически погрешностью можно считать, что представленное в выборочной совокупности распределение изучаемых признаков соответствует их реальному распределению. Для обеспечения Р. выборки данных необходимо учесть ряд обязательных для любого исследования условий. Среди них важнейшими являются следующие: а) каждая единица генеральной совокупности должна иметь равную вероятность попадания в выборку; б) выборка переменных производится независимо от изучаемого признака; в) отбор производится из однородных совокупностей; г) число единиц в выборке должно быть достаточно большим; д) выборка и генеральная совокупность должны быть по возможности статистически однородны (х(выб)-- ^(ген)->0), показатели вариации при увеличении числа наблюдений сближаются между собой: Статистическое определение Р. в практической психодиагностике необходимо для установления Р. норм психометрического теста, а также обоснованности выборок, на которых проводится стандартизация методик. В широком понимании Р. связана с комплексом характеристик валидности методики. РЖИЧАНА ЧИСЛОВЫЕ РЯДЫ— тест интеллекта, относящийся к группе невербальных. Разработан П. Ржича-ном в 1973 г. Испытуемому необходимо выявить принципы, лежащие в основе предлагаемых ему последовательностей. Автор включил в тест задачи, содержащие как восходящие, так и нисходящие арифметические и геометрические последовательности, простые и комбинированные, с чередованием различных арифметических операций. Каждое задание представляет собой ряд из 4-8 чисел. Испытуемый должен закончить его двумя числами, напр.: 1) 3,6,9,12,15,_______; 2) 29,25,21,17,___,___; 3) 5,3,6,4,7,5,8,___,___ Задания размещены в порядке возрастающей трудности. На первой странице тестовой тетради приводятся примеры правильных решений. Время выполнения ограничено, о чем сообщается испытуемым. За каждый правильный ответ присуждается 1 балл. Сумма баллов может быть переведена с помощью таблиц в оценки шкальные в виде стэнов. Имеются две параллельные формы теста А и В. Факторный анализ выявил высокий удельный вес фактора G. Результаты теста улучшаются с возрастом. В целом тест эффективен для обследования детей школьного возраста, обладает высокой дискриминативностью для популяции лиц со средним уровнем интеллектуального развития. Коэффициент внутренней согласованности составляет 0,88. Валид-ность критериальная определялась относительно успеваемости в школе. Наиболее высокие показатели связи были обнаружены между результатами Р. ч. р. и успеваемостью по математике (г = 0,54). Для мальчиков этот коэффициент составил г = 0,63, для девочек — г = 0,59. Эти данные касаются формы В. Валидность формы А оказалась несколько ниже, корреляции с оценкой по математике была г-0,46. Возможно недостаточное соответствие форм Аи В друг другу. Тест положительно коррелирует с интеллектуального потенциала тестом. Р. ч. р. аналогичны субтесту ZR Амтхауэра интеллекта структуры теста. Р. ч. р. нашли применение в отечественной психодиагностике. Методика рекомендуется как средство оценки уровня общих способностей в комплексе с другими тестами. Наиболее широко используются в профконсультации и профотборе. РИСОВАНИЯ ОБРАЗЦОВ ТЕСТ — тест специальных способностей. Предназначен для диагностики пространственного воображения и психомоторной активности. Разработан Й. X. Райскуром в 1947 г. Содержание работы испытуемого состоит в соединении точек внутри квадрата так, чтобы возник образец, изображенный рядом с квадратом (рис. 57). Рис. 57. Стимульный материал Рисования образцов теста Количество точек в рабочем квадрате— 49. Тестовая тетрадь состоит из двух частей: левой и правой. Каждое задание выполняется поочередно обеими руками. За точное копирование образца начисляется 1 балл. Оценка первичная переводится в z-показатели или процентили (см. Оценки шкальные. Стандартные показатели рассчитаны для правой и левой рук. По таблицам определяется и общий стандартный показатель. Нормы разработаны для выпускников школ (возраст 15-17 лет). При анализе валидности конструк-тной выявлена некоторая связь результатов Р. о. т. с тестом Проверка G (г = 0,187 для правой руки, г = 0,095 для левой руки, и с тестом Вонкомера (г = 0,546 и г = 0,502 соответственно). Валидность критериальная анализировалась путем сопоставления результатов Р. о. т. с групповой экспертной оценкой моторной ловкости испытуемых (г = 0,678). Р. о. т. является моделью исследования психомоторного развития детей и подростков. По мнению Й. Вонкомера (1969), он с успехом применяется в консультативной и профориентационной работе. Используется и в клинической психодиагностике (исследование особенностей визуальной памяти, латерализации функций и т. д.). Данных об использовании в СНГ нет. «РИСУНКА СЕМЬИ» МЕТОДИКИ (Drawing-Family Techniques) — группа проективных методик для оценки внутрисемейных отношений. Основана на анализе и интерпретации рисунков. «Р. с.» м., как правило, применяются при обследовании детей, Рисуночные методики являются одними из наиболее распространенных среди проективных тестов (см. «Нарисуй человека» тест, «Дом—дерево—человек» тест и др.). Идея использовать технику рисунка для диагностики внутрисемейных отношений возникла у целого ряда исследователей. Подробная схема проведения обследования и интерпретации результатов впервые была разработана для теста «Нарисуй свою семью» (В. Вульф, 1947). Опыт применения рисуночной методики в этих целях был описан в работах В. Хьюл-са (1951-1952 гг.). Согласно схеме интерпретации по В. Вульфу, в рисунке анализируются: а) последовательность рисования членов семьи, их пространственное расположение, наличие пропусков отдельных членов семьи; б) отличия в формах и пропорциях отдельных фигур. Согласно В. Вульфу, последовательность рисозания указывает на значимость данного члена семьи. Пропуск члена семьи часто выражает стремление избавиться от эмоционально-неприемлемого лица. Если величина изображенных фигур не соответствует реальной иерархии, то такое восприятие относят за счет степени субъективной доминантности и значимости. В. Вульф обращал внимание также на интерпретацию различий в рисовании отдельных частей тела, исходя из возможности переживаний, связанных с их функциями. В работах В. Хьюлса были предложены интерпретационные схемы «Р. с.» м., базирующиеся на самом процессе рисования (использование цветов, вычеркивания, стирания, сомнения, сопутствующие эмоциональные проявления, комментарии). Дальнейшее развитие «Р. с.» м. получили в работах Л. Кормана(1964),Р. Бер-нса и С. Кауфмана (1972). В инструкции к методике Л. Кормана предусмотрено задание нарисовать не «семью» или «свою семью», как в методике В. Вульфа и В. Хьюлса, а «семью, как ты ее себе представляешь». Благодаря такой установке имеется возможность использовать менее структурированный объект (стимул) (см. Проективные методики). При интерпретации результата авторы обращают внимание на случаи, когда испытуемый рисует большую или меньшую семью, чем она является на самом деле (авторы считают, что это указывает на функционирование определенных защитных механизмов; чем больше несовпадение, тем больше неудовлетворенность существующей ситуацией). В рисунках, по Л. Корману, анализируют: а) его графическое качество (характер линий, пропорции фигур, аккуратность, использование, пространства); б) формальную структуру (динамичность рисунка, расположение членов семьи); в) содержание (анализ смысла рисунка). Параллельно с традиционным проведением обследования (чтение и выполнение задания) предлагаются специальные вопросы, подталкивающие испытуемого к об- суждению темы отношении в семье (напр.: «Кто в семье самый плохой?»), предусматривающие прямой положительный или отрицательный выбор (напр.: «Отец задумал поездку в автомобиле, но в нем не хватает места для всех. Кто останется дома?»), а также вопросы, уточняющие смысл нарисованной ситуации для ребенка. Вариантом «Р. с.» м., получившим наибольшую известность в зарубежной психодиагностике, является «Кинетический рисунок семьи», предложенный Р. Берн-сом и С. Кауфманом. В нем нужно нарисовать каждого из членов семьи в действии. Интерпретация материала основана на символическом толковании изображенных отношений, действий, предметов; при этом часть трактовок, предложенных авторами методики, основана на принципах психоанализа. Техника «рисунка семьи» в советской психодиагностике нашла применение в клинических исследованиях. А. И. Захаровым (1977) предложен вариант методики, состоящий из двух заданий. Для выполнения первого из них ребенку нужно нарисовать в четырех «комнатах», расположенных на двух «этажах», по одному из членов семьи, включая себя. При интерпретации рисунка обращается внимание на размещение членов семьи по этажам и на то, кто из них находится рядом с ребенком (т. е. является эмоционально наиболее близким). Второе задание — выполнение рисунка в свободной форме без каких-либо дополнительных инструкций. Вариант «Р. с.» м. со сложной и дифференцированной интерпретационной схемой предложен Г. Т. Хоментаускасом в 1985 г. |