Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
НОРМАТИВНОЕ ОЦЕНИВАНИЕ — подход к оценке-и интерпретации измеряемых тестом показателей, отражающих особенности личности или поведения, путем сравнения индивидуальных результатов со статистическими значениями нормативной выборки. Н. о. более распространено по сравнению с альтернативным принципом ип-сативного оценивания. Здесь наиболее полно проявляется измерительный, квантифицирующий, характер психометрических техник. Существенным достоинством Н. о. является возможность строгого ранжирования испытуемых по результатам относительно выборочных данных, использования метрических шкал интервалов (см. Шкалы измерительные), относительная доступность интерпретации оценок пользователям психодиагностической информации (см. также Нормы тестовые, Стандартизация, Оценки шкальные). К недостаткам Н. о. относится эмпиричность рассчитываемых показателей, определенная условность перенесения выборочных данных на индивидуальное обследование. В качестве подхода, позволяющего минимизировать недостатки Н. о., при сохранении его основных положительных сторон можно указать на Раша шкалы, с помощью которых результат испытуемого оценивается на основе «задание—ответ» зависимостей. Следует, однако, отметить, что Раша модель психологического тестирования в принципе также должна быть отнесена к Н. о., поскольку для расчета вероятности решения того или иного задания используются данные специальных выборок испытуемых. НОРМЫ ТЕСТОВЫЕ — количественные и (или) качественные критерии оценки результатов теста, позволяющие определить уровень достижений или степень выраженности психологических свойств, которые являются объектами измерения. В качестве таких критериев выступают статистические показатели выборки стандартизации, а также различные признаки-симптомы, свидетельствующие о том или ином уровне выраженности диагностируемых качеств. В психологической диагностике наиболее распространены количественные Н. т., полученные на основании определения средних величин х и дисперсии в выборке стандартизации (см. Меры центральной тенденции, Меры изменчивости). Рассчитанные для нормативной выборки х среднее и дисперсия являются основой для разработки оценок шкальных теста. Количественные Н. т., упорядоченные в шкалы на основе процедур z-преоб-разования (см. Нормальное распределение, Стандартизация), содержатся в специальных таблицах, прилагаемых к руководствам по проведению тестирования. В этом виде Н. т. позволяют установить относительное место каждого конкретного результата по сравнению с выборочными данными, выраженными в долях дисперсии. Такие количественные Н. т. наиболее типичны для тестов интеллекта, опросников личностных и др. В проективных техниках, в силу известных затруднений, возникающих при формализации оценок первичных, вследствие сложности учитываемых диагностических показателей, количественные Н. т. не столь распространены. Своеобразной переходной формой между количественными и качественными Н. т. являются критерии оценки наиболее ранних тестов интеллекта. Так, в Вине—Симона умственного развития шкале Н. т. представлены в виде норма- тигшых заданий, на выполнении или невыполнении которых базируется установление умственного возраста и интеллекта коэффициента. В виде качественных Н. т. могут выступить стандартизированные наборы квалификационных требований к испытуемому, аналогичные шкалам умственного развития, либо специально разработанные для данного теста комплексы диагностических признаков. Примером последних может служить условная шкала определения уровня алкоголизации: 0 уровень — полное воздержание от алкоголя; отсутствие опыта приема. 1 уровень — эпизодический прием; неприятные воспоминания о приеме алкоголя. 2 уровень — систематический прием; удовольствие от употребления; включение небольших доз в общий рацион питания. 3 уровень — эпизоды передозировки; возникновение похмелья. 4 уровень — возникновение психической зависимости; случаи употребления алкоголя с утра для поднятия настроения. 5 уровень — частые случаи похмелья; активный поиск алкоголя; формирование физической зависимости. 6 уровень — эпизодические запои; признаки социальной (главным образом семейной и трудовой) дезадаптации; изменения в эмоциональной и мотива-ционной сферах личности. 7 уровень — продолжительные запои; стойкая зависимость от алкоголя; выраженные изменения личности по алкогольному типу; глубокая социальная дезадаптация. Приведенные качественные критерии выступают как нормативы, позволяющие отнести индивида к той или иной диагностической группе. Комплексы критериев Н. т. могут быть упорядочены в норматив- ные или порядковые шкалы (см. Шкалы измерительные). Одна и та же психодиагностическая методика может иметь количественные и качественные Н. т., взаимодополняющие и обогащающие интерпретацию результатов. Н. т. обычно рассчитываются раздельно для каждой возрастной группы испытуемых, что является практически обязательным условием для тестов общих способностей. Закономерное изменение нормативных показателей здесь служит своеобразным критерием валидности теста (см. Валидность по возрастной дифференциации). В методиках, применяющихся в клинической психодиагностике, иногда разрабатываются разные Н. т. для отдельных контингентов больных (например, для детей с отклонениями в умственном развитии и нормальных). Реже встречается дифференциация норм в зависимости от пола, профессиональных особенностей, уровня образования и т. д. Рестандартизация и определение норм для новой социоэтнической популяции является одним из основных и обязательных элементов адаптации теста. Наиболее сложным аспектом определения Н. т. является отбор и комплектация выборки нормирования. Выборка должна соответствовать по своему объему назначению методики (см. Выборки объем). Чем более генерализованной по области применения теста является методика, тем бблыпим должно быть число испытуемых в нормативной выборке. Большое внимание должно при этом уделяться обеспечению репрезентативности выборки по отношению к обследуемой тестом популяции. При одинаковых объемах стратифицированная (т. е. уравновешенная по основным критериям с совокупностью генеральной) выборка более эффективна, чем случайная (рандомизированная). Наиболее частыми критериями стратификации являются: социальное положение, регион проживания, возраст, пол, материальный и образовательный уровень. Ряд психодиагностических методик требует периодического (один раз в 5-7 лет) пересмотра норм в связи с их «старением». НЭО ЛИЧНОСТНЫЙ ОПРОСНИК (NEO Personality Inventory, NEOPI) — личностный опросник (аббревиатура в названии расшифровывается как «нейро-тизм», «экстраверсия», «открытость»). Разработан П. Коста и Р. Мак-Креем в 1992 г. на основе более ранних версий: NEO Inventory (1978), дополненного и пересмотренного NEO Inventory (1983) и NEO Personality Inventory (19Р5, 1990). Предназначен для измерения пяти глобальных факторов личности у здоровых лиц в возрасте от 20 до 80 лет. Теоретической основой опросника является получившая широкое распространение в зарубежных исследованиях концепция, названная «Большая пятерка» (Big Five). Предполагается существование пяти универсальных факторов, исчерпывающе описывающих личность. Это «нейротизм» (neuroticism, N), «экстраверсия» (extraversion, E), «открытость опыту» (openness to experience, О), «согласие» (agreeableness, А) и «сознательность» (conscientiousness, С). Многочисленными исследованиями, выполненными в разных странах на основе психолингвистического, а затем факторного анализа огромного количества языковых обозначений личностных черт в национальных языках, подтверждается существование указанных факторов. На этом основании делается вывод о существовании общих особенностей в структуре лич- ности, являющихся универсальными для разных языковых культур, для разных стран (близкие к «большой пятерке» факторы были обнаружены на русскоязычной выборке А. Г. Шмелевым, 1996). Опросник состоит из 240 утверждений и трех контрольных заданий («лживость»), на которые должны быть даны ответы по 5-балльной шкале от «полностью не согласен» до «полностью согласен». Помимо измерения пяти факторов, методика дифференцирует шесть лежащих в основе каждого из них параметров, что может иметь значение для ряда исследований личности. Имеется три варианта R-NEO-PI: форма для самооценки (S), форма для оценки со стороны наблюдателя (R) и сокращенная форма S, названная «НЭО пятифак-торный опросник» (NEO Five-Factor Inventory). Сокращенная форма может быть использована только для обследования взрослых в тех случаях, когда необходимо быстро получить диагностические показатели. Надежность ретестовая (интервал 6 месяцев) — от 0,86 до 0,91 для факторов личности и от 0,66 до 0,92 для их составляющих параметров; при интервале в 6 лет — около 0,80 для N, Е и О (форма S) и около 0,75 для формы R. В соответствующих исследованиях (см., напр., Ви-диджер, 1992) сообщается о достаточно высокой валидности конвергентной и валидности дискриминативной. Валидность конструктная может быть подтверждена лишь данными о валидности пятифакторной модели личности. Имеются сведения о русскоязычной адаптации опросника, однако соответствующие публикации не обнаружены. о ОБЛАКОВ КАРТИНЫ (Cloud Pictures) — проективная методика исследования личности. Впервые описана учеником В. Штерна К. Клюве в 1932 г., затем В. Якобсеном в 1935 г. В окончательном виде методика описана в 1937 г. В. Штерном. Стимульный материал О. к. представляет собой изображение трех фигур, напоминающих массы облаков. Фигуры имеют различную степень структурированности (малую, среднюю и высокую). В 0. к. сделана попытка, в отличие от Рор-шаха теста, использовать в качестве стимульного материала пятна без четкого контура и несимметричные. Испытуемому предлагают рассказать о том, что изображено на рисунках, отметить на каждом рисунке контуры выделяемых фигур. Стимульный материал О. к. не сковывает воображение испытуемого и способствует получению нестереотипных интерпретаций. Анализ полученных данных проводят в несколько этапов. 1. Количественный и качественный анализ интерпретаций испытуемого (количество интерпретаций, количество деталей в рассказе, количество повторных ответов,стандартных ответов, об- щие особенности интерпретаций и Др.). 2. Анализ рисунка испытуемого — контур фигур (степень связи с реальностью, учет формы, степень гибкости и Др.). 3. Оценка внушаемости (ее разновидность и источники). Данные о валидности и надежности О. к. отсутствуют. Сведений об использовании в СНГ не имеется. ОБЛАСТЬ ПРИМЕНЕНИЯ ТЕСТА — характеристика методики (теста), указывающая на особенности контингента испытуемых, для которых предназначен тест. Для этой группы устанавливаются нормы, оптимальная трудность заданий теста, определяются характеристики валидности, надежности и т. д. Величина О. п. т. определяется специфичностью выборки стандартизации по возрастным, половым, социокультурным, профессиональным и другим критериям. В случае, если нормы теста носят широкий, универсальный характер, соответственно широка и О. п. т. На практике обычно нормы теста составляются для дифференцированных контингентов (чаще всего разного пола и возраста) (см. Стандар- тизация). О. п. т. зависит от диагностической направленности метода и свойств исследуемой деятельности, особенностей личности. Для тестов достижений, методик профотбора, клинических тестов О. п. т. сравнительно узка. Для методик, направленных на исследование психофизиологических показателей, тестов интеллекта, опросников личностных О. п. т. существенно шире. О. п.т. имеет непосредственное отношение к определению валидности методики. В комплексе со сведениями о конструктном содержании исследуемых явлений, выбранной областью валидности О. п. т. определяет содержание, характер, трудность заданий теста. О. п. т. тесно связана с валидностью текущей и ва-лидностъю прогностической (см. Модераторы). Ее обычно намечают до начала разработки теста. Впоследствии О. п. т. подтверждают и уточняют вместе с оценкой валидности методики. Сведения об О. п. т. являются очень важными для правильного практического использования методики и обязательно должны быть включены в методические материалы по тесту. ОБЩЕГО ЗДОРОВЬЯ ОПРОСНИК (General Health Questionnaire, GHQ) — опросник личностный, разработан Д. Гол-дбергом в 1972 г. Предназначен для диагностики психологического благополучия, эмоциональной стабильности. О. з. о. имеет три варианта, которые состоят соответственно из 60,30 и 12 вопросов, ответы на которые испытуемый дает по 4-балльной шкале: 0 — «безусловно, нет», 1 — «пожалуй, нет», 2 — «пожалуй, да», 3 — «безусловно, да». Высокие баллы (характеризующие полюс психического дискомфорта) соответствуют утвердительным ответам на те вопросы, которые раскрывают проявления психологического неблагополучия, эмоциональной неустойчивости, и отрицательным ответам на те, которые связаны с выражением положительных эмоций, психологической стабильности (они оцениваются в обратном порядке). В качестве примера воспроизведем краткий вариант О. з. о. Чувствовали ли Вы в последнее время, что: 1. Вы в состоянии сосредоточиться на том, что Вы делаете? 2. Вы плохо спите из-за беспокойства? 3. Вы выполняете полезную работу? 4. Вы способны принять какое-либо решение? 5. Вы постоянно находитесь в напряжении? 6. Вы не в состоянии преодолеть затруднения? 7. Вы способны получать удовлетворение от Ваших обычных каждодневных дел? 8. ■ Вы готовы противостоять своим труд- ностям? 9. Вы несчастливы и подавлены? 10. Вы теряете уверенность в своих силах? 11. Вы думаете о себе как о никчемном человеке? 12. Вы в целом ощущаете себя счастливым, несмотря ни на что? Баллы за ответы на вопросы 1, 3, 4, 7, 8 и 12 подсчитываются в обратном порядке. В 1979 г. Д. Голдбергом и В. Хиллером предложен новый вариант О. з. о., состоящий из 28 вопросов (GHQ-28) и опера-ционализирующий, согласно авторам, психологическое благополучие как элемент более общего конструкта — «качество жизни». GHQ-28 включает 4 подшка-лы: соматические симптомы, тревога и бессонница, социальные дисфункции и депрессия. Этот вариант О. з. о. переведен на 38 языков. Все варианты О. з. о. широко используются за рубежом для измерения степе- ни дистресса. Имеются сведения об их высокой валидности и надежности, представлены нормативные данные для различных возрастных, половых и профессиональных групп. GHQ-28 использовали для обследования 691 больного ревматоидным артритом в Голландии, Франции, Швеции и Норвегии, что дало возможность получения кросскультурных данных. (В. Кроль и др., 1994) Данных об использовании в СНГ нет. ОБЩИХ СПОСОБНОСТЕЙ БАТАРЕЯ ТЕСТОВ (General Aptitude Test Battery, GATB) ■— тест интеллекта, батарея тестов, включающая вербальные и практические серии заданий. О. с. б. т. направлена на измерение общих способностей, однако имеется некоторое отличие данной методики от тестов интеллектов общего назначения (таких, напр., как Веке-лера измерения интеллекта шкалы, Станфорд—Бине умственного развития шкала и др.), состоящее главным образом в том, что валидизация тестов типа О. с. б. т. ориентируется на профессиональные критерии, а не на успехи в обучении (см. Валидность, Валидностъ критериальная). Методики типа GATB, находящие применение в зарубежной профессиональной психодиагностике, обозначаются как «комплексные батареи способностей» (Multiply Aptitude Batteries), при этом под общими способностями понимаются комплексные качества, необходимые для овладения многими видами профессиональной деятельности. О. с. б. т. разработана Службой занятости США (Б. Дворак, 1956) для использования в области профессионального отбора и профориентации. GATBвключает 12 тестов, направленных на анализ различных комплексных способностей, актуализируемых в широком круге видов профессиональной деятельности. Восемь субтестов являются тестами бланковы- ми, четыре требуют для проведения специальных приспособлений. Все субтесты являются тестами скорости. Состав тестов GATBследующий; I тест. Сопоставление и выявление сходств и различий в парах слов по буквенному составу (150 пар). Например: Jourdan — Jourdan; Fadeley Co — Fadeley Со; Pearson's — Peerson's; Ansel Arapi-an — Ansle Arapian и т. д. II тест. Арифметические упражнения (50 простых задач с одним арифметическим действием). III тест. Восприятие форм. При выполнении теста испытуемый должен определить, какой из четырех трехмерных предметов, нарисованных в правом поле, может быть получен из показанной в левом поле развертки (рис. 47, а). IV тест. Словарный. Из групп по четыре слова выделить слова, имеющие одинаковые или противоположные значения, напр.: 1) а) старый; б) молодой; в) практичный; г) родственный; 2) а) открытый; б) горячий; в) холодный; г) сухой. V тест. Сравнение изображений. Испытуемый должен определить, какое из четырех приведенных справа изображе" ний предметов полностью соответствует образцу в левом поле (рис. 47, б). VI тест. Арифметические задачи (50 заданий). |