Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
ТЕСТЫ ПРАКТИЧЕСКИЕ — тип тестов, в которых материал задач тестовых представлен невербальными заданиями. Задачи Т. п. могут быть представлены в наглядной форме (напр., составление фигур, геометрические аналогии и т. д.) (см. Мейли интеллекта тест), распространены задания на дополнение изображения (см. Векслера интеллекта измерения шкалы). Задания теста в практической форме могут моделировать конкретные трудовые операции (см. субтесты XI и XII Общих способностей батареи тестов), требовать от испытуемого выполнения определенных действий по образцу (составление изображения из кубиков, перерисовывание); распространенными являются и задачи поиска закономерностей с наглядным решением (см. Равена прогрессивные матрицы). 3281. . . , 3287 55190. . . . 55702 482991.... 482997 1024358. . . . 1024358 590213354.... 59012534 388172902.... 381892902 631027594.... 631027594 2499901354.... 2499907534 2261059310.... 2261659310 2911038227.... 2911038227 313377752.... 311377752 1012938567.... 1012938567 7166220988.... 7162220988 3177628449.... 3177682449 468672663.... 468672663 9704529003 .... 9794529003 3484657720 .... 3484657210 8588172556.... 8581722556 3120166671.... 3120166671 7611348879.... 76111345879 26557239164.... 26557239764 8819002341.... 8819002341 6571018034.... 6571018034 38779762514.... 38779765214 39003126557.... 39008126657 75658100398.... 75658700398 41181900726• , , , 41181900726 6543920817.... 6543920877 Рис. 71. Вариант невербальных заданий теста Отиса Т. п. уменьшают влияние языковых и культурных различий на результат обследования (см. Культурно-свободный интеллекта тест). Выполнение задания в невербальной форме облегчает также процедуру обследования испытуемых с нарушением речи, слуха, лиц, не имеющих образования. Практические задания оказались удобными при проведении массовых тестовых исследований (напр., из- Рис. 72. Варианты невербальных заданий (1-18) теста достижений вестные армейские тесты «Альфа» и «Бета»). Т. п. весьма распространены среди методик профессиональной психодиагностики (исследование моторики, достижений в овладении трудовыми- операциями, оценка особенностей пространственного и комбинаторного мышления и т. д.). Многие психофизиологические диагностические методики по характеру заданий также могут быть отнесены к виду Т. п. Примеры некоторых вариантов невербальных заданий приведены на рис. 71, 72, 73. Альтернативным по отношению к Т. п. видом психодиагностических методик являются тесты вербальные, хотя их противопоставление носит несколько условный характер. Об этом, в частности, свидетельствуют и высокие показатели корреляции между невербальными и вер- Рис. 73. Невербальный тест Бернштейна бальными субтестами в некоторых тестах интеллекта (см. Векслера измерения интеллекта шкалы). В типичных заданиях Т. п. могут присутствовать и вербальные элементы (инструкция, ответ испытуемого). ТЕСТЫ РЕЗУЛЬТАТИВНОСТИ (англ. power tests) — тип методик, ориентированных на измерение или констатацию результата, достигнутого испытуемым при выполнении тестового задания. При этом показатель скорости работы испытуемого не принимается во внимание или имеет вспомогательное значение. В этом отношении Т. р. противоположны тестам скорости. Следует отметить, что временное ограничение выполнения заданий может применяться и в Т. р., однако оно, как правило, служит целям стандартизации процедуры исследования или экономии времени при обследовании. К группе Т. р. относятся большинство методик исследования личности, проективные тесты, анкеты и опросники и т. д. ТЕСТЫ СКОРОСТИ (англ. speed tests) — тип психодиагностических методик, в которых основным показателем продуктивности работы испытуемых является время выполнения (объем) задач тестовых. Типичные Т. с. обычно включают большое количество однородных заданий (пунктов). Объем материала выбираехся таким образом, чтобы за отведенное (постоянное для всех испытуемых) время ни один из обследованных не успевал справиться со всеми задачами. Тогда показателем продуктивности будет количество правильно выполненных заданий. В качестве типичного примера Т. с. можно привести корректурную пробу. Показателем результативности выполнения Т. с. может являться и прямое измерение времени выполнения задания (напр., таблицы Щульте). Для Т. с, состоящих из большого количества простых заданий, имеются особые процедуры определения надежности (см. Надежность частей теста), внутренней согласованности и дискримина-тивности заданий теста. Трудность заданий в Т. с. обычно невысока и примерно одинакова. Большинство психометрических тестов интеллекта, общих и специальных тестов достижений являются Т. с. Ряд тестовых методик могут применяться и как Т. с, и как альтернативный вид — тесты результативности (см. Равена прогрессивные матрицы). Ограничение времени выполнения не является абсолютным критерием отнесения данной методики к группе Т. с. Так, при составлении рассказов в тематической апперцепции тесте продолжительность работы испытуемого регламентирована в целях сокращения времени обследования, интенсификации работы тестируемого. Вместе с тем при оценке и интерпретации результатов обследования временной показатель малосуществен. ТЕСТЫ СПЕЦИАЛЬНЫХ СПОСОБНОСТЕЙ — группа психодиагностических методик, предназначенных для измерения уровня развития отдельных аспектов интеллекта и психомоторных функций, преимущественно обеспечивающих эффективность в конкретных, достаточно узких областях деятельности. В этом отличие Т. с. с. от тестов интеллекта, направленных на измерение общего уровня интеллектуального развития и валидизируемых по отношению к наиболее широким сферам деятельности. Валидизация Т. с. с. осуществляется по отношению к конкретным областям деятельности, и этим они близки к тестам достижений. Разработка Т. с. с. за рубежом была связана прежде всего с необходимостью решения практических задач в области профотбора и профориентации. Так, измерение способностей к конкретным видам деятельности дополняло данные, полученные с помощью тестов интеллекта. Значительный прогресс в области измерения специальных способностей был достигнут за счет широкого применения факторного анализа, позволившего их более точно определить и классифицировать. В зарубежных психодиагностических исследованиях обычно различают следующие группы способностей: сенсорные, моторные, технические (механические) и профессионализированные"(счет-ные, музыкальные, скорости чтения и понимания прочитанного и др.). Соответственно осуществляется и разработка Т. с. с. Наибольшее распространение за рубежом получили комплексные батареи способностей (см. Общих способностей батарея тестов). В СССР Т. с. с. широко использовались в 20-ЗО-е гг. для профотбора, расстановки кадров, в профориентационной работе. Затем, вплоть до 60-х гг., исследования в этом направлении были единичными. Советскими психологами достигнуты определенные успехи в изучении музыкальных, математических, психомоторных и других специальных способностей (В. А. Крутецкий, 1968; Н. С. Лейтес, 1960; Б. М. Теплов, 1961; Б. В. Кулагин, 1984 и др.). ТЕСТЫ ФАКТОРНО-АНАЛИТИЧЕСКИЕ — психодиагностические методики, конструирование которых осуществляется в соответствии с факторно-аналитическим принципом. ТОМСКИЙ ОПРОСНИК РИГИДНОСТИ (ТОР) — опросник личностный. Направлен на диагностику психической ригидности. Предложен Г. В. Залевским в 1987 г. для выявления психической ригидности как трудности корректировки отдельных элементов или программы поведения в целом в соответствии с объективными требованиями ситуации при различной степени их осознанности и принятия. Т. о. р. состоит из 159 заданий, сформулированных в виде вопросов и утверждений, содержание которых достаточно широко отражает те ситуации, где находит проявление психическая ригидность, т. е. в которых от человека требуется изменить программу поведения — образ жизни, стереотипы, отношения, установки, привычки, навыки, темп и ритм жизни и деятельности, средства достижения какой-либо цели, саму цель и т. д. Возможны 4 варианта ответов («да», «скорее да», «нет» и «скорее нет»). Количественная оценка ответов по каждому пункту: «О» — психическая ригидность отсутствует, «1» — слабо выражена, «3» — сильно выражена, «4» — очень сильно выражена. С помощью Т. о. р. диагностируется психическая ригидность по 6 шкалам, эмпирическая однородность которых подтверждена дисперсионным анализом данных, полученных при исследовании здоровых лиц (/=" = 21,08; р < 0,01). 1. Шкала общей ригидности, или СКР (склонности к широкому спектру фиксированных форм поведения) т. н. «симпто-мокомплекс ригидности» (62 задания) — склонность к персеверациям, навязчи-востям, стереотипиям, упрямству, педантизму и собственно ригидности (в узком смысле: неспособности при объективной необходимости изменить мнение, отношение, установку, мотивы и т. п.). Имеется субшкала актуальной личностной ригидности (18 пунктов), выявляющая ригидность в узком смысле. 2. Шкала сензитивной ригидности, или СР (19 заданий), отражает эмоциональную реакцию человека на ситуации, требующие от него каких-либо изменений, возможно страх перед новым, своего рода неофобию. Основой для разработки опросника явилось предположение о том, что психическая ригидность как в норме, так и в патологии, входя в структуру личности, характеризуется следующими параметрами: — интенсивностью (силой, глубиной) и экстенсивностью (широтой или спектром охвата структуры личности по вертикали и по горизонтали — вдоль ее подструктур); — устойчивостью или стойкостью (реакция—состояние—черта); — генерализованностью и доминированием (черта—симптомокомплекс—тип); — мотивированностью (принятием—непринятием). По мере углубления патологии, как полагает автор, должны увеличиваться показатели интенсивности и экстенсивности психической ригидности в сторону ее чрезмерной выраженности и тотальности охвата личности, а также возрастать количество случаев проявления психической ригидности как черты, генерализующейся в направлении к типу акцентуации личности, для которого чаще всего и в высокой степени характерно непринятие требований объективной ситуации. Имеются данные о достаточно высокой валидности и надежности Т. о. р. Опросник рекомендуется использовать для дифференциальной диагностики психической ригидности у психически здоровых лиц, для уточнения прогноза реабилитации, в т.ч. психотерапии психически больных, для дифференциальной внутри-нозологической диагностики пограничных состояний и шизофрении в процессе психодиагностического обследования, экспресс- и скрининговых исследований, а также в семейных консультациях. ТРЕВОЖНОСТЬ ТЕСТОВАЯ — состо яние испытуемого, обусловленное действием разной степени выраженности мотива экспертизы, возникающего в психодиагностической ситуации, Т. т. более выражена у лиц с проявлением реактивной или личностной тревожности (см. Спилбергера тревоги и тревожности шкалы), у испытуемых с повышенной мотивацией на обследование, а также в случаях неадекватно высокой валидности очевидной выполняемого теста. Т. т. может явиться следствием неквалифицированного, неэтичного поведения экспериментатора, ошибочно составленной инструкции, стрессогенных факторов ситуации обследования (жесткое лимитирование времени выполнения, групповое выполнение заданий в условиях «открытости» результатов и т. п.). Характер влияния Т. т. на результаты обследования в полной мере не выяснен. В большинстве случаев это влияние признается негативным. Так, по данным И. Годри и Ч. Спилбергера (1974), Ч. Спилбергера (1972), С. Саразона и со-авт. (I960), К. Хилла и соавт. (1964, 1966) и др., существует обратно пропорциональная связь между уровнем тревожности и показателями тестов достижений и тестов интеллекта, отмечающаяся как у взрослых, так и у детей. С дру- гой стороны, Д. Френч (1962) не обнаружил различий в результатах тестирования студентов колледжа в напряженной и спокойной ситуации. По мнению А. Анас-тази (1982), отношения между тревожностью и качеством выполнения теста нелинейные. Для индивидов с невысоким уровнем тревожности являются благоприятными условия, вызывающие состояние незначительной тревоги, в то аремя как людям, имеющим высокий уровень тревожности, лучше выполнять тест в более спокойных условиях. Т. т., таким образом, является дополнительным фактором, оказывающим воздействие на достоверность психодиагностического обследования. Поэтому необходимо принимать меры к снижению уровня напряженности в ситуации тестирования. Это особенно важно в клинической психодиагностике, где обследование имеет не только диагностическое значение, но и в определенной степени выполняет психотерапевтическую функцию. Интерпретация результатов обследования должна проводиться с учетом индивидуального уровня Т. т. конкретных испытуемых. Сведения о Т. т. могут быть получены как из данных опроса и наблюдения, так и при использовании специаль--ных диагностических методик. Профилактика Т. т. опирается на неукоснительное следование этическим нормам психодиагностики, тщательную подготовку тестового материала, особенно инструкции, правильный выбор тактики индивидуальных и групповых обследований, условий тестирования. ТРЕХМЕРНОЙ АППЕРЦЕПЦИИ ТЕСТ (Three Dimensional Apperception Test) — проективная методика исследования личности. Опубликована Д. Твит-чел-Аллен в 1947 г. Стимульный материал Т. а. т. состоит из 28 стандартных, объемных, не обладающих четкой формой предметов — от гео- метрических форм в виде шара, цилиндра и т. д. до форм, близких человеку и животным. Обследование проводится в два этапа. На первом («психодраматическом») этапе испытуемому предлагают из всех разложенных в определенном порядке предметов выбрать.те, которые необходимо использовать для составления истории. При желании обследуемого'к ранее отобранным предметам разрешается добавлять новые. Регистрируется стиль обращения с предметами и рассказанная история. Принципы интерпретации данных, полученных на психодраматическом этапе обследования, сходны с используемыми в тематической апперцепции тесте. На втором этапе просят описать, что собой представляет каждый предмет, поочередно предъявляемый экспериментатором, назвать его. Известная неопределенность, пластичность предметов, которые нужно назвать, сближают этот этап с обследованием по Роршаха тесту. Автор полагает, что, в отличие от традиционных проективных методик, работа с Т. а. т. требует вовлечения тактильных, кинестетических и гаптических ощущений, которые способствуют большей неопределенности стимулов и как бы создают новые области для проекции. Валид-ность и надежность Т. а.' т. нуждаются в дополнительном изучении. Тест может быть использован для обследования слепых (оригинальная модификация процедуры обследования — наложение зрячим на глаза повязки). Т. а. т. широкого распространения в психодиагностических исследованиях не нашел. Сведений об использовании в СНГ не имеется. ТРУДНОСТЬ ЗАДАНИЙ ТЕСТА — характеристика задачи (пункта) теста, отражающая статистический уровень ее решаемости в данной выборке стандартизации. Вместе с анализом дискримина- тивности пунктов, внутренней согласованности, характера распределения тестовых оценок анализ Т. з. т. является одной из базовых процедур разработки и проверки диагностических качеств тестовой методики. В психологии разделяются субъективно-психологическая и статистическая (объективная) трудности. Субъективная трудность задачи связана с индивидуально-психологическим барьером, величина которого определяется как обстоятельствами (лимитом времени, доступностью инструкции и т. д.), так и уровнем формирования необходимых для решений знаний, умений и навыков, психическим состоянием испытуемого и рядом других факторов. Воздействие комплекса этих факторов на результат выполнения теста снижает надежность и достоверность данных, поэтому принимаются меры для выравнивания их воздействия с помощью направленного комплектования выборки и стандартной процедуры проведения. Показателем Т. з. т. как статистической трудности является доля лиц выборки, решивших и не решивших задание. Напр., если только 20% испытуемых решили задачу, ее можно оценить как трудную для данной выборки, если 80% — как легкую. Т. з. т. является относительной характеристикой, поскольку зависит от особенностей выборки (возрастные, профессиональные, социокультурные различия). Т. з. т. является в первую очередь характеристикой интеллектуальных задач, для которых правомерно применение критерия «правильного* и «неправильного» решений. Для вопросов или задач, входящих в состав личностных методик, статистическое понятие Т. з. т. неприемлемо. Подбор заданий по показателям Т. з. т. важен для успешного применения психодиагностической методики. Так, при выборе слишком трудных заданий валид- ность и надежность теста резко снизятся (ухудшение статистических характеристик оценивания из-за небольшого количества правильных решений, вероятность случайной оценки, влияние неудач на работу испытуемых). Слишком простые задания приведут к однообразию результатов (большинство справляется со всем набором пунктов теста), их незначительной вариативности, затрудняющей оценивание, могут вызвать негативное отношение к тесту (см. Валидность очевидная). Основная задача анализа Т. з. т. сводится к выбору оптимальных по сложности пунктов теста, а значит, и упорядочиванию отдельных заданий в нем. Обычно если задачу решает большинство испытуемых, ее (как легкую) помещают в начале теста, если задачу решает незначительный процент, испытуемых, то ее (как трудную) помещают в конце теста. Одну-две самые легкие задачи ставят перед основными задачами теста и используют в качестве примера. Расположение заданий по возрастанию ступеней трудности, выраженных долей или процентом лиц данной выборки, решивших соответствующую задачу, позволяет примерно определить порог трудности для конкретного испытуемого, характеризующий его место в группе. Такой принцип был заложен в основу измерений первых тестов интеллекта (напр., шкалы Бине—Симона), где показателем «умственного возраста» являлось выполнение задания средней трудности для данной возрастной группы. Принцип расположения заданий по нарастающей трудности сохраняется и для большинства современных психометрических тестов, направленных на исследование общих способностей, профессиональной успешности, тестов достижений и ряда других. В тестах скорости, в отличие от тестов результативности (см. Тест), Т. з. т. обычно невысока и практически неизменна. Количество задач в таких методиках заведомо делают таким, чтобы никто из испытуемых в заданное время не успел решить все. Основным показателем Т. з. т. является индекс трудности где NH— число испытуемых, не решивших задачу, m — количество вариантов ответа. В тех случаях, когда выборка и количество проверяемых пунктов велики, имеется возможность определить индекс трудности с помощью контрастных (крайних) подгрупп. В каждую из подгрупп входят по 27% лиц от численности выборки, имеющих лучшие и худшие результаты по тесту в целом. Индекс Т. з. т. вычисляется как среднее арифметическое индексов трудности для групп с максимальным и минимальным результатом Если предположить, что частоты распределения оценок испытуемых, выпол- Рис. 74. Пороговые частоты случаев правильного и ошибочного решения при отборе задач по индексу трудности нивших задание, подчиняются нормальному закону, то в пределах М ± с находятся около 68% всех испытуемых, за этими пределами — по 16% испытуемых. Эти величины принимаются за пороговые при отборе задач из первичной формы теста. Таким образом, после расчета индексов трудности в первую очередь исключаются задачи, которые решили более 84% (М - а) и с которыми не справились 84% испытуемых (М + а) (рис. 74). Более дифференцированным способом анализа Т. з. т. является использование в качестве принципа разделения испытуемых на группы внешнего критерия валид-ности, напр, продуктивности в реальной деятельности. Отбор заданий по показателям трудности может производиться параллельно расчетам коэффициентов корреляции (см. Корреляции коэффициенты дихотомические). |