Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
ТЕСТ (англ. test — проба, испытание, проверка) — в психологии — фиксированное во времени испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий. Т. — основной инструмент психодиагностического обследования, с помощью которого осуществляется диагноз психологический. Термин Т., получивший в последнее время чрезвычайно широкое распространение в различных областях знания в смысле испытания, проверки, имеет давнюю историю. По Р. Пэнто и М. Гравитц (1972), слово Т. происходит из старофранцузского языка и является синонимом слова «чашка» (лат. testa — ваза из глины). Этим словом обозначали небольшие сосуды из обожженной глины, использовавшиеся алхимиками для проведения опытов. В русском языке слово Т. долгое время имело два значения: 1) испытательная присяга, английская религиозная клятва, которую каждый вступающий в общественную должность должен давать, чтобы доказать, что он не тайный католик; 2) плоский плавильный сосуд или сосуд из выщелоченной золы для выделения олова из золота или серебра (Русский энциклопедический словарь, 1877). Совре-. менное содержание термин Т. получает в конце XIX — начале XX в. В психологические исследования введен Дж. Кэттел-лом (1890), а создателем первых Т. следует считать Ф. Гальтона. В психодиагностике существуют разнообразные классификации Т. Они могут подразделяться по особенностям используемых задач тестовых на тесты вербальные и тесты практические, по формам процедуры обследования — на тесты групповые и индивидуальные, по направленности — на тесты интеллекта и тесты личности, а в зависимости от наличия или отсутствия временных ограничений — на тесты скорости и тесты результативности. Также Т. различаются по тестов конструирования принципам. В последние десятилетия активно разрабатываются тесты компьютерные. Используемая в настоящем словаре-справочнике классификация опирается на реализуемый в Т. диагностический подход (см. Психодиагностический метод). Эта классификация учитывает, наряду со спецификой диагностического подхода, уровень стандартизации Т. Поэтому, напр., по отношению к проективным методикам, характеризуемым как недостаточно стандартизированные, термин Т. не используется. Т., как и любому другому инструменту познания, присущи особенности, которые в конкретных обстоятельствах исследования могут рассматриваться в качестве его достоинств или недостатков. Эф- фективное использование Т. зависит от учета многих факторов, среди которых важнейшими являются: теоретическая концепция, на которой базируется тот или иной Т., область применения, весь комплекс сведений, обусловленных стандартными требованиями к психологическим тестам (см. Тестов стандарты), психометрические характеристики процедуры, весь комплекс сведений о надежности и валидности (см. Теста стимульный материал, Тестовая модель). Распространенные представления о «простоте» и доступности Т. не соответствуют действительности. Являясь средством исследования сложнейших психических явлений, Т. не может толковаться упрощенно как предложение задания и регистрация его решения. Научное использование Т. возможно лишь при условии опоры на общепсихологические знания, компетентность в области теории и практики соответствующих психодиагностических исследований (см. Тестовая компетентность). Не менее существенно следование этическим нормам психодиагностики (см. Приложение II). В 1974 г. создана Международная тестовая комиссия, объединяющая усилия ученых разных стран в области разработки, оценки эффективности и распространения психологических и учебно-образовательных тестов. ТЕСТА ЗАДАНИЙ ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ — гипотетическое множество заданий теста, связанных общим фактором. Каждый тест теоретически представляет собой выборку из Т. з. г. с, которая релевантна исследуемой психологической переменной. Так, если разрабатывается тест для диагностики тревожности, то предполагается, что он является выборкой из всех возможных заданий, с помощью которых может быть обнаружена эта особенность личности. Тестовые результаты будут искажаться, если отобранные задания не репрезентируют на удовлетворительном уровне Т. з. г. с. (см. Валид-ность конструктная). Степень связи выборки заданий, включенных в конкретный тест, во многом определяет надежность теста (см. Надежность по внутренней согласованности). В тесте, связанном с разными Т. з. г. с, наблюдается снижение показателей по внутренней согласованности. ТЕСТА СТИМУЛЬНЫЙ МАТЕРИАЛ — объекты живой и неживой природы, искусственно созданные объекты, их изображения разной степени точности, цвета, слова, звуки и символы, выступающие в качестве заданий психологических тестов. Особую роль играет степень структурированности Т. с. м. Слабоструктурированные, неоднозначные стимулы способствуют актуализации личностно значимой продукции испытуемых, но этим создаются и дополнительные трудности при интерпретации полученных результатов. Наиболее богат Т. с. м. в проективных методиках: «чернильные пятна» (см. Роршаха тест), многозначные сюжетные картины (см., напр., Тематической апперцепции тест), цветовые стимулы (см., напр., Лютера цвета выбора тест), фигурки людей и животных (см., напр., Мира тест) и др. Вербальные стимулы главным образом используются в опросниках, анкетах, тестах вербальных. Геометрические фигуры, символы наиболее типичны как Т. с. м. для тестов практических. Иногда в качестве Т. с. м. используются трансформируемые материалы, например пластилин, проволока (см. Сгибания проволоки тест). В практических тестах можно встретить объекты, требующие определенного оформления (кубики", разрезан- ные картинки, пирамиды для складывания; см., напр., Векслера измерения интеллекта шкалы). Реже используется специальное оборудование (см. Тауто-фон). Выбор Т. с. м. определяется в первую очередь направленностью методики, ва-лидностью содержательной, закладываемой при разработке теста. Другим важным фактором является возраст испытуемых, их индивидуальные особенности (напр., тесты для слабовидящих, лиц с нарушениями моторики, инвалидов и т. д.). Тип Т. с. м. может существенно повлиять на валидность очевидную, интерес и мотивированность испытуемых. ТЕСТОВ_ИЗДАТЕЛЬСТВА_(ИЗДАТЕЛИ)'>ТЕСТОВ ИЗДАТЕЛЬСТВА (ИЗДАТЕЛИ) — специализированные издательства, осуществляющие выпуск и распространение тестов психологических, а также тестов для нужд системы образования (educational tests). При издании обязательно следование тестов стандартам (см. также Приложение II). Крупные Т. и. обычно являются дистрибьюторами тестов, опубликованных другими издательствами. Большинство Т. и. периодически выпускает каталоги предназначенных для продажи тестов. Полные перечни Т. и. публикуются в «Психических измерений ежегоднике». Наименования и адреса основных Т. и. см. в Приложении VI. ТЕСТОВ КОНСТРУИРОВАНИЯ ПРИНЦИПЫ — см. Критериально-ключевой принцип и Факторно-аналитический принцип. ТЕСТОВ СТАНДАРТЫ — совокупность требований, предъявляемых к тесту как психологическому инструменту измерения и предназначенных для разработчиков и пользователей психодиагностических методик. Наиболее известны «Стандарты для образовательного и психологического тестирования» Американской психологической ассоциации (АРА), изданные в 1974 и 1985 г. Стандарты АРА являются основой стандартных требований к психологическим тестам, принятым во многих странах мира (см. Тестовая компетентность, Международная тестовая комиссия, а также Приложение II). ТЕСТОВАЯ БАТАРЕЯ — совокупность групп тестовых заданий {субтестов), объединенных в одну психодиагностическую методику и направленных на измерение различных сторон сложного психологического конструкта. Наиболее известными и распространенными в современной психологической диагностике примерами Т. б. являются Векслера интеллекта измерения шкалы, Общих способностей батарея тестов (GATB), Амтхауэра интеллекта структуры тест (TSI). Составные методики с включением в них различных групп заданий, направленных на изучение вербальных и практических сторон общих способностей, довольно распространены среди тестов интеллекта. Комплекс заданий, включенных в Т. б., в значительной мере отражает элементный состав конструкта, на исследование которого направлена данная методика (см. Валидностъ конструктная). Так, батарея тестов WISC(см. Векслера интеллекта измерения шкалы) включает задания на общую осведомленность, понимание, способность к установлению сходства и аналогий, визуальную комбинаторику и репродукцию, смысловой анализ последовательных событий, арифметические способности и навыки, изучение репродуктивной функции памяти и т. д. В совокупности результаты измерений по отдельным субтестам с той или иной степенью полноты репрезентируют исследуемое комплексное качество (в данном примере — комплекс общих способностей). Несмотря на принадлежность к общей методике, некоторые субтесты Т. б. используются в отдельности для решения определенных узких диагностических задач. Часто отдельные субтесты Т. б. снабжаются собственными частными нормами и стандартами выполнения. Возможность их комбинирования в зависимости от ситуации обследования является специфической особенностью многих батарейных методик. Для отдельных многосубтестовых Т. б., таких, напр., как шкалы Векслера, Станфорд—Бине умственного развития шкала и других, разработаны сокращенные варианты, состоящие из наиболее нагруженных исследуемыми факторами субтестов, результаты которых тесно коррелируют с результатами полной батареи. Невзирая на относительную независимость некоторых субтестов Т. б., непременным условием разработки методики и оценки качеств теста в целом является анализ внутренней согласованности, трудности заданий теста, валидное-ти заданий теста не только с т. з. состава задач отдельных субтестов, но и связи отдельных субтестов с общим результатом Т. б. Таким образом, процедура разработки и проверки диагностических качеств батарейных методик значительно усложняется по сравнению с единичными тестами. Т. б. проходят процедуру исследования валидности, дискриминативности, внутренней согласованности сначала раздельно, по субтестам, а затем в целом. ТЕСТОВАЯ КОМПЕТЕНТНОСТЬ — совокупность требований, предъявляемых к психологу, осуществляющему психодиагностическое обследование с помощью тестов. В специальных исследованиях выделяется множество составляющих Т. к. Так, Дж. Робертсон и Л. Эйд (1993), обсуждая проблему совершенствования использования тестов в США, описывают 86 элементов Т. к. Факторный анализ этих элементов позволил выделить семь факторов, имеющих наибольший вес. 1. Всесторонность оценки. Следующий за тестированием и имеющий отношение к его результатам сбор информации о жизненном пути обследуемого и интеграция полученных сведений с показателями теста, что обеспечивает точность интерпретации последних. 2. Правильное использование теста. Признание ответственности за компетентное использование теста, регулярное применение соответствующих процедур контроля качества по всем аспектам использования теста. 3. Психометрические знания. Знание и правильное использование основных статистических принципов измерения (напр., ошибки измерения, надежности, валидности и т. д.). 4. Поддержание принципа целостности результатов теста. Корректное применение психометрических принципов для адекватной интерпретации результатов теста, понимание ограниченности тестовых показателей. 5. Точность оценки. Обеспечение правильного выполнения всех процедур оценивания результатов теста (запись, работа с «ключами», корректное прочтение таблиц). 6. Уместное использование норм. Понимание и корректное использование разного типа норм, особенно при решении задач профориентации и кадрового отбора. 7. Обратная связь с клиентами на этапе интерпретации данных. Представление обследуемому корректной интерпретации тестовых показателей. Требования к Т. к. излагаются в соответствующих нормативных документах. Так, Британское психологическое обще- ство, обеспечивающее сертификацию специалистов в области психодиагностики, определяет требования к двум уровням их подготовки: уровень А («Основы теории тестов и использование тестов специальных способностей и склонностей») и уровень В («Теория и практика личностной оценки») (См. Приложение V). Б основе требований к Т. к., принятых в ряде стран, лежат «Стандарты для образовательного ' и психологического тестирования», неоднократно переиздаваемые Американской психологической ассоциацией (см. Тестов стандарты, а также этические нормы психодиагностики). В странах СНГ документы, определяющие Т. к., находятся в стадии разработки. ТЕСТОВАЯ МОДЕЛЬ — совокупность стимульного материала теста и правил оперирования с ним, обусловливающая актуализацию определенного вида активности, релевантного исследуемым особенностям. В ряде психодиагностических методик Т. м. приближается к реальной (критериальной) деятельности. Это наиболее типично для тестов достижений, тестов критериально ориентированных, тестов специальных способностей (см., напр., Общих способностей батарея тестов). С развитием технических возможностей Т. м. с большей полнотой отражает критериальную деятельность. Такие возможности предоставляются психодиагностикой компьютерной, использованием тренажеров, стендов и т. п. В тестах вербальных, разного рода личностных опросниках Т. м. направлена на актуализацию состояний и свойств личности в соответствующих ситуациях, самооценки и отношения к событиям и объектам, производимую с помощью речевых воздействий. В большинстве тестов интеллекта Т. м. представляет собой деятельность 329 максимально обобщенного, неспециализированного характера, успешность выполнения которой обеспечивается вовлечением широкого спектра когнитивных функций. Здесь особенно важно как можно более полно элиминировать влияние навыка при выполнении определенных интеллектуальных действий в силу различных профессиональных или культурных особенностей испытуемых. Значительный интерес представляет Т. м. в проективных методиках, характеризующихся известной неопределенностью (слабоструктурированностью) и свободой в ответе (реагировании) испытуемого. Согласно проективной гипотезе, такая Т. м. в процессе разрешения, снятия неопределенности способствует актуализации типичного личностно обусловленного способа формирования образа внешнего мира. Предпочтение той или иной Т. м. связано с закладываемыми при разработке методики характеристиками валидности содержательной. Качества модели во многом определяют валидностъ конст-руктную и валидностъ очевидную будущего теста. Выбор Т. м. зависит от возраста и индивидуальных особенностей испытуемых. От того, насколько простой или, напротив, сложной для испытуемых окажется тестовая деятельность, будет зависеть дискриминативность заданий теста (см. Трудность заданий теста), а также надежность разрабатываемой методики. При разработке Т. м. следует учитывать возможность формализации результатов теста, особенности интерпретации получаемых данных, трудоемкость работы испытуемого и экспериментатора. Оригинальность Т. м. — одно из наиболее ценных качеств разрабатываемой методики, обогащающее арсенал средств психологической диагностики. ТЕСТЫ АППАРАТУРНЫЕ (устар.) — методики, подразумевающие применение технических (электронных) устройств разной сложности, позволяющих получать релевантную задаче информацию об обследуемом. Широко используются в медицинских исследованиях, дифференциальной психофизиологии, напр, электроэнцефалограф, рефлексометр и др. Использование Т. а. нетипично для психологической диагностики. К ним могут быть отнесены тесты компьютерные, однако применительно к последним понятие Т. а. не используется. ТЕСТЫ БЛАНКОВЫЕ (устар., сино ним — тесты «карандаш—бумага») — тесты, задания которых предъявляются на специально разработанных бланках обследования, предусматривающих самостоятельную работу с ними испытуемого (групп испытуемых). Обычно Т. б. оформлены в виде отдельных листов или брошюр, в которых содержатся инструкции и задания, а в некоторых тестах приводятся примеры решения заданий и прилагаются специальные формы для регистрации ответов. Т. б. являются одними из наиболее распространенных и давно применяемых методик психологической диагностики. К их числу относятся, напр., корректурная проба, «завершение предложения» методики, приемы исследования самооценки и многие др. Применение бланковой формы распространено практически во всех видах тестов, однако наиболее широко эта процедура используется в тестах достижений, тестах интересов, тестах общих и специальных способностей. Практически все опросники личности, диагностические анкеты, большинство тестов групповых являются бланковыми методиками. Оформление материала (форма, содержание, расположение отдельных заданий теста и граф для ответов, инструкция и т. д.) во всех Т. б. должно удовлетворять определенным требованиям (см. Бланк обследования, Тесты групповые). В последние годы большое количество Т. б. преобразовано в тесты компьютерные. ТЕСТЫ ВЕРБАЛЬНЫЕ — тесты, в которых материал задач тестовых представлен в вербальной форме. При этом подразумевается, что основным содержанием работы испытуемого являются операции с понятиями, мыслительные действия в словесно-логической форме. Т. в. чаще всего направлены на измерение способности к пониманию вербальных инструкций, навыков оперирования грамматическими языковыми формами, овладения письмом и чтением. Т. в. наиболее распространены среди тестов интеллекта (напр., субтесты 1-4 Амтха-уэра интеллекта структуры теста, субтесты I—IV тестов батарей WISCи WAIS(см. Векслера интеллекта измерения шкалы), субтест III Мейли интеллекта аналитического теста и др.). Нацеленные преимущественно на отражение вербальных факторов интеллекта, Т. в. наиболее тесно коррелируют с общей культурой, осведомленностью, академической успеваемостью. Результаты Т. в. очень чувствительны к различиям в языковой культуре испытуемых, уровню образования, профессиональным особенностям. Особые трудности представляет адаптация Т. в. к условиям обследования испытуемых другой национальности. Т. в. широко используются при оценке специальных способностей (напр., тесты творческих способностей, составление рассказов и т. д.). Благодаря доминирующей представленности факторов образовательной подготовки Т. в. наиболее распространены среди широкоориентированных и специализированных тестов достижений (см. Тесты практические). |