Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
ТЕСТЫ «КАРАНДАШ—БУМАГА» (синоним — тесты бланковые) — коммерческие тесты, которые предназначены для продажи пользователям, как правило, профессиональным психологам (см. Тестовая компетентность). Т. «к.—б.» издаются специализированными издательствами (см. Тестов издательства (издатели)) и соответствуют тестов стандартам (см. Тесты некоммерческие). Представленные в настоящем словаре-справочнике зарубежные тесты, за редким исключением, являются Т. «к.—в.». В психодиагностике стран СНГ практика разработки и последующей продажи пользователям психологических тестов в настоящее время отсутствует. Тем не менее делаются первые шаги в области издания тестов для профессионального пользователя. ТЕСТЫ КОМПЬЮТЕРНЫЕ — 1) тесты, предъявление и обработка которых приспособлены к среде ЭВМ; 2) тесты, специально разработанные для реализации условий и возможностей современной вычислительной техники. На современном этапе развития компьютерной психодиагностики преобладающее большинство Т. к. — компьютерные версии уже известных методик. Чаще всего это различные опросники личностные, реже — тесты интеллекта и др. Важнейшая проблема, возникающая в связи с появлением компьютерной формы той или иной методики, связана с доказательством ее эквивалентности основной версии теста. Сегодня многочисленными исследованиями доказано, что такие Т. к. нуждаются в изучении их психометрических параметров. Применительно к характеристике Т. к. введено понятие «эквивалентности валидности», включающее эквивалентность психометрическую, эквивалентность, относящуюся к процессу обследования и популяционную эквивалентность. Большинство исследовании за рубежом ограничиваются установлением лишь психометрической эквивалентности компьютерной версии теста. Для многих компьютерных версий тестов, используемых в странах СНГ, отсутствуют данные об их еалидности, надежности, величине стандартного отклонения и др. психометрических показателях. Собственно Т. к., т. е. те, которые изначально разработаны с учетом требований и возможностей современной вычислительной техники, весьма немногочисленны. Их создание осуществляется в рамках т. н. адаптивного тестирования, важнейшей особенностью которого является управление со стороны компьютера основными этапами психодиагностического процесса. Это означает, что должен поддерживаться постоянный и адекватный режим диалога между компьютером и обследуемым. Имеются определенные достижения в адаптивном тестировании специальных способностей, а также уровня достижений. Однако диагностика личностных особенностей в адаптивном тестировании остается проблематичной. На нынешнем уровне развития адаптивное тестирование скорее ставит проблемы, нежели их решает. Несмотря на достаточно широкое распространение Т. к. (свыше тысячи тестов ныне используются на Западе в психологических исследованиях, образовании, промышленности и управлении), не утихают споры об их месте в решении многих психодиагностических задач. Так, оспаривается значение Т. к. в индивидуальной диагностике. При этом наибольшее неприятие исследователей вызывает компьютерная интерпретация результатов тестирования. Отмечается, что простейшие, т. н. «дескриптивные» компьютерные интерпретации (в основном имеющие хождение в СНГ) игнорируют паттерны множественных шкал, а поэтому содержат противоречивые и взаимозаменяемые утверждения, не обладают гибкостью. Обобщенные утверждения, выдаваемые компьютером, содержат некоторую долю исти- ны обо всех людях, но не решают задачи их дифференциации (см. Барнума эффект). Компьютерные интерпретации, моделирующие диагностическую деятельность специалиста, также далеки от совершенства, и зачастую их использование может привести к ошибкам. Поэтому и сегодня многие психологи предпочитают при использовании компьютеров «статистический» подход, при котором получаемая информация не идет дальше обработки результатов по некоторому алгоритму, а процесс их интерпретации остается делом специалиста. Такую позицию по отношению к «интерпретациям» компьютера в индивидуальной диагностике следует считать наиболее обоснованной (см. также Диагноз психологический, Психодиагностика компьютерная). ТЕСТЫ КРЕАТИВНОСТИ (лат. сгеа-tio — сотворение, создание) — группа психодиагностических методик, предназначенных для измерения творческих способностей личности. Первые Т. к. появляются в 50-х гг., и их развитие постепенно становится одним из основных направлений в современной зарубежной психодиагностике. Наиболее мощным стимулом этого развития являются результаты многочисленных исследований, указывающие на несоответствие между успешностью выполнения традиционных тестов интеллекта и творческими способностями. Способность продуцировать новые идеи, находить нетрадиционные способы решения проблемных задач была отделена от других способностей (см. Тесты специальных способностей) и названа креативностью. Сегодня изучение и измерение креативности за рубежом осуществляется в следующих основных направлениях: «Личностном» (влияние на креативность личностных черт) и «познавательном» (влияние на креативность интеллекту- альных, познавательных особенностей). Наиболее известные тесты для измерения познавательного аспекта креативности разработаны Дж. Гилфордом с сотр. (1959) и Э. Торрансом (1962). Однако результаты использования этих тестов противоречивы, их вадидность не доказана. В отечественных исследованиях на основе выделения единицы измерения творческих способностей, названной «интеллектуальной инициативой», разработана оригинальная методика «креативного поля» (Д.Б.Богоявленская, 1983). Интеллектуальная инициатива выступает в качестве «клеточки», в которой синтезируются личностные черты и интеллектуальные особенности. Полученные с помощью методики «креативного поля» данные тесно коррелируют с внешним критерием, тем не менее в силу его субъективности необходимо дальнейшее изучение валид-ности такого подхода к измерению творческих способностей. ТЕСТЫ КРИТЕРИАЛЬНО-КЛЮЧЕВЫЕ — психодиагностические методики, конструирование которых осуществляется в соответствии с критериально-ключевым принципом. ТЕСТЫ КРИТЕРИАЛЬНО-ОРИЕНТИРОВАННЫЕ — тип тестов, предназначенных для определения уровня индивидуальных достижений относительно некоторого критерия на основе логико-функционального анализа содержания заданий. В качестве критерия (или объективного эталона) обычно рассматриваются конкретные знания, умения, навыки, необходимые для успешного выполнения той или иной задачи. Это — основное отличие Т. к.-о. от традиционных психометрических тестов, оценка в которых осуществляется на основе соотнесения индивидуальных результатов с групповыми (ориентация на статистическую норму). Тер- мин Т. к.-о. предложен Р. Гласером в 1963 г. Установление содержательного и структурного соответствия заданий теста и реальной задачи — важнейший этап разработки Т. к.-о. Этим целям служит т. н. спецификация, включающая: а) содержательный анализ критериальной задачи, описание ее возможных форм и особенностей; б) систематизацию знаний, умений и навыков, обеспечивающих выполнение критериальной задачи; в)образцы тестовых заданий и описание стратегии их конструирования. Различают две разновидности Т. к.-о.: — тесты, задания которых гомогенны, т. е. сконструированы на одной или аналогичной содержательной и логической основе. Обычно такого рода Т. к.-о. разрабатываются на материале учебных программ и используются для контроля за формированием соответствующих знаний, умений и навыков; — тесты, задания которых гетерогенны и заметно отличаются по логической структуре. В этом случае обычна ступенчатая структура теста, при которой каждая ступень характеризуется собственным уровнем сложности, определяемым логико-функциональным анализом содержания, относящегося к критериальной области поведения. Такого рода Т. к.-о. обычно используются для диагностики специфических трудностей в обучении. Существенной особенностью Т. к.-о. является то, что в них индивидуальные различия сводятся к минимуму (индивидуальные различия влияют на длительность усвоения, а не на конечный результат). Поэтому Т. к.-о. лучше всего приспособлены для оценки развития основных навыков на элементарном уровне. В более сложных областях поведения предела достижений не существует, и, исходя из этого, необходимо обращаться к оценкам, ориентированным на нормы. Сегодня за рубежом разработаны тесты, выполнение заданий которых можно соотносить как с критериями, так и с нормами. Необходимо учитывать и то, что нормы неявно присутствуют в Т. к.-о., ибо выбор содержания или навыков, подлежащих измерению,, предполагает наличие сведений о том, как в подобных ситуациях действовали другие обследуемые (А. Анастази, 1982). Исходя из этого, наиболее перспективным представляется объединение критериально-ориентированного подхода с традиционным психометрическим. . А. Анастази (1982) правомерно считает, что акцент Т. к.-о. на содержательном смысле интерпретации тестовых показателей может оказать благотворное влияние на тестирование в целом. В частности, описание результатов, полученных с помощью тестов интеллекта, в терминах специфических навыков и умений в значительной мере обогащает фиксируемые ими показатели. Для Т. к.-о. непригодны в большинстве случаев обычные приемы определения валидности и надежности. В отечественных исследованиях имеется опыт создания Т. к.-о. (Е. И. Горбачева, 1985). Кроме того, осуществляется разработка методик, близких Т. к.-о., но ориентированных не на критерий, а на т. н. социально-психологический норматив или общественно-заданный объективный содержательный эталон (см. Школьный тест умственного развития ). Так же, исходя из социально-психологического норматива, анализируются результаты, полученные с помощью известных психометрических тестов (см. Лмтхауэра интеллекта структуры тест). ТЕСТЫ ЛИЧНОСТИ — группа методик (тестов), направленных на измерение неинтеллектуальных проявлений личности. Т. л. — понятие собирательное, вклю- чающее в себя как проективные методика, опросники личностные, так и любые другие методики, предназначенные для диагностики эмоциональных, мотиваци-онных, межличностных свойств индивидуума. В психодиагностике традиционно закрепилось разделение тестов на две большие группы — Т. л. и тесты интеллекта. В соответствии с принятой в настоящем словаре-справочнике классификацией, под Т. л. понимаются только те, которые образованы в рамках объективного диагностического подхода (см. Психодиагностический метод), что позволяет отличать их от проективных методик и личностных опросников. Т. л. в этом случае можно подразделить на объективные тесты действия и ситуационные тесты. Объективные тесты действия представляют собой относительно простые, четко структурированные процедуры, ориентирующие обследуемого на выполнение какой-либо задачи {см. Замаскированных фигур тест). Особенностью ситуационных тестов является помещение обследуемого в ситуации, близкие к реальным. По мнению А. Анастази (1982), ситуационные тесты почти на полвека предвосхитили существующий сегодня в психодиагностике интерес к специфике ситуаций, в которых проявляются особенности личности. Надежность и валидность большинства ситуационных тестов удовлетворительна. Сведений об использовании в СНГ нет. ТЕСТЫ НЕКОММЕРЧЕСКИЕ — тесты, которые разрабатываются для решения какой-либо исследовательской задачи и не предназначены для продажи другим пользователям. К ним, в отличие от тестов коммерческих, не предъявляются строгие требования соответствия тестов стандартам. Наиболее полные сведения о зарубежных Т. н. представлены (около 1300 наименований) в изданном в 1995 г. 6-томном руководстве «Directory of Unpublished Experimental Mental Measures», изданном Американской психологической Ассоциацией. ТЕСТЫ ОБЪЕКТИВНЫЕ — вид тес тов, данные по которым могут быть оценены независимо от лица, проводящего тестирование и интерпретацию. Понятие «Т. ол введено Р..Кэттеллом (1957). Их наиболее существенной особенностью, обеспечивающей объективность обследований, является сокрытие цели от испытуемого. Не имея представления об истинной направленности методики, испытуемые лишаются возможности произвольно искажать результаты. В качестве Т. о. могут выступать самые разнообразные методики. Р. Кэттелл иЕ. Варбуртон (1967) в «Сборнике объективных тестов» описывают более 400, например: — Тест готовности принимать быстрые решения в процессе адаптации к темноте. При проведении этого теста испытуемый находится в темной комнате. Затем включается яркий свет и ему предлагают смотреть на белый экран. Испытуемый должен назвать одну из трех последовательно предъявляемых на экране букв, как только ее увидит. Измеряемой переменной является время реакции испытуемого. Основанием для разработки теста явилось предположение о том, что испытуемые с доминированием процесса торможения должны демонстрировать более быструю световую адаптацию. — Измерение спонтанных движений фиджетометром. Фиджетометр — вращающееся кресло с электрическими контактами, замыкающимися при движениях обследуемого. Внешне кресло неотличимо от обычных. Измеряемым показателем является количе- ство движений за единицу времени. Основанием для разработки теста явилось предположение о том, что тревожные индивиды должны совершать больше суетливых, беспокойных движений. Нередко в качестве Т. о. используются опросники. Напр., объективным опросником является «Тест критических оценок* (Critical Evaluations Test). Испытуемых просят указать, является ли определенная производительность труда (к примеру, если у официантки уходит 10 минут на то, чтобы принести 6 порций на столик) очень хорошей, хорошей, плохой, очень плохой. Конкретное содержание ответов не имеет отношения к оценке. В данном тесте определяется количество критических оценок. В понимании Р. Кэттелла Т. о. имеют отношение к тестам личности. Достоинством Т. о. является известная объективность результатов, что особенно важно в области профотбора и психодиагностики клинической. Важным преимуществом Т. о. является пригодность таких методик для исследования испытуемых, принадлежащим к разным культурно-языковым общностям. Одна из основных и наиболее дискуссионных проблем, возникающих при работе с многими Т. о., — психологическое значение измеряемых переменных, которое зачастую остается неопределенным или допускает разные истолкования. Т. о. не следует смешивать с методиками, реализующими «объективный» поход к диагностике (см. Психодиагностический метод). ТЕСТЫ ОЦЕНКИ ЮМОРА — группа тестов личности, направленных на выявление особенностей чувства юмора. В зависимости от способа применения стимульного материала и организации обследования существуют пять типов Т. о. ю.: — Классификация соответствия юмористического материала (афоризмов, юмористических рассказов, картин и т. д.) смыслу отражаемых тем. Группировка юмористического материала, выполняемая испытуемым, сопоставляется с образцом, полученным в нормативной группе. Например, тест чувства юмора (Sense of Humor Test) А. Робака (1939); юмористических фраз тест и др. — Оценка «качества» юмористического материала с последующим сравнением с нормативными данными. Например, . тест юмора (Sense of Humor Test) Дж. Ал мака (1928); юмористический тест личности (Humor Test of Personality) P. Кэттелла и Л. Луборского (1952) и др. — Выбор наиболее смешного из предлагаемых возможных окончаний юмористического рассказа или выбор наиболее смешной легенды к комическому рисунку (тест Люсса). В таких Т. о. ю. также возможно сравнение с результатами нормативной группы. — Тесты типа «Истории завершение* методик, «Завершение предложения» методик. — Свободное творчество испытуемого на заданную тему. Под чувством юмора, на анализ которого прямо или косвенно направлены Т. о. ю., обычно понимается способность создавать вербальные или какие-либо иные произведения, которые могут развлечь, позабавить, вызвать переживание смешного, а также способность находить забавное и смешное в юмористических произведениях. Вторая группа особенностей чувства юмора наиболее легко доступна изучению. На оценку таких проявлений личности направлены первые три из приведенных выше типов Т. о. ю. Относительная ценность методик классифика- 342 ции юмористического материала по «значению» и по «качеству» состоит в том, что при использовании первых акцент делается на оценке чувства юмора по степени когнитивного согласия субъекта с референтной группой, а при использовании второго типа методик — по степени аффективного согласия. Результаты Т. о. ю., основанные на принципе выбора возможного окончания юмористического произведения теста, коррелируют с интеллектуальными факторами. Т. о. ю., актуализирующие деятельность по продуцированию юмористических произведений, близки по характеру к тестам креативности, интерпретация их данных связана со значительными трудностями. Одной из важных причин интереса к Т. о. ю. и их достаточно широкого распространения в психологической диагностике является то, что исследуемые с их помощью психологические особенности тесно связаны с личностью испытуемого. В оценках юмористической продукции проявляются структура отношений личности, образцы эмоционального реагирования в тех или иных ситуациях, особенности мотивационной сферы. В качестве примеров можно привести способность субъекта посмеяться над шуткой, направленной в его адрес, возможность внутренней разрядки эмоциональной напряженности и т. д. Юмористический тест личности Р. Кэттелла и Л. Луборского является одним из наиболее известных примеров использования Т. о, ю. в качестве индикатора личностных переменных. Тест применяется в двух формах и строится на оценке шуток и карикатур. Форма А содержит 104 пары шуток, в каждой из которых испытуемый выбирает более смешную с его т. з. В форме В 130 шуток и карикатур, каждая из которых оценивается как смешная или несмешная. Таким образом, форма В позволяет контролировать установку на ответы, отмечать в качестве смешных или несмешных разное количество шуток. Форма А дает дополнительную информацию об общей тенденции восприятия юмора испытуемым. Показатели теста разработаны на основе факторного анализа, .при этом выделяются 13 оценочных факторов (А. Анастази, 1982). Анализ факторов, влияющих на результаты тестов оценки «качества шуток» (под термином «шутка» понимается любая продукция, которая может рассматриваться как юмористическая), проведенный Г. Айзенком в 40-е гг., показывает, что для тестов оценки вербальных шуток, юмористических рисунков и некоторых других существует общий фактор, ответственный за 16,5% дисперсии результатов. Этот фактор интерпретируется Г. Айзенком как фактор «чувства юмора» и в значительной мере отражает количество шуток из общего числа предлагаемых в тесте, на которые испытуемый реагирует положительно. Другими словами, если испытуемый в одном тесте обнаруживает достаточно много смешного или остроумного, то и в другом тесте на другом материале вероятна оценка большинства шуток как образцов «качественного юмора». Наряду с общим фактором «чувства юмора» в результатах Т. о. ю. выделяются и более частные. Среди таких — фактор, разграничивающий испытуемых, предпочитающих шутки с сексуальным содержанием, и тех, которые считают материал такого рода наименее интересным (5,6% дисперсии); фактор сложности шуток, противопоставляющий испытуемых, предпочитающих простые шутки, тем, кто предпочитает сложные, утонченные, «интеллектуальные» шутки (6,3% дисперсии); фактор предпочтения шуток, основанных на высмеивании особенностей личности (своей и окружающих) или, на- оборот, на необычных ситуациях (безличного характера). Различные исследования особенностей оценки юмора (Т. Андрюс, 1943; Р. Крош, 1939; Дж. Дилей и соавт., 1954) показывают, что результаты тестов более всего подвержены влиянию принадлежности испытуемых к той или иной этнокультурной группе, их культурного уровня, профессиональных особенностей и др. Против ожидания, на показатели оценки «качества юмора» практически не влияет фактор пола. Напротив, возраст испытуемого имеет весьма важное значение. Одна и та же шутка по-разному оценивается в различные периоды жизни. Специальные исследования показывают, что коэффициент надежности тестов «оценки качества» юмора обычно невысок (около 0,55). Т. о. ю. являются перспективным направлением развития тестов личности. В СНГ разработан юмористических фраз тест (1982). |