Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
«БЛЕККИ» КАРТИНКИ (Blacky Pic tures) — проективная методика исследования личности. Разработана Г. Блу-мом в 1949 г. Стимульный материал Б. к. состоит из 12 стандартных таблиц с выполненными в юмористическом стиле рисунками-ситуациями, в которые попадает маленькая собачка по кличке Блекки (рис. 7, 8). Другие животные, изображенные на рисунках, — родители Блекки и щенок неопределенного пола по кличке Типпи, являющийся братом (сестрой) Блекки. Обследование проводится так же, как и в тематической апперцепции тесте, с тем отличием, что перед демонстрацией каждой картинки следуют вводные замечания, уточняю- щие, какие персонажи изображены. После составления рассказа по картинкам обследуемому предлагают ответить на серию стандартных вопросов. Тест направлен на оценку особенностей психосексуального развития, понимаемого с позиции психоанализа. Это определило и содержание рисунков (мотивы орального эротизма, анального садизма, комплекса Эдипа и т. п.). Вопрос о валидности Б. к. связан с мерой обоснованности в психоанализе концепции, определяющей тип личности из того, на какой стадии полового созревания фиксируется развитие индивидуума. Украинскими психологами начата работа по адаптации и валидизации методики (О. И. Морозова, 1997). Рис. 7. Образец «Блекки» картинок Рис. 8. Пример «Блекки» картинок БЛИЗНЕЦОВЫЕ ИССЛЕДОВАНИЯ — метод установления сходства близнецов для оценки относительной роли наследственности и среды в появлении межиндивидуальных вариаций измеряемого признака. При этом сравнивают степень внутрипарного сходства генетически идентичных монозиготных (МЗ) и неидентичных дизиготных (ДЗ) близнецов. Начало Б. и. положено трудами Ф. Гальтона (1876). Предполагается примерное равенство постнатальных воздействий среды на близнецов, входящих как в МЗ, так и в ДЗ пару. Из этого следует, что если по какому-либо признаку МЗ близнецы оказываются более сходными, чем ДЗ, то это означает формирование данного признака под влиянием генотипа. Если интересующий исследователя признак формируется под влиянием внешних воздействий, то внутрипарное сходство МЗ и ДЗ близнецов должно быть почти полным. Помимо данного метода, получившего название метода контрастных групп, в Б. и. используются и другие: метод контрольного близнеца, метод разлученных МЗ близнецов и метод близнецовой пары (Р. Заззо, 1960,1962; И. В. Равич-Щербо, 1978). Эти методы могут быть дополнены сопоставлением близнецов с людьми других степеней родства и не находящимися в родстве. Наибольшее значение имеет изучение МЗ близнецов, разлученных в раннем детстве и, следовательно, воспитывающихся в разной среде. Это создает почти идеальные условия для Б. и. В психодиагностике Б. и. посвящены прежде всего изучению проблемы «генотип—среда» применительно к интеллекту, измеренному с помощью тестов (см. Тесты интеллекта). В большинстве исследований отмечается большее внутри-парное сходство различных функций интеллекта у МЗ близнецов, чем у ДЗ близнецов (Л. Эрленмайер-Кимлинг и Л. Ярвик, 1963 и др.). Однако в этих исследованиях не учитывается ограниченность Б. и., связанная с некорректностью допущений одинакового воздействия среды на членов МЗ и ДЗ близнецовых пар. МЗ близнецы уже на ранних этапах онтогенеза благодаря большому соматическому сходству имеют более сходный тип активности; чаще у них общие друзья, окружающие стимулируют их идентичность и т. д. Иначе говоря, у них существуют и средовые условия для конвергентного психического развития (И. В. Равич-Щербо, 1978, 1981). Подвергнутые тщательному критическому анализу исследования рано разлученных членов МЗ пар также оказались не вполне состоятельными. Близнецы, хотя и были разлучены, как правило, воспитывались в сходных социально-психологических условиях (Л. Кэмин, 1974; И. В. Равич-Щербо, 1978). Таким образом, методические ошибки, допускаемые при сопоставлении результатов изучения МЗ близнецов, воспитывавшихся отдельно друг от друга (а сюда относится не только пренебрежение тщательным анализом среды, но и, напр., сравнение данных, полученных в различных возрастных группах, использование нестандартизированных тестов), заставляют усомниться в обоснованности выводов этих исследований. Тем самым ставятся под сомнение зарубежные теории, исходящие из генетической обусловленности интеллекта. Необходимо признать, что возможности Б. и. не столь велики, как это считалось долгое время, и заметно снижаются при переходе от исследования антропометрических и физиологических признаков к психологическим. С такой позиции следует оценивать и результаты выполненных за рубежом работ, в которых изучалось влияние генотипа на параметры экстра—интроверсии, нейротизма и другие личностные особенности. В нашей стране Б. и. в психодиагностике единичны (Н. С. Кантонистова, 1980). Значительно шире они используются в психофизиологии, медицине. БРЭЙСА МОТОРНЫХ СПОСОБНОСТЕЙ ТЕСТЫ (Brace Motor Ability Tests (Scale) — тестовая батарея исследования уровня развития двигательных умений, компонентов моторики детей и подростков. Предложена в 1927 г. Д. Брэйсом, профессором физического воспитания Техасского университета (США). Методика имеет шкальный принцип построения (см. Бине—Симона умственного развития шкала, Станфорд—Бине умственного развития шкала). Шкала разработана в двух вариантах, включающих соответственно 20 и 30 тестов, допускается как индивидуальное, так и групповое обследование детей и подростков в возрасте от 10 до 16 лет, а также взрослых в возрасте до 45 лет. Приводим примеры заданий Б. м. с. т.: Тест 1. Пройти по прямой линии, ставя носок одной ноги вплотную к пятке другой ноги. Упражнение начать с левой ноги. Сделать 10 шагов, При выполнении задания глаза испытуемого открыты, допускается балансирование руками. Тест считается невыполненным, если испытуемый потерял равновесие и сошел с прямой линии либо при несоблюдении условия прикосновения носка одной ноги к пятке другой. Тест 11. Подпрыгнуть и во время прыжка хлопнуть обеими руками по пяткам. Тест считается невыполненным, если испытуемый не смог прикоснуться одновременно к обеим пяткам. Тест 20. Стать на левую ногу. Правую ногу вытянуть вперед. Опуститься и сесть на левую ногу, не прикасаясь пра- вой ногой или руками к полу. Подняться из такого положения, не теряя равновесия. Тест считается невыполненным, если испытуемый не смог присесть на левую ногу, прикоснулся правой ногой или руками к полу, не смог подняться на левой ноге без прикосновения правой ноги к полу. Процедура обследования стандартизирована. Методические материалы по тесту снабжены фотографиями, демонстрирующими правильное выполнение движений. Продолжительность обследования 35-40 мин. При оценке результатов обследования сырые баллы (см. Оценки первичные), соответствующие числу выполненных тестов, по специальным таблицам переводятся в стандартные показатели моторного развития (ПМР). По мнению Д. Брэйса, основными функциями, подлежащими измерению при оценке моторного развития, являются: ловкость движений, гибкость, мышечная сила, способность к сохранению равновесия и координация сложных движений. При отборе заданий, вошедших в Б. м. с. т., автор руководствовался следующими принципами: преимущественная направленность на врожденные качества моторики, а не на двигательные навыки; моделирование сложных двигательных комплексов, а не отдельных движений; широкий охват наиболее типичных комплексов движений; доступность шкалы для массового использования. Б. м. с. т. стандартизированы на выборке 155 детей и взрослых. Полная форма теста (из 30 заданий) имеет два параллельных варианта (формы А и Б). Сокращенная шкала (20 заданий) имеет также две формы (тесты 1-10 — форма М, тесты 11-20 — форма И). При оценке характеристик Б. м. с. т. как диагностической процедуры валидность конструктная определялась на основе сравнения показателей моторного развития с экспертны- 27 ми оценками 75 преподавателей. По различным критериям (см. Валидизации критерий) коэффициент корреляции составил 0,58-0,68. Среди критериев экспертных оценок были: «способность к легкому усваиванию форм движений», «разнообразие движений», легкость сложных движений» и др. Валидность текущая проверялась на материале контрастных групп детей, интенсивно занимающихся спортом и не занимающихся спортом. Коэффициент надежности ре-тестовой составил 0,78-0,90, надежности параллельных форм (формы А, В) — 0,73. На разработку Б. м. с. т. существенное влияние оказала Озерецкого оценки моторики шкала. Б. м. с. т. переведена на русский язык Е. В. Гурьяновым в 1928 г. Сведений об использовании в СНГ не имеется. «В ТРИДЕВЯТОМ ЦАРСТВЕ» ТЕСТ (The «Once Upon a Time» Test) — проективная методика исследования личности. Предназначена для оценки у детей способности испытывать эмоции тревоги и удовольствия. Предложена Т. Фагула в 1994 г. Испытуемому предъявляют 9 рисунков-сцен из мультфильмов и просят упорядочить их и составить рассказ. Результаты оценивают в соответствии с реакцией испытуемого на тестовые ситуации, изменчивостью выбора картинок, частотой выбранных сцен, что выражает чувства тревоги или удовольствия, а также последовательность размещения сцен. Сообщаются данные о валидности теста на выборке из 5-10-летних детей. Данные, полученные по тесту, используются для дифференциации нормальных, агрессивных, тревожных или изолированных детей. Сообщается о достаточно высокой валидности и надежности методики. Сведений об использовании в СНГ не имеется. ВАЙНЛЕНДСКАЯ СОЦИАЛЬНОЙ ЗРЕЛОСТИ ШКАЛА (Vineland Social Maturity Scale) — методика определения степени овладения социальными навыка- ми, предназначена для детей в возрасте от 3 до 9 лет. Разработана Е. А. Доллом в 1935 г. Автор исходил из понимания социальных навыков как свойств, присущих всем людям, «как общих предпосылок уровня наблюдаемой активности индивида, имеющей социальное значение». Эта активность проявляется в первую очередь в способности следить за своими потребностями и ощущать ответственность за свои действия. Комплекс этих атрибутов ЕгДолл обозначил как «социальная зрелость». Сущность тестирования состоит в описании активности ребенка и соотнесении конкретных форм его поведения с нормативами. Экспериментатор получает в ходе беседы сведения о ребенке и затем оценивает их по стандартной схеме. Применение шкалы не требует участия испытуемого, данные чаще всего получают от других лиц, обладающих информацией о его развитии (родители, воспитатели и т. д.). Ориентиром для беседы и оценки действий является бланк для ответов, который содержит 36 пунктов, касающихся поведения ребенка. Пункты сформулированы таким образом, чтобы выявить, спо- собен ли ребенок самостоятельно удовлетворить свои потребности в соответствии с нормативными требованиями для данного возраста. В первую очередь нормативы касаются «социальных способностей», например: самостоятельность, способность к общению, социальная включенность и т.д. Формулировка нормативов примерно такова: — для возраста 3-4 года: сам застегива-" ет одежду, сам одевается, кроме завязывания шнурков; — для возраста 4-5 лет: играет в простые настольные игры, имеет представление о деньгах и их значении. Нормативы объединяются в следующие категории: 1. Способность к самообслуживанию; 2. Самостоятельность во время еды; 3. Самостоятельность при одевании; 4. Способность к саморегуляции поведения; 5. Уровень активности; 6. Уровень общения; 7. Физическая активность; 8. Степень социализации. Беседа как форма получения информации от лиц, знающих ребенка, оказывается вполне адекватной для определения степени овладения социальными навыками, но предъявляет повышенные требования к экспериментатору, который должен уметь выделить сведения, относящиеся к нормативным показателям. Выполнение каждого нормативного требования оценивается в 1 балл. Оценка первичная с учетом хронологического возраста переводится в условный показатель, позволяющий отнести испытуемого к определенной «зоне развития». В каждой возрастной категории выделяется пять таких зон. Исходя из характера тестовых заданий методика пригодна для обследования лиц от рождения до 25 и даже до 30 лет. Однако из-за отличий в культурных условиях в разных возрастных выборках автор определил зону применимости шкалы от 3 до 9 лет (хотя стандартизация ее проводилась на испытуемых в возрасте от нескольких месяцев до 11 лет). Для обсле- дования детей в возрасте до 3 лет рекомендуется использовать шкалу развития Гезелла (см. Психодиагностика раннего детства). В процессе рестандартиза-ции шкалы (Й. Кожены, 1974) была установлена внутренняя согласованность заданий (коэффициенты для отдельных возрастных категорий находились в диапазоне от 0,59 до 0,86). Возможности использования шкалы достаточно широки. Она может быть с успехом применена в детской клинической психодиагностике, при контроле развития детей младшего возраста. Данных об использовании в СНГ нет. ВАЛИДИЗАЩШ КРИТЕРИЙ — непосредственная и независимая от вали-дизируемого теста мера психического свойства, на исследование которого направлена психодиагностическая методика. Сравнение результатов теста с В. к. является непременным условием процедуры определения валидности критериальной. В качестве В. к. на практике обычно используют: — объективные социально-демографические и биографические данные (стаж, образование, профессия, прием или увольнение с работы); — показатели успеваемости, чаще всего являющиеся критериальной мерой тестов способности к обучению, достижений в отдельных дисциплинах, тестов интеллекта; — производственные показатели эффективности выполнения отдельных видов профессиональной деятельности, имеющие наибольшее значение при валидизации методик, используемых в профотборе и профориентации; — результаты реальной деятельности (рисование, моделирование, музыка, составление рассказа и т. д.) при испытании тестов общих и специальных способностей, тестов личности; - врачебный диагноз или другие заключения специалиста; — контрольные испытания знаний и умений; — данные других методик и тестов, ва-лидность которых считается установленной. Среди многообразия видов В. к. можно в самом общем виде выделить объективные (относительно независимые от субъективных мнений, оценок людей) и субъективные критерии. Последние в психодиагностике используются более часто. К числу таких критериев относятся оценки, суждения, заключение об объекте исследования, сделанные экспертом (специалистом, педагогом, руководителем, психологом). При таком методе индивидуальной оценки эксперт дает заключение на основе предложенной ему разработчиком теста оценочной шкалы. Объективизация В. к. достигается увеличением числа экспертов. Использование экспертных оценок в качестве В. к. включает четыре возможных метода проведения процедуры валидизации; коллективная оценка, средневзвешенная оценка, ранжирование, парное сравнение. При коллективной оценке эксперты совместно оценивают объект с помощью оценочной шкалы. Выбор оценочных шкал чаще всего осуществляется по принципу наибольшего удобства для эксперта. Так, педагогам удобней оценить учащихся по 5-балльной шкале. Условием коллективной оценки является выработка общего компромиссного мнения. При таком способе оценивания результат весьма зависим от личностных особенностей и характера группового взаимодействия экспертов. Распространенным методом получения В. к. является метод средневзвешенной оценки. В этом случае каждый испытуемый оценивается несколькими экспертами, так что оценки, данные ие- пытуемому одним экспертом, неизвестны другим. Затем полученные оценки усредняются. Вместо оценочной шкалы можно применить метод ранжирования, заключающийся в том, что несколько экспертов независимо друг от друга или совместно распределяют всех членов выборки на группы по степени выраженности оцениваемого признака. Полученные ранговые места при независимом оценивании могут быть также усреднены. При определении рангового места или оценке по шкале нередко эксперты встречаются с трудностью соотнесения выраженности признака с тем или иным уровнем или положением на шкале. Эта трудность возрастает при оценивании малодифференцированных признаков или при низкой квалификации экспертов. В этом случае определенными преимуществами обладает метод парного сравнения. Задача экспертов состоит в попарной расстановке субъектов по позициям альтернативных признаков («общительный—замкнутый» или выраженность большая—меньшая предложенного для оценки качества и т. п.). Субъективно задача экспертов облегчается благодаря отсутствию количественной оценки качеств субъекта. Показателем места, занимаемого испытуемым в ряду других, служит общее число предпочтений этого суббъекта по сравнению с остальными по данным всех экспертов. Этот показатель может быть приведен к числу экспертов и числу сравниваемых испытуемых и вычислен в процентах. Для расчета применяется формула Дж. Гилфорда где В — число предпочтений, N — число экспертов, п — количество сравниваемых объектов. Выбор В. к. является ответственным и важным этапом конструирования теста и его валидизации. Чем более сложным, комплексным является изучаемое психическое явление, тем шире, обобщеннее, должен быть критерий. Напр., при обосновании теста на общий интеллект в качестве В. к. может выступать эффективность учебной, производственной или научной деятельности в целом; при валидизации методики для исследования экстраверсии—интроверсии — экспертные оценки таких личностных характеристик, как общительность, жизнерадостность, социальная ответственность и др. Более узкие и частные критерии применяются для обоснования тестов, направленных на измерение уровня развития конкретных профессиональных знаний, умений, навыков, напр.: мануальной ловкости, памяти на числа и т. д. Узость выбираемого критерия определяется областью психологических явлений, охватываемых тестом, однородностью (гомогенностью) задач методики, конкретностью, однозначностью интерпретации результатов. Напротив, чем шире В. к., тем разнородней (гетеро-геннее) по характеру могут быть задачи теста и тем менее однозначна интерпретация результатов. В реальной практической деятельности успех или неуспех человека в любой области определяется не каким-нибудь изолированным фактором, а их комплексом. Поэтому в принципе каждый В. к. является многокомпонентным. Для адекватной оценки объекта его следует считать комплексным, составным, что не только расширяет сферу реальной валидизации, но и делает ее результаты более точными и обоснованными. Разделение критерия на элементы в соответствии с элементами изучаемого тестом сложного качества, области поведения осуществляется при характеристике синтетической валидности (см. Валидность критериальная). Ана- лиз и интерпретация связи тестовых оценок с В. к. опирается на количественные и качественные методы и вместе с выбором критерия является ключевым аспектом, определяющим достоверность характеристики валидности теста (см. Валидности коэффициенты). |