Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии

Название	Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Дата	10.08.2022
Размер	5.87 Mb.
Формат файла
Имя файла	Валидность тестов.doc
Тип	Справочник #643669
страница	11 из 71

1 ... 7 8 9 10 11 12 13 14 ... 71

ВНУТРЕННЯЯ СОГЛАСОВАННОСТЬ

(консистенция, консистентность)— характеристика теста, указывающая на степень однородности состава заданий с т. з. измеряемого качества.

Критерий В. с. является существенным элементом валидности конструкт-ной теста, характеризуя, в какой мере задания направлены на измерения данного психологического явления, а также меру вклада каждого пункта (задания) в коли-

чественную оценку всей методики. Максимальная валидность теста достигается за счет отбора таких заданий, которые, обладая значительной корреляцией с результатом теста, в то же время минимально коррелируют между собой (при неоправданно высокой корреляции отдельных заданий тест будет перегружен лишними практически однозначными заданиями). Отбор заданий по критерию В. с. обеспечивает наибольшую прагматическую эффективность теста, допуская объединение в методике пунктов, максимально связанных с изучаемым показателем.

На практике В. с. определяется корреляцией между результатами каждого отдельного задания и теста в целом. Для этого используется метод корреляции би-сериальной между исходами каждого задания («справился—не справился»,ответ на пункт опросника в виде утверждения или отрицания и т. д.) с суммарной оцен- кой всех пунктов теста. Более сложной процедурой определения В.с. является анализ частных корреляций между общим результатом и отдельными заданиями, предусматривающий построение уравнения множественной регрессии (см. Регрессионный анализ, Факторный анализ). В таком уравнении каждый пункт получает весовой коэффициент, количественно выражающий его вклад в общий результат, несводимый к вкладу других пунктов. Достоинство метода в том, что весовой коэффициент впоследствии может использоваться как «ключ» для данного пункта. Это существенно повышает достоверность результатов, особенно при использовании опросников личностных. При такой дифференцированной оценке каждый ответ получает не +1 или 0 баллов, а вносит конкретный вклад в сумму тестовых оценок.

При анализе В. с. иногда применяется метод контрастных групп, сформированных из испытуемых, показавших самые

высокие и самые низкие суммарные результаты. Выполнение каждого пункта группой лиц с высокими результатами по тесту в целом сравнивается с его выполнением группой с низкими результатами, и те задания, с которыми первая справляется незначительно лучше, чем вторая, признаются невалидными и либо отбрасываются, либо пересматриваются.

Критерий В. с. имеет также отношение к корреляционной связи между результатами отдельных субтестов комплексной тестовой методики и их интегра-тивным результатом. Многие тесты интеллекта, напр., состоят из раздельно применяемых субтестов (таких, как словарный, арифметический, общей осведомленности и др.). При построении таких методик определяется степень связи субтестов с общим показателем, и плохо коррелирующие с тестом субтесты отбрасываются. Коэффициенты корреляции оставшихся субтестов свидетельствуют о В. с. тестовой батареи, мере вклада отдельных компонентов в обобщенный показатель.

Анализ В. с. элементов методики служит не только практическим целям повышения однородности заданий теста, но может в значительной мере способствовать углублению представлений о содержательно-теоретическом статусе измеряемого конструкта. На основании содержательного анализа пунктов, отобранных по этому критерию (напр., отдельных субтестов методики исследования общих способностей), появляется возможность уточнить понимание измеряемого комплексного свойства, в данном случае — область свойств интеллекта, измеряемых данным тестом (см. Валидность конст-руктная).

Процедура определения критерия В. с. близка характеристике дискриминативно-сти заданий теста, однако эти показатели различаются по своей направленности. Если критерий В. с. ориентирован на

оценку теста в целом, своеобразную «внутреннюю» валидность заданий с т. з. отражения измеряемого свойства, то индексы дискриминативности отражают диагностическую силу (удельный вес в общем результате теста) лишь отдельных пунктов. Таким образом, определение дискриминативности отдельных заданий является подготовительной процедурой для анализа В. с. целого теста.

«ВНУШАЕМОСТЬ» ТЕСТ — опросник

личностный. Предложен С. В. Клауче-ком и В. В. Деларю в 1997 г. и предназначен для скрининга лиц, обладающих повышенной внушаемостью и соответственно высокой готовностью к развитию психо-генно индуцированных состояний (хемо-фобий, радиофобий и т. п.).

«В», т. состоит из 20 утверждений, отобранных из известных личностных опросников. Напр.:

— В детстве Вас считали упрямым ребенком.

— Когда при Вас кто-нибудь зевает, Вам тоже нередко хочется зевнуть.

— Вы умеете настоять на своем и часто этим пользуетесь.

На первом этапе разработки опросника для подтверждения дискриминативности 10 экспертов провели экспертную оценку каждого утверждения; затем был рассчитан показатель согласованности экспертов. На втором этапе была осуществлена серия исследований, направленных на проверку валидности и надежности утверждений (результаты ответов сопоставлялись с данными 5 традиционных проб на внушаемость, адресованных зрительному, тактильно-кинестетическому и обонятельному анализаторам, ассоциативному мышлению). При этом было обследовано 110 практически здоровых лиц.

На основе обследования 2092 взрослых людей трудоспособного возраста (бо-

лее подробные данные о выборке не сообщаются) получены ориентировочные значения популяционной нормы для мужчин и женщин.

Авторы сообщают о достаточно высокой валидности и надежности методики при обследовании людей в естественных условиях жизнедеятельности, рекомендуют ее для оценки уровня внушаемости как отдельных индивидов, так и групп населения.

ВОПРОСОВ (УТВЕРЖДЕНИЙ)

ФОРМА — целостная характеристика задания, указывающая на особенности формирования структуры «вопрос—ответ* в опросниках. Термин, используемый как при конструировании методик, так и при их описании. В англо-американской литературе наиболее близким его эквивалентом является термин «построение задания» (item format).

Наиболее распространенными являются следующие формы:

1. Вопросы, предусматривающие ответы «да» или «нет». Такие вопросы легко формулируются, обычно понятны и не затрудняют обследуемых. Наиболее часто используются при конструировании методик. Напр., «Вы ходите медленно и нето- * ропливо?»

2. Вопросы, предусматривающие ответы «да», «нечто среднее», «нет». Добавляется неопределенный ответ. Как правило, неопределенные ответы неинформативны, а опросники, предусматривающие такую форму, не защищены от искажений (см. Установка на ответ). Использование такой формы вопросов обычно обусловлено тем, что у некоторых обследуемых возникает раздражение, бывают отказы от работы в том случае, когда их принуждают отвечать только утвердительно или отрицательно. Напр., «Я всегда в состоянии строго контролировать проявления своих чувств».

3. Вопросы, предусматривающие ответы «правда» или «ложь», или т. н. альтернативные задания. Мало отличаются от дихотомических (1). Напр., «Терпеть не могу втискиваться в переполненный автобус».

4. Вопросы, предусматривающие ответы «нравится», «не нравится». Точнее, в таких случаях речь идет как о фразах, так и об отдельных словах, которые, строго говоря, вопросом или утверждением не являются. Крайне редко используемая форма. Напр., «1) фонарщики, 2) воротники из бобрового меха, 3) бас-барабан».

5. Вопросы, предусматривающие ответы по рейтинговым шкалам. В таких случаях к вопросам (утверждениям) прилагаются различным образом градуированные шкалы с крайними значениями, напр.: «всегда»—«никогда». Основные проблемы, возникающие при использовании такой формы, связаны с разным пони^ манием обследуемыми терминов, указывающих на частоту. Возможно появление установки на «крайние» ответы. Напр.: «В окружении подчиненных я стараюсь показать свое превосходство: а) всегда, б) очень часто, в) от случая к случаю, г) редко, д) очень редко, е) никогда».

6. Вопросы, предусматривающие ответы, являющиеся вариантами «да», «затрудняюсь ответить», «нет». Это могут быть такие ответы, как «обычно»— «иногда»—«никогда», «согласен»—«не уверен»—«не согласен» и т. п. Подбор того или иного варианта обусловливается смысловыми особенностями вопроса (утверждения). Напр.: «Бывают периоды, когда мне трудно удержаться от жалости к самому себе: «часто», «иногда», «никогда».

7. Вопросы, предусматривающие ответы на основе выбора из нескольких предложенных развернутых высказываний. Обычно это завершающие предложение фразы, одну из которых и необходимо

выбрать. Используются два, три и более варианта выбора. Напр.: «Когда мне нечего делать, я могу...: а) позвонить другу (подруге), чтобы поболтать; б) заняться разгадыванием кроссвордов или чтением; в) пойти на джазовый концерт.

Особенности формирования структуры «вопрос—ответ» оказывают влияние на валидность и надежность опросников.

«ВРЕМЕНИ РАСПРЕДЕЛЕНИЯ» МЕТОДИКА — методика исследования мотивационной сферы личности, ее устремлений и интересов. Опубликована С. Я. Рубинштейн а 1979 г.

Обследуемому предлагают пронумерованный список различных дел и просят приблизительно указать, сколько часов он затрачивает на эти дела в течение 20 дней (480 ч). Так,если испытуемый спит около 8 ч в сутки, то в графе «сон» отмечает — 160 ч. После того как это задание выполнено, обследуемому представляется возможность «располагать временем по собственному желанию», т. е. он должен отметить, сколько времени потратит на те же самые дела в том случае, если будет им свободно распоряжаться. Пере-чень занятий состоит из следующих 17 пунктов:

1. Сон.

2. Длительность рабочего дня.

3. Транспорт.

4. Еда (кроме ее приготовления).

5. Забота о внешности.

6. Покупки и поиски нужных предметов

в магазинах.

7. Самообслуживание (приготовление пищи, уборка и т. п.).

8. Забота о детях и других родственниках.

9. Общение с близкими и друзьями.

10. Обучение.

11. Чтение художественной литературы,

газет и т. д.

12. Посещение театров, кино, выставок и т.д.

13. Прослушивание радио и телепередач.

14. Прогулки.

15. Занятие физкультурой или спортом.

16. Игры.

17. Полный отдых (отсутствие всякой деятельности).

Обработка полученных результатов сводится к сопоставлению фактического и желаемого распределения времени, что наиболее удобно изобразить графически. Теоретической основой «В. р.» м. является положение Л. Сэва (1972) о том, что отношение человека к использованию своего времени является важнейшим показателем его жизненных установок, стремлений, осознаваемых и неосознаваемых.

Данные об использовании «В. р.» м. носят предварительный характер. Валив-ность* и надежность методики не изучались, стандартизация не проводилась. Автор отмечает, что обследование психически больных не выявило диагностического значения методики. Тем не менее следует признать перспективность дальнейшей разработки «В. р.» м. как психодиагностического инструмента.

ВЫБОРКИ ОБЪЕМ —число элементов, включенных в совокупность выборочную. В. о. определяется: а) задачами исследования; б) степенью однородности совокупности генеральной, которую данная выборка репрезентирует; в) величиной доверительной вероятности (Р), при которой гарантируется достоверность результата исследований; д) требуемой точностью результатов, т. е. величиной допускаемой ошибки репрезентативности. При выборке В. о. учитывается совокупность технических приемов, применяемых для ее качественного и статистического анализа. В. о. определяется с помощью статистических таблиц больших чи-

сел, по номограммам достаточно больших чисел, а также с помощью специальных расчетов.

В тех случаях, когда отсутствует информация о средних показателях и дисперсии в выборочной и генеральной совокупностях, прибегают к таблицам достаточно больших чисел. В. о. зависит от вероятности (Р) заключения о достоверности выводов, от величины предельной ошибки репрезентативности (D), а также от вероятности появлений события (р). Практически достаточная величина Р не превышает 95% (0,95). Допускаемая ошибка репрезентативности, т. е. погрешность производимых наблюдений, вычисляемая как доля от выборочной средней X, задается в пределах от 0,01 до 0,05. Чем выше величина доверительной вероятности Р и чем меньше допускаемая ошибка репрезентативности, тем большим должно быть число наблюдений (я). Если средние показатели и дисперсия для выборочной и генеральной совокупностей известны, для определения В. о. можно воспользоваться специальным расчетом. При этом вначале определяется желательный уровень точности измерения, выражаемый в долях измеряемой величины или процентах доверительной вё¹роятности, напр.: х ± 0,01х или Р ± 5%. Для непрерывно изменяющейся нормально распределенной величины объем выборки (я) будет определяться по формуле

где N—объем генеральной совокупности, t— значение абсциссы для кривой нормального распределения, определяемое желаемой точностью оценки или выбора (для Я = 0,95 / = 1,96, для

Р = 0,99 /

2,58), Л — уровень точности в долях от х выборки, а — стандартное отклонениех.

В качестве примера определим величину выборки для генеральной совокупности 5000 человек: х=\0, заданная ошибка не превышает 5% от среднего значения, вероятность попадания значений переменной за пределы доверительного интервала х ± t$> не более 5% (Р = 0,95), стандартное отклонение s - 2;

Как видно из расчетной формулы В. о., при заданной предельной ошибке с возрастанием дисперсии признака и надежности заключения, выражаемой вероятностью Р, число наблюдений в выборке увеличивается.

ВЫБОРОЧНАЯ СОВОКУПНОСТЬ ЗАДАНИЙ ТЕСТА — совокупность тестовых задач, являющаяся частью гипотетической генеральной совокупности заданий теста. Каждый конкретный тест теоретически представляет собой некую В. с. з. т., однако на практике отдельные части теста могут представлять выборки заданий из различных генеральных совокупностей, а также одни и те же задания В. с. з. т. могут принадлежать нескольким генеральным совокупностям.

В. с. з. т. должна по возможности в наибольшей степени представлять генеральную совокупность заданий, связанных с тестируемым качеством. Адекватная репрезентация лежит в основе надежности (см. Надежность по внутренней согласованности, Надежность факторно-дисперсионная) и валиднос-ти теста. Связь В. с. з. т. с определенной

генеральной совокупностью задании определяет внутреннюю согласованность теста.

ВЫГОТСКОГО—САХАРОВА ТЕСТ —

методика, предназначенная для исследования мышления, способности формирования понятий. Предложена Л. С. Выготским и Л. С. Сахаровым в 1927 г.

Материал методики представляет собой набор объемных фигур (рис. 17), от-

Рис. 17. Набор фигур Выготского—Сахарова теста

личающихся друг от друга формой, цветом и величиной. На нижней поверхности объектов нанесены условные обозначения в виде бессмысленных, искусственных слов («биг», «цев», «гур», «лаг»). Испытуемому демонстрируют одну из фигур, объясняют, что надпись совершенно условна, однако имеющимся в наборе фигурам с такой же надписью присущи определенные признаки. Задача испытуемого — обобщить признаки по группам. Перед началом выполнения заданий экспериментатор просит составить предполагаемый план выполнения, в ходе работы указывает на ошибки, фиксирует количество попыток решения.

В.—С. т. представляет собой разновидность методики двойной стимуляции и является видоизменением известной методики искусственных слов, предложен-

Рис. 18. Набор фигур Выготского—Сахарова

теста (модификация А. Ф. Говорковой) (задания

1-16)

ной в начале века Н. Ахом для изучения понятийного мышления. По данным Л. С. Выготского, с помощью предложенной им методики можно констатировать нарушение процессов обобщения не только при явных расстройствах мышления, но и в тех случаях, когда вне условий эксперимента трудно заметить нарушения формального мышления.

Несмотря на кажущуюся простоту заданий и процедуры обследования, методика сложна и требует определенных навыков в проведении и правильной интерпретации результатов. Это связано с необходимостью оказания помощи испытуемому в ходе выполнения, оценки восприимчивости к помощи, подсказки способа решения. Б ходе исследования и качественного анализа его результатов могут быть получены данные об аффективно-личностных особенностях испытуемого, прежде всего связанных с реакцией на успех. Стандартизация В.—С. т. не проводилась, сведения о валидности и надежности отсутствуют. Методика ориентирована на качественный анализ особенностей мышления.

Определенным недостатком В.—С. т. является то обстоятельство, что данная методика, в силу своей сложности для

испытуемого, применяется, как правило, для исследования процессов обобщения у взрослых. В целях приспособления В.—С. т. к детскому возрасту была разработана упрощенная модификация методики (А. Ф. Говоркова, 1962).

Обследуемому показывают 16 вырезанных из картона фигур (рис. 18), отли-_% чающихся формой (2 вида), цветом (красные и зеленые) и величиной (4 варианта). На обороте фигур написаны их условные обозначения. Одну из фигур дают обследуемому и просят отобрать другие фигуры из этого разряда. Каждую отобранную фигуру испытуемый переворачивает и убеждается в правильности или ошибочности своего выбора. О результатах исследования судят по количеству «ходов», понадобившихся для формирования искусственного понятия.

При обследовании детей с помощью этой методики определяют способность к целенаправленным и последовательным действиям, умение вести анализ одновременно в нескольких направлениях, отбрасывать неподкрепленные признаки, что характеризуют течение процессов обобщения и отвлечения.

В.—С. т. достаточно широко используется в отечественных, прежде всего" клинико-диагностических исследованиях (И. Н. Гильяшева, 1974 и др.). Имеются сведения о том, что сопоставление результатов, полученных с помощью В.—С. т., с результатами традиционных тестов интеллекта расширяет диагностические возможности последних, позволяя, в частности, обнаружить особые, специфичные для некоторых психически больных формы невербального мышления. В.—С. т. также послужил основой для разработки некоторых вариантов диагностического обучающего эксперимента.

1 ... 7 8 9 10 11 12 13 14 ... 71