|
Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
МОЗАИКИ ТЕСТ (Mosaic Test) — проективная методика исследования личности. Предложена М. Ловенфельд в 1929 г.
Обследуемому предлагают 465 деревянных или пластиковых мелких предметов разной формы (квадраты, ромбы, треугольники) и различной окраски (черные, белые, красные, синие, зеленые и желтые). Из этих деталей необходимо составить произвольный узор-рисунок. Время не ограничено.
Наиболее детально разработанная схема оценки результатов, полученных с помощью М. т., принадлежит Б. Даймонду и Г. Шмале (1944). Авторы исходят из положения о том, что неспособность обследуемого создать ясно распознаваемую, четкую форму в М. т. коррелирует со значительными личностными отклонениями.. Выделены пять типов сложения мозаики.
1. «Мозаика нормальная» —легко распознаваемый гештальт (образ), созданный сочетанием формы и цвета предложенных деталей.
2. «Мозаика с незначительно выраженными дефектами» — отдельные элементы мозаики нечетки, узнаваемы с трудом, имеются ошибки в использовании цвета, характерен ряд взаимно не связанных рисунков-узоров, нет завершенного рисунка.
3. «Мозаика с умеренно выраженными дефектами» — обнаруживаются лишь попытки создания формы, игнорируется цвет, а если цвет учитывается, то форма неудовлетворительна.
4. «Мозаика с выраженными дефектами» — не распознается форма рисунка-узора, имеются выраженные отклонения от «мозаики нормальной».
5. «Мозаика неклассифицируе-мая» —полная неспособность создать рисунок-узор, хаотическое расположение предметов.
В зарубежных исследованиях отмечается возможность дифференциации клинических групп с помощью М. т., причем тест наиболее чувствителен к лицам с органическими поражениями головного мозга, что позволяет рекомендовать его в качестве одной из нейропсихологических методик. Валидность М. т. как проективной методики личности не доказана.
Сведений об использовании в СНГ нет.
МОТИВА ДОСТИЖЕ!1ИЯ РЕШЕТКА
(LeistungsmotivsGitter) — проективная методика исследования личности. Разработана и опубликована Г. Д. Шмальтом в 1976 г. Предназначена для диагностики интенсивности и экстенсивности мотива достижения, близка тематической апперцепции тесту в его модификации по X. Хекхаузену.
Стимульный материал М. д. р. состоит из 18 картинок, объединенных в тройки,
относящиеся к шести различным сферам жизнедеятельности (труду, музыке, школьному обучению, самоутверждению, оказанию помощи, спорту). На рис. 45 см. в качестве примера картинки из сферы спорта и школьного обучения (вариант для обследования детей). Под каждой картинкой располагаются 18 стандартных высказываний, напр.:
— Он хорошо себя чувствует;
— Он думает: «Раз это трудно, то попробую еще»;
— Он считает, что справится с этим;
— Он думает: «Может быть опять неудача»;
— Он думает: «Я лучше сделаю что-нибудь потруднее».
Обследуемый должен отметить те высказывания, которые соответствуют его пониманию ситуации на картинке.
За исключением 4-х т. н. «избыточных» утверждений (напр., «Он хорошо себя чувствует* или «Это ему не нравится») 14 репрезентируют ключевые категории для обработки содержания при выявлении мотивов успеха и неудачи. Напр.: «Он думает, что все сделал правильно» — позитивное ожидание успеха.
Обработка результатов сводится к об>единению всех отмеченных утвержде-
Рис. 45. Две из 18 ситуаций, изображенных на картинках Мотива достижения решетки, вариант
для детей
ний по каждой из картинок с целью получения матрицы ответов (отсюда название методики — «решетка»). Столбцы этой матрицы представляют интенсивность мотива (разнообразные высказывания, относящиеся к одной и той же картинке), а строки — его экстенсивность (одни и те же высказывания по отношению к разным картинкам). При помощи факторного анализа установлена принадлежность каждого из утверждений к одной из моти-вационных тенденций, обозначаемых как НУ, БН1 и БН2. НУ — уверенность в успехе, предпочтение более трудных проблем и «Я»-концепция достаточного развития собственных способностей; БН1—активное избегание неудачи и «Я»-концепция недостаточного развития способности; БН2 — боязнь неудачи.
При изучении валидности М. д. р. выявлена тесная связь с Хекхаузена модификацией ТАТ. Надежность ретестовая при интервале между обследованиями от 2 до 8 недель — 0,67-0,85. Существуют варианты М. д. р. для обследования детей и взрослых.
Данных об использовании в СНГ нет.
МОТИВАЦИИ АНАЛИЗА ТЕСТ (Motivation Analysis Test, MAT) — тест-объективный личности. Разработан Р. Кэттеллом и Д. Чайлдом в 1975 г.
Опросник включает 208 пунктов, состоит из четырех субтестов, содержащих разные типы заданий:
1 субтест содержит 48 заданий с предложенными вариантами ответов. В этих заданиях описывается некоторая ситуация, в которой следует решить, как лучше потратить деньги, распорядиться временем, использовать те или иные предметы;
2 субтест содержит 56 заданий, в которых необходимо произвести определенную оценку с помощью 4-балльной шкалы, напр.: «Какой процент взрослых людей будут рады отдать деньги на ...»;
3 субтест содержит 48 пар слов, к каждой из которых предлагается ключевое слово. Испытуемый должен решить, какое из двух слов в паре наилучшим образом подходит к ключевому;
4 субтест оценивает информированность субъекта в области повседневных жизненных задач.
В методике измеряются две группы показателей: «эрги» (основные тенденции личности) и «чувства» (культурально-сформированные тенденции). Кчислу первых относятся направленность на поиск партнера, уверенность в себе, нарциссизм (поиск комфорта), неуживчивость. Кгруп-пе измеряемых «чувств» относятся уровень супер-эго (совести), отношение к себе, отношение к партнеру, карьере и родительскому дому. В факторах «эргов» и «чувств» содержатся два компонента, «не-интегрированный» и «интегрированный», по мнению разработчиков приблизительно соответствующие бессознательному и сознательному аспектам психической активности. Последние два субтеста направлены на измерение интегрированных компонентов личностных тенденций. Основой для их разработки стало положение Р. Кэттелла и Д. Чайлда (1975), что люди знают больше о тех предметах, с которыми связаны их интересы, и, следовательно, будут располагать о них большей информацией, чем о других (4 субтест), и, вероятнее всего, будут ассоциировать слова с областью своих интересов (3 субтест).
Авторы теста полагают, что испытуемые не имеют представления о тех психологических показателях, которые исследуются тестом (на этом основании методика относится к объективным тестам).
Показатели надежности М. а. т. недостаточно удовлетворительны. Так, коэффициент альфа варьирует от 0,33 до 0,71. Валидность являлась предметом исследований Р. Кэттелла и соавт. (1970), которые приводят данные о ее высоких показа-
телях (на основании сопоставления с результатами «Шестнадцати личностных факторов» опросника). Однако эти результаты ставятся под сомнение (К. Бурд-селл, 1975). В исследовании П. Клайна и Дж. Гриндлей (1974) валидность подтверждается соответствием между результатами этого теста и анализом дневниковых материалов испытуемых.
Исследования К. Купер и П. Клайна (1982) заставляют усомниться в валидности М. а. т. (в психометрическом аспекте). Факторный анализ М. а. т. и шкал 16 PFбыл осуществлен на выборке из 109 мужчин. Исследование выявило восемь факторов, ни один из которых не соответствовал постулированной структуре теста. В качестве дальнейшей проверки был проведен анализ, в котором было продемонстрировано, что шкалы не являются однородными (задания не соответствовали шкалам, которым они приписывались). Руководство к тесту сопровождается нормами, рассчитанными для американской выборки (объем выборки незначительный).
По мнению П. Клайна, тест представляет интерес, поскольку относится к весьма немногочисленной группе объективных тестов и к тому же является стандартизированным. Тем не менее тест недостаточно доработан и в настоящем виде не может быть рекомендован к применению в психодиагностических исследованиях.
Сведений об использовании в СНГ нет.
МЫШЛЕНИЯ ПРОСТРАНСТВЕННОГО ТЕСТ — тест специальных способностей. Предложен И. С. Якиманской, В. Г. Зархиным и X. М. Кадаяс в 1991 г. Предназначен для диагностики уровня развития пространственного мышления.
М. п. т. включает пять субтестов, задания которых требуют от испытуемых в процессе создания образа работы с величиной объектов (1), их формой (2), а также оперирования образами, приводящего к мысленному видоизменению положения объекта (3), его структуры (4), к одновременному изменению пространственного положения и структуры образа (5). Два вида заданий направлены на выявление процесса создания образа и три — на фиксацию типов оперирования образом. Внутри субтестов задания различаются по материалу (черчение, геометрия, рисование). Тест имеет две формы (А и Б), каждая из которых состоит из 5 видов заданий. Каждый вид заданий представлен двумя вариантами, различающимися уровнем сложности.
Надежность ретестовая (3,5 мес) — 0,841 прир < 0,01. Валидность определялась: сравнением успешности выполнения заданий со школьной оценкой по геометрии (г = 0,683, р < 0,01); сопоставлением результатов выполнения заданий М. п. т. и субтеста № 8 Амтхауэра интеллекта структуры теста (г = 0,623, р < 0,01); путем сравнения результатов тестирования с успешностью выполнения стандартизированной контрольной работы по геометрии (г = 0,697, р < 0,01). Доказана эквивалентность форм А и Б (г = 0,959, р < 0,01). Разработана схема качественного анализа результатов тестирования.
Авторы считают, что с помощью теста можно выявить не только индивидуальные различия в содержании и структуре пространственного мышления, но и конструировать обучающие коррекционные программы с учетом всех структурных компонентов этого вида мышления, их взаимосвязи и компенсируемости.
н
НАДЕЖДЫ ИНДЕКС (Hope Index) —
опросник личностный, предназначен для диагностики мотивационной сферы личности, ее отношения к будущему. Разработан С. Стаатс и М. Стассен в 1986 г.
Стимульный материал представляет собой бланк с перечнем 16 наиболее распространенных желаний, которые были выявлены в ходе предварительных опросов. Испытуемый должен оценить в 6-балльной Лайкерта шкале и указать в баллах от 0 до 5: 1) насколько он хочет осуществления каждого желания (от 0 — «совсем не хочу» до 5 — «хочу очень сильно*»); 2) какова вероятность осуществления каждого желания (от 0—«очень низкая» до 5 — «очень высокая*). Испытуемый может добавить к списку 1 -2 желания.
Общий показатель надежды представляет собой сумму баллов «желания», умноженных на количество баллов «ожидания» по каждому пункту. Шкала надежды имеет субшкалы «надежды-для-себя» (напр., иметьхорошее здоровье), «надежды -для-других» (напр., «иметь больше друзей», «понимание в семье»), «надежды-для-всех» (напр., «мир во всем мире»); по другому основанию деления — субшкалы «желание» и «ожидание».
Надежда, диагностируемая по Н. и.,
определяется как результат взаимодействия желаемого и ожидаемого (С. Стаатс, М. Стассен, 1986). При этом с помощью Н. и. диагностируются в первую очередь когнитивные аспекты надежды (см. Ожидаемого баланса шкала). Теоретической основой методики является концепция триады «я—другие—мир» А. Бека (1967), описывающая взаимодействие человека с окружающим миром.
Надежность ретестовая Н. и. при обследовании 112 испытуемых-студентов с интервалом 9 недель составила rt= 0,62-0,74; внутренняя согласованность (при обследовании 130 испытуемых студентов) — 0,72-0,85. Н. и. обладает достаточно высокой валидностью.
Сведений об использовании в СНГ не имеется.
НАДЕЖНОСТИ КОЭФФИЦИЕНТЫ — статистические показатели надежности психологического теста.
При оценке надёжности наиболее часто применяются различные виды корреляционного анализа. В качестве Н. к. при характеристике надежности ретес-товой используются коэффициенты корреляции результатов первичного и по-
вторного обследования, при оценке надежности параллельных форм. — коэффициент корреляции результатов, полученных с помощью разных форм теста (см. Параллельные формы теста).
При оценке надежности частей теста находят применение специальные коэффициенты, полученные на основе урав-нений Кьюдера—Ричардсона, Спирме-на—Брауна. Распространенным методом анализа надежности является расчет коэффициента «альфа». При характеристике надежности факторно-дисперсионной используются специальные методы дисперсионного анализа.
Н. к., определенные на основе разных подходов, нередко существенно отличаются по своим эмпирическим значениям. Между разными моделями определения надежности могут отмечаться противоречия (см. Надежность по внутренней согласованности). Имеется ряд сложностей количественной характеристики надежности, аналогично проблемам, возникающим при анализе содержания ва-лидности коэффициентов.
Несмотря на то что количественные характеристики надежности в виде традиционного Н. к. более распространены в практике психодиагностики, нежели количественные коэффициенты при оценке валидности, о надежности теста следует (как и в случае валидности) судить на основании изучения разных аспектов. При интерпретации Н. к. обязателен учет закономерностей разных подходов к определению надежности н психологический анализ показателей проверяемого на надежность теста.
НАДЕЖНОСТЬ — характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. Н. и валидность являются важнейшими ха-
рактеристиками методики как инструмента психодиагностического исследования.
Результат психологического исследования обычно подвержен влиянию большого количества неучитываемых факторов (напр., эмоциональное состояние или утомление, если они не входят в круг исследуемых характеристик, освещенность, температура и другие особенности помещения, в котором проводится исследование, уровень мотивированности испытуемых на обследование и др.). Любое изменение ситуации исследования усиливает влияние одних и ослабляет воздействие других факторов на результат теста.
Общий разброс (дисперсию) результатов тестового обследования можно, таким образом, представить как результат влияния двух групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измерительной процедуры.
В самом широком смысле Н. теста — это характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным ошибкам.
В более узком, методическом, смысле под Н. понимают степень согласованности результатов теста, получаемых при первичном и вторичном его применении, у одних и тех же испытуемых в различные моменты времени, с использованием разных (но сопоставимых по характеру) наборов тестовых заданий или при других изменениях условий обследования.
Распределение оценок испытуемых при выполнении теста, измеряющего одно качество, в идеальном случае совпадает с нормальным распределением, и дисперсия при этом будет «истинной» (т. е. отражающей вариативность только измеряемого признака). Каждый испытуемый занимает определенное место по оценкам
теста, и теоретически это место для каждого члена выборки постоянно. В рассматриваемом случае повторное выполнение теста теми же лицами должно давать распределение мест на шкале оценок, идентичное первому. Тогда методика точна и максимально надежна. Реальные оценки и ранговые места испытуемых при повторном обследовании изменяются, и их распределение в той или иной степени отличается от исходного. При этом дисперсия нового распределения выше исходного на величину дисперсии ошибки измерения. Сказанное можно выразить формулой, описывающей Н. теста как отношение «истинной» и реальной (эмпирической) дисперсии:
5? а = |г.
или
Величина ошибки измерения обратно пропорциональна показателям точности измерения (чем шире доверительный интервал, внутри которого возможно появление истинного результата у данного ис-
На практике в большинстве применяемых методик редко удается получить значения коэффициентов Н., превышающие 0,7-0,8. При rtпорядка 0,8 относительная доля стандартной ошибки (см. Ошибка измерения) составляет ^1 - 0,8 = 0,45, а эмпирическое значение отклонения тестового балла от среднего оказывается завышенным. Для коррекции эмпирического значения в практических исследованиях применяется формула:
xt = rlxi+x(\rt),
где xt— истинное значение тестового балла, xi— эмпирический балл испытуемого, г( — коэффициент ■ надежности, х — среднее значение оценок по тесту.
Напр., у испытуемого при обследовании по шкале Векслера (см. Векслера интеллекта измерения шкалы) оценка вербального интеллектуального показателя составила 107 баллов. Среднее значение" х для шкалы составляет 100, а надежность г{— 0,89. При этом истинное значение х, = 0,89 ■ 107 + 0,11 ■ 100 - 106,2.
Разновидностей характеристик Н. теста так же много, как условий, влияющих на его результаты. Наиболее широкое практическое применение находят несколько типов характеристик Н.: надежность ре-тестовая, надежность параллельных форм, надежность частей теста.
Подчеркивается, Что ни одна из существующих процедур не является идеальной с т. з. Н. Свойства Н. могут существенно изменяться при незначительных, на первый взгляд, изменениях условий проведения обследования, изменении ха-
рактера заданий, они значительно варьи* руют в зависимости от степени сложности или трудности конкретных заданий для испытуемого. Стандартный набор сведений о психодиагностических методах обычно включает характеристики Н., относящиеся к комплексу приведенных выше типов и процедур определения.
На характеристики Н., определяемые эмпирическим путем, существенно влияет характер исследуемой выборки. Особое значение здесь имеет диапазон различий в оценках и соответственно в ранговых местах отдельных испытуемых и их групп в выборке определения Н. Так, если оценки обследуемых концентрируются в узком диапазоне значений и близки друг другу, следует ожидать, что при повторном обследовании оценки также расположатся в тесной гомогенной группе. Возможные изменения ранговых мест будут внешне незначительны, и в таком случае коэффициент Н. будет завышен. Такое же неоправданное завышение коэффициента может возникнуть при анализе Н. на материале выборки, включающей контрастные группы лиц, напр, имеющих самые высокие н самые низкие оценки по тесту. Тогда эти далеко отстоящие оценки заведомо не будут перекрываться под воздействием случайных причин.
В практике психодиагностики при разработке руководств и методик обычно указывается характер групп, на которых проводилось определение Н. Коэффициенты Н. нередко рассчитываются для конкретных контингентов испытуемых, различающихся по полу, возрасту, уровню образования, профессиональной подготовке. Нередко производят расчет Н. раздельно для групп испытуемых, получивших по тесту высокий или низкий результат (см. Станфорд—Бине умственного развития шкала).
Важнейшим средством повышения Н. психодиагностических методик является
стандартизация процедуры обследования. При строгой регламентации процедуры обследования (обстановка и условия работы испытуемого, характер инструкции, временные ограничения, способы и особенности контакта с испытуемым, порядок предъявления элементов методики, получения оценок первичных и т. д.) существенно уменьшается дисперсия ошибки и повышается Н. теста.
Если исходить из широкого понимания Н. как отражения в результате исследования удельного веса измеряемого параметра и совокупности посторонних факторов, то можно усмотреть определенную связь Н. с другой важнейшей комплексной характеристикой психодиагностической методики — валидностью.
Н. — устойчивость процедуры относительно объектов исследования. Валид-ность — однозначность, устойчивость относительно измеряемых свойств объекта (т. е. предмета измерения). Устойчивость теста относительно объектов (испытуемых) является необходимым, но не достаточным условием его устойчивости относительно измеряемых свойств объектов. Следовательно, Н. является необходимым, но не достаточным условием валид-ности. Это означает, что валидность теста не может качественно и количественно превышать Н. Данное соотношение нельзя, однако, трактовать как указание на прямую пропорциональную связь характеристик валидности и Н. Повышение Н. отнюдь не сопровождается обязательным повышением валидности. Напр., у теста-опросника из одного вопроса внутренняя согласованность предельна, однако валидность у него минимальна.
|
|
|