|
Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
ДИСКРИМИНАЦИИ ФОРМ ТЕСТ —
тест специальных способностей. Предназначен для оценки дискриминативной перцепции геометрических образов, качеств внимания. Относится к невербальным тестам. Разработан Й. Шванцарой в 1956 г/В значительной степени продолжает линию ранних функциональных проб (см. Корректурная проба).
Материал теста состоит из 1250 геометрических фигур, размещенных на листе белой бумаги формата А4 по 50 в строке. Типов фигур пять, однако размещены они по-разному (развернуты в стороны, вверх или вниз) в случайном порядке (рис. 24). Задача испытуемого — отыскивать и вычеркивать указанную экспериментатором фигуру. Перед началом обследования проводится тренировка. По указанию экспериментатора испытуемый отмечает место на бланке, соответствующее количеству проделанной за истекшее время работы.
Автор рекомендует Д. ф. т. для обследования лиц в возрасте 9-18 лет. При оценивании фиксируется: время выполнения всего задания; количество пропущенных знаков; количество неправильных зачеркиваний; количество исправлений. Полученные данные (раздельно по скорости и точности решения) переводятся в шкалу стэнов (см. Оценки шкальные). Наряду с возрастной дифференциацией, введены раздельные нормы для мальчиков и девочек.
Надежность Д. ф. т. устанавливалась методом ретеста на трех различных по
Рис. 24. Образцы геометрических фигур теста дискриминации форм
возрасту и полу выборках. Благодаря выраженному воздействию эффекта обучения, при повторном обследовании коэффициенты надежности оказались малоудовлетворительными (0,402-0,693). Коэффициенты корреляции между параметрами теста (скоростью и точностью) и успеваемостью в школе не достигают уровня статистической значимости. При сопоставлении Д. ф. т. со Станфорд— Вине шкалой умственного развития оказалось, что параметр скорости не имеет связи с интеллектуальными показателями; обнаруживается связь на уровне г 0,43-0,40 с критерием точности выполнения теста. Методика допускает как групповое, так и индивидуальное обследование.
Д. ф. т. рекомендуется в исследованиях профессиональной пригодности, для оценки переносимости монотонной деятельности, в психофармакологических исследованиях, консультативной и
клинической практике, при нарушениях внимания и др. (В. Черны, Т. Колларик, 1988).
Данные об использовании в СНГ отсутствуют.
ДИСПЕРСИОННЫЙ АНАЛИЗ — ана
литико-статистический метод изучения влияния отдельных переменных, а также их сочетаний на изменчивость изучаемого признака.
Метод основан на разложении общей дисперсии на составляющие компоненты, сравнивая которые можно определить долю общей вариации изучаемого (результирующего) признака, обусловленную действием на него как регулируемых, так и неучтенных в опыте факторов. По характеру решаемых задач к Д. а. наиболее близок регрессионный анализ.
При осуществлении Д. а. результаты наблюдений группируются с учетом градаций каждого учитываемого фактора (возраста, уровня образования, отдельных психологических особенностей и т. д.). Если учитываемый фактор оказывает влияние на признак, средние результирующего признака изменяются в соответствии с градациями фактора. Внутри каждой такой группы обнаруживается своя дисперсия, связанная с действиями других факторов. Суммарная дисперсия может быть выражена уравнением
где Dy— сумма квадратов отклонении отдельных вариант (jc(-) всего комплекса наблюдений от общей средней (х), или Z(xi х)2, Dx— сумма квадратов отклонений в комплексах (группах) частного среднего (xt) от общей средней, умноженная на число вариант в группах, или л£( х{ - х)2, Ог — сумма из сумм квадратов отклонений отдельных вариант от их групповых средних, или Tl[T.(xi'xi) \-
Путем соотнесения сумм квадратов отклонений к числу степеней свободы (df) получают выборочные дисперсии:
а) общую по комплексу
52
Отношение -j| служит критерием
оценки влияния на признак регулируемых в опыте факторов (F-критерий Фишера). Дальнейший анализ проводится путем проверки нуль-гипотезы, сводящейся к предположению о равенстве межгрупповых средних и дисперсий {т. е. никакого систематического действия факторов на результативный признак нет, наблюдаемые различия в групповых средних случайны). Нулевая гипотеза отвергается при F£ FKp, значение FKp определяется по статистическим таблицам с учетом принятого уровня значимости и числа степеней свободы (dfxи dfz).
После доказательства действия регулируемого фактора на результирующий признак переходят, если необходимо, к сравнению групповых средних друг с другом или другими показателями. Заключительный этап Д. а. — оценка силы влияния отдельных факторов (или их групп) на результирующий признак.
Таким образом, Д. а. позволяет учитывать не только влияние каждого фактора на результирующий признак по отдельности, но и совместное действие факторов
во всех возможных сочетаниях. Действие неучтенных факторов оценивается не дифференцированно, а суммарно.
Д. а. допускает статистическое исследование признаков, выраженных не только в абсолютных количественных единицах, но и в относительных или условных баллах и индексах.
ДИСТРАКТОРЫ (от англ. distract — отвлечение внимания) — варианты ответов в заданиях с выбором (см. Задачи закрытого типа), не являющиеся правильными решениями, но внешне близкие к правильному решению.
В качестве примера Д. можно привести задания следующего типа: — Телевизор так относится к микроскопу, как телефон к... В этом задании необходимо выбрать правильный вариант окончания суждения из следующих: а) усилителю; б) микропроцессору; в) осциллографу; г) микрофону; д) громкоговорителю. Для правильного решения испытуемый должен понять, что содержанием аналогии является применение устройства для усиления сигнала. Следовательно, правильным решением будет «а». Как видно, Д. подобраны с подвохом, все они связаны с техническим оборудованием, и испытуемый, обнаруживший неверную связь, выберет, вероятно, микрофон. Если в приведенном задании использовалось бы другое вменю» ответов (например, а) усилителю, б) отвертке, в) паяльнику, г) микросхеме, д) диоду), то такие ответы не являлись бы Д. в строгом понимании, т. к. они подсказывают испытуемому верное решение.
Подбор адекватных Д. является неотъемлемой частью процедуры разработки надежного и валидного теста, составленного на материале заданий с выбором. Д., как правило, выявляются эмпирически. Так, может быть проведено исследование в специально подобранной выборке испы-
туемых. При этом используются задания, основанные на формулировках будущего теста, однако предъявляемые в виде заданий открытого типа. Полученные таким образом варианты неправильных решений могут быть использованы в качестве Д.
После подбора Д. необходимо провести дополнительную проверку адекватности разработанного «меню». При этом обращается внимание на действенность Д. При использовании Д.; слишком близких к правильным ответам, надежность и валидность теста может быть существенно снижена. Д. становится практически неотличимым от правильного решения. Напр.: — Расстояние от Киева до Житомира
составляет: а) 140 км, б) 137 км,
в) 135 км, г) 830 км, д) 1020 км.
Использование неадекватных Д/ искусственно ухудшает результаты тестирования, т. к. испытуемые будут введены в заблуждение. При этом в наибольшей степени пострадает наиболее «сильная» по исследуемым показателям часть испытуемых.
Анализ адекватности Д. должен быть дополнен исследованием дискримина-тивности заданий теста и трудности заданий теста.
ДИФФЕРЕНЦИАЛЬНО-ДИАГНОСТИЧЕСКАЯ МЕТОДИКА (The Differential Diagnostic Technique, DDT) — проективная методика исследования личности. Рассматривается как визуально-моторный проективный тест. Предложена О. Вейнингером в 1986 г.
Задача испытуемого — последовательное копирование 14 фигур, которые ему предъявляют на стимульных картах. Визуальная запись того, как испытуемый копирует стимульные фигуры, и оценивание его рисунков безотносительно к тому, как он реально вел себя во время тестирова-
ния, репрезентирует, по мнению автора, тип организации «эго» и уровни его функционирования. Интерпретация основывается на выявлении способа, каким испытуемый контролирует свои действия по отношению к стимульным картам.
Автор приводит данные о достаточно высокой надежности и валидности Д.-д. м. Существуют варианты для взрослых и детей. Сообщается, что результаты последних исследований (1989) позволяют сделать вывод о раскрытии с помощью этой методики связи между силой «эго» и некоторыми личностными характеристиками, что важно для лечения беспокойных подростков, развития зрелой ответственности и гармонизации личности ребенка, для развития у детей эмпатичес-кого поведения.
Сведений об использовании в СНГ нет.
«ДОМ—ДЕРЕВО—ЧЕЛОВЕК» ТЕСТ
(House—Tree—Person Test, H—T—P) — проективная методика исследования личности. Предложена Дж. Буком в 1948 г. Тест предназначен для обследования как взрослых, так и детей, возможно групповое обследование.
Обследуемому предлагают нарисовать дом, дерево и человека. Затем проводят детально разработанный опрос. Выбор предметов для рисования автор обосновывает тем, что они знакомы каждому обследуемому, наиболее удобны как объекты для рисования и, наконец, стимулируют более свободные словесные высказывания, нежели другие объекты.
По мнению Дж. Бука, каждый рисунок — это своеобразный автопортрет, детали которого имеют личностное значение.
По рисунку можно судить об аффективной сфере личности, ее потребностях, уровне психосексуального развития и т. д. Помимо использования «Д.—д.—ч.» т. в качестве проективной методики автор де-
монстрирует возможность теста определять уровень интеллектуального развития (коэффициент корреляции ранговой с тестами интеллекта составляет 0,41 — .0,75). Это согласуется с давними традициями диагностики уровня интеллекта с помощью рисунка (см. Гудинаф «Нарисуй человека» тест). Зарубежные исследователи заявляют о необходимости дополнительного изучения валидности «д.—д.—ч.»т. как инструмента измерения интеллекта и личностных особенностей. Широкого распространения в психодиагностических исследованиях «д.—д.—ч.» т. не получил.
Тест используется в СНГ, включен в методику Керна—Йирасека (Рабочая..., 1991).
ДОМИНО-ТЕСТ (D-48) — тест интеллекта, создан А. Энстеем в 1943 г. и предназначен для измерения невербальных интеллектуальных способностей у лиц старше 12 лет.
Д.-т. состоит из 44 основных заданий и 4 примеров. Задания расположены в порядке возрастающей трудности, установленной при конструировании методики (см. Трудность заданий теста). Основным элементом всех тестовых заданий является изображение фишек домино, расположенных в соответствии с различными закономерностями (рис. 25, 26). Одна из фишек (последняя в ряду) «пустая» и обозначается пунктирным контуром. Количество фишек в заданиях различно (от 4 до 14) и возрастает по мере перехода от задания к заданию. Испытуемый должен выявить принцип, согласно которому выстроены фишки, и определить ту фишку, которую следует поставить на место, обозначенное пунктиром. Несмотря на то что во всех заданиях используется один и тот же стимульный материал, принципы решения весьма разнообразны. Выполнение
Д.-т. не требует математических знаний или арифметических способностей, хотя испытуемый и работает с числами. Первые четыре задания используются как тренировочные. Перед началом работы испытуемого ставят в известность о временной регламентации работы. Общее время выполнения теста — 25 мин. За десять минут до окончания работы испытуемого предупреждают об оставшемся в его распоряжении времени. Каждый правильный ответ оценивается в 1 балл. Максимальная оценка — 44 балла. Оценки первичные переводятся в процентили или /(р-показатели (см. Оценки шкальные).
Рис.25. Задания №39, 40 основного набора Домино-теста А. Энстен
Исследования показывают, что этот тест практический высоко насыщен фактором Gи считается одним из наиболее «чистых» по отношению к из-
Рис. 26. Образцы заданий Домино-теста А. Энстея
мерению этого фактора. Результаты факторного анализа указывают на то, что показатели D-48 преимущественно связаны со способностями текучими. Знания и опыт, приобретенные индивидом, или способности кристаллизованные, влияют на результаты в меньшей степени (В, Миглиерини, 1982). Методика обладает всеми преимуществами невербальных тестов (см. Равена прогрессивные матрицы).
Д.-т. отличается высокой надежностью. Так, коэффициент надежности частей теста, полученный методом расщепления на две части, составил в различных выборках г = 0,781-0,818. Коэффициент надежности, рассчитанный по формуле Кью дер а—Ричардсона, г = 0,771-0,867. Коэффициент надежности ретестовой г( = 0,758'. Дискримина-тивность заданий теста при сопоставлении 27% выборок испытуемых с низкими и высокими результатами составила rph. = 0,74. Индекс внутренней согласованности г=0,36. Получены данные о валидности конструктной на основании сопоставления D-48 с наиболее распространенными невербальными тестами общих способностей (г = 0,68-0,80), высока связь результатов D-48 и с батареями тестовыми, ориентированными на измерение общих факторов интеллекта (В. Миглиерини, 1982). При анализе валидности критериальной путем сопос-
тавления результатов теста с критериями успеваемости школьников коэффициенты валидности в разных выборках распределялись в пределах г = 0,31-0,80.
Нормы, определенные для французской и чешской выборок, оказались очень близкими, что свидетельствует об относительной устойчивости D-48 к межэтническим факторам. Также не было статистически значимых различий в выполнении теста мужчинами и женщинами (В. Черны, Т.Колларик, 1988). В первые годы после разработки тест использовался только в армии, позднее стал применяться и для гражданского населения, были существенно расширены возрастные границы применения. Сегодня Д.-т. применяется в области профессионального консультирования, школьной психодиагностики. Эффективно объединение D-48 в батарее с тестами вербальными. В отечественной практике D-48 нашел применение в клинической психодиагностике (В. М. Блейхер, И.В.Крук, 1986).
ДОСТОВЕРНОСТЬ РАЗЛИЧИЯ (сходства) — аналитико-статистическая процедура установления уровня значимости различий или сходств между выборками по изучаемым показателям (переменным). Анализ Д. р. имеет практическое значение при оценке статистической значимости разности выборочных средних величин в сопоставляемых распределениях.
Этот случай весьма распространен в эмпирических исследованиях. Предположим, перед психодиагностическим исследованием стоит задача проверки валидно-сти текущей (диагностической) разрабатываемого теста методом контрастных групп. Если проверяемая методика является, к примеру, тестом общих способностей, валидизация может базироваться, в частности, на оценке степени устойчийо-сти различий в тестовых оценках у детей со слабой и хорошей школьной успеваемостью. После проведения тестирования той и другой группы необходимо получить подтверждение истинности (а не случайности, напр, за счет ошибки измерений) выявленных различий в средних оценках по тесту в сравниваемых выборках.
При проверке нулевой гипотезы о случайности (неслучайности)сходства(различия), в сущности, используется оценка вероятности совместного перекрытия (или не перекрытия) доверительных интервалов, в которые с определенной, наперед заданной вероятностью могут попадать переменные в сопоставляемых выборках.
При оценке статистической значимости разности выборочных средних арифметических двух распределений первичных величин применяется (-критерий Стью-дента, эмпирическое значение которого вычисляется в этом случае по формуле:
Разность средних считается статистически значимой, если t > tKpдля доверительной вероятности а = 0,05 (см. Уровень значимости). Нулевая гипотеза о сходстве принимается при tй /кр (ее = 0,05) и отклоняется при t> / (а = 0,01). Критическое значение критерия Стьюдента (*кр) для каждой выборки определяется по таблицам (см. Приложение III, табл. 2) с учетом ее объема и числа степеней свободы (п1).
Значения /кр в таблице представлены для трех порогов доверительной вероятности ('а = 0,05; 0,01; 0,001).
Предположим, в сопоставляемых контрастных группах учащихся получены следующие данные: Мх = 108,1; тх = 10,44; Л12=89,2; т2-9,07; число обследованных в первой выборке 106, во второй — 94 (л' = 106 + 94 - 2 = 198). Эмпирическое значение /-критерия
Критическое значение по таблице — 1,97 (для а = 0,05); при / < tKp, гипотеза о различии результатов в сравниваемых группах отвергается.
Приведенный критерий используется и для оценки долей выборки (в тех случаях, когда доли находятся в пределах 0,2 < Р < 0,8); /-критерий для этого случая принимает вид:
определяют с учетом числа объектов (А) с измеряемым признаком и объема выборки (п):
Дальнейшая процедура аналогична приведенному выше случаю со средними значениями выборок.
|
|
|