Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
ОШИБКА ИЗМЕРЕНИЯ — статистический показатель, характеризующий степень точности отдельных измерений. <-. При проведении эмпирических психологических исследований в различных сериях эксперимента редко наблюдается полное соответствие значений измеряемых параметров даже в выборке, состоящей из одних и тех же испытуемых. Обычно значение переменной в идентичных измерениях флуктуирует в определенном диапазоне. Напр., многократно проводя тест общих способностей с одним и тем же ребенком, можно обнаружить, что оценки варьируют в определенном интервале, предположим, 108-115 баллов. Аналогичным образом при повторении обследования одной или нескольких выборок определяемые средние значения также распределятся в каком-то интервале значений на осиХ. Таблица 20 Распределение ошибки измерений общего показателя теста Векслера Колебания результатов измерений в определенном интервале значений могут быть связаны с систематическими и случайными факторами. К причинам систематических ошибок можно отнести какое-либо отклонение от стандартного проведения теста, неточность в процедуре обработки эмпирической информации (напр., технические ошибки в «ключе»), применение методики вне пределов ее валидности по возрастному критерию. В этих случаях результаты измерений отличаются от истинных на более или менее постоянную величину. Случайные ошибки возникают по самым разнообразным объективным и субъективным причинам. Их величина в основном и характеризует точность метода. При большом количестве повторных наблюдений индивидуальные оценки или средние величины образуют свой тип распределения, статистические показатели которого и отражают О. и., полученные при использовании данного метода. О. и. характеризуется величиной квад-ратической ошибки, связанной с дисперсией распределения отдельных измере- ний. Благодаря случайным ошибкам, зависящим от большого количества различных факторов, распределение эмпирических ошибок и средних оценок при повторных наблюдениях подчиняется нормальному закону. Исходя из основных свойств нормального распределения, можно считать, что 68% измерений попадут в интервал ± 1а, около 95% — в интервал ± 2а и 99% — в пределы ± 2,58а распределения оценок повторяющихся наблюдений. Таким образом, для того чтобы установить, в каких пределах с заданной вероятностью будет находиться «истинная» оценка, необходимо определить стандартное отклонение такого распределения. В табл. 20 приведены данные 10-кратного обследования испытуемого с помощью теста общих способностей. Полученная в этом случае величина стандартного отклонения результата Sx = 3. Следовательно, с вероятностью Р = 0,05 (95% случаев) можно ожидать, что «истинное» значение величины определяемого показателя попадает в интервал значений 100 ± 6 баллов, что составляет 94-106 баллов по шкале данной методики. Показатели О. и. имеют большое значение при оценке надежности методики.. Надежность теста можно выразить в виде стандартной О. и. (ат), называемой также стандартной ошибкой показателя. При интерпретации индивидуальных показателей эта мера более полезна, чем коэффициент надежности (г,). Исходя из коэффициента надежности, стандартная О. и. определяется по формуле: где Sx— стандартное "отклонение результатов теста в выборке, rt— коэффициент надежности. Стандартная О. и. и коэффициент надежности — взаимосвязанные способы выражения надежности. При этом О. и. не зависит от однородности выборки. Важным аспектом применения критерия О. и. в психодиагностике являются анализ и интерпретация различий между результатами теста. Представление результатов в виде интервальных вероятностных значений предотвращает их ошибочное толкование как отражения реальной динамики измеряемого свойства у испытуемого, а также необоснованность констатации различий между средними показателями в сопоставляемых выборках (см. Достоверность различий, Критерий Хг) при сравнении результатов нескольких обследуемых или группы тестовых оценок у одного испытуемого. В последнем случае при сопоставлении разных тестовых оценок, зная стандартные ошибки показателей для одного и другого теста (или субтестов), стандартную ошибку различий (стд) можно определить следующим образом: где Sx— стандартное отклонение, одинаковое для двух тестов, поскольку перед сопоставлением оценок они переводятся в одну и ту же шкалу (см. Стандартизация, Оценки шкальные). Предположим, необходимо удостовериться, существует ли у испытуемого различие по оценкам вербальных и практических субтестов шкалы. Для Векслера интеллекта измерения шкалы г. вербальных субтестов составляет 0,96, практических — 0,93, значение стандартного отклонения для той и другой шкалы — 15. Тогда Таким образом, для установления различий между оценками с доверительной вероятностью примерно 68% необходимо, чтобы разность в оценках по названным шкалам не превышала 5 баллов. При доверительной вероятности Р - 0,05 значение Од удваивается, приближаясь к 10 баллам. п ПАЛЬЦЕМ ОКРАШИВАНИЯ ТЕСТ (Finger Painting Test) — проективная методика исследования личности. Описана Р. Шоу в 1932 г., в дальнейшем разрабатывалась П. Наполи как личностная методика (1946, 1951). Обследуемому предлагают влажный лист бумаги и набор красок. Рисунок выполняется пальцем, который окунается в краску. После завершения рисунка просят рассказать о том, что получилось. Рекомендуется составить серию таких «картин», созданных одним и тем же лицом за сравнительно длительный период. Счи-, тается, что в силу слабой структурированности тестовой ситуации создаются наиболее благоприятные условия для самовыражения. Это сближает П. о. т. с методикой свободных ассоциаций (см. Ассоциации словесной тест). Интерпретация основана на учете следующих основных показателей: особенности моторных реакций, предпочтение определенных красок, формальные и символические характеристики рисунка, высказывания обследуемого. П. о. т. может быть использован как при индивидуальном, так и групповом обследовании. Данные о валидности и надежности П. о. т. отсутствуют. Сведений об использовании в теста СНГ нет. улп ПАРАЛЛЕЛЬНАЯ ФОРМА ТЕСТА — вариант теста, близкий его основной форме по критериям валидности, надежности и другим характеристикам и способный его заменить. Разработка нескольких модификаций одного и того же теста, различающихся по конкретному содержанию набора пунктов (заданий), имеет целью повышение достоверности повторного тестирования одних и тех же испытуемых спустя непродолжительное время. Предположим, необходимо выявить характер психофармакологического воздействия препарата на эмоциональную сферу пациента. Для этого до приема лекарства ему предлагают ответить на вопросы методики оценки эмоционального состояния. Через некоторое время после начала действия препарата процедура обследования повторяется. При повторном применении одних и тех же вопросов создается опасность того, что испытуемый отразит в своих ответах не текущее состояние, а будет стремиться припомнить, что он отвечал на те же пункты при первом обсл-едовании. Это приведет к значительному искажению результатов исследования, что выражается также и в резком сокращении времени выполнения. Применение П. ф. т. позволяет в значительной степени снять воздействие перечисленных посторонних факторов. Использование П. ф. т. является средством определения надежности методики по типу взаимозаменяемых форм. При характеристике этого показателя надежности одни и те же испытуемые проходят обследование с помощью основной и сравнимой форм теста. Корреляция между результатами, полученными в двух обследованиях, служит показателем надежности теста, отражая устойчивость результатов относительно различных случайных влияний. Несмотря на то что П. ф. т. подбираются таким образом, чтобы максимально соответствовать друг другу по основным характеристикам, варианты теста не всегда могут давать одинаковые средние показатели и стандартное отклонение. Однако обязательным требованием к П. ф. т. является возможность приведения одних показателей к другим с помощью специальных коэффициентов или таблиц эквивалентности. П. ф. т. следует отличать от уравновешенных форм, состоящих из заданий, попарно уравновешенных по структуре и содержанию, и эквивалентных форм, не уравновешенных, но тем не менее дающих результаты, обладающие весьма близкими статистическими характеристиками. Общее наименование упомянутых серий — сопоставимые формы. В американской литературе применяются иные названия отдельных разновидностей сопоставимых форм: коррелированные (correlated), дублированные (duplicated), равные (equal) и подобные (similar). Наличие П. ф. т. — важное качество теста, создающее ощутимые удобства при его практическом использовании. Вместе с тем имеется определенный круг методик, не нуждающихся в наличии таких форм. К их числу относятся большие по объему заданий тесты, в ходе повторного выполнения которых малозаметно влияние навыка или характера предыдущего выполнения (см. Миннесоте кий многоаспектный личностный опросник). Допускается повторное применение спустя непродолжительное время одних и тех же заданий в методиках с большим количеством относительно простых операций (напр., корректурная проба). Однако для повышения достоверности результатов таких повторных проб желательно принять некоторые меры. Так, до основного исследования целесообразно сформулировать путем тренировок устойчивый навык работы с тестом. Когда он достигает определенного фиксированного уровня, разница в показателях между «фоновым* и измеренным в условиях эксперимента результатами будет с высокой степенью вероятности определяться исследуемой переменной. Распространенным способом повышения достоверности результатов повторного обследования с использованием методик, не имеющих П. ф. т., является расщепление совокупности пунктов на четные и нечетные задания (см. Надежность частей теста). При этом следует помнить, что надежность и внутренняя согласованность каждой из половин теста уменьшаются по сравнению с методикой в целом. При невозможности применения П. ф. т. или метода расщепления в некоторых случаях допустимо повторное использование одного и того же теста. При этом следует иметь в виду, что увеличение промежутка ретеста уменьшает возможность появления ошибочных результатов. В инструкциях к некоторым методикам указывается минимально возможный временной интервал для повторного обследования с использованием одинакового тестового материала. ПАТОХАРАКТЕРОЛОГИЧЕСКИЙ ДИАГНОСТИЧЕСКИЙ ОПРОСНИК (ПДО) — опросник личностный. Предназначен для определения типов акцентуации характера и вариантов конституциональной психопатии, психопатических развитии и органических психопатий в подростковом и юношеском возрасте (14-18 лет). Является реализацией типологического подхода к исследованию личности. Предложен А. Е. Личко в 1970 г. П. д. о. неоднократно пересматривался с целью усовершенствования; последние данные об основных шкалах опубликованы в 1983 г. Опросник состоит из 25 наборов фраз-утверждений, отражающих отношение разных патохарактерологических типов к ряду жизненных проблем («самочувствие», «настроение», «сексуальные проблемы», «отношение к родителям» и т. д.). В каждом наборе содержится 10-19 пронумерованных утверждений. Напр., в набор «самочувствие» входят следующие пункты: — У меня почти всегда плохое самочувствие (1) — Я всегда себя чувствую бодрым и полным сил (11) — Я очень плохо переношу боль и физические страдания и очень их боюсь (12) Обследование проводят в два этапа. Первоначально обследуемому предлагают в каждом наборе утверждений выбрать наиболее подходящее для него и соответствующий номер внести в регистрационный лист. На втором этапе из тех же наборов просят отобрать наиболее неподходящее, отвергаемое утверждение и также отметить его номер. Количество выборов в первом и втором случае не должно быть более трех. Разрешается отказаться от выбора («О» в регистрационном листе). Семь и более отказов по двум этапам — показатель трудности работы с опросником в силу невысокого интеллекта или негативного отношения к обследованию. Полученные результаты оценивают по двум шкалам: объективной и субъективной оценок. Шкала объективной оценки сконструирована на основе сопоставления средних частот выборов здоровыми подростками и представителями каждого из типов психо- патий акцентуаций (подробнее об акцентуации см. Шмишека опросник), а также сопоставления частоты выборов каждым из типов психопатий и акцентуаций со всеми остальными и между собой. С помощью объективной шкалы могут быть диагностированы следующие типы психопатий и акцентуаций характера: гипертим-ный; циклоидный; лабильный; астенонев-ротический; сенситивный; психастенический; шизоидный; эпилептоидный; истеро-идный; неустойчивый; конформный. А. Е. Личко помимо названных выделяет смешанные типы, достаточно часто встречающиеся при акцентуациях характера и психопатиях. Они двояки по своей природе и определяются автором как: а) промежуточные типы, в которых сочетания обусловлены эндогенно; б) амальгамные — формирующиеся в течение жизни вследствие напластования черт одного типа на эндогенное ядро другого в условиях длительного воздействия каких-либо неблагоприятных факторов. Помимо диагностики типов психопатий и акцентуаций характера объективная шкала П. д. о. дает возможность получения дополнительных диагностических показателей. К ним относятся: I) показатели диссимуляции откровенности, позволяющие оценить достоверность результатов (см. Шкалы контрольные); 2) индекс В (brain minimal damage), указывающий возможность изменений характера вследствие резидуального органического поражения головного мозга; 3) показатель отражения реакции эмансипации — стремление освободиться от контроля, оценки старших; 4) показатель психологической склонности к алкоголизации; 5) показатель психологической склонности к делинквентности, т. е. проступкам, правонарушениям; 6) показатель мужественности—женственности, позволяющий судить о преобладании тех или иных качеств в общей системе личностных от- ношений (см. Миннесотский многоаспектный личностный опросник). Шкала субъективных оценок предназначена для выяснения того, каким видит свой характер сам обследуемый (или каким хочет его представить). На основе полученных данных можно сделать вывод о правильности самооценки. А. Е. Личко указывает на то, что совпадение результатов по этой шкале с клинической характеристикой типа, т. е. правильная самооценка, зависит как от степени пси-хопатизации, так и от типа характера. С помощью шкалы субъективной оценки могут быть также выделены черты достоверно отвергаемых типов. Теоретической основой П. д. о. является, как отмечает автор, опыт психиатрии клинико-нозологического направления и концепция психологии отношений. Наборы фраз-утверждений составлялись на основе описаний патологических типов характера и акцентуации характера, представленных в трудах известных психиатров (Э. Крепелин, Э. Кречмер, П. Б. Ган-нушкин, К. Леонгард и др.), а принцип отношения к личностным проблемам (А. Ф. Лазурский, В. Н.Мясищев) рассматривается как наиболее плодотворный для распознания типов характера. Принцип построения П. д. о., в соответствии с которым допускается переход от клинических типов психопатии к анализу «вариантов нормы» (перенос данных патологии на истолкование нормы), неоднократно критиковался в советской психологии, т. к. за ним скрыто представление о характере как конституционально запрограммированной статичной структуре (С. Я. Рубинштейн, 1979). Дискуссионным является и использование понятия «характер» в качестве психологической реальности, на диагностику которой направлен П. д. о. (см. Опросники личностные). Стандартизация П. д. о. проводилась на материале обследования 2258 здоровых подростков и 650 подростков с пси- хопатиями и акцентуациями характера разных типов, госпитализированных в психиатрические больницы или наблюдавшихся в психоневрологических дис-пансерах. Совпадение данных по шкале объективной оценки с оценкой клинической составляет 74-84% при разных типах акцентуаций. Опубликованы популяцион-ные нормы для определяемых П. д. о. показателей акцентуаций характера у подростков (Н. Я. Иванов, 1985). Разработана дополнительная шкала, позволяющая выявить черты психического инфантилизма в возрасте 16-17 лет и акселерацию формирования системы личностных отношений в возрасте 14-15 лет (А. Е. Личко с соавт., 1985). Опросник может быть использован для группового обследования. Существуют модификации П. д. о. для изучения взаимоотношений в семье подростка. П. д. о. достаточно широко используется в отечественных психодиагностических исследованиях. ПИКТОГРАММА (от лат. pictus — нарисованный, греч. grapho — пишу) — методика исследования особенностей мышления, опосредованной памяти, аффективно-личностной сферы. Как прием экспериментально-психологического исследования П. была предложена в начале 30-х годов. Обычно испытуемому предлагают для запоминания определенное количество слов или выражений, при этом для каждого из них нужно нарисовать любое изображение или знак, то есть пиктографически записать ряд понятий. В качестве стимулов используются понятия различной степени обобщенности, и в основном такие, прямое изображение которых затруднено либо невозможно (напр., «веселый праздник», «теплый ветер», «обман», «справедливость» и т. д.). Особенностью инструкции является ориентация испытуемого на исследование только особенностей памяти, а также зап- решение использовать любые буквенные обозначения. После выполнения рисунков испытуемый должен назвать соответствующие им понятия или выражения. Одним из важнейших элементов исследования является беседа, позволяющая раскрыть смысл символов, продуцируемых испытуемым. Время обследования не регламентируется. Если при использовании варианта П. по А. Н. Леонтьеву выбор испытуемого был ограничен 30 изображениями, входившими в набор карточек (при этом в процессе выполнения заданий число возможных вариантов уменьшалось), то единственным фактором, ограничивающим выбор образа в варианте со свободным рисованием, является интеллектуально-ассоциативный фонд личности испытуемого, его аффективные установки. Т. о. характер деятельности испытуемого и возможность интерпретации рисунка приближают П. к проективным методикам. Другой особенностью, расширяющей интерпретативную направленность методики П., является то обстоятельство, что опосредованное запоминание отражает как мнестические, так и интеллектуальные процессы (А. Р. Лурия, 1962). Построение образа, пригодного для запоминания, является следствием творческой активности мышления, в котором отражается его индивидуальная структура (С. В. Лонгинова, С. Я. Рубинштейн, 1972). Отсюда — широкие возможности для исследования мышления, в первую очередь процесса обобщения. (Не случайно первые исследования с применением П. (Г. В. Биренбаум, 1934) были посвящены анализу особенностей мышления больных психическими заболеваниями, т. к. построение П. сопряжено со значительными умственными усилиями и недоступно при интеллектуальной недостаточности). В советской психологии методика использовалась в контексте изучения опос- редованного запоминания в рамках культурно-исторической концепции (Л. С. Выготский, 1935). Наиболее простой прием пиктографического исследования был предложен Л. В. Занковым (1935). Испытуемым предлагали запомнить конкретное слово с помощью определенного изображения на картинке, путем установления связи между словом и предъявляемым изображением. Вариант П., предложенный А. Н. Леонтьевым (1930), требовал более сложной деятельности: выбора для запоминания слова картинки из предлагаемого набора. Этот вариант П. нашел широкое распространение, особенно в клинических исследованиях детей (А. Я. Иванова, Э. С. Мандрусова, 1970; Л.В.Бондарева, 1969; Л.В.Петренко, 1976). В настоящее время отмечается тенденция разработки и совершенствования интерпретативной схемы П., учитывающей разнообразные категории исследуемых показателей и предусматривающей формализацию данных. Это расширяет возможности методики, допускавшей ранее лишь качественную обобщенную интерпретацию результатов, является основой для стандартизации показателей, что. приближает П. к современным психодиагностическим методикам. Одной из наиболее полных схем анализа данных П. является интерпретативная схема Б. Г. Херсонского (1988). Интерпретация складывается из качественного анализа каждого образа с последующей формализованной оценкой на основе отнесения к определенному типу; оценки количественного соотношения образов различного .типа в данном протоколе; учета аналитических факторов, недоступных формализации (особые феномены), в том числе графических особенностей рисунка. При качественном анализе учитываются: тематика рисунка, факторы абстрактности (конкретные об- разы, метафорические образы, геометрические, графические и грамматические символы, индивидуально-значимые образы, формальные образы). Дополнительно рисунки оцениваются по фактору частоты (стандартные, оригинальные, повторяющиеся) и по фактору адекватности (близость образа и понятия, степень обобщенности, лаконичность изображения). К регистрируемым особым феноменам относятся ассоциации по созвучию, сверхабстрактность символики, недифференцированные изображения, «шоковые» реакции (см. Роршаха тест), употребление буквенных обозначений, стереотипии, высказывания испытуемых и т. д. Графические особенности рисунка анализируются с учетом расположения на листе бумаги, характера линий, размера, нажима и т. д. Выделяются дифференциально-диагностические критерии оценки П., полученные на основании сопоставления контин-гентов больных и здоровых лиц. Имеются нормы, которые носят как статистический, так и описательный характер. Валидность конструктная стандартизированной формы П. анализировалась на основе сопоставления полученных данных с тестом Роршаха, рисуночными проективными тестами, в частности «Дом— дерево—человек» тестом, Бентона визуальной ретенции тестом, вербальными методиками исследования мышления. Валидность критериальная (текущая) определялась сопоставлением результатов больных с различными психическими заболеваниями и здоровых. П. относится к числу наиболее широко употребляемых методик изучения познавательной сферы и личности в отечественной клинической психодиагностике. |