Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
У УМСТВЕННЫЙ ВОЗРАСТ (англ. mental age, MA) — показатель успешности выполнения тестовых заданий, используемый в первых тестах интеллекта. Так, в шкалах типа Бине (см. Бине—Симона умственного развития шкала) задания группируются по возрастам. Напр., задания, с которыми справляется большая часть восьмилетних детей, а это устанавливается в процессе определения возрастных норм, относятся к уровню 8 лет, выполняемые большинством девятилетних, — к уровню 9 лет и т. д. У. в. ребенка в этом случае будет соответствовать самому высокому возрастному уровню тех заданий, с которыми он справляется. Однако реальное выполнение обследуемым тестовых заданий несколько иное. Обследуемый может не справиться с некоторыми заданиями, которые по сложности соответствуют более низкому У. в., нежели его собственный. В то же время он выполняет отдельные задания, рассчитанные на более высокий возрастной уровень. В связи с этим первоначально принято устанавливать т. н. «базовый возраст» обследуемого (см. Станфорд— Бине умственного развития шкала). Это максимальный возрастной уровень, ниже которого все тестовые задания ока- зываются доступными для обследуемого. Выполненные им задания, рассчитанные на более высокие возрастные уровни, приплюсовываются к основному результату как «частичные зачеты» в виде определенного количества месяцев. Таким образом, У. в. определяется как сумма «базового возраста» и дополнительных месяцев. Напр., хронологический возраст обследуемого — 12 лет. Получены следующие данные:
Абсолютной мерой интеллекта выступает разность между У. в. и возрастом хронологическим. Однако эта разность для различных возрастных групп имеет неодинаковое значение, т. к. развитие интеллекта идет неравномерно. Один год опережения или отставания в интеллектуальном развитии для четырехлетнего ребенка имеет гораздо большее значение, нежели для двенадцатилетнего. В связи с этим В. Штерном было предложено определять не абсолютную меру интеллекта — разность, а относительную (см. Интеллекта коэффициент). Тем не менее понятие У. в., по мнению A. Анастази (1982), весьма полезно в силу общедоступности информации о том, что, напр., шестилетний ребенок выполняет те задания, которые рассчитаны на восьмилетний возраст. УПРАВЛЯЕМОЙ ПРОЕКЦИИ МЕТОДИКА — проективная методика исследования личности. Предложена B. В. Столиным (1981-1982 гг.) для диагностики особенностей самоотношения. Испытуемому предъявляют его собственный словесный психологический портрет под именем другого лица, а также портрет его вымышленной противоположности. Словесный портрет составляют на основе его ответов на «Шестнадцать личностных факторов» опросник. Портрет обследуемого (персонаж А) выдается за описание реального человека, ранее проходившего тестирование. При этом указываются возраст, пол, профессия (близкие соответствующим характеристикам обследуемого). При обследовании специфических контингентов могут указываться дополнительные характеристики, соответствующие положению обследуемого (семейное положение, число детей и т. п.). Портрет лица, противоположного персонажу А (персонаж В), составляют исходя из тех же факторов опросника Р. Кэттелла, но в их противоположном значении. Прочие характеристики (пол, возраст и т. д.) также должны быть несоответствующими либо полярно противоположными. В ходе обследования испытуемому предлагают ряд вопросов относительно прошлого, настоящего и будущего описываемых людей (напр.: «К чему этот человек стремится в жизни?»; «Почему он вы- брал такую профессию?»; «Как этот человек оценивает сам себя?»). Затем испытуемого просят указать, какие взаимоотношения сложились бы у него с персонажами А и В и у последних между собой. По мнению автора методики, отношение к персонажу Л отражает самоотношение, а к персонажу В — отношение испытуемого к отсутствующим у него чертам. Анализ протоколов обследования осуществляется качественным путем с учетом параметров: «глобальное самоотношение», самоуважение, аутосимпатия и т. д. Наряду с качественной интерпретацией возможен контент-анализ данных. Имеются специальные категории и их эмпирические индикаторы эмоционально-ценностного отношения к себе. Оценка проводится в трехмерной системе координат с осями: «симпатия—антипатия», «уважение—неуважение», «близость— отдаленность». Имеются сведения о валидности методики (коэффициент корреляции результатов обследования с экспертными оценками составляет 0,40-0,60). Получены предварительные данные о валидности конструктной на материале сопоставления с исследованием локуса контроля (см. Уровня субъективного контроля опросник). По мнению В. В. Столина, методика пригодна к использованию в условиях психологического консультирования и дает важную информацию о форме и характере самоотношения личности. УРОВЕНЬ ЗНАЧИМОСТИ — понятие математической статистики, отражающее степень вероятности ошибочного вывода относительно статистической гипотезы о распределении признака, проверяемой на основе выборочных данных. Статистические гипотезы выдвигаются либо относительно вида распределения какого-либо признака в генеральной совокупности 353 (напр., гипотеза о нормальном распределении тестовых оценок интеллектуального развития детей определенного возраста), это может быть и гипотезой о независимости или связанности распределений (напр., предположение о том, что тяжесть соматического заболевания и частота задержек психического развития взаимосвязаны). Проверка статистических гипотез всегда связана с риском неправильного суждения из-за каких-либо случайных особенностей распределения. У. з. и есть величина, оценивающая этот риск. Показатель У. з. обозначается и выражается в процентах и долях вероятности ошибок. В психологических исследованиях за достаточный У. з. обычно принимается а = 0,05, что означает: если в совокупности генеральной верна нулевая гипотеза, то результат, полученный на выборке, может повториться в 5% случаев повторных выборок. Для достаточно больших выборок может быть принят а = 0,1. Это объясняется тем, что с увеличением объема выборки и У. з. растет мощность критерия, на основе которого производится проверка гипотезы, что уменьшает вероятность принятия ложной нулевой гипотезы (см. Критерий I2). УРОВЕНЬ НЕВРОТИЗАЦИИ И ПСИ-. ХОПАТИЗАЦИИ (УНП) — опросник личностный, предназначен для скрининга невротической и психопатической симптоматики. Составлен И. Б. Ласко и Б. И. Тонконогим в 1974 г. В У. н. и п. включены 90 утверждений, из которых 80 составляют основное содержание опросника. Они отобраны из утверждений Миннесотского многоаспектного личностного опросника в качестве информативно дифференцирующих больных неврозами от психически здоровых лиц. Отбор производился путем сопоставления частот положительных и отрицательных ответов на задания MM'PIв соответствующих группах испытуемых. Испытуемый на бланке ответов должен сделать пометки, означающие его согласие или несогласие с утверждением. Шкалы У. н. и п.: 1. Шкала невротизации. Утверждения, входящие в эту шкалу, позволяют оценить такие проявления невротических состояний, как быстрая утомляемость, нарушения сна, ипохондрическая фиксация на неприятных соматических ощущениях, снижение настроения, повышенная раздражительность, возбудимость, наличие страхов, тревоги, неуверенность в себе. 2. Шкала психопатизации. Утверждения, входящие в шкалу, позволяют оценить лишь некоторые из черт, характеризующих психопатические личности: равнодушие к принципам долга и морали, безразличие к мнению окружающих, повышенный нонконформизм, стремление выделиться из окружающих, лицемерие, вспыльчивость, подозрительность, повышенное самолюбие и самоуверенность. 3. Шкала неискренности. Включает 10 утверждений, взятых из MMPI. Каждый ответ испытуемого оценивается соответствующим диагностическим коэффициентом, установленным отдельно для мужчин и женщин. Отрицательная величина коэффициента свидетельствует о патологии, положительная — о норме. Итоговая оценка по каждой шкале, представляющая собой алгебраическую сумму всех диагностических коэффициентов, также может быть положительной или отрицательной. Оценки, не выходящие за пределы ± 10 по шкале невротизации и ± 5 по шкале психопатизации, попадают в зону неопределенного диагноза. Если оценки выходят за эти пределы, то может быть принято соответствующее диагностическое решение. Чем больше абсолютное значение итоговой оценки, тем дальше ис- пытуемый находится от границы, разделяющей дифференцируемые группы. При корреляционном анализе данных по У. н. и п. с данными по MMPI, Пато-характерологичеасому диагностическому опроснику, «Шестнадцать личностных факторов» опроснику, опроснику Айзенка, шкалам самооценки и врачебной оценки психического состояния на выборке из 156 психически здоровых испытуемых получены результаты, свидетельствующие о том, что невротизация формируется под влиянием: 1) эмоционально-мотивационных особенностей личности; 2) психосоматической симптоматики; 3) самочувствия индивида, основного тона его переживаний. Уровень невротизации отражает как динамические, так и статические (состояния и свойства) особенности личности. Следовательно, невротизация является вариативной личностной переменной. Типичный для конкретного человека уровень невротизации, в первую очередь обусловленный его личностными особенностями, и определяет вероятностный диапазон изменений, вызываемых различными психо-, сомато- и социогенными факторами. Психопатизацию, измеряемую шкалой, следует рассматривать как относительно устойчивое личностное свойство. Оценки по шкале значимо коррелируют с данными других методик, характеризующих личностные свойства, которые влияют на стиль межличностного взаимодействия, и не коррелируют с данными оценки состояния человека. В качестве теоретической базы У. н. и п. использованы принципы теории распознавания образов, рассматривающей задачу конструирования решающего правила для классификации наблюдений по заданной совокупности известных для каждого наблюдения признаков. Решающее диагностическое правило вырабатывается на осно- ве анализа образцов наблюдений, для которых с высокой надежностью определена принадлежность к диагностическим классам. Т. о., формализован не только процесс измерения личностных свойств, но и сам процесс принятия диагностического решения. (См. Диагноз психологический.) Стандартизация проводилась на 400 психически здоровых взрослых испытуемых, 188 больных неврозами и 100 больных психопатией. У. н. и п. характеризуется высокой надежностью ретестовой и валидностью (конструктной, о чем свидетельствуют коэффициенты корреляции данных, полученных с его помощью, и других психодиагностических методик; критериальной, на что указывает высокая точность совпадения оценок психически больных с клиническим диагнозом — 93% у больных неврозами по шкале невротизации, при учете зоны неопределенности, и 69% у больных психопатией по шкале психопатизации). У. н. и п. рекомендуется использовать в целях предварительной (доврачебной) диагностики, для выявления «группы риска», объективации динамики состояния больных неврозами в процессе лечения, при профотборе и профосмотре лиц, работающих в особо сложных условиях (выработаны рекомендации), т. е. в психопрофилактике. УРОВНЯ СУБЪЕКТИВНОГО КОНТРОЛЯ ОПРОСНИК — опросник личностный. Предназначен для диагностики интернальности—экстернальности. Разработан на основе шкалы локуса контроля Дж. Роттера (Locus of control scale) и опубликован Е. Ф. Бажиным с соавт. в 1984 г. У. с. к. о. состоит из 44 утверждений, с которыми обследуемый может согласиться (+) или не согласиться (-). Для исследовательских целей предусмотрен ответ по шестибалльной шкале «-3, -2, -1, +1, +2, +3», в которой «+3» означает ♦полностью согласен», а «-3» — «совершенно не согласен». С помощью У. с. к. о. осуществляется измерение интерналь-ности—экстернальности по следующим шкалам: 1. Шкала общей интернальности (Ио). 2. Шкала интернальности в области дос-" тижений(Ид). 3. Шкала интернальности в области неудач (Ин). 4. Шкала интернальности в семейных отношениях <ИС). 5. Шкала интернальности в области производственных отношений (Ип). 6. Шкала интернальности в области межличностных отношений (Им). 7. Шкала интернальности в отношении здоровья и болезни (И3). Примеры утверждений У. с. к. о. (рядом «ключевой» ответ по соответствующей шкале): — Продвижение по службе больше зависит от удачного стечения обстоятельств, чем от способностей и усилий человека. Ио-, Ид-, Ин-. — Думаю, что случай или судьба не играют важной роли в моей жизни. Ио. — Многие мои успехи были возможны только благодаря помощи других людей. Ио-.Ид-. Полученные результаты выражаются в стэнах (см. Оценки шкальные) и могут быть представлены в виде «профиля субъективного контроля». Уровень субъективного контроля — обобщенная характеристика личности, оказывающая регулирующее воздействие на формирование межличностных отношений, способы разрешения кризисных семейных и производственных ситуаций и т. д. В соответствии с концепцией локуса контроля (лат. locus — место, месторасположение), те лица, которые принимают ответственность за события своей жизни на себя, объясняя их своим поведением, способностями, чертами личности, обладают внутренним (интернальным) контролем. И напротив, людям, которые склонны приписывать ответственность за все события внешним факторам (другим людям, случаю, судьбе и т. п.). присущ внешний (экстернальный) контроль. Любой человек по локусу контроля занимает определенное место на континууме интер-нальность—экстернальность. В многочисленных экспериментальных исследованиях установлена связь между различными формами поведения, особенностями личности и уровнем интернальности—экстернальности. Так, интерналы, в отличие от экстерналов, менее склонны подчиняться давлению других людей, сильнее реагируют на утрату личной свободы, активнее ищут информацию, более уверены в себе и т. д. Стандартизация опросника проводилась на выборке из 84 обследуемых — студентах вуза, средний возраст которых составлял 20,4 года. Авторы У. с. к. о. сообщают о весьма высоких показателях его надежности. Валидность демонстрируется связями шкал опросника с другими особенностями личности, измеренными, в частности, с помощью «Шестнадцать личностных факторов» опросника. Рекомендуется использование У. с. к. о. в клинической психодиагностике, семейных консультациях, для изучения эффективности социально-психологического тренинга и групповой психотерапии. УСТАНОВКИ НА ОТВЕТ (response sets) — психологический феномен, имеющий установочную природу, возникновение которого приводит к снижению достоверности ответов на задания опросников. Л. Кронбах (1946) определяет его как стилистическую последовательность, стимулируемую формой ответов на задания оп- росников (см. Вопросов (утверждений) форма). Степень проявления У. н. о. зависит от индивидуально-личностных особенностей испытуемого, характера заданий опросника, особенностей мотивации на обследование и диагностической ситуации (см. Психодиагностические ситуации) ряда других факторов. При применении методик, реализующих субъективный психодиагностический подход (см. Психодиагностический метод), наиболее частым и заметным является влияние следующих У. н. о. 1. Установка на согласие (response set of acquiescence). Тенденция испытуемого соглашаться с утверждениями или давать на поставленные вопросы ответ «да» независимо от их содержания. Чаще всего, согласно Дж. Гилфорду (1959), эта установка проявляется тогда, когда утверждения (вопросы) неоднозначны и неопределенны. Проявляется данная установка у лиц, отличающихся конформностью, а также у тех, кто испытывает подозрительность по отношению к обследованию и (реальным или воображаемым) последствиям, связанным с его результатом. 2. Наряду с установкой на согласие возможен и противоположный вариант — установка на отрицание, проявляющаяся у лиц, испытывающих отрицательное отношение к исследованию, а также в случаях низкой валидности очевидной методики и при использовании большого объема заданий в методике. 3. Установка на социально одобряемые ответы (response set of social desirability). Тенденция испытуемого отвечать на вопросы так, чтобы выглядеть «социально положительным». Истинные результаты самооценки подменяются представлением испытуемого о «положительном» или «нормальном» проявлении исследуемого качества личности или особенности поведения (см. Шкалы контрольные). 4. Установка на неопределенные или средние ответы (response set of using the uncertain or middle category). Если в опроснике представлена средняя категория ответов, отражающая нерешительность или неуверенность (например, «не знаю», «не уверен», «затрудняюсь ответить» и т. п.), то некоторые испытуемые склонны прибегать к такой формулировке ответа как к безопасному компромиссу. Обычно это приводит к снижению валидности и искусственному завышению надежности опросника, поскольку большинство способов анализа результатов обследования основываются на крайних значениях ответов. 5. Установка на «крайние» (расположенные по краям шкалы) ответы (response set of using the extreme responce). Может проявляться при использовании многоэлементной рейтинговой шкалы (П. Верной, 1964). Наиболее часто отмечается в случаях большого числа рейтинговых категорий ответов (8 и более). Минимизация влияния У. н. о. — один из важных аспектов конструирования надежного и валидного теста. При составлений-вопросов или утверждений опросников необходимо следовать таким основным правилам: 1. Принимать все возможные меры к тому, чтобы испытуемый не мог проникнуть в суть того, что изучается при помощи предлагаемых ему заданий (см. Тесты объективные). В случае возникновения определенного представления об исследуемой с помощью методики черте (качестве) испытуемый склонен скорее отражать свое собственное отношение к данной психической особенности, а не ее реальное проявление. Согласно Дж. Гилфорду (1959), следует стремиться оценивать те психологические особенности испытуемого, о которых он не знает, задавая ему вопросы о том, что он знает хорошо. 2. Формулировать понятные и недвусмысленные вопросы. 3. Составлять задания, которые отражают конкретные, а не общие аспекты изучаемой области поведения. Так, например, вопрос «Нравится ли Вам спорт?» является слишком общим: термин «спорт» в данном случае неопределенный, как и понятие «нравиться». Более конкретной формулировкой будет: «Вы играете регулярно в какую-либо спортивную игру?», «Вы занимаетесь оздоровительными тренировками?» или «Вы регулярно следите за игрой Вашей любимой команды?». На такие вопросы ответы вряд ли будут фальсифицированы, также можно ожидать, что отношение к ним не изменится за сравнительно небольшой промежуток времени. Испытуемые будут давать практически одинаковые ответы, когда бы их ни тестировали. Таким образом, надежность опросника будет повышена. 4. В каждом задании задавать только один вопрос. Например, утверждение «свободное время я люблю проводить за книгой или у телевизора» следует разделить на два независимых суждения. 5. Избегать слов, обозначающих частоту действий. Напр, вопрос: «Часто ли Вам снятся сны?» лишен смысла. Предпочтительней такая формулировка: «Снятся ли Вам сны дважды в неделю или чаще?» 6. Избегать терминов, относящихся к различным чувствам (см. пример к правилу 3. Слово «нравится» заменено на «играете»). Вместо выражения чувств можно сформулировать задание в поведенческом аспекте («находите удовольствие», «предпочитаете», «наслаждаетесь» и т. д.). 7. Обеспечить при помощи инструкции или временного лимита выполнение требования давать первые приходящие на ум ответы. В том случае, когда испытуемый начинает задумываться, сомневать- ся, с особой силой могут проявляться установки, особенно стремление соответствовать социально одобряемому поведению. 8. Избегать определенных вариантов построения схемы ответов. Например, в 5-балльных шкалах испытуемым «трудно» выбрать оценки «Ь и «2» из-за «школьного» отношения к ним. При коррекции влияния установки на согласие (отрицание) может быть использована шкала сбалансированная. Она не устраняет влияние установки, однако позволяет отделить лиц, у которых высокий (или низкий) результат связан с действием установки, от испытуемых с реально высоким или низким измеряемым показателем. Сложность конструирования сбалансированных шкал состоит в трудности подбора семантически взвешенных противоположных суждений (например, сравните значения внешне симметрично противоположных высказываний: «Я люблю женщин» и «Я не люблю женщин»). Распространенным приемом контроля за установками на социально положительные ответы является применение дополнительных наборов заданий типа шкалы L(см. Миннесотский многоаспектный личностный опросник) или других шкал контрольных. Другим приемом является использование опросника совместно с методиками, непосредственно нацеленными на диагностику выраженности установки к социально одобряемым ответам в определенной области поведения (см. Опросники установок), напр. Кроуна—Мар-лоу социальной желательности шкалой. Включение в материал опросника таких подчас значительных по объему дополнительных шкал менее удобно, чем проверка основного опросника на специальной выборке с целью установления корреляции его результата с данными шкал установок. Если связь результата проверяемого опросника и шкалы уста- новки окажется большой, то, вероятно, в этом случае действует тенденция стимулирования социально одобряемых ответов (опросник перенасыщен формулировками, имеющими выраженную социально-положительную или отрицательную окрашенность). В тех случаях, когда необходимо исследовать качество, социальная окрашенность которого выражена явно, способом снижения влияния установки может стать реализация своеобразного «проективного» подхода. Прямой вопрос о наличии определенных аспектов исследуемого качества можно заменить изучением от- ношения к определенным высказываниям. Напр., при исследовании «жадности» можно использовать вопросы типа: «Можете ли Вы полностью согласиться с поговоркой: "Бережливость лучше богатства"?». Выявление подверженности психодиагностических методик влиянию различных У. н. о. всегда предусматривает проведение специальных пробных исследований с использованием отдельных выборок испытуемых. При этом желательно установление дифференцированного воздействия установок в различных контин-гентах испытуемых. |