Главная страница
Навигация по странице:

  • Диагностическая

  • Валидность содержательная

  • ВАЛИДНОСТЬ ДИФФЕРЕНЦИАЛЬ­НАЯ

  • ВАЛИДНОСТЬ ИЛЛЮЗОРНАЯ

  • Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии


    Скачать 5.87 Mb.
    НазваниеСловарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
    Дата10.08.2022
    Размер5.87 Mb.
    Формат файлаdoc
    Имя файлаВалидность тестов.doc
    ТипСправочник
    #643669
    страница6 из 71
    1   2   3   4   5   6   7   8   9   ...   71


    ВАЛИДНОСТИ КОЭФФИЦИЕН­ТЫ — статистические показатели ва­лидности эмпирической теста.

    В качестве меры валидности наиболее часто на практике применяются разные виды корреляционного анализа связи между индивидуальными оценками по те­сту и оценками по валидизации крите­рию (либо связь между результатами ва-лидизируемого теста и эталонной методи­ки). В большинстве случаев распределе­ние тестовых оценок в репрезентативной выборке валидизации близко к нормаль­ному. Оценки по критерию чаще бывают дихотомическими, ранговыми (см. Шка­лы измерительные) или распределяются по закону, отличному от нормального. Ес­ли оба ряда переменных (тестовые и кри­териальные оценки) носят континуальный характер, используют коэффициент кор­реляции произведения моментов Пирсона (см. Корреляционный анализ). В зависи­мости от шкалы представления перемен­ных в сравниваемых рядах применяют те или иные методы корреляционного анали­за (см. Корреляция качественных при­знаков, Корреляция бисериальная, Кор­реляция ранговая).

    Наряду с В. к., определяемыми тради­ционным способом, существуют и некото­рые другие меры количественной оценки валидности теста, в частности с помощью /-коэффициента, цредложенного Э. При-мовым (Е. S. Primoff, 1975). /-Коэффици­ент является одним из методов характери­стики синтетической валидности (см. Ва­лидность критериальная). Процедура его определения предусматривает нали-

    чие перечня элементов сложной деятель­ности или способности, выраженных языком профессиональных или других специальных действий, и экспертной оценки относительной значимости этих элементов для осуществления данной сложной деятельности. Окончательный анализ проводится на базе корреляции оценок теста и отдельных элементов ре­альной деятельности с учетом их удель­ных весов. Статистическая обработка ос­нована на применении уравнения множе­ственной регрессии. Для каждого элемен­та деятельности его корреляция с деятель­ностью в целом умножается на «вес» в те­сте, и полученные произведения суммиру­ются по всем элементам деятельности.

    В. к. являются важными, но далеко не определяющими и не исчерпывающими ха­рактеристиками валидности методики. В. к. являются лишь элементом в сложном про­цессе характеристики валидности теста.

    Приблизительность отдельно вычис­ленного В. к. обусловлена многими фак­торами. Во-первых, условия валидности теста не представляется возможным оп­ределить полностью. Всегда остается мно­жество неучтенных факторов, ситуаций, условий и т. д. Во-вторых, логика крите­риальной валидизации предполагает ва­лидность самого критерия. Проверка та­кой валидности представляет собой весь­ма трудную проблему. К тому же очень ча­сто тесты валидизируются относительно доступного, а не наиболее соответствую­щего критерия. Так, тесты интеллекта сопоставляются с показателями академи­ческой успеваемости, которая несомнен­но связана с интеллектом, но его далеко не исчерпывает. В-третьих, условия вали­дизации по критерию предполагают, что выборка полностью репрезентативна в по­пуляции, для которой позже будут делать­ся заключения. В реальной ситуации это требование осуществить трудно, и репре­зентативность выборки валидизации все-

    гда требует дополнительной проверки статистическими и качественными мето­дами. На практике обычно весьма сложно охватить адекватно большое количество случаев, особенно при определении ва­лидности прогностической.

    Наибольшая сложность интерпрета­ции В. к. с т. з. определяемой реальной ва­лидности теста заключается в следую­щем. Критериальная валидизация опира­ется, как правило, на круг внешних для психологии социально-прагматических критериев. Это оправдывается тем, что важнейшая цель валидизации — опреде­ление практической ценности разрабаты­ваемой методики. Критерии в этом случае выступают как показатели, обладающие непосредственной ценностью для опреде­ленных областей практической деятель­ности, напр.: «успеваемость», «производи­тельность*, «преступность», «состояние здоровья» и т. д. При ориентации на эти категории в ходе валидизации решаются сразу две задачи: собственно задача изме­рения валидности и оценка прагматичес­кой эффективности психодиагностиче­ской методики. Если получен значимый коэффициент корреляции, то можно счи­тать, что с той или иной степенью досто­верности решены с позитивным результа­том сразу две эти задачи. Но если корре­ляция не обнаружена, то остается неопре­деленность: либо не валидна сама проце­дура (тестовый балл не отражает, напр., стрессоустойчивость оператора), либо не верна гипотеза о наличии причинно-след­ственной связи между психическим свой­ством и социально ценным показателем (стрессоустойчивость не влияет на про­цент аварийных ситуаций).

    Наряду с перечисленными теоретичес­кими и методическими сложностями при­менения и интерпретации В. к. необходи­мо помнить и об обеспечении статистичес­кой значимости рассчитываемых коэффи­циентов. Делая вывод о валидности теста

    с привлечением В. к., нужно быть уверен­ным в том, что данный коэффициент не появился в результате случайных откло­нений в выборке. Установив значимость корреляции между тестовыми показателя­ми и критерием, необходимо оценить вели­чину стандартной ошибки тестовых оце­нок. Применяемый при этом статистичес­кий показатель ошибки измерения указы­вает на допустимые пределы ошибки в ин­дивидуальных показателях вследствие ог-- раниченной надежности теста. Анало­гично ошибка в оценке указывает на допу­стимые пределы возможной ошибки в про­гнозируемой величине индивидуального критериального показателя, возникающей в результате ограниченной валидности те­ста.

    Ошибка оценки находится по формуле



    Особенности интерпретации В. к. как статистических мер аналогичны другим мерам связи.

    ВАЛИДНОСТЬ (англ. valid — действи­тельный, пригодный, имеющий силу) — комплексная характеристика методики (теста), включающая сведения об обла­сти исследуемых явлений и репрезента­тивности диагностической процедуры по отношению к ним.

    В наиболее простой и общей формули­ровке В. теста это «...понятие, указываю­щее нам, что тест измеряет и насколько хорошо он это делает» (А. Анастази, 1982). В стандартных требованиях к пси­хологическим и образовательным тестам (Standarts..., 1974) В. определяется как комплекс сведений о том, относительно каких групп психологических свойств личности могут быть сделаны выводы с помощью методики, а также о степени обоснованности выводов при использова­нии конкретных тестовых оценок или дру­гих форм оценивания. В психологической диагностике В. — обязательная и наибо­лее важная часть сведений о методике, включающая (наряду с указанными выше) данные о степени согласованности ре­зультатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретические ожидания, наблюдение, экспертные оцен­ки, результаты других методик, достовер­ность которых установлена и- т. д.), суж­дение об обоснованности прогноза разви­тия исследуемого качества, связь изучае­мой области поведения или особенности личности с определенными психологичес­кими конструктами. В. описывает также конкретную направленность методики

    (контингент испытуемых по возрасту, уровню образования, социально-культур­ной принадлежности-и т.д.) и степень обоснованности выводов в конкретных условиях использования теста. В сово­купности сведений, характеризующих В. теста, содержится информация об адек­ватности применяемой модели деятельно­сти с т. з. отражения в ней изучаемой пси­хологической особенности, о степени од­нородности заданий (субтестов), вклю­ченных в тест, их сопоставимости при ко­личественной оценке результатов теста в целом.

    Важнейшая составляющая В. — опре­деление области изучаемых свойств —

    имеет принципиальное теоретическое и практическое значение при выборе мето­дики исследования и интерпретации ее данных. Содержащаяся в названии теста информация, как правило, недостаточна для суждения о сфере его применения. Это лишь обозначение, «имя» конкретной процедуры исследования. В качестве при­мера можно привести широко известную корректурную пробу. Область изучае­мых свойств личности включает устойчи­вость и концентрацию внимания, психо­моторную подвижность. Данная методика позволяет получать оценки выраженнос­ти этих психологических качеств у испы­туемого, хорошо согласуется с показате­лями, полученными другими методами и, следовательно, обладает высокой В. На­ряду с этим результаты выполнения кор­ректурной пробы подвержены влиянию большого количества других факторов (нейродинамические особенности, харак­теристики кратковременной и оператив­ной памяти, индивидуальная переноси­мость монотонии, развитие навыка чте­ния, особенности зрения и т. д.), по отно­шению к которым методика не является специфичной. В случае применения кор­ректурной пробы для их измерения В. бу­дет невелика или сомнительна.

    Таким образом, очерчивая сферу при­менения методики, В. отражает и уровень обоснованности результатов измерения. Очевидно, что при небольшом количестве сопутствующих факторов, влияющих на результат исследования, а значит, при их незначительном воздействии на резуль­тат теста достоверность тестовых оценок будет выше. Еще в большей степени дос­товерность данных теста определяется на­бором измеряемых свойств, их значимос­тью для осуществления диагностируемой сложной деятельности, полнотой и су­щественностью отражения в материале теста предмета измерения. Так, чтобы удовлетворить требованиям В., диагнос-

    тическая методика, предназначенная для профотбора, должна включать анализ ши­рокого круга нередко различных по своей природе показателей, наиболее важных для достижения успеха в данной профес­сии (уровень внимания, особенности па­мяти, психомоторика, эмоциональная ус­тойчивость, интересы, склонности и т. д.).

    Как видно из вышеизложенного, в по­нятие В. входит большое количество са­мой разнообразной информации о тесте. Различные категории этих сведений и способы их получения образуют типы В.

    Диагностическая (конкурентная) В. отражает способность теста дифференци­ровать испытуемых по изучаемому при­знаку. Анализ диагностической В. имеет отношение к установлению соответствия показателей теста реальному состоянию психологических особенностей испытуе­мого в момент обследования (см. Валив-ность текущая). Примером определения этого типа В. может быть исследование по методу контрастных групп. Проведение теста интеллекта у нормально развиваю­щихся детей и их сверстников с наруше­ниями в интеллектуальном развитии мо­жет выявить глубокие количественные и качественные различия в выполнении за­даний сравниваемыми группами. Степень надежности дифференциации детей пер­вой и второй групп по данным теста будет характеристикой диагностической В. оценки умственного развития, получае­мой с помощью данной методики.

    Сведения, характеризующие степени обоснованности и статистической надеж­ности развития исследуемой психологи­ческой особенности в будущем, составля­ют валидность прогностическую мето­дики. Заключение об этом типе В. может быть получено, напр., путем сравнения тестовых оценок в одной и той же группе испытуемых спустя определенное время. Основой прогностической В. является оп­ределение того, насколько важен исследу-

    емый признак с т. з. деятельности испыту­емого в будущем с учетом закономерно изменяющихся обстоятельств, перехода на другой уровень развития.

    Большинство методик, особенно тес­тов способностей и интеллекта, исследу­ется на предмет диагностической и про­гностической В. Два этих типа В. нередко объединяют в понятие валидности эмпи­рической. Здесь подчеркивается общ­ность подхода к их определению, который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параметру, избранному в качестве валидизации кри­терия (см. Валидностъ критериальная). Критерий В. выступает в качестве меры, показателя исследуемых психологиче­ских особенностей. Так, тесты специ­альных способностей проверяются пу­тем сопоставления с результатами обуче­ния по другим предметам, достижениями в музыке, рисовании и т. д. Тесты общих интеллектуальных способностей валиди-зируются сравнением с еще более широ­кими характеристиками школьных дости­жений (общая успеваемость, овладение сложными системами знаний и навыков). Критерий В. является независимым от те­ста показателем, обладающим непосред­ственной ценностью для определенных областей практической деятельности. Напр., в области педагогической психоло­гии это «успеваемость», в психологии тру­да — «производительность», в медицин­ской психологии — «состояние здоровья» и т. д. В качестве непосредственных кри­териев часто используются экспертные оценки и характеристики лиц, обследо­ванных с помощью валидизируемого тес­та, данные педагогами, сотрудниками, ру­ководителями.

    Во многих случаях бывает сложно или невозможно подобрать адекватный крите­рий валидизации. При этом особую важ­ность приобретает комплекс характерис-

    тик, входящих в тип теоретической В. При разработке и использовании теста может быть сформулирован ряд гипотез о том, как будет коррелировать исследуемый тест с другим тестом, измеряющим род­ственные или противоположные психоло­гические характеристики испытуемых. Эти гипотезы выдвигаются на основании теоретических представлений об измеря­емых свойствах как о психологическом конструкте. Подтверждение гипотез сви­детельствует о теоретической обосно­ванности методики, т. е. о степени ее конструктной валидности. Этот тип В. является наиболее сложным и комплекс­ным. Для подтверждения соответствия получаемых с помощью теста результатов теоретическим ожиданиям и закономер­ностям используется самая различная ин­формация, в том числе и относящаяся к другим типам В.

    Валидность содержательная(внут­ренняя, логическая) — комплекс сведе­ний о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям. Одним из основных требо­ваний при валидизации методики в этом направлении является отражение в содер­жании теста ключевых сторон изучаемо­го психологического феномена. Если об­ласть поведения или особенность очень сложна, то содержательная В. требует представления в заданиях теста всех важ­нейших составных элементов исследуемо­го явления. Так, при разработке теста «вербального интеллекта» необходимо ввести группы заданий (субтестов) для проверки довольно разнородных по свое­му операциональному составу навыков письма и чтения.

    Наряду с перечисленными основными типами В. (содержательной, критериаль­ной и конструктной) на практике выде­ляют факторную, перекрестную (конвер­гентную) и дискриминантную В. (см. Валидность конструктная).

    Классификация типов В. в достаточной мере условна, так как нередко для различ­ных критериев В. применяются общие ме­тоды определения, а с другой стороны, одни и те же исходные данные могут ин­терпретироваться с т. з. различных ти­пов В. На рис. 9 приведена примерная схе­ма, отражающая виды и связи валидности.

    Рис. 9. Основные виды валидности

    В психологической диагностике не су­ществует универсального подхода к ха­рактеристике В. Для валидизации каждо­го вида психодиагностических процедур и отдельных тестов могут применяться раз­личные, типы В. Сведения, входящие в комплекс В., можно оценить качественно и количественно (при помощи коэффици­ента валидности), нередко их можно опи­сать. Однако в силу сложности, комплекс­ности, ситуативности по отношению к конкретным условиям применения мето­дики В. в целом невозможно измерить, о ней можно лишь судить.

    Реальная В. раскрывается только в ре­зультате накопления значительного опы­та работы с тестами. Получение новых, расширенных данных о В. может ради­кально изменить представление о сфере приложения и эффективности методики. Так, некоторые методики, разработанные

    для диагностики вербальных факторов ин­теллекта, с достаточной В. отражают лишь уровень осведомленности. Сфера применения теста в ходе его длительной валидизации может быть, напротив, рас­ширена. В качестве примера можно при­вести Равена прогрессивные матрицы, которые были разработаны для изучения определенных сторон перцептивной де­ятельности, однако оказались в значи­тельной степени насыщены фактором, об­щим для тестов интеллекта (см. Фак­тор G). Реальная В. ряда психодиагности­ческих методик, особенно тестов интел­лекта, достижений в обучении, професси­ональной пригодности, опросников лич­ностных изменяется со временем. Это объясняется устареванием возрастных статистических норм, изменением соци­альных норм и образцов поведения, мето­дов обучения и содержания заданий, тре­бований к профессиям. Данное обстоя­тельство создает необходимость периоди­ческого контроля В. методик.

    ВАЛИДНОСТЬ ДИФФЕРЕНЦИАЛЬ­НАЯ ъка, валидности конструктной, рассматривающей внутренние взаимоот­ношения между психологическими факто­рами, диагностируемыми с помощью пси­ходиагностической методики. Содержа­ние В. д. может быть иллюстрировано на примере тестов интересов, которые в сво­ем большинстве обычно умеренно корре­лируют с показателями общей академи­ческой успеваемости,однако в различной степени связаны с успеваемостью по от­дельным дисциплинам. В. д. особенно важ­на как показатель диагностической ценно­сти методик, используемых в профотборе.

    ВАЛИДНОСТЬ ИЛЛЮЗОРНАЯ (лож­ная) — иллюзия соответствия заключе­ния по результатам тестирования лично­стным характеристикам обследуемого. Возникает как следствие использования



    предельно общих, а поэтому применимых практически ко всем обследуемым фор­мулировок, таких, например, как «разум­ный в выборе цели», «стремящийся к лучшей жизни» и т. п. Такого рода утвер­ждения принимаются почти всеми людь­ми в качестве точного описания их лич­ности, что создает почву для деятельнос­ти различного рода прорицателей и пред­сказателей. В. и. названа Барнума эф­фектом по имени Финиса Барнума, по­пулярного организатора публичных зре­лищ, говорившего, что «глупец рождает­ся ежеминутно».
    1   2   3   4   5   6   7   8   9   ...   71


    написать администратору сайта