Главная страница
Навигация по странице:

  • ВАЛИДНОСТЬ СОДЕРЖАТЕЛЬ­НАЯ

  • ВАЛИДНОСТЬ ТЕКУЩАЯ

  • ВАЛИДНОСТЬ ЭКОЛОГИЧЕСКАЯ

  • ВАЛИДНОСТЬ ЭМПИРИЧЕСКАЯ

  • Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии


    Скачать 5.87 Mb.
    НазваниеСловарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
    Дата10.08.2022
    Размер5.87 Mb.
    Формат файлаdoc
    Имя файлаВалидность тестов.doc
    ТипСправочник
    #643669
    страница8 из 71
    1   ...   4   5   6   7   8   9   10   11   ...   71

    ВАЛИДНОСТЬ ПРОГНОСТИЧЕ­СКАЯ — информация о том, с какой сте­пенью точности и обоснованности методи­ка {тест) позволяет судить о диагности­руемом психологическом качестве спустя определенное время после измерения. В. п. отражает временной интервал, на ко­торый распространяется обоснование та­кого суждения. Сведения о В. п. имеют са­мое непосредственное отношение к рас­крытию предсказательной силы методики, выяснению степени обоснованности сформулированного на ее основе ближай­шего и более отдаленного прогноза, ана­лизу значимости получаемых в тесте по­казателей с т. з. экстраполирования ре­зультатов на будущее.

    В стандартных требованиях к педаго­гическим и психологическим тестам (Standarts.... 1974) различают В. п. и ва­лидность текущую в зависимости от временной связи между критерием и тес­том. Эти два вида относятся к валидное-ти критериальной теста. Иногда говорят о предсказательной валидности. Термин «предсказание», по мнению А. Анастази (1982), может использоваться как в широ­ком смысле, означая прогноз на основе данных тестирования поведения испыту­емого в реальной (критериальной) ситуа­ции, так и в более узком смысле, указы-

    вая лишь на временной интервал. В пос­леднем смысле он и используется в В. п. Характеристика В. п. определяет отрезок времени, для которого задается или про­веряется связь с критерием исследуемых качеств.

    В качестве валидизации критерия могут выступать не только показатели ак­туального поведения, но и ожидаемые ре­зультаты деятельности, лечения, обуче­ния и т. д. Процедура определения В. "п. опирается на анализ корреляции между оценками по тесту и предсказанными ре­зультатами деятельности, формирующи­мися свойствами личности, исходом лече­ния и т. п. Вместе с тем различие двух видов критериальной валидности связано не только с временными пределами крите­риальных сопоставлений. Валидность те­кущая и В. п. отражают разные цели при-, менения методики: текущий диагноз, оценка настоящего положения, с одной стороны, и прогнозирование развития ка­чества или успеха в деятельности — с другой.

    Сравнивая В. п. и валидность теку­щую, следует отметить, что, несмотря на общий принцип критериального сопостав­ления, характерный для двух типов валид­ности, оценка В. п. является более слож­ной проблемой. Точность прогноза и, следовательно, суждения о В. п. находит­ся в обратной зависимости от времени, за­данного для такого прогнозирования. Обоснование отдаленной экстраполяции данных теста требует учета большего ко­личества факторов, чем оценка диагнос­тической значимости теста.

    С большими сложностями сопряжено определение В. п. для тестов, направлен­ных на измерение комплексных свойств и видов деятельности, таких сложных пси­хологических конструктов, как общие способности, особенности личности, уровни достижений в учебной и професси­ональной деятельности и т. д. Развитие этих психологических свойств в большой

    степени зависит от приобретаемых зна­ний, навыков и может резко изменяться в зависимости от обстоятельств жизни и де­ятельности индивида. Особую проблему представляет прогноз качеств в случае изменения со временем наиболее важных для их реализации элементов. Так, при прогнозе достижений в овладении чтени­ем на первых этапах обучения одним из ведущих показателей, на котором может базироваться прогноз, является беглость. Впоследствии ведущей характеристикой становится уровень понимания, развитие которого будет доминирующим при обуче­нии чтению. С этого момента методика, опирающаяся лишь на показатели темпа, теряет прогностическую значимость, по­скольку повторяет уже пройденные этапы развития навыка.

    При диагностике обучаемости млад­ших школьников в комплексе показате­лей, на которые может опираться про­гноз, на первый план выступает меха­ническая память. В старших классах про­гностическое значение этого показателя значительно снижается, уступая место смысловой организованной памяти, ана­литическому усвоению знаний. Приведен­ные примеры указывают на необходи­мость глубокого анализа психологичес­ких конструктов, лежащих в основе тес­тов, понимания динамики их развития, четкого представления о значимости изу­чаемых показателей с т. з. будущей дея­тельности. Необходимость такого анали­за при определении отдаленной В. п. сближает эти характеристики теста с ва-лидностью конструктной.

    При отдаленном критериальном сопо­ставлении легко получить неправильное представление о В. п., если взять для сравнения независимый критерий, приме­нявшийся раннее для текущей валидиза­ции. Так, объективный показатель успеш­ности профессиональной деятельности к моменту отдаленного сопоставления мо­жет оказаться слишком простым (напр.,

    если тест достижении при анализе его ди­агностической валидности сопоставляет­ся с успешностью выполнения самой про­стой сборочной операции, которая в мо­мент отдаленного сравнения хорошо усва­ивается практически всеми испытуемыми из выборки валидизации). Более правиль­ным будет сопоставление с новым уров­нем независимого критерия, комплексом более сложных навыков и операций, тре­бующихся для успешной профессиональ­ной деятельности с учетом приобретенно­го работниками опыта. Определение ново­го, более сложного независимого крите­рия может базироваться на исследовании статистического распределения и разбро­са показателей критерия в выборке лиц, относительно которой проверяется В. п. методики.

    При использовании критериев дея­тельности, определяемых субъективными методами (напр., экспертной оценкой), необходимо избегать возникновения явле­ния контаминации критерия.

    В ряде случаев текущая валидность за­меняет В. п. Часто практически невыгод­но слишком затягивать валидизацию, изу­чая отдаленные критериальные меры тес­тируемого свойства в обследуемой выбор­ке валидизации. В качестве компромисс­ного решения для ускорения процедуры валидизации тест может быть проведен на группе, для которой уже имеются крите­риальные данные. Напр., результаты об­следования студентов могут сравниваться с данными об их успеваемости, данные те­стирования служащих — с их успешнос­тью в деятельности. В отдельных случаях для быстрого получения сведений о пред­сказательных возможностях можно вос­пользоваться ретроспективной валидиза-цией (см. Валидность критериальная). Так, для проверки того, в какой мере хо­рошие результаты теста способностей со­ответствуют быстрому обучению в какой-либо области, можно сопоставить крите­риальные оценки (успеваемость, ретро-

    спективные экспертные заключения и т. д.) за период обследования и в теку­щий момент у лиц с высокими и низкими оценками по тесту.

    Одним из наиболее надежных спосо­бов получения сведений о прогности­ческих возможностях результата теста является метод «когорт». Предположим, следует проверить, насколько результат теста, предназначенного для изучения не­которых аспектов эмоциональных состоя­ний у больных предсказателен в отноше­нии вероятности возникновения психосо­матических заболеваний, позволяет ли определенный результат по этому тесту судить о повышенном риске подвергнуть­ся таким расстройствам. Учитывая веро­ятный объем экстремальных (контраст­ных) групп, выборка должна быть доста­точно большой. На основании эпидемио­логических данных.напр., можно предпо­ложить, что определенной болезнью в те­чение трех лет заболевает 57 человек из 1000. Тогда превентивной диагностикой должно быть охвачено около 2000 чело­век, чтобы получить численность группы заболевших порядка 100. Прогностичес­кие возможности в таком случае будут подтверждаться исходя из значимости ко­личественных различий в результатах те­ста, проведенного в момент набора «ко­горт» из числа заболевших и здоровых (Практикум по психодиагностике, 1984). Определение В. п. обязательно для пра­вильного использования и интерпретации результатов большинства тестов. Глубо­кое изучение этих характеристик необхо­димо для формулирования прогноза в ди­агностическом заключении на основании данных методики, выявления значения измеряемых тестом показателей в дина­мике развития изучаемых свойств и спо­собностей. Естественно, наибольшее зна­чение критерий В. п. имеет для методик, прямо или косвенно направленных на предсказание развития того или иного психологического свойства или вида дея-

    тельности. К их числу в первую очередь относятся тесты общих способностей, профориентационные методики, тесты от­бора и т. д.

    Важность показателей В. п. при ана­лизе тестовых процедур, направленных на отбор, подчеркивается введением спе­циального понятия валидности инкре-ментной. Этот показатель В. п. дает ин­формацию о том, насколько улучшается процедура отбора с применением данного теста по сравнению с традиционной (осно­вывающейся лишь на формальных сведе­ниях о предыдущей деятельности, анали­зе документов личного дела, беседах).

    ВАЛИДНОСТЬ СОДЕРЖАТЕЛЬ­НАЯ — один из основных типов валидно­сти методики, характеризующий степень репрезентативности содержания зада­ний теста измеряемой области психичес­ких свойств.

    Комплекс сведений В. с. традиционно имеет наибольшее значение для тестов, исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной или профессиональной). Изучае­мая деятельность носит, как правило, син­тетический характер, складывается из многих, подчас разнородных факторов (проявления личностных особенностей, комплекс необходимых знаний и навыков, специфические способности и т. д.). По­этому одной из важнейших задач созда­ния адекватной модели тестируемой дея­тельности является подбор таких зада­ний, которые будут охватывать главные аспекты изучаемого феномена в правиль­ной пропорции к реальной деятельности в целом.

    Валидность по содержанию заклады­вается в тест уже при подборе заданий будущей методики. Первым этапом вали-дизации является определение круга ис­следуемых свойств и видов деятельности, расчленение сложной способности или

    деятельности на элементы. На втором этапе разрабатывают собственно модель тестовой деятельности на основе наибо­лее важных элементов реальной деятель­ности. Наконец, на последнем этапе про­водят анализ степени соответствия разра­ботанной модели реальной деятельности, проверку соответствия пропорций пред-ставленности элементов в заданиях теста и в реальной деятельности. Так, для тес­тов достижений по отдельным предме­там разработке конкретного содержания тестовых задач предшествуют полная си­стематическая проверка соответствую­щих учебников и учебных программ, а также консультации со специалистами по данному предмету. На основе собранной таким путем информации составляют спе­цификацию теста, где указывают тестиру­емые области содержания (темы), задачи (процессы) обучения, а также относи­тельное значение каждой темы и процес­са для достижения целей обучения на дан­ном этапе. Конкретные задания оценива­ются экспертами по принципу их близос­ти к реальным требованиям. Эксперты вы­носят суждения о том, охватывает ли тест репрезентативную выборку конкретных навыков и знаний исследуемой области, обучения.

    Широкое использование экспертных оценок сближает В. с. с процедурой опре­деления валидности критериальной. Однако существенным различием между этими типами валидности является то, что экспертные оценки при анализе содер­жания являются критерием самого теста, в то время как при критериальной валиди-зации они относятся к испытуемым из вы­борки стандартизации. Расчленение изу­чаемой деятельности или способности на элементы является необходимым этапом характеристики синтетической валиднос­ти (см. Валидность критериальная). В В. с. синтетический подход реализуется в анализе элементного состава содержания

    самого теста, а не совокупности внешних валидизации критериев.

    Экспертная оценка адекватности со­держания заданий теста может быть до­полнена при характеристике В. с. рядом эмпирических процедур. Так, можно про­верить, насколько от класса к классу по­вышается суммарный показатель для группы и индивидуальное выполнение те­ста достижений. Эта процедура в значи­тельной мере близка определению валид­ности конструктной с помощью критерия возрастной дифференциации (см. Валид­ность по возрастной дифференциации). Роль этого критерия при оценке В. с. зак­лючается не в верификации конструкта, лежащего в основе теста, а лишь в анали­зе гипотез, приведших к выбору того или иного материала теста.

    Наряду с тестами достижений В. с. является одной из важнейших форм вали­дизации тестов критериально-ориен­тированных, а также методик, предна­значенных для профотбора, анализа ус­пешности овладения профессией.

    Для валидизации опросников личнос­тных и тестов интеллекта критерии В. с. имеют ограниченное применение и используются лишь на начальных стадиях составления теста. Личностные опросни­ки, как правило, не имеют того сходства с исследуемой областью поведения, как это имеет место в случае тестов достижений. Ответы на вопросы анкеты, опросника, данные проективных исследований позво­ляют лишь косвенно судить о реальной де­ятельности испытуемого. Проявление личностных свойств и реализация способ­ностей в деятельности могут носить инди­видуальный характер.

    При проведении теста интеллекта эф­фективное решение заданий может дости­гаться за счет логического мышления, ме­ханической памяти, психомоторной по­движности, разными путями и способами. Наконец, в отличие от тестов достиже-

    ний, опросники личностные и тесты ин­теллекта прямо не связаны с конкретным курсом обучения или общностью предше­ствовавшего жизненного опыта, на кото­рых строится содержание тестов достиже­ний.

    ВАЛИДНОСТЬ ТЕКУЩАЯ (диагности­ческая, конкурентная)— характеристика теста, отражающая его способность раз­личать испытуемых на основании диагно­стического признака, являющегося объек­том исследования в данной методике. В качестве таких признаков могут высту­пать уровни общих способностей, при­тязаний, вербальный интеллект, тревож­ность и т. д. В более узком значении В. т. — установление соответствия ре­зультатов валидизируемого теста неза­висимому критерию, отражающему состо­яние исследуемого тестом качества в момент проведения исследования.

    Вместе с валидностью прогности­ческой В. т. входит в комплекс сведений валидности критериальной методики. Основной процедурой определения В. т. является корреляционный анализ связи результатов теста с критериальными ха­рактеристиками исследуемого свойства. Распространенным способом характерис­тики диагностической эффективности ме­тодики является сравнение контрастных групп (см. Валидность). В. т. может оп­ределяться на основании сопоставления оценок и заключений по валидизируемо-му тесту с результатами другой методики, валидность которой является установлен­ной.

    Своеобразным показателем В. т. явля­ется комплекс сведений о том, насколько удобен, экономичен тест по сравнению с получением информации об исследуемом качестве из других источников (наблюде­ние, анализ объективных данных, экспер­тная оценка и т. д.). По этой информации можно судить, напр., о том, что является

    более простым и подходящим с т. з. конк­ретных практических задач исследования: провести обследование членов бригады с помощью теста достижений или про­анализировать такие традиционные пока­затели, как производительность, качество работы, стабильность выработки, удов­летворенность работой,текучесть кадров и т. д. (см. Валидность инкрементная). Критерий В. т. является одним из ве­дущих при характеристике валидности любой психодиагностической методики. Однако наиболее высоким требованиям В. т. должны отвечать клинические тесты, служащие для уточнения дифференциаль­ного диагноза, скрининговые методики (см. Отсеивание), тесты достижений, психометрические тесты интеллекта и ряд др.

    ВАЛИДНОСТЬ ЭКОЛОГИЧЕСКАЯ

    валидность теста по отношению к из­меряемому свойству в контексте опреде­ленной ситуации. В. э. является свой­ством теста, проявляющимся в том, что его применение при решении различных практических задач ведет к качественно различной интерпретации результатов те­стирования (В. Н. Дружинин, 1990).

    Введение понятия В. э. связано с дав­но обсуждающейся в психодиагностике проблемой влияния ситуации на результа­ты тестирования. Споры между «чертис-тами» (сторонниками теории черт лично­сти, постулирующими устойчивость в разных ситуациях форм поведения, соот­ветствующих определенным психическим свойствам) и «ситуационалистами» (по­рой утвержающими полное отстутствие влияния свойств личности на поведение в конкретной ситуации), хотя и продолжа­ются по сей день, привели к возникно­вению и развитию теорий личностно-си-туационного взаимодействия. Однако остаются невыясненными параметры си­туаций, релевантных измеряемым свой-

    48

    ствам, требуют изучения личностные проявления, подверженные влиянию си­туации. И сегодня остается во многом ак­туальным провозглашенный в начале восьмидесятых годов призыв Д. Магнус-сона (1981) к созданию психологии ситу­аций.

    Как хорошо известно, тестирование всегда происходит в конкретной жизнен­ной ситуации, а тест разрабатывается для решения определенной задачи (задач). Поэтому необходимо, используя тест в различных ситуациях, быть уверенным в том, что возможна такая переносимость теста из ситуации в ситуацию. Описание теста, по мнению В. Н. Дружинина, долж­но, наряду с другими известными характе­ристиками, содержать сведения о его В. э. Важнейшим моментом в создании модели тестирования, учитывающей В. э., явля­ются свойства ситуации тестирования (см. Психодиагностические ситуации). Следует учесть, что понятие В. э. в насто­ящее время связано исключительно с пси­ходиагностическими ситуациями, т. е. си­туациями, в которых происходит взаимо­действие между диагностом и обследуе­мым, и не распространяется на другие типы ситуаций, в которых осуществляет­ся поведение (проявление индивидуаль­но-психологических особенностей).

    ВАЛИДНОСТЬ ЭМПИРИЧЕСКАЯ

    совокупность характеристик валидности теста, полученных сравнительным ста­тистическим способом оценивания. Име­ет отношение главным образом к области валидности критериальной и двум ее видам: валидности текущей и валидно­сти прогностической.

    Если при определении валидности содержательной оценка теста проводит­ся с помощью различных качественных процедур получения информации описа­тельными методами с использованием эк­спертных оценок и других источников ин-

    формации (для вынесения суждения о со­ответствии заданий теста содержанию предмета измерения), то В. э. измеряется всегда с помощью статистического корре­лирования. Проводится корреляционный анализ связи двух рядов значений — оце­нок теста и показателей по внешнему па­раметру изучаемого свойства (или ре­зультатов другого теста, валидность которого известна) (см. Валидизации критерий). Конкретные процедуры опре­деления В. з. связаны с комплексом ва­лидности коэффициентов.
    1   ...   4   5   6   7   8   9   10   11   ...   71


    написать администратору сайта