Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
Скачать 5.87 Mb.
|
Содержательная валидность. Г.8. Если деятельность по выполнению теста интерпретируется как репрезентативная выборка из видов деятельности в общем множестве ситуаций, в руководстве необходимо дать четкое определение учитываемого общего множества и описать критерии отбора выборки из него. (Существенно.) Комментарий. В определение не должны включаться предположения о детерминирующих деятельность психических процессах, т. к. это объект не содержательной, а конструктной валидности. Г.8.1. Если вопрос о соответствии выборки заданий их общему множеству или о точности выставления оценок решали эксперты, в руководстве должен быть описан соответствующий профессиональный опыт и квалификация экспертов, а также инструкции, на основании которых проводилась экспертная оценка. (Очень желательно.) Г.8.1.1. Если задания отобраны экспертами, то должна быть обобщена степень согласованности между их суждениями. (Желательно.) Г.8.1.2. Содержание теста должно быть проверено относительно возможности смещения. (Желательно.) Комментарий. Смещение может иметь место, если задания не представляют сравнимых видов деятельности и поэтому не являются выборкой из области деятельности, общей для различных подгрупп. Такое смещение следует выявлять с помощью достаточно полных суждений экспертов. Изучение установок или интерпретаций заданий в различных подгруппах также дает полезную информацию. Суждения о смещении могут быть сами смещены — следует придерживаться принципа, что по возможности суждения должны подтверждаться статистическими данными. Г.8.2. В руководствах к тестам достижений учебных результатов должна быть сообщена система классификации, использованная для отбора заданий. (Желательно.)* Г.8.2.1. Если тест достижений был разработан в соответствии с двумерной схемой «темы—процессы», в руководстве должна быть представлена эта схема с перечислением заданий, относимых к каждой клетке схемы. (Очень желательно.) Г.8.3. Для любого утверждения о связи заданий с изучаемым предметом (или другими источниками содержания) в руководстве должна быть указана дата, когда изучаемый предмет был разработан. (Существенно.) Г.8.4. Если тест описан как валидный по содержанию труда или видов трудовой деятельности, в свидетельствах о валидности должно быть полное описание трудовых обязанностей, относительная частота, важность, а также уровень умений, требующихся при их выполнении. (Существенно.) Конструктная валидность. Г.9. Если автор интерпретирует тест как меру диагносцируемого конструкта (способности, черты установки), то должна быть полностью изложена предполагаемая интерпретация. Этот конструкт должен быть полностью ограничен^ интерпретаций, вытекающих из других теорий. (Существенно.) Комментарий. Например, если тест предназначен для измерения конструкта «тревожность», автор теста должен отразить отличия самого определения данного конструкта от некоторого другого возможного значения термина, которое подразумевается, и должен соотнести свою концепцию с мерами тревожности, рассмотренными в литературе. Описание конструкта может быть простым, например определение «креативности» как «совершения многих оригинальных действий». Все подобные характеристики или гипотезы являются частью авторской концепции. Г.9.1. В руководстве должна быть отражена степень случайности предложенной интерпретации и обобщены исследования гипотез, вытекающих изданной теории. (Существенно.) Г.9.1.1. Каждое исследование, содержащее теоретические выводы о тесте, должно быть отражено так, чтобы были раскрыты и операциональные процедуры исследования, и соотнесение результатов с теорией. (Очень желательно.) Г.9.1.2. В руководстве должны быть сообщены корреляции между тестом и другими тестами, для которых интерпретация относительно ясна. (Очень желательно.) Г.9.2. В руководстве необходимо привести доказательства степени, с которой другие конструкты, отличающиеся от предполагаемого автором, объясняют дисперсию баллов теста. (Очень желательно.) Комментарий. Хотя неразумно требовать от автора теста предвосхищения или включения в руководство каждой противоположной интерпретации, он все же должен представить достаточные данные о противоположных гипотезах, наиболее вероятно объясняющих дисперсию тестовых баллов. Г.9.2.1. В руководстве к любому специализированному тесту или вопроснику, используемому в образовательном отборе, профориентации, необходимо приводить корреляцию его баллов с общепринятыми мерами вербальной и вычислительной способности в соответствующей популяции. (Очень желательно.) Г.9.2.2. В руководстве должна быть представлена информация о факторных исследованиях (если тест подвергался им), показывающих процент тестовой дисперсии, выявляемой хорошо известными факторами. (Желательно.) Г.9.2.3. Для опросников, являющихся мерами личности, интересов или установок, должны быть представлены доказательства степени, с которой оценки чувствительны к попыткам испытуемых представить социально желаемую (конформную) картину своей личности или с которой баллы могут отражать'другие искажающие особенности ответов. Такие виды ответов должны изучаться в первую очередь для определенных выборок, а не для более общей генеральной выборки. Могут быть представлены корреляционные или экспериментальные исследова-ния.„ (Очень желательно.) Г.9.2.4. Если тест, проводимый с ограничением во времени, интерпретируется в качестве измеряющего гипотетическое психологическое свойство, не связанное специально с быстротой выполнения теста, то должны быть представлены свидетельства о влиянии скорости на тестовые баллы и об их корреляции с другими переменными. (Существенно.) Комментарий. Наиболее полным доказательством влияния скорости выполнения может быть сравнение баллов по двум формам с обычным ограничением при неограниченном времени. Корреляция баллов этих вариантов имеет ограниченный смысл, т. к. эти два балла не являются независимыми. Менее исчерпывающим доказательством является процент испытуемых, ответивших на последнее задание или некоторое задание, близкое к концу теста, за время, отведенное на выполнение теста. Если этот процент ниже 90, необходимо более глубокое исследование, чтобы показать, что индивидуальные различия по тесту существенно не отражают скорости. Г.9.2.5. Если различия в стратегии выполнения теста влияют на интерпретацию баллов, связанных с определенными характеристиками подгрупп, об этом должна быть дана ясная информация или ясно указано на отсутствие ее. (Очень желательно.) Г.9.2.6. Если свидетельство против противоположной интерпретации основано на низкой корреляции при малом различии между группами, в руководстве не-. обходимо сообщить доверительность поправки или обсудить ошибки измерения, которые могли снизить соответствующую зависимость. (Желательно.) Д. Сведения о процедуре применения теста. Интерпретация тестов и средств измерения, так же как и результатов эксперимента, наиболее надежна, когда измерения ведутся в стандартизированных и контролируемых условиях. Конечно, в тестировании существуют ситуации, когда важно систематически менять обстоятельства для максимального понимания деятельности индивида. Например, исследователь может систематически менять процедуры в последовательных повторениях теста, чтобы выяснить пределы умения ребенка в определенной содержательной области. Тем не менее составитель теста должен сам предусмотреть стандартные процедуры, в которых возможна подобная модификация. Вне стандартизации качество интерпретации может ухудшиться в степени, с которой различия в процедуре влияют на результаты тестирования. Для большинства целей наибольший упор делается на строгую стандартизацию процедур проведения тестов и инструкций к нему, Если тест предназначен для разнообразных популяций, эти процедуры должны быть полностью доступны для всех испытуемых из каждой популяции. Д.1. В руководстве к тесту должна быть указана квалификация и специализа- ция, необходимая для проведения теста и его интерпретации. (Существенно.) Комментарий. Однако из руководств в определении квалификации, необходимой для индивидуального тестирования детей данным тестом, различают психологов, которые работают с детьми, и тех, кто работает только со взрослыми. Другое руководство указывает на специфичность тестирования учащихся, родной язык которых отличается от языка теста. Квалификация пользователя может быть описана путем указания на профиль специального обучения, которое в общем считается необходимым для достижения компетентности. В некоторых руководствах к тестам могут выделяться наиболее частые источники ошибок применения теста и указываться виды обучения пользователей, дающие возможность устранить эти ошибки. Д. 1.1. Если тест рекомендован для нескольких целей и типов заключений, в руководстве следует указать степень обучен-ности пользователей, необходимую для каждого применения. (Существенно.) Д. 1.2. Если авторы предполагают, что тест может использоваться неспециалистами, то руководство должно быть написано в форме, доступной их пониманию. (Существенно.) Комментарий. С тестом могут иметь дело не только лица, специально обученные этому. Испытуемые, члены педагогических и общественных комиссий, родители имеют также основание для суждений по тесту. Это их право не вступит в противоречие с необходимостью сохранять тайну, если им доступны описательные и объясняющие материалы. Д.1.3. Руководство не должно допустить, чтобы тест понимался как «самоинтерпретирующийся». В нем должно быть указано, какую информацию о результатах тестирования возможно представить лицам, не имеющим необходимой для интерпретации подготовки. (Существенно.) Комментарий. Обычно желательно получать интерпретацию оценок подготовленным лицам. Конечно, существуют тесты, результаты которых могут быть оценены испытуемыми; часто полезно сообщать тестовые баллы учащимся и родителям. Если это практикуется, смысл данного требования в том, что должны даваться необходимые сведения по интерпретации этих баллов. В руководстве должно быть указано, что может выполняться необученным лицом и что не может выполняться. Например, в одном руководстве к широко известному тесту интересов указывается, что испытуемые могут усвоить способы оценивания результатов собственных ответов, но подчеркивается, что они нуждаются в помощи квалифицированного учителя или консультанта при интерпретации результатов и построении планов на будущее. Д.2. В руководстве к тесту следует указать степень необходимого для теста сохранения тайны его содержания в ходе предварительной тренировки. (Очень желательно.) Комментарий. Тест числового ряда предполагает тренировочную практику, для того чтобы испытуемые лучше поняли инструкцию. Данная тренировочная практика не дублирует заданий теста и, следовательно, сохраняет содержание самого теста втайне. Д.2.1. В руководстве должны быть описаны примеры неприемлемой практики. (Очень желательно.) Д.З. В руководстве к тесту необходимо отразить основные этапы процедуры его проведения. (Существенно.) Комментарий. Обычно последовательность проведения теста такова: 1) объяснить испытуемым цель проведения теста; 2) гарантировать сохранение тайны индивидуальных ответов; 3) в соответствии с требованиями руководства прочитать инструкцию и провести тренировку; 4) попросить испытуемого или самому заполнить (если требуется) паспортные и биографические данные в регистрационных бланках; 5) ответить на имеющиеся вопросы; 6) обработать результаты теста в соответствии с требованиями руководства. Д.4. Инструкции по проведению должны быть отражены в руководстве к тесту максимально подробно, с подчеркиванием, что пользователь теста может и должен воспроизвести те условия тестирования, при которых разработаны нормы и получены данные о надежности и валиднос-ти. (Существенно.) Комментарий. Так как лица, проводящие тесты в школах и на производстве, иногда могут не поступать строго по инструкциям и не понимать необходимости их соблюдения, важно, чтобы руководство в этом отношении было очень убедительным. Для обеспечения стандартности процедуры.некоторые тесты проводятся полностью механизированным способом. Д.4.1. Инструкции, опубликованные в руководстве к тесту, должны быть достаточно полными, чтобы тестируемые понимали необходимость действовать так, как подразумевал автор теста. (Существенно.) Комментарий. Например, при заполнении опросника личности субъект иногда может давать первый встретившийся ему ответ. Следовательно, подобная возможность должна быть указана в инструкции, которую субъект читает или которая ему зачитывается. Инструкция для вопросников интересов должна определить, следует ли испытуемому отмечать то, что ему нравится в идеале, или также следует предусмотреть возможность того, что ему необходимо иметь благоприятные условия и способности этого достигнуть. Подобным образом в инструкции необходимо определить, следует ли испытуемому отмечать то, что ему нравится, но встречается иногда,или только то, что ему нравится и встречается постоянно. Д.4.1.1. Инструкция должна четко подчеркнуть такие критические моменты, как указания об угадывании, лимиты времени и способ ответов. (Существенно.) Д.4.1.2. Инструкция для тестирующего должна содержать указания по поводу вопросов со стороны испытуемых. (Очень желательно.) Д.4.2. Если предусматривается возможность изменения и совершенствования инструкций, описанных в руководстве к тесту, то должны быть ясно указаны условия, при которых позволительно это делать; эти условия приводятся или в форме общих правил, или на основе значительного числа примеров, или тем и другим способом. (Существенно.) Д.5. Инструктаж должен подготовить испытуемого к обследованию: необходимо предусмотреть подборки необходимых видов стимульного материала, листы ответов, карандаши, ручки и т. п. (Желательно.) Д.6. Процедуры выставления баллов по тестовым заданиям должны быть изложены в руководстве с максимальной детализацией и ясностью, чтобы уменьшить вероятность ошибки при оценивании. (Существенно.) Д.6.1. В руководстве к тесту должны быть представлены инструкции по оцениванию результатов выполнения задания и указаны процедуры предотвращения ошибок подсчета и вычисления. (Очень желательно.) Д.6.2. Если оценивание результатов теста содержит субъективные процедуры, в руководстве должны быть представлены данные степени согласованности независимых оценщиков в операциональных условиях. Если таких свидетельств не имеется, в руководстве должно быть обращено внимание на вариации оценивания как возможный значимый источник ошибок измерения. (Очень желательно.) Д.6.3. Если в тесте используется более чем один метод выражения ответов испытуемыми, руководство к тесту должно сообщить данные о степени, с которой результаты, полученные при использовании различных методов, взаимозаменяемы. (Существенно.) Комментарий. Разное количество времени, необходимого для ответа на задания в формах, приспособленных к разным методам выставления баллов, мбжет влиять на надежность или валидность теста, на применимость тестовых норм. Д.6.4. Если использована необычная или сложная система выставления балов, в руководстве к тесту необходимо указать приблизительное количество времени, необходимое для выставления баллов по заданиям теста. (Желательно.) Д.6.5. «Формулы поправки на угадывание» должны использоваться при заданиях с множественным выбором или при ответах вида «истинно—ложно» теста на скорость выполнения заданий. (Желательно.) Е. Сведения о процедуре обработки и интерпретации тестовых результатов. По традиции интерпретация тестовых баллов является нормированно-референ-тной, т. е. индивидуальная оценка интерпретируется в сравнении с оценками других индивидов. Однако возможны и другие интерпретации. Содержательно-референтная интерпретация имеет место, если балл интерпретируется непосредственно, соответственно деятельности на каждой точке измеренного континуума достиже- ний. Критериально-референтная интерпретация отражает непосредственно интерпретацию баллов в соответствии с деятельностью в любой данной точке континуума внешней переменной. Переменной внешнего критерия могут быть средние оценки или уровни трудовой деятельности. Стандартные требования параграфа в принципе относятся больше к норми-рованно-референтным интерпретациям тестов и в меньшей степени к содержательно-референтным. ЕЛ. Нормы должны публиковаться в руководстве к тесту одновременно с публикацией теста (для операционального использования). (Существенно.) Н. 1.1. Нормы должны быть определены также к тесту, разработанному только для локального применения или только для целей предсказания. (Желательно.) Комментарий. Иногда забывают, что таблицы норм дают информацию, полезную не только для сравнения индивида с групповыми данными. Например, пользователь теста из таблицы норм может извлечь информацию относительно уровня баллов, на котором различительная сила измерения хороша или плоха. ЕЛ.2. Даже если предполагается, что тест в первую очередь будет использоваться с локальными нормами, в руководстве к тесту следует предусмотреть нормировочные данные, чтобы помочь интерпретатору, не имеющему локальных норм. (Очень желательно.) Е.2. Нормы, представленные в руководстве к тесту, должны относиться к определенным и ясно описанным популяциям. Этими популяциями должны быть группы, с которыми пользователи теста обычно желают сравнивать тестируемых лиц. (Существенно.) Комментарий. Почти во всех случаях, когда тесты разработаны не только для локальных целей, пользователь хочет знать, насколько они применимы для различных групп. Для тестов, разработанных с целью широкого использования в школах или в промышленности, необходима информация о различиях и сходствах нормативных данных для таких групп, как группы по полу, национальности, образованию или возрасту. В руководстве должны быть описаны случаи, когда нормы для одних групп также подходят и для других групп. Например, руководство к вяпроснику профессиональных интересов или к тестам способностей, важных для некоторых профессий, должно подчеркивать, что лицо, получающее высокую оценку интересов или способностей к учебному предмету или профессии при сравнении со «средним» человеком, получает более низкую оценку интересов при сравнении с лицами, фактически занимающимися в этой области. Так, высокий процентильный балл по шкале музыкальных интересов, в которой испытуемый сравнивается со «средним» человеком, может быть эквивалентен низкому процентильному баллу при сравнении испытуемого с профессиональным музыкантом. |