|
Валидность тестов. Словарьсправочник по психодиагностике издание 2е, переработанное и дополненное Серия Мастера психологии
часть элементов совокупности генеральной, отобранная с помощью специальных методов. Главной особенностью С. в. является то, что она репрезентативна по отношению к генеральной совокупности, хотя ее объем меньше. Отбор С. в. является важнейшим этапом проведения экспериментальных и других исследований. В психологической диагностике анализ характеристик С. в., выбор методов ее комплектования имеют ведущее значение при работе по стандартизации и характеристике валидности тестовой методики, разработке тестовой программы.
Формирование (комплектация) С. в. включает несколько этапов:
— обоснование структуры С. в. в соответствии с характером задач и гипотез исследования;
— уточнение структуры С. в. с учетом информации, полученной при анализе первичных результатов исследований, данных пробных и пилотажных исследований, доработки на их основе гипотез;
— определение типа и объема выборки. В наиболее общем виде по типу С. в.
делят на целенаправленные (из генеральной совокупности выбираются типичные элементы, воспроизводящие ее структуру) и случайные (вероятностные). Чисто случайная выборка — основная форма вероятностной выборки, когда все элементы генеральной совокупности имеют одинаковую вероятность попадания в С. в. Для комплектации такой выборки существует несколько приемов: отбор по принципу лотереи; отбор с помощью случайных чисел; систематический отбор, в основу которого положена определенная схема (напр., выбор по заданному интервалу). Для организации чисто случайной выборки требуется большой объем информации. Выборочные исследования имеют существенные преимущества перед сплошными с т. з. эффективности, трудовых и временных затрат на решение той или иной проблемы.
СОВОКУПНОСТЬ ГЕНЕРАЛЬНАЯ —
множество элементов, объединенных общей характеристикой, указывающей на их принадлежность к определенной системе. С. г. может быть качественной или количественной в зависимости от того, являются ли свойства единиц отбора признаками или переменными. Соответственно статистическое описание континуума С. г. принимает форму либо средних арифметических (см. Меры центральной
тенденции), либо частот распределения и процентов.
С. г. может быть конечной или бесконечной в зависимости от того, ограничено число элементов выборки или нет. Понятие бесконечной С. г. применяется в тех случаях, когда нет надобности ограничивать ее размер. Формулы расчета выборки объема для бесконечной С. г. бодее просты, чем для конечной, поэтому к ним прибегают всякий раз, когда размеры конечной совокупности достаточно велики.
При определении С. г. обычно оговариваются ее пространственные и временные границы.
СОНДИ ТЕСТ (Szondi Test) — проективная методика исследования личности. Опубликована Л. Сонди в 1939 г.
Стимульный материал С. т. состоит из 48 стандартных карточек с портретами психически больных людей (гомосексуализм, садизм, эпилепсия, истерия, катато-ническая шизофрения, параноидная шизофрения, депрессия и мания). Большинство используемых в С. т. портретов больных заимствованы из известных немецких учебников по психопатологии. Карточки-портреты разделены на 6 серий по 8 в серии (по одному портрету от каждой категории больных). Обследуемому предлагают во всех сериях портретов выбрать по два наиболее и наименее понравившихся. Для получения устойчивых показателей обследование рекомендуется проводить не менее шести раз.
При интерпретации полученного материала исходят из того, что если четыре или более портретов одной категории больных получили благоприятную или неблагоприятную оценку, то данную «диагностическую область» следует признать значимой для обследуемого. Считается, что выбор портретов зависит прежде всего от инстинктивных потребностей. Отсутствие выбора свидетельствует об удов-
летворенных потребностях, а неудовлетворенные, действующие с большой динамической силой, приводят к позитивному или негативному выбору. В случае позитивного выбора речь идет о потребностях, которые признаются, а негативный выбор указывает на задержанные, подавленные потребности.
Теоретическая позиция Л. Сонди — генетический детерминизм. Основное назначение С. т. видится его автору в исследовании родовых бессознательных черт, связанных с организацией рецессивных генов. Родовое бессознательное, согласно Л. Сонди, расположено как бы между индивидуальным и коллективным бессознательным, а «подавленные предки» направляют поведение индивидуума. Умозрительность этой концепции критикуется как отечественными, так и зарубежными исследователями. Однако стимульный материал С. т. можно использовать вне связи с теоретической позицией его автора.
Данные зарубежных исследований показывают, что С. т., как правило, не позволяет выделить клинические группы. Изучение валйдности привело к неоднозначным или отрицательным результатам.
В советской психологии на основе стимульного материала С. т. разработан «социально-перцептивный интуитивный тест», авторы которого исходили из развиваемых в 70-80 гг. психологических концепций о восприятии человека человеком (О. Н. Кузнецов с соавт., 1986). Этот тест использовали для выявления трудностей межличностных отношений в зоне социальной перцепции и изучения особенностей ценностных ориентации.
«СОСТАВЬ КАРТИНУ-ИСТОРИЮ» ТЕСТ (Make-A-Picture-Story Test, MAPS) — проективная методика исследования личности. Предложена Э. Шнейдманом в 1947 г. По существу,
«С. к.-и.» т. является вариантом тематической апперцепции теста.
Стимульный материал «С. к.-и.» т. состоит из 21 стандартного изображения «фона» (жилая комната, спальня, улица, пейзаж и т. д.) и 67 различных вырезанных из картона фигурок соответствующего масштаба (взрослые люди, дети, животные, легендарные персонажи и т. д.). Картины фона предъявляются обследуемому по одной, в то время как все фигурки постоянно находятся перед ним. Задача обследуемого заключается в том, чтобы к предложенному фону подобрать фигурки, расставить их как бы на сцене и рассказать историю о созданной им ситуации. Помимо записи истории регистрируется выбор фигурок в каждом отдельном случае.
Интерпретация полученных данных проводится так же, как в тематической апперцепции тесте. Предусмотрен количественный анализ выбора и размещения фигурок. Э. Шнейдманом опубликованы результаты исследований, показывающие возможность на статистически достоверном уровне отличить психически больных от здоровых с помощью «С. к.-и.» т. Допускается обследование как взрослых, так и детей.
Сведений об использовании в СНГ не имеется.
СПИЛБЕРГЕРА ТРЕВОГИ И ТРЕВОЖНОСТИ ШКАЛЫ —группа опросников личностных, разработанных Ч. Д. Спилбергером в 1966-1973 гг. Согласно концепции Спилбергера, следует различать тревогу как состояние и тревожность как свойство личности. Тревога — реакция на грозящую опасность, реальную или воображаемую, эмоциональное состояние диффузного безобъектного страха, характеризующееся неопределенным ощущением угрозы, в отличие от страха, который представляет собой реак-
цию на вполне определенную опасность. Тревожность — индивидуальная психологическая особенность, состоящая в повышенной склонности испытывать беспокойство в различных жизненных ситуациях, в том числе и тех, объективные характеристики которых к этому не предрасполагают. С точки зрения автора, существует возможность измерения различий между двумя упомянутыми видами психических проявлений, которые обозначаются A-state (тревога-состояние) и A-trait (тревога-черта), то есть между временными, преходящими особенностями и относительно постоянным предрасположением. Понимание тревоги в теории Спилбергера определяется следующими положениями:
1. Ситуации, представляющие для человека определенную угрозу или личнос-тно значимые, вызывают в нем состояние тревоги. Субъективно тревога переживается как неприятное эмоциональное состояние различной интенсивности;
2. Интенсивность переживания тревоги пропорциональна степени угрозы или значимости причины переживаний. От этих факторов зависит длительность переживания состояния тревоги;
3. Высокотревожные индивиды воспринимают ситуации или обстоятельства, которые потенциально содержат возможность неудачи или угрозы, более интенсивно;
4. Ситуация тревоги сопровождается изменениями в поведении или же мобилизует защитные механизмы личности. Часто повторяющиеся стрессовые ситуации приводят к выработке типичных механизмов защиты.
Концепция Спилбергера формировалась под влиянием психоанализа. В возникновении тревожности как черты ведущую роль он отводит взаимоотношениям с родителями на ранних этапах развития ребенка, а также определенным событи-
■ям, ведущим к фиксации страхов в детском возрасте.
Наиболее широко распространенной является шкала State-Trate-Anxiety-Inventory (STAI), представляющая собой комбинацию трех известных тестов: шкалы тревожности Кэттелла и Шайера, «Проявлений тревожности» шкалы (MAS) Тейлор и шкалы тревожности Вел-ша (1964). Шкала состоит из двух частей по 20 заданий в каждой. Первая шкала (STAI:X-I) предназначена для определения того, как человек чувствует себя сейчас, в данный момент, то есть для диагностики актуального состояния, а задания второй шкалы (STAI.X-2) направлены на выяснение того, как субъект чувствует себя обычно, то есть диагностируется тревожность как свойство личности. Примеры утверждений для диагностики тревоги-состояния и тревожности-свойства:
Х-1:
— Я чувствую себя свободно.
— Я слишком возбужден и мне не по себе.
— Я чувствую себя отдохнувшим.
— Я нервничаю. Х-2:
— Я обычно быстро устаю.
— Обычно я чувствую себя в безопасности.
— Я так сильно переживаю свои разочарования, что потом долго не могу о них забыть.
— Меня охватывает сильное беспокойство, когда я думаю о своих делах и заботах.
Каждая из частей шкалы снабжена собственной инструкцией, заполнение бланка ответов несложно, продолжительность обследования составляет примерно 5-8 мин. Каждое высказывание, включенное в опросник,оценивается респондентами по 4-балльной шкале. Вербальная интерпретация позиций оценочной шкалы в первой и второй частяхопросника различ-
на. Для STAI-.X-1: «совершенно верно» (4 балла), «верно» (3 балла), «пожалуй, верно» (2 балла), «совершенно неверно» (1 балл). Для STAI:X-2; «почти никогда» (1 балл), «иногда» (2 балла), «часто» (3 балла), «почти всегда» (4 балла).
Оценка первичная переводится в процентильные показатели (см. Оценки шкальные). Процентили приводятся отдельно для мужчин и женщин. Кроме этого, Спилбергер приводит средние показатели тревожности и тревоги для отдельных контингентов испытуемых (операторов, таможенников, диспетчеров железной дороги, рабочих,студентов, руководящих работников, алкоголиков, шизофреников).
При анализе валидности обнаружены положительные коэффициенты корреляции результатов STAIс такими опросниками, как «Шестнадцать личностных факторов» опросник и EPQ(см. Айзен-ка опросники личностные). Результаты факторного анализа подтверждают ва-лидность шкалы STAI. Надежность определялась методом расщепления (см. Надежность частей теста); в разных выборках г = 0,38-0,32. Внутренняя согласованность утверждений опросника находится на достаточно высоком уровне. Надежность ретестовая при интервале ретеста 14 дней для STAI:X-2 составила г, = 0,77, для STAIiX-1 rt= 0,59, что в данном случае является еще одним подтверждением ориентированности опросников Х-1 и Х-2 на ситуативные и относительно постоянные черты.
Опросник допускает индивидуальное и групповое использование.
Наряду со шкалой STAIв 1973 году была разработана шкала STAIC(State-Trait-Anxiety-Inventory for Children). Окончательная версия STAICявилась продолжением работы над STAI с целью создания опросника для подростков в возрасте от 10 до 15 лет. Также как и в шка-
ле STAI, в подростковой версии содержится 20 вопросов и опросник делится на две части: A-state, A-trait.
Обработка и интерпретация аналогична STAI, с той только разницей, что в опроснике для подростков количество позиций шкалы рейтинговых оценок уменьшено до трех.
Шкала характеризуется высокой стабильностью результатов во времени (см. Надежность ретестовая). Коэффициенты корреляции при повторном тестировании спустя 2 нед. для всей выборки стандартизации имели значение rt = 0,27 (для A-state) и rt= 0,83 (для A-trait) у мальчиков и соответственно г, = 0,22 и г, = 0,82 у девочек. Внутренняя согласованность подтверждается корреляцией заданий с общим результатом по каждой из частей шкалы и коэффициентом альфа Кронбаха. При исследовании A-state rxy = 0,26-0,52, коэффициент альфа имеет значение 0,80; при исследовании A-trait rxy= 0,13-0,52, коэффициент альфа— 0,916. Корреляция между шкалой свойства и шкалой состояния гху = 0А1.
Анализ валидности STAICосуществлялся по описанной выше модели ва-лидизации STAI. Однако имелось и оригинальное исследование валидности критериальной путем оценивания различий в состоянии тревожности у десятилетних девочек и мальчиков во время пребывания в школе и перед посещением стоматолога. Имеются сведения о положительной связи STAIC с Детской проявлений тревожности шкалой (CMAS).
Проведение обследования с помощью STAICаналогично работе со взрослой версией шкалы, выполнение обеих частей занимает от 8 до 12 мин. Рекомендуется первой предъявлять шкалу состояний, а второй шкалу свойств. В отличие от опросника STAI, в подростковой форме оценки первичные могут быть переведены
как в процентили, так и в стэны (см. Оценки шкальные) отдельно для мальчиков и девочек. Разница между возрастными категориями испытуемых была настолько малой, что авторы отказались от разработки отдельных норм.
Возможно индивидуальное и групповое обследование.
Опросники широко распространены в прикладных исследованиях, особенно в области клинической психодиагностики, и высоко оцениваются за компактность и достоверные диагностические данные.
Получил широкое распространение русскоязычный вариант STAI, который известен как шкала реактивной и личностной тревожности Спилбергера—Ханина (1976, 1978). Ю. Л. Ханин адаптировал, модифицировал и стандартизировал методику, а также получил ориентировочные нормативы поуровневой выраженности тревожности: от 20 до 34 баллов — низкий уровень тревожности, от 35 до 44 баллов — средний уровень тревожности и выше 46 баллов — высокий уровень тревожности.
СПОСОБНОСТИ КРИСТАЛЛИЗОВАННЫЕ (crystallized abilities, gc) — группа факторов интеллекта, формирующаяся в результате научения. С. к. выделены Р. Кэттеллом и Дж. Хорном (1974) с помощью факторного анализа как компонент фактора G. В модели Р. Кэттелла С. к. — конденсат жизненного опыта, формирующийся на основе природно обусловленных способностей текучих под влиянием культуры, к которой принадлежит человек, активности, интересов личности. По мнению Р. Кэттелла, генетические факторы не оказывают на С. к. непосредственного воздействия, а возрастное снижение может не проявляться до глубокой старости. С. к. измеряются с помощью стандартных психометрических тестов интеллекта.
СПОСОБНОСТИ ТЕКУЧИЕ (Fluid abilities, gf) — группа факторов интеллекта, связанных с врожденными основами общих способностей. С. т. выделены с помощью факторного анализа Р. Кэттеллом и Дж. Хорном как компонент фактора Gна материале тестов, минимизирующих индивидуальные различия в образовательном и культурном уровнях. Индивидуальные природно обусловленные С. т., в основе которых, как полагается, лежит способность отыскивать связи, выявлять отношения и зависимости, являются основой для реализации в условиях конкретной культуры способностей кристаллизованных. Р. Кэттелл считает, что генетические факторы оказывают на С. т. непосредственное воздействие, а их возрастное снижение начинается сравнительно рано (в третьем десятилетии жизни). Предполагается, что С. т. могут быть измерены с помощью т. н. культурно-свободных тестов интеллекта (см. Культурно-свободный интеллекта тест.
СТАВЕЛА ОРИЕНТИРОВОЧНАЯ ПРОВЕРКА— тест интеллекта. Разработан Й. Ставелом в 1928 г., издан под названием «Братиславский тест». Позднее редактировался несколько раз и переводился на многие языки, Название С. о. п. получил авторский вариант 1950 г.
Методика представляет собой тестовую батарею, включающую 7 субтестов. Общее количество заданий— 170. Состав субтестов:
Субтест А. Арифметическое мышление. Содержит 21 задание. Успешность его выполнения зависит от усвоения основных арифметических операций и способности решить простые математические задания.
Субтест Б. Обобщение. Содержит 32 задания, выявляет уровень ориентировки в окружающем мире. Решение заданий заключается в выборе правильного отве-
та из предлагаемых альтернативных решений.
Субтест В. Выполнение инструкций. Содержит 19 заданий, выполнение которых требует правильного понимания письменной инструкции, удержания всех ее элементов в памяти и верного применения. Требуются также анализ и структурирование стимульного материала, достаточный объем памяти и концентрация внимания.
Субтест Г. Практическая осведомленность. Содержит 12 заданий, с помощью которых оценивается уровень понимания повседневных жизненных ситуаций. Правильный ответ выбирается из 3-х предлагаемых решений.
Субтест Д. Исключение. Содержит 28 заданий, решение которых требует понятийного анализа, сравнения понятий. Испытуемому необходимо исключить одно из пяти слов, четыре из которых логически связаны.
Субтест Е. Овладение понятиями. Содержит 29 заданий, решение которых требует сопоставления, осознания сходства и различия между понятиями разного уровня и абстракции. Выполнение задания заключается в подборе к определенному понятию логически противоположного из пяти предлагаемых вариантов.
Субтест Ж. Аналогии. Содержит 29 заданий. Проверяется понимание отношений между понятиями. Решение заключается в выборе понятия, аналогичного заданному.
Тест предназначен для обследования детей школьного возраста начиная с 8 лет и допускает индивидуальное и групповое проведение. Время выполнения ограничено. За каждый правильный ответ испытуемому начисляется 1 балл. Суммарный показатель по всем субтестам переводится в стэны или показатель IQ(см. Оценки шкальные). Стандартизация, а также оценка психометрических характери-
стик проводилась Й. Ставелом на выборке более чем 2000 детей.
По мнению В. Черны и Т. Колларик (1988), С. о. п. пригодна для изучения уровня общих способностей, получения предварительной информации об учащихся в связи с выбором профессии.
Сведений об использовании в СНГ нет.
СТАНДАРТИЗАЦИЯ (англ. standard —
типовой, нормальный) — унификация, регламентация, приведение к единым нормативам процедуры и оценок теста. Благодаря С. методики достигается сопоставимость полученных результатов у разных испытуемых, появляется возможность выражения тестовых оценок в относительных к выборке С. показателях (см. Оценки шкальные), сопоставления таких оценок в разных тестовых методиках.
В психологической диагностике различают две формы С. В первом случае под С. понимаются обработка и регламентация процедуры проведения, унификация инструкции, бланков обследования, способов регистрации результатов, условий проведения обследования, характеристика контингентов испытуемых (см. Область применения теста, Модераторы). Строгая периодичность процедуры обследования — обязательное условие обеспечения надежности теста и определения тестовых норм для оценки результатов обследования.
Во втором случае под С. понимается преобразование нормальной (или искусственно нормализованной) шкалы оценок в новую шкалу, основанную уже не на количественных эмпирических значениях изучаемого показателя, а на его относительном месте в распределении результатов в выборке испытуемых.
Наиболее распространенными преобразованиями оценок первичных в психометрике являются центрирование и нормирование посредством среднеквадра-
тических отклонений. Под центрированием понимается линейная трансформация величин признака, при котором средняя величина распределения становится равной нулю (Z.xix<j) = Zxix> j)). Так, если
при обследовании группы испытуемых с помощью вновь разрабатываемого теста получено значение х = 17 «сырых» баллов, то это величина может быть выбрана в качестве центра отсчета шкалы, в обе стороны от которой симметрично (если подтверждена нормальность распределения оценок (см. Оценка типа распределения) располагаются показатели х <хи х > х.
Процедура нормирования заключается в переходе к другому масштабу (единицам) измерения, который осуществляется по формуле:
где / (х) — теоретические частоты в эмпирической выборке, п — число членов выборки стандартизации, h— ширина интервала группирования данных в эмпирическом распределении, а — стандартное отклонение в выборке, / (X) — функция нормирования значений х{.
В качестве функции нормирования обычно выступает г-показатель (стандартный показатель), выражающий отклонение индивидуального результата xtв единицах, пропорциональных стандартному отклонению единичного нормального распределения.
Удобство пользования любой нормальной кривой заключается в том, что ее можно совместить со стандартной (единичной) кривой с параметрами Мн- О и он = 1 путем вычитания х эмпирического распределения (при этом центр нормальной кривой эмпирического распределения смещается от М = х кМ = хн =0) и делением на стандартное отклонение
Таблица 24 Перевод тестовых оценок в стандартные
Используя эти равенства, можно перевести любое нормальное распределение в другое нормальное распределение, в том числе и единичное. Как видно из табл. 24, оценки 2-шкалы могут принимать как отрицательное (выполнение индивидом теста на уровне ниже среднего), так и положительное значение. К недостаткам шкалы следует отнести слишком крупный масштаб единиц измерения (а= 1). Для удобства простую г-шкалу можно трансформировать, выбрать другие значения Miи ст(-. Новые е-показатели (zt) будут определяться по формулам:
32
| -9,07
| -2,91
| -2,91
| 20,9
| 33
| -8,07
| -2,59
| -2,59
| 24,1
| 34
| -7,07
| -2,27
| -2,27
| 27,3
| 35
| -6,07
| -1,95
| -1,95
| 30,5
| 36
| -5,07
| -1,63
| -1,63
| 33,7
| 37
| -4,07
| -1,31
| -1,31
| 36,9
| 38
| -3,07
| -0,98
| -0,98
| 40,2
| 39
| -2,07
| -0,66
| -0,66
| 43,4
| 40
| -1,07
| -0,34
| -0,34
| 46,6
| 41
| -0,07
| .Гр.02
| -0,02
| 49,8
| 42
| 0,93
| 0,30
| 0,30
| 53,0
| 43
| 1,93
| 0,62
| 0,62
| 56,2
| 44
| 2,93
| 0,94
| 0,94
| 59,4
| 45
| 3,93
| 1,26
| 1,26
| 62,6
| 46
| 4,93
| 1,58
| 1,58
| 65,8
| 47
| 5,93
| 1,90
| 1,90
| 69,0
| 48
| 6,93
| 2,22
| 2,22
| 72,2
| * М^ = 41,7; **ол = 3,12.
Пример перевода первичных оценок по тексту в г-шкалу приведен в табл. 24.
Если в оценке по двум тестам х1и х2 распределены нормально, z— показатель нормальной кривой:
Пример подобной трансформации с выбранными значениями М = 50; о = 1 (см. Оценки шкальные) приводится в табл. 24.
Благодаря возможности таких преобразований шкалы, традиционно принятые в психодиагностике и построенные на основе шкалы г-показателей, становятся сопоставимыми, и возможен переход из одной шкалы в другую с иными показателями М и а.
СТАНДАРТИЗИРОВАННОЕ ИНТЕРВЬЮ ПОВЕДЕНИЯ ТИПА А — разновидность опросника личностного. Разработан сотрудниками Каунасского медицинского института в 1978 г. Направлен на диагностику поведения типа А.
Методика состоит из 21 вопроса оценочной шкалы, с помощью которой экспериментатор оценивает поведение испытуемого (учитываются следующие параметры: манера держать себя, походка, скорость движений, их амплитуда, поза, речь, общий стиль поведения и др.)
Примеры вопросов:
— Часто ли Вы думаете о работе по вечерам и в выходные дни?
— Старались ли Вы быть во всем первым и лучшим, когда были моложе?
— Если Вы испытываете нетерпение и раздражение, то трудно ли Вам это скрыть?
Возможны три варианта ответов: «Да», «Нечто среднее», *Нет».
Имеются данные о достаточной кон-структной валидности опросника. При сопоставлении с данными Дженкинса поведения обозрения коэффициент корреляции — 0,64. Диагностические заключения и выводы совпадают в 71,8% случаев с подтвержденным клиническим диагнозом.
Методика стандартизирована на выборке из 1450 человек. Как психодиагностический инструмент требует дальнейшей проверки. В случае установления достаточно высокой валидности прогностической, валидности текущей и диск-риминативности может быть рекомендована как вспомогательный инструмент для скрининга (см. Отсеивание), а также для исследований, направленных на изучение психологических особенностей психосоматических больных.
СТАНФОРД—БИНЕ УМСТВЕННОГО РАЗВИТИЯ ШКАЛА (Stanford— Binet Intelligence Scale) — тест интеллекта. Предназначен для измерения уровня интеллектуального развития. Первый вариант С.—Б. у. р. ш. был разработан Л. М. Терменом в 1916 г. и представлял собой модификацию Бине—Симона шкалы умственного развития. В ходе разработки в базовую методику было введено большое количество изменений. По сравнению со шкалой Бине было добавлено более трети новых заданий, ряд старых был либо переделан, либо отброшен или переадресован другим возрастным груп-
пам. Фактически уже первая редакция С.—Б. у. р. ш. представляла собой новый тест. В дальнейшем тест неоднократно радикально совершенствовался, и к настоящему времени используется уже третья его редакция (1972).
Тесты, включенные в батарею Стан-форд—Бине, группируются по возрастным уровням (см. Бине—Симона умственного развития шкала), от уровня II (2 года) до уровня взрослого (22 года и 10 месяцев — XVI — 8 уровень). Для уровней II—V группы заданий по возрастным градациям составляются с разницей в полгода, что связано с быстрым психическим развитием в соответствующие периоды. Для возрастных уровней V-XIV тесты учитывают разницу в возрасте в 1 год. Остальные уровни обозначаются как подростковый и взрослый I, II и III уровни. Комплекс задач для каждого возрастного уровня, за исключением подросткового, состоит из 6 тестов (для подросткового уровня — 8 тестов).
Батарея тестов Станфорд—Бине включает задания, направленные на исследование широкого диапазона способностей — от простого манипулирования до абстрактного рассуждения. На ранних возрастных уровнях тесты требуют главным образом зрительно-моторной координации, перцептивного различия, способности понимать инструкцию (в заданиях типа складывания кубиков, нанизывания бус, подбора геометрических фигур), а также способности узнавать предметы, предъявляемые в виде игрушечных моделей или изображений на карточках. На высших возрастных уровнях в наибольшей степени представлены тесты, использующие вербальное содержание заданий. Среди них словарный тест (объяснение значения слов), аналогии, завершение предложений, определение абстрактных понятий, интерпретация пословиц. Некоторые тесты направлены на характеристи-
ку степени плавности и беглости речи (быстрое называние не связанных между собой слов, подбор рифм, построение предложений с заданными словами).
Среди заданий батареи широко представлены тесты общей осведомленности, знания норм общественной жизни, правил поведения (ответы на вопросы, интерпретация ситуаций, обнаружение несоответствий в сюжетных картинках или рассказах). В шкалу включен ряд тестов памяти, пространственной ориентации (визуальная репродукция фигур, лабиринты, складывание и разрезание бумажных объектов и т. д.). На более высоких возрастных уровнях анализируется степень усвоения некоторых навыков, приобретенных в школе (умение читать, знание арифметики).
Тесты внутри каждого возрастного уровня одинаковы по трудности и расположены без учета сложности заданий. Для каждого возрастного уровня предусмотрен запасной набор задач, применяемых по мере необходимости.
Четыре субтеста из каждого уровня отбираются для сокращенной шкалы, которую применяют в случае использования методики в качестве краткой пробы. Вместе с тем корреляция результатов укороченной и полной программы обследования является достаточно высокой.
Особенностью процедуры обследования, вытекающей из шкального принципа подбора заданий, предложенного А. Бине, является то, что испытуемому предлагается неполный набор заданий методики. Предъявляются лишь те тесты, которые соответствуют интеллектуальному уровню обследуемого. Стандартная процедура обследования начинается с применения заданий, относящихся к более низкому уровню, чем тот, который соответствует возрасту испытуемого. Затем в зависимости от успеха или неуспеха осуществляется переход на более высокий или низкий
уровень. «Базовый уровень» определяется как максимальный возрастной уровень, все задания которого выполняются. Исследование продолжается с переходом на возрастающие по сравнению с базовым уровнем группы заданий до тех пор, пока нерешенными оказываются все тесты данной группы. Соответствующий уровень определяется как «потолочный».
Показатель «умственного возраста» в С.—Б. у. р. ш. равен «базовому возрасту» с прибавлением к нему добавочных месяцев за правильно решенные задания из уровней, находящихся выше. Для уровней II—V с полугодовыми интервалами каждый из шести решенных тестов засчи-тывается за 1 месяц. Для уровней VI-XIV за каждое решенное задание дополнительно даются 2 месяца. На каждый из взрослых уровней приходится более года «умственного возраста», поэтому число дополнительных месяцев здесь определяется пропорционально временному интервалу и числу тестов.
Процедура обследования с помощью С.—Б. у. р. ш. занимает примерно 30-40 мин для детей младшего возраста. Для более старших возрастных групп длительность обследования не более 1,5 ч. Материалы, необходимые для проведения теста, включают набор игрушек для обследования детей младшего возраста, тестовые тетради с заданиями, протоколы, руководство по проведению обследования и обработке результатов.
При обследовании с помощью ряда тестов методика допускает возможность получения широкой качественной информации о методах работы испытуемого, способах решения им задач. Большие возможности предоставляются и наблюдению за личностными качествами: уровнем активности и мотивированности, уверенности, настойчивости и т. д.
Сложная процедура проведения обследования и интерпретации полученных
результатов, необходимость строгого соблюдения стандартов требуют высокой квалификации и предварительной тренировки экспериментатора.
Первый вариант С.—Б. у. р. ш. (1916) и вторая редакция шкалы (Л. М. Термен, М. А. Мерилл, 1937) отличались репрезентативным нормированием. Редакция 1937 г. включала две параллельные формы теста (Lи AT) и была предназначена для обследования испытуемых в возрасте от 1,5 до 18 лет.
В первых редакциях основным измеряемым показателем являлся относительный /Q-показатель (см. Интеллекта коэффициент). В третьей редакции (1960) вводятся оценки IQ-показателя стандартного. В этой же редакции параллельные формы преобразованы в единую
а-м).
Наиболее распространенная к настоящему времени редакция формы L—Mшкалы Станфорд—Бине (1972) включает тестовые задания, аналогичные по содержанию включенным в вариант шкалы 1937 г., однако нормы теста здесь были подвергнуты рестандартизации. Выборка стандартизации включала примерно по 100 детей для каждой возрастной группы в интервале от 2 до 5,5 года (временной шаг выборок — 0,5 года) и в возрастных группах от 6 до 18 лет (через 1 год). Последняя редакция теста содержит таблицы стандартного /Q-показателя для умственного (МА) и фактического (СА) возраста, соответствующие годам и месяцам возраста испытуемого, включает нормативные таблицы показателя МА по данным варианта L-M(1937).
По применению шкал Станфорд— Бине накоплен огромный опыт, включающий фактические данные и их интерпретацию. По широте использования эта методика занимает в зарубежной психодиагностике одно из ведущих мест среди тестов интеллекта. Для большинства
специалистов в области психологической диагностики и потребителей психодиагностической информации /Q-коэф-фициент, определяемый с помощью шкалы Станфорда—Бине, связывается с конкретным выражением понятия «интеллект». Длительность использования и широта распространения сделали систему отсчета оценок шкальных С.—Б. у. р. щ. стандартом для других психометрических тестов (см. IQ-показатель стандартный).
Распределение результатов /Q-показа-телей шкал Станфорд—Бине положено в основу классификации степеней умственной отсталости, широко распространенной в западной психодиагностике (Классификация Американской Ассоциации по изучению умственной неполноценности — AAMD).
В ходе многолетнего накопления данных получены разнообразные сведения о характеристиках С.—Б. у. р. ш. Ее надежность (по параллельным формам теста) с интервалом ретеста до недели составляет для возрастных групп от 2,5 до 5,5 года 0,83 для интервала /Q-показате-лей 140-149 и 0,91 —для /(р-показате-лей_60-69. В возрастных группах 6-13 лет для соответствующих величин IQ-no-- казателей коэффициенты надежности составляют соответственно 0,91 и 0,97, а для возраста 14-18 лет — 0,95 и 0,98. Таким образом, тест более надежен для лиц старшего возраста с относительно низкими /Q-показателями. Однако очевидно, что и в прочих случаях надежность шкалы достаточно высока.
Валидность критериальная шкалы Станфорд—Бине (текущая и прогностическая) характеризовалась на основе сопоставления с показателями школьной успеваемости (сравнение с экспертными оценками учителей и данными тестов достижений). Коэффициент валидности по связи с этими критериями составляет
0,40-0,75. Особенно значимой является связь /Q-оценок с показателями (констатирующего характера и прогностическими) успешности обучения предметам с преобладанием словесного материала. Результаты критериальной валидизации показывают, что тест.Станфорд—Бине в основном направлен на измерение уровня школьных способностей.
Данные валидности конструктной С.—Б. у. р. ш. опираются на анализ этой группы характеристик методом дифференциации по возрастному критерию, подтверждающий прогрессивную вариабельность измеряемых показателей с возрастом.
Однородность заданий шкалы (см. Внутренняя согласованность) для батарейного теста является достаточно высокой (около 0,66). Факторный анализ указывает на связь результатов выполнения тестов шкалы с фактором, G.
В целом анализ валидности содержательной и конструктного содержания теста указывает на доминирующую направленность С.—Б. у. р. ш. на тестирование комплекса вербальных способностей, некоторую перегруженность содержания тестов вербальным материалом. Эта особенность затрудняет адаптацию теста для других языковых и социокультурных групп.
Сведений об использовании в СНГ не имеется.
СТЕПЕНЬ СВОБОДЫ — характеристика распределения, используемая при проверке статистических гипотез. Обозначается символами dfили я'. В вариационной статистике понятие С. с. отражает степень произвольности вариантов заполнения определенных групп, на которые квантифицируется распределение. Предположим, строится распределение /Q-оценок в определенной группе лиц (рис. 69).
Рис. 69. Вариант заполнения интервалов оценок в выборке из 100 обследованных
Известно, что /Q-оценкй в данной группе варьируют от -2а до +2а. Тогда групп (интервалов шкалы) (k), если считать пределом интервала сг, будет четыре. Число испытуемых в группе составляет 100 человек. Если в первых трех интервалах шкалы число испытуемых, получивших соответствующие оценки, может быть произвольным, то в последнем интервале их число может составить лишь разницу между суммарным числом испытуемых в трех интервалах и общим числом обследованных. Другими словами, при заполнении четвертого интервала произвольность ограничена. С. с. данного распределения будет равна трем (df = k-\).
При представлении переменных в виде таблицы размером tх k, dk = (t - \)(k -- 1), где t— количество интервалов первого признака (количество строк таблицы), k— количество интервалов второго признака (столбцов таблицы).
В общем случае при малой выборке (п < 50) df = nlдля распределения одного признака и df - п - 2 для распределения двух признаков (л — число наблюдений).
Показатель С. с. наиболее широко используется при расчете статистических гипотез с использованием критериев Стьюдента, Фишера, z-критерия, критерия X2. При применении каждого критерия и в каждом конкретном случае его использования существуют свои правила определения количества степеней свободы.
СТИМУЛЬНО-ИНСТРУКТИВНАЯ СИТУАЦИЯ ТЕСТА — комплексная характеристика теста, отражающая особенности инструкции, характер и тип теста стимульного материала и особенности оценки полученного результата.
Понятие С.-и. с. т. введено Р. Кэттел-лом и Е. Варбуртоном (1967) и лежит в основе предложенной ими таксономии психодиагностических методик. Выделяют тринадцать параметров, характеризующих типы С.-и. с. т. и соответственно варианты конструкции тестов.
1. Ориентированность теста на фиксацию наличия или отсутствия реакции на стимул (напр., тесты чувствительности к боли, тесты на время реакции и т. д.).
2. Наличие ограничений или неограниченное разнообразие ответов, способов реагирования (напр., ср. опросники с дихотомическим выбором ответа и Рорша-ха тест).
3. Наличие вариантов выбора решения или свободно продуцируемый ответ (см. Задачи открытого типа; Задачи закрытого типа). Примером свободных ответов являются те, которые дает обследуемый в тематической апперцепции тесте.
4. Наличие в тесте единичных или повторяющихся ответов (см,, напр., Тесты скорости).
5. Упорядоченная или неупорядоченная последовательность ответов (напр., от испытуемого может требоваться выполнение теста в строгой последовательности от первого до последнего задания, и, напротив, может допускаться свободный выбор последовательности решаемых задач).
6. Однородность или разнородность ответов (некоторые тесты состоят из заданий единого типа, в других, напр, в тестовых батареях, задания могут отличаться по своему характеру).
7. Свободное или ограниченное время решения.
8. Завершенность (окончательность) реакции или реагирование на реакцию. Испытуемый либо непосредственно реагирует на материал теста, либо на свою собственную реакцию, например, тот или иной стимул как-либо оценивается, вызывает ассоциации или воспоминания (см., напр., Пиктограмма).
9. Наличие явного или неявного смысла заданий. Некоторые тесты не имеют никакого вне их лежащего значения (напр., измерение времени реакции). В то же время там, где интересуются мнением о чем-либо, такое значение всегда присутствует.
10. Представление теста в виде отдельных заданий или целостное представление. Речь идет о различиях между тестами, состоящими из дискретных задач или же из единственного задания.
11. Психологическая сущность действия, необходимого для выполнения теста. Этот параметр учитывает, требуется ли для ответа: а) знание (напр., верное суждение); б) мнение; в) опознание или распознание.
12. Различия в субъективной приемлемости в ситуации тестирования.
13- Различия в свободе выхода из ситуации тестирования.
Приведенные таксономические параметры теоретически обусловливают существование 213 типов С.-и. с. т. Дополнительно к параметрам, описывающим характеристики стимулов и инструкции, выделяют шесть характеристик оценивания результатов теста:
1. Объективность—субъективность оценивания.
2. Оценка целостного поведения или отдельных реакций.
3. Регистрация одного правильного (или возможного) ответа либо классификация разнообразных ответов (параметрическое или непараметрическое оценивание). Параметрически раскрывается
время, количество ошибок, повторений и т. д. Непараметрически оценивается количество и разнообразие классов ответов. Непараметрическое оценивание свойственно многим тестам креативности.
4. Анализ всей совокупности ответов или их части, соответствующей некоторому критерию (напр., опросники личностные).
5. Наличие единого однородного показателя или различных относительных показателей. Единый показатель возможен при оценке теста в целом, как, напр., в случае личностных опросников. Разнотипные относительные показатели могут определяться в форме: различия во време-
ни выполнения первой и второй частей теста (см. Корректурная проба); запоминания материала в обычных условиях и при действии отвлекающих факторов и т. д.
6. Нормативное оценивание или ип-сативное оценивание.
С учетом общего количества приведенных параметров теоретическое число возможных вариантов С.-и. с. т. составляет (2i3 х 26) типов. Согласно Р. Кэттеллу и Е. Варбуртону, для использования в практике конструирования тестов особое значение имеют 64 варианта, полученные из трех наиболее важных ситуаций и параметров оценивания, генерирующих по восемь возможных вариантов.
I
ТАУТОФОН (Tautophone) — проективная методика исследования личности. Предложена Д. Шаковым и С. Розенцвей-гом в 1940 г. на основе т. н. «вербального сумматора», созданного Б. Скиннером (1936) для проверки его гипотезы о развитии звуков речи.
Обследуемому сообщают о том, что он должен прослушать запись мужского голоса, однако эта запись нечеткая, неразборчивая, а поэтому нужно быть очень внимательным. Требуется разобрать, о чем «говорит» записанный на пленку голос (в действительности запись смысла не имеет, а представляет-собой повторение определенных групп гласных звуков). Разработана система оценки полученных результатов, учитывающая степень сложности структуры ответов, элементы подчиненности ответа стимульному звуку, его личностные элементы и некоторые другие особенности. На этом основании делаются выводы о внушаемости, контактности, субъективности, отношении к себе и другим людям. Данные о валидно-сти и надежности Т. отсутствуют. Существуют различные модификации Т. Наиболее известной является слуховой апперцепции тест.
Сведений об использовании в СНГ не имеется.
|
|
|