Главная страница
Навигация по странице:

  • РАЗВИТИЕ ТЕСТИРОВАНИЯ ЗА РУБЕЖОМ

  • ОТЕЧЕСТВЕННАЯ ИСТОРИЯ ТЕСТИРОВАНИЯ

  • СОВРЕМЕННЫЕ ТЕОРИИ ТЕСТИРОВАНИЯ

  • СУЩНОСТЬ И ПОНЯТИЕ ПЕДАГОГИЧЕСКОГО ТЕСТА

  • ТЕСТОВОЕ ЗАДАНИЕ КАК СТРУКТУРНАЯ ЕДИНИЦА ТЕСТА

  • ДОСТОИНСТВА И НЕДОСТАТКИ ТЕСТОВОЙ ФОРМЫ КОНТРОЛЯ ЗНАНИЙ

  • КОМПЬЮТЕРНОЕ ТЕСТИРОВАНИЕ И АДАПТИВНЫЙ ТЕСТОВЫЙ КОНТРОЛЬ Адаптивное тестирование

  • ТЕСТ КАК ИНСТРУМЕНТ ИЗМЕРЕНИЯ КАЧЕСТВА ЗНАНИЙ

  • Доклад. филлипова. Становление и развитие тестирования


    Скачать 42.25 Kb.
    НазваниеСтановление и развитие тестирования
    АнкорДоклад
    Дата04.12.2022
    Размер42.25 Kb.
    Формат файлаdocx
    Имя файлафиллипова.docx
    ТипДокументы
    #827418

    СТАНОВЛЕНИЕ И РАЗВИТИЕ ТЕСТИРОВАНИЯ

    В 1879 г. в Лейпциге В. Вундт создал первую лабораторию экспериментальной психологии, по образцу которой открылось, большое количество лабораторий в Англии, Франции, Америке, Голландии, России. В. Вундт считал возможным применение экспериментальных методов для изучения низших уровней психики (ощущений, восприятия), его многочисленные ученики и последователи постепенно перешли к изучению явлений более высокого уровня: мышления (О. Кюльпе), внимания (Э. Тит-ченер, Д. М. Кеттелл), поведения в целом (Э. Мейман, С. Холл, В. Бехтерев). Изменение предмета йисследования влекло за собой изменения в используемых методах. Изучение поведения потребовало адресации стимуляции уже не отдельным психическим процессам, а личности в целом.

    Автором термина «тест» (от англ. test – проверка, проба) является ученик В. Вундта американский психолог Джеймс Кеттелл, предложивший термин в 1890 г. в работе «Интеллектуальные тесты и измерения». Им была высказана мысль о необходимости исследования с помощью тестов большого числа индивидов с соблюдением стандартных условий исследования, что позволит сопоставлять результаты, полученные разными исследователями, и приведет к преобразованию психологии в точную науку. Впоследствии им было создано около 50 «умственных тестов» для определения глазомера, чувства времени, исследования оперативной памяти.

    Предоставленная тестами возможность количественной оценки психических явлений и сопоставления на этой основе результатов разных испытуемых между собой обусловили бурное развитие метода на рубеже XIX-XX вв. Предметом исследования в этот период являлись в основном способности, необходимость диагностики которых ощущалась в психиатрии (в связи с необходимостью диагностики нарушений психической деятельности) и в сфере обучения (для объективной оценки знаний, умений и навыков).

    В 1904 г. появился первый тест, соответствующий современному пониманию тестов: французскими психологами А. Бине и Т. Симоном был разработан тест интеллекта для выявления умственно неполноценных детей, не способных обучаться в обычных школах. Шкала умственного развития Бине-Симона содержала 30 заданий, расположенных по возрастанию трудности и позволяющих отделять случаи умственной отсталости от нормы. Например, для ребенка 3 лет требовалось: 1) показать свои глаза, нос, рот; 2) повторить предложение длиной до 6 слогов; 3) повторить по памяти 2 числа; 4) назвать нарисованные предметы; 5) назвать свою фамилию. Если ребенок решал все задания, ему предлагались задания более старшей возрастной группы. Итоговым показателем являлся умственный возраст, который считался следующим образом: если, например, трехлетний ребенок сделал все задания своего возраста и половину заданий старшей группы, то его умственный возраст равнялся 3,5 г. С 1904 по 1986 г. шкала выдержала несколько редакций, став родоначальником современных тестов уровня умственного развития.

    В 1912 г. немецким психологом В. Штерном был введен коэффициент интеллекта IQ (от англ. Intellegence Quotient), определяемый как отношение умственного возраста к хронологическому возрасту, выраженное в процентах.

    В начале XX в. развитие тестирования стимулируется также запросами промышленности и армии. Создаются тесты, способные осуществлять профессиональную дифференциацию и отбор в различных отраслях производства и сферы обслуживания (тесты Мюнстербергадля профотбора телефонисток, тесты Фридриха для отбора слесарей, тесты Гута для наборщиков и др.), а также для набора новобранцев в армию и распределения- их по родам войск (тесты «Армия Альфа» и «Армия Бета»). Это привело к появлению группового тестирования. Впоследствии армейские тесты были использованы в гражданских целях для дошкольников, школьников, студентов и даже заключенных.

    Одновременно наблюдается всплеск развития клинических тестов. Первые клинические тесты служили в основном задаче выявления патологии умственного развития. В первой половине XX в. появляется целый ряд методик, направленных уже надифференциальную диагностику, на отличение одного типа патоло- гии от другого. Наиболее выдающиеся фигуры этого времени:немецкий психиатр Э. Крепелин, предложивший тесты интеллектуальной пробы, свободных ассоциаций и др.; швейцарский психиатр Г. Роршах, автор «теста чернильных пятен» (и термина «психодиагностика», которым изначально назывался метод работы стестом, затем – с проективными методиками, ныне – наука ипрактика работы с методами постановки психологического диагноза вообще). Постепенно наблюдается распространение тестов на околоклиническую сферу (выявление последствий травм нервной системы, обследование правонарушителей, лиц сэмоциональными расстройствами).

    Параллельно идет развитие теоретических основконструирования тестов, совершенствование методов математико-статистич ческой обработки. Появились корреляционный и факторный анализы. Это позволяло разрабатывать принципы стандартизации тестов, что давало возможность создавать согласованные тестовые батареи. В итоге были предложены методики, построенные по факторному принципу (опросник Р. Кеттелла 1бРРидр.), и появились новые тесты интеллекта (1936 г. – тест Равена, 1949 г. – тест Векслера, 1953 г. – тест Амтхауэра). В это же время совершенствуются тесты профотбора (батарея GATB для армии США в 1957 г.) и клинические тесты (опросник MMPIв 1940-е гг.).

    В послевоенные годы происходят важные изменения в идеологии тестирования. Если раньше тесты «работали» на общество (отсев, отбор, типизация людей по различньш категориям), то в 1950-1960-е гг. тестология «индивидуализируется» и обращается к нуждам и проблемам отдельной личности (тест УСК, опросники Айзенка и др.). Тесты профотбора («годен – не годен») сменяются тестами профориентации («куда годен»). Появляется огромное количество личностных опросников. Цель – углубленное познание личности, выявление ее особенностей.

    В настоящее время в арсенале психодиагностики имеется более 10 тысяч различных методик.

    РАЗВИТИЕ ТЕСТИРОВАНИЯ ЗА РУБЕЖОМ

    Метод тестирования широко известен за рубежом. Однако в нашей стра­не в силу различных причин тесты разного назначения и качества появи­лись не так давно. Современная тестология, равно как и другие науки, име­ет свою историю.

    Проникновению измерительных методов в педагогику и психологию спо­собствовало быстрое развитие естествознания, возникновение и распрост­ранение теорий, объясняющих процесс развития человека как изменяющий­ся и усложняющийся во времени. Одними из первых ученых, попытавшихся измерить различия между людьми в области элементарных психических про­цессов, были Френсис Гальтон, Джеймс Мак-Кин Кэттелл. Собственно это не были тесты в современном понимании, скорее это были попытки поиска но­вых методик для описания интересующих качеств индивида.

    Однако еще в 1864 г. появляются «scale books» (шкалированные книги) англичанина Джорджа Фамера. В 1894 г. публикуются таблицы по проверке орфографических знаний учащихся американца Дж.М. Раиса. Данных ис­следователей можно назвать пионерами зарождения современной тесто­вой теории.

    Важным этапом представляются работы Френсиса Гальтона, чей науч­ный интерес лежал в области изучения наследственности. В рамках дан­ной работы автор проводил систематические антропологические исследо­вания, пытаясь установить определенные закономерности.

    На Всемирной выставке 1884 г. Ф. Гальтон организовывает антрополо­гическую лабораторию. Все желающие за определенную плату могли из­мерить некоторые свои физические характеристики: зрительную, слуховую, тактильную чувствительности, определить мускульную силу, время реак­ции и др. Кроме того, оценивались способности запоминать буквы и разли­чать цвета, ряд физиологических особенностей организма и некоторые пси­хические свойства.

    Ф. Гальтон сам разрабатывал простые тесты, которые применялись в его исследованиях. Многие из этих тестов находят свое применение и сегодня. После закрытия выставки лаборатория переехала в Лондон и про­должала работать еще 6 лет. Всего за годы своей работы Ф. Гальтону удалось провести обследование около 10 тысяч человек, что позволило авто­ру обобщить полученный опыт и сделать ряд выводов, касающихся как антропологических измерений, так и методики применения тестов.

    Измеряя физические характеристики отдельного индивида, Ф. Гальтон проводил параллели с умственным развитием человека. Фактически, на основании физиологических данных делался вывод о развитии интеллекта человека. В этом отношении Ф. Гальтон отчасти опирался на учение Д. Локка, полагая, что сенсорные отличия и время реакции равны интеллекту.

    Кроме того, Ф. Гальтон заложил и основу теории статистической обра­ботки результатов, полученных при тестировании. Исследователь разраба­тывает метод статистического сравнения двух рядов переменных, вводит индекс совместного отношения, получившего название коэффициента кор­реляции. Также Ф. Гальтон изучает взаимосвязь переменных и построение линий регрессии одной переменной на другую.

    А.Н. Майоров называет три основных принципа, выделенных Ф. Гальтоном и внесших существенный вклад в развитие теории тестов:

    • применение серии одинаковых испытаний к большому количеству ис­пытуемых;

    • статистическая обработка результатов;

    • выделение эталонов оценки.

    Ф. Гальтон отмечал, что методически упорядоченное тестирование тре­бует определенных условий эксперимента. Это был существенный отход от тысячелетней практики испытаний и проверок, основанных на интуиции. Хотя не все аппаратурные испытания Гальтона можно назвать тестами с позиции сегодняшнего дня, он сделал первый шаг на пути создания объек­тивных методов оценки способностей и свойств личности.

    Ф. Гальтон впервые предложил термин «тест» для обозначения своих исследований. Однако в 1894 г. выходит статья Джеймса Мак-Кина Кеттелла «Умственные тесты и измерения». Именно после выхода данной статьи термин «тест» приобретает наибольшую популярность. Работы американ­ского психолога Дж. М. Кеттелла объединили модное тогда направление эк­спериментального психологического тестирования. Под влиянием Ф. Галь­тона он занимался созданием лаборатории экспериментальной психоло­гии и распространения тестов.

    Дж.М. Кеттел работал над проблемой описания личности, используя лишь минимальное число экспериментов. Выход из этой проблемы был найден -исследователь разработал набор заданий, которые он использовал для опи­сания интеллектуальной характеристики личности. Так, например, в рабо­те, опубликованной в 1890 году, он дает список 50 лабораторных тестов, которые были еще и снабжены стандартными инструкциями. Необходимо отметить, что данные задания разрабатывались в течение нескольких лет различными лабораториями в одинаковых условиях, что позволило получить качественный инструментарий. Тем не менее данные тестовые задания по­зволяли описать лишь элементарные проявления психики и не затрагивали высшие психические функции. Увлечение описанием только элементарных психологических состояний в целом характерно для психологической науки того времени. Простые функции могли быть измерены с большой точнос­тью, а разработка объективных методов измерения более сложных функций казалась безнадежной задачей.

    Равно как и Ф. Гальтон, Дж.М. Кеттел работал над требованиями, позво­ляющими использовать тест в проведении научных исследований. Такими требованиями явились:

    • одинаковость условий для всех испытуемых;

    • ограничение времени тестирования приблизительно одним часом;

    • в лаборатории, где проводится эксперимент, не должно быть зрителей;

    • оборудование должно быть хорошим и располагать людей к тестиро­ванию;

    • одинаковые инструкции и четкое понимание испытуемыми, что нуж­но делать;

    • результаты тестирования подвергаются статистическому анализу, находят минимальный, максимальный и средний результаты, рассчитыва­ют среднее арифметическое и среднее отклонение.

    Начиная с первого десятилетия XX века представление о тесте и его научное определение стали заметно отличаться друг от друга. Хотя всякий тест включает в себя задания как элементы испытаний, он перестает сво­диться только к этому. Все чаще тест применяется как метод научного ис­следования, включающий в себя ряд требований измерения.

    Первая попытка научного измерения интеллектуальных способностей де­тей была сделана в начале XX века во Франции. Авторы созданного для этой цели теста А. Бине и Т. Симон провели эмпирическую проверку заданий, пре­тендующих на включение в тест. Для оценки работоспособности ученика авто­ры использовали два основных критерия:

    1) эмпирическую меру трудности каж­дого задания, определявшуюся на группах детей разного возраста,

    2) инфор­мацию о степени совпадения результатов теста с мнением преподавателей.

    Для достижения сопоставимости данных, полученных ими, с данными других ис­следователей и минимизации ошибок измерения А. Бине и Т. Симон приложили к тесту стандартную инструкцию по проведению тестирования.

    Необходимо отметить, что первоначально А. Бине занимается изучени­ем простых физических реакций. Ученым был разработан ряд оригиналь­ных методик, направленных на изучение интеллекта. Были испробованы многие методы, в том числе, например, изучение формы черепа, лица, рук, анализ почерка. Однако в процессе своих исследований А. Бине ставит перед собой задачу измерения, пусть даже грубого, высших интеллекту­альных качеств личности.

    В 1896 г. А. Бине публикует статью, где критикует работы Ф. Гальтона и Дж.М. Кеттелла. Критике подверглась возможность адекватного исследо­вания интеллекта в целом посредством измерения элементарных психиче­ских процессов.

    В 1904 г. А. Бине приступает к работе по созданию тестов, позволяющих дифференцировать детей, не желающих трудиться, от детей, страдающих врож­денными умственными недостатками. Работа проводилась в рамках создания в Париже специальных школ для умственно неполноценных детей. А. Бине и его коллега Т. Симон разработали серию заданий для детей разных возрастных групп. Впервые был применен принцип возрастающей трудности при составле­нии тестовых заданий. То есть задания подбирались таким образом, чтобы ве­роятность успешного выполнения задания возрастала с хронологическим воз­растом. Трудность определялась по сравнению с контрольными группами, со­стоящими в основном из «нормальных» детей и небольшого количества детей слабоумных. Данная шкала получила название шкала 1905 года.

    В 1908 году А. Бине и Т. Симон модернизируют тест. Общее количество тес­тов было увеличено, неудачные тесты были заменены, и все тесты были сгруп­пированы по возрастным уровням. Таким образом, исследователи определили нормы для детей разных возрастов. А. Бине и Т. Симон вводят понятие умствен­ного уровня, соответствующего возрасту нормальных детей. Позже появился более популярный термин умственного возраста. В целом можно выделить сле­дующие преимущества разработанных А. Бине и Т. Симоном тестов:

    • дифференцировались по трудности заданий (от более простых к бо­лее сложным);

    • дифференцировались по возрастным группам;

    • была предпринята попытка стандартизировать тест, разработать стан­дартизированные шкалы;

    • применялись статистические методы обработки результатов. Тесты Бине-Симона пользовались огромной популярностью в мире. По­являются различные переводы и модификации данных тестов.

    Одной из таких модификаций является предложенный в Америке Левисом Мэдисоном Терменом свой вариант теста. Он получил название Станфордской шкалы интеллекта Бине или шкалы Станфорда-Бине. В данной редакции исследователь увеличивает количество тестов, разрабатывает инструкции для проведения отдельных субтестов, проводит ряд других усо­вершенствований. Именно в этом варианте впервые было введено поня­тие коэффициента интеллектуальности IQ, которое рассматривалось как отношение между умственным и фактическим возрастами.

    Одновременно с попытками создания качественного тестового инстру­ментария проводятся работы в области статистической обработки резуль­татов и определения валидности.

    Так, в 1896 г. Карл Пирсон закладывает основы теории корреляции. Ко­эффициент Пирсона показывает не только положение индивида в группе, но и степень его отклонения от группового значения.

    В 1904 г, Чарльзом Эдвардом Спирменом была фактически обоснована двухфакторная теория. Согласно этой теории корреляция между двумя пе­ременными свидетельствует о наличии общего фактора (причины, опреде­ляющей величины этих переменных) и специфических факторов, прису­щих каждой переменной.

    Впоследствии Луис Левой Терстоун развил далее идею факторного ана­лиза. Работам Л. Терстоуна по статистике предшествовала разработанная теория интеллекта. Согласно данной теории интеллект рассматривался как целое, объединяющее различные индивидуальные характеристики (вербаль­ные, перцептивные способности, способности к восприятию пространства, памяти, беглой речи). Все эти факторы равноправны, не существует единого фактора интеллекта. С помощью факторного анализа не просто устанавли­вается связь изменения одной переменной с изменением другой, а опреде­ляется мера этой связи и обнаруживаются основные причины, лежащие в основе указанных изменений. Достижения корреляционного и факторного анализа находят свое применение и в современных исследованиях.

    Следующим мощным толчком развития теории о тестах явилось интен­сивное техническое перевооружение ведущих капиталистических стран. Все острее стала осознаваться мысль о том, что не каждый желающий сможет управлять сложными техническими устройствами: для этого необходимы знания, способности и соответствующие навыки, а значит, нужны тесты, про­фессиональный отбор и профессиональная подготовка. Существенное вли­яние на развитие тестологии оказали объективные потребности в подготов­ке квалифицированных специалистов в годы Первой и Второй мировых войн. Большинство тестов, разрабатываемых в то время в США, призваны были удовлетворить нужду армии в здоровых, квалифицированных служащих.

    Важная задача, стоявшая перед исследователями в этот период, - раз­работка и внедрение групповых тестов. В 1917 г. Американской психологи­ческой ассоциацией был назначен комитет для рассмотрения тех средств, которыми психология может помочь ведению войны. Данный комитет стол­кнулся с необходимостью оперативного определения интеллектуального уровня полутора миллионов новобранцев, качественного распределения их по родам войск, выявления способных к командованию и т.д.

    В 1917-1919 гг. в США появляются первые групповые тесты для нужд армии. Наибольшее применение нашли тесты Артура Синтона Отиса. Им были предложены два набора тестов - армейский Альфа-тест и армейский Бета-тест - для владеющих английским языком и для не владеющих или плохо владеющих названным языком. Основные принципы, использован­ные при составлении этих тестов, были систематизированы и впоследствии легли в основу всей методологии групповых тестов.

    1. Принцип ограничения во времени (чтобы только 5% испытуемых мог­ли окончить проработку всего теста).

    2. Принцип детализированной инструкции в отношении проведения и в отношении подсчета.

    3. Введены тесты с выборочным методом формирования ответа с ука­занием подчеркивать наугад в случае незнания или сомнения.

    4. Подбор тестов после тщательной статистической обработки и экспе­риментальной проверки.

    В это же время широко развиваются методики обработки результатов тестирования, создания тестовых систем.

    С начала XX века определилось и педагогическое направление в разви­тии тестологии. А.А. Маккол разделил тесты на педагогические и психоло­гические - по определению уровня умственного развития. Основной зада­чей педагогических тестов являлось измерение успешности учащихся по школьным дисциплинам за определенный период обучения, а также успеш­ность применения определенных методов преподавания и организации.

    Разработка первого педагогического теста - теста Стоуна на решение арифметических задач, снабженного «нормами», принадлежит американс­кому психологу Эдуарду Ли Торндайку. Он считается основоположником педагогических измерений.

    В 1918 г. А. Отис публикует серию групповых тестов для школы. Амери­канские психологи работают над созданием «интеллектуальных» тестов для школ всей страны, названных «национальные тесты». «Национальные те­сты» были составлены в 2 сериях по 2 варианта в каждой серии. Совер­шенствуя методику, американские тестологи в этих тестах впервые перед каждым разделом теста дают примерные упражнения.

    В 60-е гг. американскими психологами Дж. Кэрроллом и Б. Блумом были разработаны тестовые задания на основе модели полного усвоения. Дж. Кэрролл предложил сделать постоянным, фиксированным параметром именно результаты обучения. В таком случае все параметры условий будут меняться, подстраиваясь под достижение всеми учащимися заранее за­данного результата. Этот подход был поддержан и развит Б.С. Блумом. Текущие тестовые задания носили диагностический характер и не служили основой для выставления отметок. Оценочное суждение, которое делал учитель по результатам теста, принадлежало к типу «зачет - незачет» (или «усвоил - не усвоил»). Тестовые задания, разработанные Б. Блумом, Дж. Кэрроллом, имели дифференцированный характер: одни задания были нацелены на запоминание и воспроизведение изученного материала, дру­гие - на способность понимать значение изученного, третьи - на умение использовать изученный материал в конкретных условиях и новых ситуа­циях, четвертые - на умение разбить материал на составляющие, пятые -на умение комбинировать элементы, чтобы получить целое, обладающее новизной, шестые - на умение оценивать значение того или иного матери­ала. Основное назначение текущих тестовых заданий - выявить необходи­мость коррекционной работы, вспомогательных учебных процедур. Следу­ющий шаг в разработке тестовых заданий по методике обучения на основе полного усвоения - подготовка альтернативных «коррекционных» учебных материалов по каждому из тестовых вопросов; эти материалы рассчитаны на такую дополнительную проработку неусвоенного материала, которая отличается от первоначального способа его изучения, дает возможность ученику подобрать подходящий для него способ работы.

    Последовавшее за открытием тестов как метода измерения в психологии и педагогике быстрое развитие психотехники, педологии, эксперименталь­ной педагогики вызвало настоящий ажиотаж. Массовое использование тес­тов в практике психодиагностики и школы происходило одновременно с ин­тенсивным развитием не столько теории, сколько технологии тестирования.

    ОТЕЧЕСТВЕННАЯ ИСТОРИЯ ТЕСТИРОВАНИЯ

    В России до 1917 года вопросам тестирования не уделялось достаточного внимания. Практическое значение тесты получили только после 1925 года, когда была создана особая тестовая комиссия. Тестовая комиссия существовала при педагогическом отделе Института методов школьной работы. В ее задачи входила разработка стандартизированных тестов для советской школы. И уже в 1926 году были разработаны тесты по некоторым предметам: природоведению, обществоведению, счету, решению задач, знанию географической карты, на понимание чтения и правописание, созданные на основе американских. К этим тестам прилагались инструкции и личная карточка для учета прогресса учащегося.

    Проблемой разработки тестов вплотную занимались видные российские психологи и педагоги: С.Г. Геллерштейн, П.П. Блонский, А.П. Болтунов, М.С. Бернштейн, A.M. Шуберт, Г.И. Залкинд и др. В 1927 году вышла книга С.М. Василейского «Введение в теорию и технику психологического, педологического и психотехнического исследования», где излагались теоретические и практические подходы к созданию и использованию тестов.

    В 20-е годы Центральная педологическая лаборатория MОHO под руководством педолога Е. Гурьянова разработала и выпустила в свет несколько тестов:

    1. Шкала для измерения умственного развития испытуемых.

    2. Тесты для учета навыков в чтении, счете и письме.

    3. Тесты коллективного испытания умственной одаренности.

    Под руководством П.П. Блонского в педагогическом кабинете Академии коммунистического воспитания осуществлялась проверка шкалы Бине-Симона, создание тестов и построение собственных стандартов. В Ленинградском научно-педагогическом институте им. А.И.Герцена и Детском обследовательском институте им. А.С. Грибоедова разрабатывались тесты на одаренность для массовых обследований испытуемых нормальных школ.

    Однако вскоре положение кардинально изменилось. Вышедшее
    в 1936 году постановление ЦК ВКП(б) «О педологических извращениях в системе Наркомпросов» негативно сказалось на развитии педологии в целом и тестологии в частности. Метод тестов был признан буржуазным орудием для дискриминации обучающихся и «изгнан» из советской школы. Одной из причин негативного отношения к тестам того времени было отсутствие заинтересованности системы управления в объективных результатах обследований педологов.

    В стране появилось несколько центров, в которых достаточно профессионально занимаются работой с тестовыми методиками. Среди наиболее активных следует назвать: Центр тестирования профессионального образования (ЦТПО, г. Москва), Центр оценки качества образования Института общего среднего образования РАО, Центр тестирования выпускников общеобразовательных учреждений Российской Федерации, Центр психологического и профессионального тестирования МГУ, Лаборатория аттестационных технологий Московского института повышения квалификации работников образования (МИПКРО), Лаборатория изучения образовательных систем Центра развития образования (г. Санкт-Петербург), Центр аттестации областного института повышения квалификации и переподготовки педагогических кадров (г. Вологда), Научно-информационный центр государственной аккредитации Минобразования России (г.Йошкар-Ола), Исследовательский центр проблем качества подготовки специалистов, Центр аттестации Института развития регионального образования (г. Екатеринбург) и целый ряд других.

    Завершая обзор становления и развития тестирования, хочется подчеркнуть важность и педагогическую ценность этого метода, дающего возможность статистически точно анализировать процесс получения образования, искоренять недочеты и видеть дальнейшие перспективы его развития. Критическое отношение к тестированию, понимание его возможностей позволит педагогу адекватно использовать тесты для улучшения педагогического процесса.

    СОВРЕМЕННЫЕ ТЕОРИИ ТЕСТИРОВАНИЯ

    Педагогическое измерение латентных качеств в западной литературе ассоциируется с Latent Trait Theory; этим названием утверждается специфическая направленность и даже уникальность данной теории для измерения именно латентных качеств. Однако это неверно. На самом деле все, без исключения, теории тестов направлены на оценку истинных компонентов измерений, явно не наблюдаемых.

    И все теории исходят из аксиомы устойчивого существования истинных (латентных) компонентов измерения испытуемых. В начале 30-х годов классик Чикагской психометрической школы Тюрстон подчеркивал важность индекса надежности результатов измерения (rxt). Этот индекс является мерой связи наблюдаемых значений каждого варианта теста с истинными, ненаблюдаемыми компонентами измерений. В силу приведенных аргументов название Latent Trait Theory нельзя признать правильным.

    Вероятно, поэтому часто применяется второе название Latent Trait Theory - Item Response Theory. Ввиду отсутствия приемлемого аналога названия этой теории на русском языке российский тестолог В.С. Аванесов, как и большинство на Западе, называет её современной.

    В фокусе изучения IRT находится, строго говоря, не тесты, как системы заданий, а отдельные задания. Вот почему это скорее не теория «тестов», а математизированная теория анализа характеристик тестовых заданий.

    Не случайно главным в IRT являются утверждение о зависимости вероятности правильного ответа испытуемого от уровня подготовленности испытуемого и от параметров задания. Эту зависимость удобнее представлять в виде логистической функции.

    Числу рассматриваемых параметров ставится в соответствие одна-, двух- и трехпараметрическая модели измерения. Эти модели с надлежащей полнотой изложены в работах многих западных исследователей. Одним их первых исследователем этих моделей измерения в России был В.С. Аванесов.

    Хотя отдельные методы IRT (например, расчет информационной функции теста) применяются для оценки соответствия теста уровню подготовленности испытуемых, это - следствие суммирования значений информационных функций отдельных заданий. Всё отмеченное позволяет предложить новый вариант перевода названия IRT на русский язык как математико-статистической теории анализа тестовых заданий. Что близко к смыслу названия оригинала и согласуется с излагаемой ниже классификацией теорий педагогического измерения латентных качеств.

    СУЩНОСТЬ И ПОНЯТИЕ ПЕДАГОГИЧЕСКОГО ТЕСТА

    Развитие информационных технологий приводит к широкому использованию тестирования в педагогической практике. Тесты используются на всех стадиях обучения для различных целей: оценки способностей и склонностей, самооценки и оценки уровня знаний. Они являются основой единого государственного экзамена (ЕГЭ), применяются при аттестации высших учебных заведений.

    В настоящее время существуют организации, которые занимаются разработкой компьютерных тестов. Однако преждевременно говорить о наличии единых стандартных тестов проверки знаний по дисциплинам профессионального образования, которые позволяют сравнить знания студентов различных потоков, факультетов, институтов.

    «Педагогический тест – это система специально подобранных проверочных заданий специфической формы, позволяющая количественно оценить учебные достижения в одной и нескольких областях знаний». Тест, созданный для проверки уровня усвоения знаний по одной учебной дисциплине, называют гомогенным.

    Одной из основных характеристик качественного теста является его валидность. Валидность можно определить как всеобъемлющую качественную характеристику теста, что отражается в приведенных ниже высказываниях. «Степень научности педагогического контроля связана с понятием валидности (т.е. пригодности, адекватности) используемого метода для достижения поставленной цели. Знания можно проверить различными целями, но не все они пригодны для эффективной оценки. Самый пригодный метод и есть наиболее валидный». Понятие валидности касается всех сторон разработки тестов и тестирования. На начальных этапах создания тестов особое значение играет отбор учебного материала, который планируется включить в тест. Важность этого этапа сконцентрирована в таком понятии, как валидность по содержанию, которое в основном предопределяется на стадии отбора тестового материала для включения в тест. Отметим, что сам процесс создания теста, как метода контроля знаний, является итерационным, поэтому совокупность тестового материала может измениться на любом этапе его создания и использования. Например, из-за неполноты (излишней детализации) описания предметной области в вопросах теста, несоответствия требованиям надежности при оценке уровня знаний.

    Отношение к тесту, как к методу контроля знаний, имеет несомненные достоинства, ибо в этом случае все этапы подготовки теста и процесса тестирования направлены на конечный результат – достоверную оценку уровня знаний.

    Таким образом, гомогенный педагогический тест является валидным по содержанию, если тестовые задания:

    • находятся в соответствии с изучаемым предметом и полностью отражают его содержание;

    • не включают вопросы смежных дисциплин, а также дисциплин, изученных ранее.

    Поскольку в результате изучения дисциплины студенты должны приобрести не только определенные знания, но и умения, то применительно к педагогическим гомогенным тестам валидный по содержанию тест должен соответствовать учебной программе и включать тестовые задания по всем разделам дисциплины, которые позволяют оценить степень освоения учебного материала, а также умение применять полученные знания в профессиональной деятельности.

    Определение валидного по содержанию теста является общей установкой для более детального раскрытия понятия «Содержание дисциплины». При ответе на этот вопрос целесообразно в соответствии с учебной программой выделять содержание разделов, из которых она состоит. Затем вводится понятийный индикатор «Знание раздела», которое раскрывается через названия тем, составляющих тот или иной раздел. Далее при необходимости вводятся индикаторы второго, третьего и других уровней, отражающие названия вопросов, входящих в изучаемую тему. Каждому вопросу ставятся в соответствие один или несколько эмпирических индикаторов, которые и являются тестовыми заданиями. При этом правильные ответы на задания свидетельствуют о знании темы. Ответы на задания по всем темам и разделам отражают уровень знаний дисциплины.

    «Педагогический тест является и методом и результатом педагогических измерений. Например, если студент неверно отвечает на вопрос, отражающий понятийный индикатор нижнего уровня, но дает правильный ответ на связанный с ним вопрос более высокого уровня, то в тесте присутствует либо элемент угадывания, либо неточность формулировки тестового задания, либо неудачно выбрана форма его отражения, что в свою очередь требует дальнейшей переработки материала.

    Эффективность теста будет тем выше, чем тщательнее отобрано содержание заданий, чем точнее определены связи между ними. Логическую структуру теста можно анализировать различными способами. Наиболее удобной формой анализа является ее графическое представление. Структура дисциплины изображается в виде графа, у которого вершинами служат разделы курса, темы, вопросы, а ребра указывают на их взаимосвязь. Отметим, что такой анализ можно проводить с помощью программных средств, которые используются при концептуальном проектировании объектов экономического управления и служат для описания совокупности элементов системы и их взаимосвязи.

    Каждый раздел (тема) может быть информационно и логически завершенной частью теста. В этом случае появляется возможность более гибко осуществлять контроль и управление ходом обучения за счет использования теста в текущем контроле. Кроме того, при анализе структуры теста определяются вершины и графы, удаление которых нарушает целостность теста как системы.

    «Тестовое задание – минимально законченная составляющая, часть теста в виде проверочного материала специфической формы». Требования к формам представления тестовых заданий являются достаточно устоявшимися и служат для единства понимания сущности вопроса. Они отражены в Методических указаниях по подготовке педагогически тестовых материалов к сертификации (приложение № 3 к приказу Минобразования России от 17.04.2000 № 1122). В соответствии с ними тестовые задания рекомендуется разрабатывать в одной из четырех форм:

    а) задания с выбором ответов (испытуемый выбирает правильный ответ из числа готовых, предлагаемых в задании теста);

    б) задания на дополнение (испытуемый сам формулирует краткий или развернутый ответ);

    в) задания на установление соответствия между элементами двух множеств;

    г) задания на установление правильной последовательности в ряду предлагаемых элементов.

    Выбор и соотношение форм представления заданий в гомогенном тесте зависит от специфики учебной дисциплины. Как известно, все курсы, изучаемые в вузах, можно условно разделить на два класса: логические и информационные. В первых из них наряду с изучением фактического материала студенты должны усвоить логику доказательства теорем, решений задач. Эта особенность содержания дисциплины является решающей при оценке уровня знаний. В дисциплинах информационных в основном требуется усвоение формулировок, соотношений, результатов. Следует подчеркнуть, что, безусловно, это деление является относительным, поскольку всякий логический курс требует запоминания определенного количества сведений, а информационный развивает логическое мышление.

    При формулировке тестовых заданий значительное место занимают такие формы, как «Установить соответствие», «Установить последовательность», поскольку именно они позволяют описать алгоритм решения задач.

    ТЕСТОВОЕ ЗАДАНИЕ КАК СТРУКТУРНАЯ ЕДИНИЦА ТЕСТА

    Педагогический тест состоит из тестовых заданий. Содержание теста существует, сохраняется и передается в одной из четырех (B.C. Аванесов) или шести (А.Н. Майоров) основных форм тестовых заданий. По мнению В,С. Аванесова, имеется принципиальная разни­ца между понятием «тестовое задание» и близким ему понятием «задание в тестовой форме».

    Задание в тестовой форме определяется как педагогическое средство, отвечающее требованиям.

    • цель;

    • краткость;

    • технологичность;

    • логическая форма высказывания;

    • определенное место для ответов;

    • одинаковость правил оценки ответов;

    • правильное расположение элементов задания;

    • одинаковость инструкции для всех испытуемых;

    • адекватность инструкции форме и содержанию.

    В самом общем виде задание в тестовой форме состоит из трех частей.

    • инструкции, которая должна содержать указания на то, что испытуемый должен сделать, каким образом выполнять задание, где и как делать пометки и записи и т.д.; в тестах допускается делать одну инструкцию для группы одно­типных заданий, которая помещается в начале данной группы задании.

    • текста задания;

    • правильного ответа.

    Тестовое задание - составная единица теста, отвечающая требова­ниям к заданиям в тестовой форме и статистическим требованиям; извест­ной трудности; дифференцирующей способности (достаточной вариации тестовых баллов); положительной корреляции баллов задании по всему тесту а также другим математико-статистическим требованиям. Таким образом, только проверенные на практике (апробированные), имеющие рассчитанные показатели качества и трудность задания в тестовой форме могут именоваться тестовыми заданиями. До этого момента мы можем го­ворить лишь о системе заданий в тестовой форме и соответственно осто­рожно относиться к результатам, полученным данным способом.

    В целом надо сказать, что тесты являются только одним из видов учеб­ных заданий, используемых для контроля, диагностики обученности и обу­чаемости учащихся. Независимо от содержания и формы построения тес­том можно считать только такую систему специально составленных зада­ний решение которых имеет однозначные правильные ответы либо четкое описание (как минимум - на уровне ранговой шкалы) критериев интерпре­тации и оценки ответов (хотя бы как правильные - неправильные).

    Естественно не все необходимые характеристики усвоения можно полу­чить средствами тестирования. Такие, например, показатели, как умение кон­кретизировать свой ответ примерами, умение связно, логически и доказа­тельно выражать свои мысли, некоторые другие характеристики знании, уме­ний навыков диагностировать тестированием невозможно. Это значит, что тестирование должно обязательно сочетаться с другими (традиционными) формами и методами проверки. Правильно действуют те педагоги, которые, используя письменные задания в тестовой форме, тестовые задания, тесты, дают возможность школьникам устно обосновывать свои ответы.

    ДОСТОИНСТВА И НЕДОСТАТКИ ТЕСТОВОЙ ФОРМЫ КОНТРОЛЯ ЗНАНИЙ

    Достоинства:

    Развивать речь, логическое и образное мышление, умение анализировать и делать самостоятельные выводы.

    В ходе обсуждения выясняется, понятны ли учащимся изучаемые закономерности.

    Выясняется, могут ли ученики делать выводы мировоззренческого характера.

    Возможность ликвидации пробелов в учебной подготовке учащихся.

    Недостатки:

    Невозможность организовать систематический и полный индивидуальный контроль знаний каждого ученика, т.к. в классах большое количество учеников.

    Невозможно провести сравнение ответов учащихся на один и тот же вопрос.

    Не позволяет сделать объективный вывод об уровне подготовки учащихся, т.к. оценка учащихся зависит от субъективного мнения учителя, характера и темпа ответа ученика, от уровня подготовленности класса.

    КОМПЬЮТЕРНОЕ ТЕСТИРОВАНИЕ И АДАПТИВНЫЙ ТЕСТОВЫЙ КОНТРОЛЬ

    Адаптивное тестирование — это такой подход к компьютерному тестированию, при котором предъявляемые испытуемому текущие задания зависят от результатов его ответов на предыдущие задания. Технической предпосылкой адаптивных тестовых методик служит способность компьютера за счет быстродействия вести обработку поступающих данных в масштабе реального времени.

    Такой подход к психологическому тестированию имеет некоторые преимущества. Во-первых, он позволяет привнести в стандартные групповые тесты элементы индивидуализации, учета индивидуальных особенностей данного испытуемого в процессе тестирования. Во-вторых, испытуемому можно давать гораздо меньше заданий с сохранением диагностической способности целого объемного теста. В-третьих, удается значительно снизить трудоемкость и время тестирования, что на практике бывает очень важно (например, при обследовании детей, некоторых категорий больных и лиц со сниженным интеллектом).

    Компьютерное тестирование может проводиться в различных формах, различающихся по технологии объединения заданий в тест. Часть из них пока не получили специального названия в литературе по тестовой проблематике.

    Первая форма – самая простая. Готовый тест, стандартизованный или предназначенный для текущего контроля, вводится в специальную оболочку, функции которой могут различаться по степени полноты. Обычно при итоговом тестировании оболочка позволяет предъявлять задания на экране, оценивать результаты их выполнения, формировать матрицу результатов тестирования, обрабатывать ее и шкалировать первичные баллы испытуемых путем перевода в одну из стандартных шкал, чтобы каждый испытуемый получил свой балл и протокол оценок по заданиям теста.

    Вторая форма компьютерного тестирования предполагает автоматизированную генерацию вариантов теста, осуществляемую с помощью инструментальных средств. Варианты создаются перед экзаменом или непосредственно во время его проведения из банка калиброванных тестовых заданий с устойчивыми статистическими характеристиками. Калибровка достигается благодаря длительной предварительной работе по формированию банка, параметры заданий которого получают на репрезентативной выборке учащихся, как правило, на протяжении 3-4 лет с помощью бланковых тестов. Содержательная разность и параллельность вариантов обеспечиваются за счет строго регламентированного отбора заданий каждого варианта в соответствии со спецификацией теста.

    Третья форма – компьютерное адаптивное тестирование – базируется на специальных адаптивных тестах. В основе идей адаптивности лежат соображения о том, что учащемуся бесполезно давать задания теста, которые он выполнит наверняка правильно без малейших затруднений или гарантированно не справится с ними в силу высокой трудности. Поэтому предлагается оптимизировать трудность заданий, адаптируя ее к уровню подготовленности каждого испытуемого, и сократить за счет исключения части заданий длину теста.

    ТЕСТ КАК ИНСТРУМЕНТ ИЗМЕРЕНИЯ КАЧЕСТВА ЗНАНИЙ

    Создание системы оценки качества знаний – одна из основных задач в сфере образования. Один из способов оценки качества – тестирование учебных достижений школьников. Система тестирования – универсальный инструмент определения уровня обученности. Тест обладает способностью сравнивать индивидуальный уровень знания с некими эталонами, уровень знания отражается в тестовом балле испытуемого. Индивидуальные результаты тестирования можно сравнить с результатами других школьников этой же группы и проранжировать их, можно сравнить результаты тестирования нескольких групп и т.д.

    Помимо уровня знаний с помощью теста можно оценить структуру знаний, т.е. установить наличие последовательности в усвоенных обучающимися знаниях, отсутствие пробелов.

    Тесты можно разделить на две категории – адаптивные и традиционные тесты.

    Виды тестовых заданий:

    1. Задания с выбором ответов (закрытые задания).

    2. Задания на установление соответствия.

    3. Задания с выбором нескольких правильных ответов.

    4. Задания с открытым ответом.


    написать администратору сайта