Главная страница
Навигация по странице:

  • Преимущества тестирования перед другими методами

  • Понятие тест, тестирование

  • Исторические предпосылки тестирования

  • Развитие тестирования в зарубежной педагогике и психологии

  • Исследования по проблемам измерения и тестирования

  • Основные направления современных зарубежных исследований по проблемам измерения и тестирования.

  • Различия между педагогическими и психологическими тестами

  • Тестирование дидактическое

  • Требования к описанию дидактического теста.

  • Вопросы

  • Тестирование т. 3,4.. Развитие системы тестирования в России и за рубежом Психологопедагогические аспекты тестирования


    Скачать 107 Kb.
    НазваниеРазвитие системы тестирования в России и за рубежом Психологопедагогические аспекты тестирования
    АнкорТестирование т. 3,4..doc
    Дата29.08.2018
    Размер107 Kb.
    Формат файлаdoc
    Имя файлаТестирование т. 3,4..doc
    ТипДокументы
    #23733

    Развитие системы тестирования в России и за рубежом

    Психолого-педагогические аспекты тестирования

    1. Преимущества тестирования перед другими методами

    2. Понятие тест, тестирование

    3. Исторические предпосылки тестирования

    4. Развитие тестирования в зарубежной педагогике и психологии

    5. Исследования по проблемам измерения и тестирования

    6. Различия между педагогическими и психологическими тестами


    Преимущества тестирования перед другими методами

    Стандартизация современного школьного образования предполагает создание инструмента измерения уровня обученности учащихся по предмету, отличающегося от традиционных форм педагогической диагностики более высокой степенью объективности и экономичности в силу технологичности осуществления процедуры контроля. Проблема объективной оценки знаний - одна из наиболее актуальных проблем образования. Существует мнение, что традиционные методы контроля знаний не отвечают своей цели, недостаточно эффективны. На сегодняшний день все большее распространение приобретает тестирование как сравнительно новый для пашей страны способ контроля знаний. Диагностика уровня обученности в форме тестирования осуществляется на принципах легитимности, преемственности требовании, предъявляемых на всех этапах обучения, связи качества контроля с качеством обучения, гласности, коллегиальности принятия управленческих решений.

    Предметный тест как инструмент оценивания имеет ряд преимуществ перед другими методами диагностики.

    Во-первых, тест значительно более качественный и объективный способ оценивания.

    Во-вторых, показатели теста ориентированы на измерение степени определения уровня усвоения ключевых понятий учебной программы, а не на констатацию наличия у учащихся определенной совокупности формально усвоенных знаний. Стандартизированная форма оценки, используемая в предметных тестах, позволяет соотнести уровень достижения учащегося по учебной дисциплине в целом и по отдельным ее разделам со средним уровнем достижений учащихся в классе и уровнем достижений каждого из них.

    В-третьих, тесты - более широкий инструмент. Выполняя тестовую работу, ученик выполняет задание, используя знания по всей теме (темам), изучение которой (которых) предусматривала программа.

    Четвертым отличием тестов является то, что они ставят всех учащихся в равные условия, используя единые критерии оценки.

    Понятие тест, тестирование

    Слово "тест" произошло из старофранцузкого языка и имеет синоним "чашка". Этим термином обозначали небольшие сосуды из обожженной глины, используемые алхимиками для проведения опытов.

    Согласно другой версии слово "тест" произошло от английского «test» -испытание, исследование.

    Согласно современных словарных определений для психолого-педагогической области тест - это

    1. объективное и стандартизированное измерение, легко поддающееся количественной оценке, статистической обработке и сравнительному анализу;

    2. система заданий, позволяющих измерить уровень развития определенного психологического качества (свойства) личности;

    3. специфический инструмент, состоящий из совокупности заданий или вопросов и проводимый в стандартных условиях, позволяющий выявить типы поведения, уровень владения какими-либо видами деятельности и т.п.;

    4. стандартизированное, часто ограниченное во времени испытание, предназначенное для установления количественных и качественных индивидуально-психологических особенностей.

    Тест (англ. test — задание) — задание стандартной формы для проведения испытаний с целью установления степени наличия тех или иных качеств объекта.
    В педагогике, психологии, психиатрии, социологии — научно — разработанная сертифицированная диагностическая методика, прошедшая необходимые процедуры апробации и стандар­тизации.

    Эти определения близки между собой. Наиболее существенным в психолого-педагогическом понимании этого слова является то, что оно означает проверку, испытание. Но это не простое установление факта наличия или отсутствия какого-либо качества или свойства. Тест не является аналогией экзаменационным вопросам, анкетам, контрольным работам и пр. В его основе лежит специально подготовленный и испытанный набор заданий, позволяющих объективно и надежно оценить исследуемые качества и свойства на основе использования статистических методов.

    В немецкоязычных странах классическим считается следующее определение Линерта: «Тестирование — это обычный научный метод исследования одного или нескольких эмпирически различаемых признаков личности, цель которого — определить относительную степень выраженности индивидуального признака на основании максимального использования количественных показателей» (Lienert, 1969). В настоящее время мы уже не можем пользоваться в педагогике этим определением, так как оно не включает тестирование, ориентированное на критерии, и так как в нем не упоминаются необходимые критерии качества. Для педагогической сферы деятельности более приемлемо следующее определение: «Тестированием можно считать все контролируемые ситуации в целом, в которых, во-первых, диагностически релевантное поведение вызывается стандартизованными раздражителями и для которых, во-вторых, разработаны правила интерпретации, позволяющие на основании наблюдаемого поведения сделать вывод о наличии и степени выраженности способностей, свойств и т. д. той или иной конкретной личности» Применительно к педагогической диагностике определение тестирования можно сделать еще более конкретным, и тогда но будет выглядеть следующим образом.

    Тестирование — это метод педагогической диагностики, с помощью которого выборка поведения, репрезентирующая предпосылки или результаты учебного процесса, должна максимально отвечать принципам сопоставимости, объективности, надежности и валидности измерений, должна пройти обработку и интерпретацию и быть готовой к использованию в педагогической практике.
    Исторические предпосылки тестирования

    Тест как метод изучения индивидуальных различий возник сравнительно недавно. Временем его возникновения считается конец 19 -начало 20 века, когда для определения физических, физиологических и психических особенностей человека психологи попытались применить различные способы измерения.

    С начала 20 века определилось и педагогическое направление в развитии тестологии. Основной задачей педагогичесих тестов являлось измерение успешности учащихся по тем или иным школьным дисциплинам за определенный период обучения, а также успешность применения определенных методов преподавания и организации.

    Разработка первого педагогического теста принадлежит американскому психологу Э.Торндайку.

    Особым путем шло проникновение тестов в Россию. До 1917 года вопросам тестирования уделялось недостаточное внимание. Практическое значение тесты получили после 1925 года, когда была создана особая тестовая комиссия. Тестовая комиссия существовала при педагогическом отделе Института методов школьной работы. В ее задачи входила разработка стандартизированных тестов для советской школы. И уже весной 1926 года вышли такие тесты, созданные на основе американских. Были разработаны тесты по природоведению, обществоведению, счету, решению задач, знанию географической карты, на понимание чтения и правописание.

    К этим тестам прилагались инструкции и личная карточка для учета прогресса учащихся. Проблемой разработки тестов вплотную занимались видные российские психологи и педагоги: С.Г.Геллерштейн, П.П.Блонский, А.П.Болтунов, М.С.Бернштейн, А.М.Шуберт, Г.И.Залкинд и др. В 1927 вышла книга С.М.Василейского "Введение в теорию и технику психологического, педологического и психотехнического исследования", где излагались теоретические и практические подходы к созданию и использования тестов. Можно сказать, что это был первый учебник, где была отражена методика составления анкет и тестов, статистические методы обработки результатов.

    Однако вскоре положение кардинально изменилось. Вышедшее в 1936 году постановление ЦК ВКП(б) "О педагогических извращениях в системе Наркомпроса" негативно сказалось на развитии педологии в целом и тестологии в частности. Метод тестов был признан буржуазным орудием дискриминации учащихся и "изгнан" из советской школы. И в дальнейшем в течение многих лет тестирование официально не признавалось объективным методом и не находило практического применения. Педагоги-практики вернулись к тестам в период прекращения массовых политических репрессий. Уже к началу 60-х гг. XX в. многие учителя, заботящиеся не о формальных показателях, а о реальном качестве учебного процесса, стали использовать при контроле наборы заданий в тестовой форме, которые чаще всего назывались по-разному, но только не словом «тест».

    Промежуток времени с 60-х гг. до начала 90-х гг. XX в. был для отечественной школы периодом постепенной либерализации, когда учителя изыскивали различные резервы в борьбе за повышение качества обучения на фоне снижения авторитарного характера учебного процесса. Тесты в это время существовали полулегально, официально запрет на них не был отменен, но уже предпринима­лись попытки диссертационных исследований по проблемам тестирования, появлялись работы педагогов-новаторов, в которых тесты и анкетные опросы использовались как инструментарий для подтверждения эффективности нововведений. В это время тесты разрабатывались без должного знания теории педагогических измерений, на основе опыта и здравого смысла, поэтому чаще всего тестами их было можно назвать лишь условно. Столь же необоснованными по надежности и валидности были наборы заданий с выбором ответов, создаваемые практически повсеместно на рубеже 60 —70-х гг. XX в. в связи с интенсивным развитием программированного обучения. Только к середине 80-х гг. XX в. в нашей стране в научных и методических работах преподавателей стали утверждаться основные положения теории педагогических измерений, декларирующие необходимость эмпиричес­кой верификации качества измерений и статистического анализа характеристик тестов [
    Развитие тестирования в зарубежной педагогике и психологии

    Исторически сложилось, что ядром дидактической диагностики в 20-е годы становятся дидактические и психодиагностические тесты. Вошедшие в практику диагностирования в образовании на рубеже XIX и XX веков тесты по своим кажущимся, но обманчивым простоте, оперативности, дешевизне применения прочно закрепились в системах образования Запада. Специфика национальных систем образования такова, что в одних странах тесты как средство контроля получали активную правительственную и научную поддержку (в Великобритании, Франции, США), в других они просто не запрещались и использовались отдельными учебными заведениями, постепенно распространяясь в качестве «передового педагогического опыта». В США еще в 1908 г. Ф. Парсоне, организовавший в Бостоне Бюро профессиональной ориентации, стал основателем системы «Гайденс», помогающей школьникам в отборе предметов для обучения, в профориентации.

    Появление педагогических тестов за рубежом нередко связывают с именем французского врача и психолога А. Бине (A. Binet). Его работа по диагностике интеллектуальных способностей, вышедшая в 1905 г., считается точкой отсчета в становлении основных научных подходов к измерениям в психологии и образовании. Конечно, были и более ранние попытки создания подобных тестов. Британские исследователи Ф. Гальтон (F. Gallon) и Дж.Кэттелл (/ Cattell) в 1890 г. использовали термин «тест на интеллект» (mental test). Им же принадлежит заслуга введения в научный оборот специальной характеристики качества теста (power of discrimination), указывающей на его способность дифференцировать испытуемых по измеряемой переменной.

    Немного позднее идеи А. Бине были использованы немецким психологом и философом В.Штерном (W. Stern), который предложил специальный коэффициент для оценивания интеллекта — коэффициент IQ. Этот термин используется до сих пор, правда, несколько в ином контексте. В США работы А. Бине по измерениям продолжил Л.Терман (L. Тегтап). Он создал новые тесты (Стэнфорда-Бине), представляющие собой оригинальную модификацию работы его предшественника.

    Достижения второго десятилетия XX в. в сфере измерений были связаны с проблемой распределения большого количества призывников по различным родам, войск в США во время Первой мировой войны. Правительство Соединенных Штатов организовало «мозговой центр» из специалистов — составителей тестов, статистиков и экспертов по измерениям — и направило его работу на решение задач, продиктованных военной необходимостью. В этом центре свои усилия по отбору и распределению новобранцев объединили такие известные специалисты, как Э.Торндайк (Е. Thorndike), Р. Годдард (R. Goddard), П.Йеркс (P. Yerkes) и Л.Терман (L. Теппап). Результатом их работы стали знаменитые батареи Альфа и Бета тестов для армии, которые после стали использовать (вплоть до настоящего времени) в качестве примеров при обучении разработчиков тестов в образовании.

    Первые стандартизированные измерители в образовании США были созданы для оценки качества почерка, правописания и выполнения арифметических действий в конце 20-х гг. XX в. Тогда же в Америке появилась батарея тестов SAT, разработанных по инициативе Совета колледжей и предназначенных для отбора абитуриентов. Несколько позже, в конце 40-х гг. XX в., были созданы батареи тестов достижений, реализующие идеи многомерных измерений и обеспечивающие сопоставимость результатов по разным школьным предметам.

    В 1904 г. англичанин Ч. Спирмен (С.Spearman) опубликовал фундаментальный теоретический труд по исследованию общих интеллектуальных способностей. Используя школьные оценки по различным предметам, Ч.Спирмен применил к данным тестирования аппарат новой для того времени теории корреляции и выявил примеры ковариации оценок школьников. Тем самым он заложил основы научных подходов к обоснованию качества тестов, соединив в своем исследовании теорию физических измерений, корреляционные методы и накопленный его предшественниками-психологами опыт оценивания способностей детей. Прообразом научных положений теории педагогических измерений послужила далекая от образования работа Н.Р. Кэмпбелла «Основы физики» (1920), благодаря которой был разработан теоретический аппарат для анализа качества измерений, а обыденное представление о тесте и его научное определение стали заметно различаться. Для обоснования качества педагогических измерений, их надежности и валидности была создана классическая теория тестов, получившая впоследствии название традиционной, и базирующаяся на концепции параллельных измерений и теории корреляции. На основе этой теории в 30 — 40-е гг. XX в. интенсивно разрабатывались количественные методы для анализа качества тестовых заданий, строились стандартизованные тесты учебных достижений и осваивались методы шкалирования результатов выполнения тестов.

    В конце 40-х гг. XX в. увлечение чистой теорией сменилось пониманием важности правильного применения измерений в сфере психологии и образования. Исследователи осознали тот факт, что к тестируемым нужно относиться бережно и осторожно и что лю­бая ошибка в оценках может привести к необратимым последствиям. В этой связи в теории педагогических измерений активизировался поиск эффективных методов повышения надежности результатов тестирования, стали разрабатываться методы фактор­ного, дисперсионного и корреляционного анализа данных, получили широкое развитие методы формирования репрезентативных выборок, необходимых для стандартизации тестов.

    Значимым событием конца 40-х гг. XX в. для развития теории и практики измерений в образовании стало создание в 1947 г. в США Службы образовательного тестирования — Educational Testing Service (ETS). Сегодня эта организация имеет представительства практически во всех странах мира. Из числа тестов, созданных ETS, наибольшую известность в связи с расширением программ международного обмена в обучении приобрел TOEFL, выявляющий уровни владения различными видами речевой деятельности для обучения в англоязычных странах.

    В истории тестов были этапы подъемов и спадов. В частности период ожесточенной критики педагогических тестов наблюдался в США в конце 60-х гг. XX в. Широкая публичная дискуссия по проблемам использования тестирования совпала по времени с научной критикой, вызванной недостатками классической теории тестов. Высказывались опасения в том, что тестирование служит инструментом подавления инициативы и творчества учащихся, слишком упрощенно трактует такие сложные конструкты, какими являются учебные умения, не объективно оценивает учебные достижения. Приводились и другие аргументы против широкого использования тестов. Ученые-тестологи занимались в основном конструктивной научной критикой традиционных методов разработки тестов, что привело к построению новой теории — Item Response Theory (IRT), которую нередко в наши дни называют современной теорией тестов.

    Неоспоримые преимущества IRT, связанные с возможностью прогноза надежности измерений, увеличения эффективности тестирования и получением оценки параметров подготовленности учащихся, не зависящих от трудности заданий теста, стали широко применяться на практике с конца 80-х гг. XX в. В это время были разработаны алгоритмы оценивания параметров испытуемых и заданий на основе математических моделей IRT, создано программное обеспечение и стали широко использоваться ПК. Сочетание аппарата классической теории и IRT при разработке тестов открыло новые возможности повышения качества педагогических измерений и применения тестирования в образовании. Современный период в истории развития тестов характеризуется интенсивным развитием теории IRT, созданием новых моделей и методик ее применения, внедрением в тестирование компьютерных технологий, адаптивного тестирования, различных инноваций в области разработки и применения тестов. В настоящий момент наметился ряд направлений исследований, нацеленных на расширение возможностей педагогических измерений, разработку инновационных измерителей и повышение качества тестов. К их числу относится создание новых моделей педагогического измерения, инновационных форм тестовых заданий для проверки творческих и практико-ориентированных аспектов подготовленности учащихся, методов калибровки тестовых заданий и методик компьютерного моделирования тестов, обеспечивающих планируемую точность измерений. Большое внимание уделяется психолого-педагогическим проблемам тестирования (проблемам тревожности, мотивации), развитию специальных процедур для выявления размерности пространства измерений, созданию специальных методик, позволяющих обоснованно использовать результаты педагогических измерений в управлении качеством образования.
    Исследования по проблемам измерения и тестирования

    Развитие научных исследований по проблемам педагогических измерений в России тесно связано с расширением сферы их приложения, поэтому период активизации исследований по тестовой проблематике совпал с началом эксперимента по введению ЕГЭ и повсе­местным созданием в вузах России систем менеджмента качества образования.

    В конце XX — начале XXI в. появились исследования по тестам и смежной проблематике В. С. Аванесова, Т. М. Балыхиной, Н. Ф. Ефремовой, И. И.Легостаева, А.А.Макарова, Е. А. Михайлычева, В. Г. Наводнова, В.П.Панасюка, В. Ю. Переверзева, И.Д. Рудинского, М.Б. Челышковой и др.

    С конца 90-х гг. XX в. вплоть до настоящего времени из года в год растет число монографий, учебных пособий, статей и методических работ по вопросам измерений и тестирования в образовании. В целом современные исследования отечественных ученых по проблемам измерения и тестирования в образовании осуществляются по пяти направлениям: 1) разработка научных подходов к совершенствованию содержания измерителей в контексте современных трактовок качества учебных достижений; 2) разработка теоретико-методологического и 3) методического обеспечения процесса конструирования надежных и валидных тестов; 4) научное обоснование процедур применения тестов; 5) научное обоснование шкалирования данных тестирования и их интерпретация для применения результатов педагогических измерений в управлении качеством образования.

    Несомненный интерес представляют также анализ и психолого-педагогическая интерпретация латентных характеристик подготовленности выпускников, развитие моделей содержательной преемственности тестовых материалов для итогового контроля на различных ступенях обучения (предшкольное, начальное, основное, среднее, высшее), необходимость разработки которых резко возросла в наше время в связи с созданием Общероссийской системы оценки качества образования (ОСОКО). К перечисленным направлениям исследований примыкает работа по формированию репрезентативных выборок учащихся для проведения мониторинговых исследований, для выравнивания шкал по параллельным вариантам тестов, разработке моделей и технологий информационного сопровождения тестирования, хранения и автоматического формирования тестов и др. Проведение исследований по выделенным направлениям в на­шей стране, безусловно, позволит значительно повысить качество используемых в образовании измерителей и тем самым будет способствовать повышению качества образования.

    Основные направления современных зарубежных исследований по проблемам измерения и тестирования. В современных зарубежных исследованиях в теории педагогических измерений к приоритетным направлениям исследовательских работ относятся:

    • развитие методологии сочетания качественных и количественных методов при эвалюапии в образовании;

    • оптимизация методов интеграции данных педагогических измерений, полученных с помощью инновационных форм заданий тестов;

    • развитие параметрических и непараметрических моделей IRT;

    • разработка методик, алгоритмов и математико-статистичес-кого аппарата теории педагогических измерений для создания программного обеспечения и практического использования новых моделей IRT;

    • исследования психологических и этических проблем в тестировании;

    • разработка научно-методических подходов к построению уровневых шкал в образовании, разработка новых методов выравнивания;

    • развитие специальных процедур и подходов для выявления размерности пространства измерений и ее адекватности поставленным целям тестирования и т.д.

    Многие зарубежные исследования посвящены аппарату и методам теории IRT, которая широко используется в практике тестирования. Работу педагогов значительно облегчают многочисленные программно-инструментальные и программно-педагогические продукты, реализующие алгоритмы IRT для оценки результатов испытуемых и конструирования новых тестов. К числу наиболее интересных, созданных мировым лидером в компьютерном тестировании Assessment Systems Corporation (ASC), можно отнести такие программы, как RASCH, RASCAL, Quest, ConQuest, a также программы XCALIBRE, ASCAL, LOGIMO, MSP, PARELLA и многие другие. Некоторые из разработок корпорации ASC, например MieroCAT, CAT, позволяют реализовывать адаптивные варьирующие алгоритмы с переменным шагом и осуществлять процессы генерации адаптивных тестов. Таким образом, в XXI в. за рубежом теория IRT заняла лидирующее положение в сфере конструирования и применения педагогических тестов, а результаты, полученные такими исследователями, как Ф.Лорд (F.M. Lord), M. Новик и другими.
    Различия между педагогическими и психологическими тестами

    Взаимодействие психологов и педагогов в области разработки тестов имеет свои исторические причины и научные предпосылки. В научном плане оно предопределено близостью методологий измерений в эмпирических науках и единством методик разработки тестов, общностью объекта исследования, тесной взаимосвязью и частичным пересечением субъектов измерения. Исторические аспекты этого взаимодействия обусловлены особенностями становления теории педагогических измерений, сложившимися за рубежом в 20 —40-е гг. XX в. В то время потребность в стандартизиро­ванных педагогических тестах постоянно увеличивалась, а сообщество тестологов в сфере образования практически еще не сложилось, поэтому психологи зачастую привлекались к работе над педагогическими тестами. Тенденция вхождения психологов в педагогические измерения в нашей стране наметилась в середине 90-х гг. XX в. В это время возрос интерес к педагогическим тестам, и отсутствие тестологов в образовании ощутилось особенно остро. Образовавшийся кадровый вакуум в значительной степени заполнили психологи. Попутно, сами того не желая, они привнесли в образовательную среду устойчивые представления о тестах как о наборе довольно тривиальных по содержанию заданий, носящих косвенный характер и имеющих форму с выбором ответа. Преодолению искаженного представления о тестах способствует эксперимент по введению ЕГЭ. Однако, несмотря на то что он начался еще в 2001 г., многим пользователям до сих пор неизвестны широкие возможности педагогических тестов.

    Несмотря на имеющиеся точки соприкосновения, между педагогическими и психологическими тестами есть существенные различия. А.Анастази обращает внимание на то, что педагогические тесты оценивают результаты усвоения общего для всех обучаемых программного курса, а психологические — отражают индивидуальное восприятие жизненного опыта, различающегося по социальным и экономическим условиям его приобретения.

    Результаты тестирования в психологии используются в основном для прогнозирования успешности какой-либо деятельности в зависимости от оценок личностных характеристик и склонностей или носят рекомендательный характер при выявлении личностных проблем. Педагогические тесты в итоговом контроле дают количественные оценки уровня подготовленности обучаемых, которые нередко служат основой для принятия административно-управленческих решений в образовании, поэтому к качеству ре­зультатов педагогических измерений и их сопоставимости должны предъявляться повышенные требования, обеспечивающие корректность управленческих выводов и административных решений.

    Внешние различия между тестами в психологии и в образовании проявляются в формулировках заданий, которые в педагогических тестах всегда носят прямой, а в психологических тестах, чаще всего, косвенный характер. Например, в психодиагностике встречаются ситуации, когда неправильные ответы испытуемых расцениваются как положительные характеристики их личности, а правильные, наоборот, свидетельствуют о необходимости принятия коррекционных мер. Иногда границы между тестами стираются, особенно в тех случаях, когда педагогические тесты выступают в качестве предикторов успешности профессиональной деятельности или нацелены на проверку логического мышления и творческих способностей учащихся. На существующее сходство между измерителями в психологии и в образовании обычно указывает высокая корреляция, которую можно оценить по эмпирическим результатам выполнения тестов.

    В зависимости от области исследований Ингенкамп различает следующие виды тестов:

    1. Тесты достижений - тесты развития, интеллекта, общей результативности, школьной успеваемости, специальные тесты, определяющие профессиональную пригодность и функциональные возможности.

    2. Психометрические личностные тесты - личностные структурные тесты, тесты на интересы и установки, клинические тесты.

    В психологии тест - система специальных стандартизированных заданий, позволяющих оценить уровень развития или состояния определённого психологического качества или свойства испытуемого (в т. ч. количественно). Психологические тесты: Векслера шкала, тесты интеллекта, корректурная проба, тесты креативности, личностные тесты, Люшера тест, проективные тесты пятен Роршаха, тест Рокича, тесты специальных способностей, теппинг-тест, тесты на познавательные процессы, характерологический опросник и другие.

    Тестирование

    Существует два вида тестирования:

    • научное;

    • обыденное, практическое (применяемое в учебном процессе).

    В учебном процессе тесты применяются в основном для проверки качества знаний. До 60-х годов смысл тестов усматривался в дифференциации обучаемых по знаниям. После 60-х годов тесты стали ориентироваться на критериальную дифференциацию (критериально-ориентированные тесты). Тесты могут быть гомогенными (по одному предмету) и гетерогенными (проверяется сумма знаний). Тестирование предполагает системность.

    Тестирование дидактическое - одно из эффективных средств контроля в системе многоэтапного контроля знаний. Основные тенденции современного дидактического тестирования:

    • исследование характерных ошибок в тестах с множественным выбором для того, чтобы знать, что придётся корректировать;

    • развитие стратегий тестирования, соответствующих различным стилям обучения, вызванных к жизни последними достижениями когнитивной психологии;

    • использование оценки в качестве формирующего (а не результатируюшего) инструмента с включением методов оценивания, недавно утвердившихся в дидактическом тестировании;

    • расширения сферы тестирования и включение в нее установок, чувств, впечатлений, так как они имеют отношение к составлению учебных планов;

    • расширение форматов ответов за пределы законченных, например, включение незаконченных ответов, кратких ответов и (или) ответов проб;

    • систематическая запись и анализ образцов ученических работ;

    • возрастание роли компьютеров в диагностике и коррекции.

    Большинство современных авторов выделяют следующие виды тестов:

    • психодиагностические тесты (диагностики функциональных состояний, диагностики психических процессов, сенсомоторных и творческих способностей, характерологические);

    дидактические тесты, среди которых выделяются тесты обучаемости, тесты учебных достижений.

    В основе тестологии лежит понятие «педагогический тест» - некоторое множество специально составленных заданий специфической формы, позволяющее по ответам испытуемых объективно измерить на определенной шкале их уровень подготовленности по конкретным разделам определенной области знания. Под обобщенным термином «уровень подготовленности» понимают уровень обученности испытуемых по указанным разделам, совокупность их умений и соответствующих навыков. Уровень подготовленности участников тестирования является, к сожалению, латентным параметром (недоступным для непосредственного измерения).

    Цели тестирования могут быть различны Различные цели тестирования определяют различные типы тестов. Мы остановимся только на двух типах, назначение которых наиболее существенно различается. [Основным назначением тестов первого типа является сопоставление подготовленности испытуемых в определенной области знаний.

    При этом не ставится задача оценить уровень подготовленности каждого участника тестирования персонально, а ставится задача сравнить их относительно друг друга или относительно специально выбранной группы лиц (нормативной выборки). Такое тестирование называют относительным или нормативно-ориентированным (если ис­пользуется упомянутая нормативная выборка).

    Тесты второго типа предназначены, наоборот, для оценивания уровня подготовленности каждого участника тестирования персонально. Такое тестирование называют абсолютным. В идеале абсолютный тест должен содержать бесконечно большое количество заданий, полностью отражающих всю совокупность знаний и умений, предусмотренных определенными требованиями. Практически всегда приходится ограничиваться той или иной аппроксимацией. Абсолютное тестирование можно называть критериально-ориентированным, если указывается некоторое пороговое значение уровня подготовленности в четко определенной области знаний. При относительном тестирова­нии важно добиться значимого расхождения результатов как можно большего числа испытуемых. При их создании предпочтение отдается заданиям средней трудности.

    Абсолютные измерения выполнить всегда сложнее, чем относительные. Для отражения результатов относительного тестирования достаточно пользоваться порядковыми шкалами, а абсолютного метрическими или нормированными. Сложность создания абсолютного теста тем выше, чем выше сложность самого учебного материала, подлежащего тестированию.

    При абсолютном тестировании включаются задания различной трудности, позволяющие проверить глубину усвоения материала, умения и навыки в определенной области знания.

    Основополагающим принципом должен быть выбор вида тестирования: критериальное или нормативно-ориентированное. Ориентация на критерий, который должен быть известен всем участникам образовательного процесса, наиболее эффективна при педагогической диагностике, когда определяется уровень учебных достижений всех обучаемых, необходима при аттестации и аккредитации образовательных учреждений. Трудности при рассмотрении теоретических оснований критериально-оценочной базы вызывает методологический подход к построению стандартизации российского образования, которое ведется в рамках «знаниевой» парадигмы, предусматривающей вна­чале разработку стандарта содержания образования, а затем стандарта учебных достижений. При этом невозможно создать эффективную таксономию педагогических целей, которая стала бы основой критериальной базы диагностики, исходным пунктом для описания конечной цели образовательной деятельности.

    Требования к описанию дидактического теста. В России определены в 2000 г.

    Дидактический тест должен включать в свое описание в обязательном порядке, как минимум:

    • назначение (диагностические цели и задачи в операциональных терминах конкретных действий);

    • точные сведения об авторах-разработчиках (фамилия, место работы, учёные степени и звания, прочие значимые характеристики)

    • данные о репрезентативности (представительности) выборки контингента обследуемых, на котором апробировался тест,

    • краткое описание основных нормативов, критериальных оценок или получаемых при апробации результатов (по разным выборкам, если их было несколько);

    • сведения о надежности теста (воспроизводимости результатов при повторном тестировании или применении другого подхода к проверке надежности);

    • сведения о валидности (содержательной, критериальной, прогностической конструктной и локальной - как минимум);

    • инструкцию диагносту по проведению процедуры тестирования и обработке данных;

    • инструкцию обследуемому (она может быть включена в содержание тестового материала или прилагается отдельно).

    На основе выполнения этих требовании разработчиком пользователь может получить элементарные представления о дидактической ценности теста, возможностях применения для ограниченных целей составляющих его субтестов или включения целиком в батарею тестов.

    Вопросы для обсуждения

    1. Каково ваше отношение к тестам в образовании? Под влиянием каких факторов оно сложилось?

    2. Какие периоды можно выделить в отечественной и зарубежной истории развития тестов? Каковы их отличительные черты?

    3. Каковы приоритетные направления исследований в теории педагогических измерений? Какие из них, по вашему мнению, являются первоочередными для развития тестирования в школах России?

    4. В чем различие педагогических и психологических тестов





    написать администратору сайта