Лопаткина, Е. В
Скачать 1.6 Mb.
|
Глава 3 ИСТОРИЯ РАЗВИТИЯ ТЕСТИРОВАНИЯ В РОССИИ И ЗА РУБЕЖОМ Практическое задание: составьте цепочку соответствий: имя учёно- го и его вклад в развитие теории тестов (на примере развития отече- ственной или зарубежной тестологии). Теоретическое задание: проследите этапы внедрения тестирования за рубежом и в России по материалам гл. 3 «Педагогическое тестиро- вание (история зарождения тестирования) [5]. План лекции: 3.1. Исторические предпосылки современного тестирования в отече- ственном образовании. 3.2. Развитие тестирования в зарубежных странах. 3.3. Направления и проблематика современных российских и зару- бежных исследований по вопросам измерений и тестирования в обра- зовании. 3.4. Тестированиев психологии и в образовании. 3.1. Исторические предпосылки современного тестирования в отечественном образовании История тестов, пришедших на смену обыденным представлениям педаго- гов о проверочных средствах, началась в России, как и в других странах, в конце XIX – начале XX в. В этот период тесты широко применялись сторонниками экспе- риментальной педагогики, которые всяче- ски пропагандировали их наравне с други- ми, разрабатывали психометрические ме- тодики в педологии 9 9 Фрадкин Ф.А. Педология: мифы и действительность. М., 1991. Ключевые понятия педология тестология педагогическое из- мерение классическая тео- рия тестирования современная теория тестов История того, что есть, - это исто- рия того, что было и того, что будет. Жак Анри Бернарден Опережающая самостоятельная работа 39 У истоков советской педологии, в рамках которой развивались тестовые методики, стояли известные ученые того времени: М.Я. Ба- сов, Л.С. Выготский, А.П. Болтунов, П.П. Блонский, К.Н. Корнилов, А.П. Не- чаев, А.Р. Лурия и др., посвятившие ряд своих работ оценке результатов обуче- ния и развития детей. До 1917 г. вопро- сам тестирования уделялось недостаточное внимание. Фактически свое практическое значение тесты получили после 1925 г., когда была создана особая тестовая комиссия. Тестовая комиссия существовала при педагогическом отделе Института методов школьной работы. В её задачи входила разра- ботка стандартизированных тестов для советской шко- лы. И уже весной 1926 г. в Москве была выпущена первая серия тестов для школьников по природове- дению, обществоведению, счёту, решению задач, знанию географической карты, на понимание чтения и правописание. К этим тестам прилагались инструкции и личная карточка для учёта прогресса учащегося. Наркомат просвеще- ния РСФСР финансировал специальные лаборатории по разработке тестов, по этой теме выпускались книги, публиковались статьи в газе- тах и журналах. Однако период активной деятельности педологов и тестологов в советской России оказался коротким. Работа по созда- нию тестов в начале 30-х гг. была подвергнута критике, тесты были объявлены вредным методом. В 1936 г. использование тестов было запрещено 10 Многие годы, вплоть до начала 90-х гг. XX в., отношение к тес- там было негативным. Педагоги-практики вернулись к тестам в период прекращения массовых политических репрессий. Уже к началу 60-х гг. XX в. многие учителя, заботящиеся не о формальных показателях, а о 10 О педологических извращениях в системе Наркомпросов. Постановление ВКП(б). 1936 г. Педология (от греч. pais – дитя и logos – слово, наука) – течение в психологии и пе- дагогике, возникшее на рубеже XIX – XX вв., обусловленное проникновением эволюци- онных идей в педагогику и психологию, развитием прикладных отраслей психологии и экспериментальной педагогики. Как давно стали востребованы тесты в России? 40 реальном качестве учебного процесса, стали использовать при кон- троле наборы заданий в тестовой форме, которые чаще всего называ- лись по-разному, но только не словом «тест». Промежуток времени с 60-х гг. до начала 90-х гг. XX в. был для отечественной школы перио- дом постепенной либерализации, когда учителя изыскивали различ- ные резервы в борьбе за повышение качества обучения на фоне сни- жения авторитарного характера учебного процесса. Тесты в это время существовали полулегально, официально запрет на них не был отме- нен, но уже предпринимались попытки диссертационных исследова- ний по проблемам тестирования, появлялись работы педагогов- новаторов, в которых тесты и анкетные опросы использовались как инструментарий для подтверждения эффективности нововведений. В это время тесты разрабатывались без должного знания теории педаго- гических измерений, на основе опыта и здравого смысла, поэтому чаще всего тестами их было можно назвать лишь условно. Столь же необоснованными по надежности и валидности были наборы заданий с выбором ответов, создаваемые практически повсе- местно на рубеже 60 – 70-х гг. XX в. в связи с интенсивным развитием программированного обучения. Только к середине 80-х гг. XX в. в на- шей стране в научных и методических работах преподавателей стали утверждаться основные положения теории педагогических измере- ний, декларирующие необходимость эмпирической верификации ка- чества измерений и статистического анализа характеристик тестов. Первое признание тестирования как способа проверки уровня знаний официально появилось в декабре 1988 г., тесты разрешалось исполь- зовать в системе повышения квалификации. Затем вышли норматив- ные документы, разрешающие проводить тестирование в качестве вступительных испытаний, в том числе в техникумах. В 1995 г. тести- рование предлагалось использовать уже как способ итоговой аттеста- ции школьников 11 . Таким образом, состоялась реабилитация тестиро- вания после 1936 г. В целом рассматриваемый временной промежуток в развитии тестов был периодом прогресса, когда на смену представлениям о 11 Об утверждении документов по итоговой аттестации и награждению выпуск- ников. Приказ Минобразования РФ № 88 от 24 февраля 1995 г. 41 тесте как о простом наборе заданий пришло научное понимание этого термина. В этот период появляются научные издания по тестовой и смежной с ней проблематике, учебные пособия и многочисленные статьи отечественных авторов, как поддерживающие, так и осуж- дающие тесты в образовании. В 90-е гг. XX в. стали больше гово- рить не о руководстве, а о научно обоснованном управлении учебным процессом, в информационном обес- печении которого важная роль по праву принадлежит тестам. Новое понимание возможностей тестов в образовании способствовало росту научных исследований. В это вре- мя появляются работы по проблемам измерений и тестирования в об- разовании, защищаются многочисленные кандидатские и докторские диссертации, издаются монографии, учебные пособия, журналы, про- водятся конференции и симпозиумы. С октября 1995 г. в документах Госкомвуза стала отражаться работа по введению централизованного тестирования – ЦТ 12 Последнее десятилетие XX в. в нашей стране совпало с перио- дом бурного развития структур, занимающихся практической работой по созданию и применению тестов. Значимым событием в области подготовки кадров по педагогическим измерениям стало открытие в 2001 г. на факультете повышения квалификации Российского универ- ситета дружбы народов кафедры тестологии, где впервые в нашей стране началась реализация профессиональной образовательной про- граммы для получения дополнительной квалификации «Тестолог (специалист в области педагогических измерений)». Коренные изменения в отношении учителей к тестам произошли в 2001 г. в связи с началом эксперимента по введению единого госу- дарственного экзамена, благодаря которому тесты получили офици- 12 Об утверждении порядка приема в государственные образовательные учреж- дения высшего профессионального образования (высшие учебные заведения) Россий- ской Федерации. Постановление Госкомвуза РФ № 9 от 27 декабря 1995 г.; О централи- зованном тестировании выпускников общеобразовательных учреждений Российской Федерации. Приказ Минобразования РФ № 537 от 26 декабря 1996 г. В чём специфика новой истории тестов России? 42 альное признание в Рос- сии. За годы экспери- мента значительно повы- силась степень доверия к результатам тестирова- ния со стороны органов управления образованием, образовательных учреж- дений, самих учителей, которые убедились в высокой объективности и обоснованности баллов ЕГЭ, в их высокой прогностичности при от- боре абитуриентов вузов. В 2002 г. был открыт Федеральный инсти- тут педагогических измерений (ФИПИ), приоритетным направлением деятельности которого является научное, методическое и организаци- онное сопровождение процесса создания контрольных измеритель- ных материалов (КИМ) для ЕГЭ, а в последствие и для ГИА. Приме- нение технических средств в конце ХХ в. оказало большое влияние не только на методы тестирования (появились компьютерные тесты), но и на методологию тестирования: были разработаны нетрадиционные тесты, к которым относятся интегративные, адаптивные тесты и тесты с критериально-ориентированной интерпретацией результатов. Подводя итоги развития тестирования в России, необходимо подчеркнуть, что на сегодняшний день среди ученых-педагогов в на- шей стране сложилось понимание того, что теория педагогических измерений – наука, обладающая своей методологией, методами и ап- паратом, необходимым для разработки качественных педагогиче- ских тестов. Это подтверждает широкое издание инновационных ра- бот по педагогическим тестам отечественных ученых и зарубежных авторов, а также тиражирование сборников контрольно-измеритель- ных материалов ГИА и ЕГЭ, специальные журналы по тестовой про- блематике. Таким образом, можно считать, что на данный момент в России сформировалось сообщество профессионалов – специалистов по разработке и применению тестов. Сегодня Россия не только прак- тически свела к минимуму последствия запрещения разработки и ис- пользования тестов, но и постоянно вносит свой вклад в развитие тес- тологии. Тестология (от англ. test – проба, греч. logos – знание) – междисциплинарная наука о созда- нии качественных и научно обоснованных измерительных диагностических методик. Зарубежные психологи называют эту нау- ку психометрикой (Psychometrika), а педаго- ги – педагогическим измерением (Educational measurement). 43 3.2. Развитие тестирования в зарубежных странах К числу одних из самых ранних попыток создания тестов можно отнести исследова- ния Ф. Гальтона и Дж. Кэт- телла, которые ещё в 1890 г. использовали термин «тест на интеллект» (mental test). Им же принадлежит заслуга введения в научный оборот специальной характеристики качества теста (power of discrimination), указывающей на его способность дифференцировать испытуемых по измеряемой переменной. Однако появление педагогических тестов за рубежом нередко связывают с именем французского врача и психоло- га А. Бине 13 и его работой по диагностике интеллектуальных способ- ностей. В 1905 г. А. Бине и Т. Симон стали авторами первого практи- ческого теста интеллекта, называвшегося «шкала умственного разви- тия Бине – Симона». В 1916 г. Л. Термен создал новые тесты (Стэн- форда – Бине), представляющие собой оригинальную модификацию работы его предшественника. Немного позднее идеи А. Бине были использованы немецким психологом и философом В.Штерном, кото- рый предложил специальный коэффициент для оценивания интеллек- та – коэффициент IQ. Этот термин используется до сих пор, правда, несколько в ином контексте. Достижениями второго десятилетия XX в. в сфере измерений считают знаменитые батареи Альфа и Бета-тестов для армии. Благо- даря команде специалистов, в со- став которой входили Э. Торн- дайк,Р. Годдард, П. Йеркс и Л. Терман, были созданы тесты, ко- торые впоследствии стали ис- пользовать (вплоть до настояще- го времени) в качестве примеров при обучении разработчиков тестов в образовании. Первые стандартизированные измерители в образова- нии США были созданы для оценки качества почерка, правописания и вы- 13 Бине А. По поводу измерения интеллекта. Психологический ежегодник, 1905. Чья работа считается точкой отсчета в становлении основных научных подходов к измерениям в психологии и образовании? Что способствовало разви- тию классической теории пе- дагогических измерений и тестирования XX в.? 44 полнения арифметических действий в конце 20-х гг. XX в. Тогда же в Америке появилась батарея тестов SAT, предназначенных для отбора абитуриентов колледжей. Несколько позже, в конце 40-х гг. XX в. бы- ли созданы батареи тестов достижений, реализующие идеи много- мерных измерений и обеспечивающие сопоставимость результатов по разным школьным предметам. В 1904 г. англичанин Ч. Спирменопубликовал фундаменталь- ный теоретический труд по ис- следованию общих интеллек- туальных способностей. Ис- пользуя школьные оценки по различным предметам, он применил к данным тестирования аппарат новой для того времени теории корре- ляции и выявил примеры ковариации оценок школьников. Тем самым он заложил основы научных подходов к обоснованию качества тес- тов, соединив в своем исследовании теорию физических измерений, корреляционные методы и накопленный его предшественниками- психологами опыт оценивания способностей детей. Прообразом научных положений теории педагогических изме- рений послужила далекая от образования работа Н.Р. Кэм- пбелла «Основы физики» (1920), благодаря которой был разработан теоретический аппарат для анализа качества измерений, а обыденное представление о тесте и его научное определение стали заметно различаться. Для обоснования ка- чества педагогических измерений, их надежности и валидности была создана классическая теория тестов, получившая впоследствии на- звание традиционной, и базирующаяся на концепции параллельных измерений и теории корреляции. На основе этой теории в 30 – 40-е гг. XX в. интенсивно разрабатывались количественные методы для ана- лиза качества тестовых заданий, строились стандартизованные тесты учебных достижений и осваивались методы шкалирования результа- тов выполнения тестов. В конце 40-х гг. XX в. увлечение чистой теорией сменилось по- ниманием важности правильного применения измерений в сфере пси- хологии и образования. Значимым событием конца 40-х гг. XX в. для Корреля́ция – статистическая взаимосвязь двух или нескольких случайных величин. Ковариа́ция – в теории вероятностей мера ли- нейной зависимости двух случайных величин. 45 развития теории и практики измерений в образовании стало создание в 1947 г. в США Службы образовательного тестирования – Education- al Testing Service (ETS). Сегодня эта организация имеет представи- тельства практически во всех странах мира. Из числа тестов, создан- ных ETS, наибольшую известность в связи с расширением программ международного обмена в обучении приобрел TOEFL, выявляющий уровни владения различными видами речевой деятельности для обу- чения в англоязычных странах. Вистории тестов были этапы подъемов и спадов. В частности в США в конце 60-х гг. XX в. жестко критиковались педагогические тесты. Высказывались опасения, что тестирование служит инстру- ментом подавления инициативы и творчества учащихся, слишком уп- рощенно трактует такие сложные конструкты, какими являются учебные умения, необъективно оценивает учебные достижения. При- водились и другие аргументы против широкого использования тес- тов. Ученые-тестологи занимались в основном конструктивной науч- ной критикой традиционных методов разработки тестов, что привело к построению новой теории – Item Response Theory (IRT), которую нередко в наши дни называют современной теорией тестов. Неоспоримые преимущества IRT, такие как возможность про- гноза надежности измерений, увеличения эффективности тестиро- вания и получение оценки параметров подготовленности учащихся, не зависящих от трудности заданий теста, стали широко применяться на практике с конца 80-х гг. XX в. Это стало возможным благодаря разработке алгоритмов оценивания параметров испытуемых и зада- ний на основе математических моделей IRT,создания программного обеспечения и широкого использования ПК. Сочетание аппарата классической теории и IRT при разработке тестов открыло новые возможности повышения качества педагогических измерений и при- менения тестирования в образовании. Современный период в истории развития тестов характеризует- ся интенсивным развитием теории IRT, созданием новых моделей и методик её применения, внедрением в тестирование компьютерных технологий, адаптивного тестирования, различных инноваций в об- Что такое IRT? 46 ласти разработки и применения тестов. В настоящий момент наме- тился ряд направлений исследований, нацеленных на расширение воз- можностей педагогических измерений, разработку инновационных измерителей и повышение качества тестов. К их числу относится соз- дание новых моделей педагогического измерения, инновационных форм тестовых заданий для проверки творческих и практико- ориентированных аспектов подготовленности учащихся, методов ка- либровки тестовых заданий и методик компьютерного моделирования тестов, обеспечивающих планируемую точность измерений. Большое внимание уделяется психолого-педагогическим проблемам тестиро- вания (проблемам тревожности, мотивации), развитию специальных процедур для выявления размерности пространства измерений, созда- нию специальных методик, позволяющих обоснованно использовать результаты педагогических измерений в управлении качеством обра- зования. 3.3. Направления и проблематика современных российских и зарубежных исследований по вопросам измерений и тестирования в образовании Период активизации исследований по тестовой проблематике конца XX – начала XXI в. совпал с началом эксперимента по введе- нию ЕГЭ и повсеместным созданием в вузах России систем менедж- мента качества образования. Тогда же появились исследования по тестам и смежной проблематике В.С. Аванесова, Т.М. Балыхиной, Н.Ф. Ефремовой, И. И. Легостаева, А.А. Макарова, Е.А. Михайлыче- ва, В. Г. Наводнова, В. П. Папасюка, В.Ю. Переверзева, И.Д. Рудин- ского, М.Б. Челышковой и др. С конца 90-х гг. XX в. вплоть до настоящего времени из года в год растет число монографий, учебных пособий, статей и методичес- ких работ по вопросам изме- рений и тестирования в обра- зовании. В целом современ- ные исследования отечествен- ных учёных по проблемам из- мерения и тестирования в образовании осуществляются по следую- щим направлениям: За счёт чего произошло расши- рение сферы приложения педа- гогических измерений в России? 47 разработка научных подходов к совершенствованию содер- жания измерителей в контексте современных трактовок качества учебных достижений; разработка теоретико-методологического и методического обеспечения процесса конструирования надежных и валидных тестов; научное обоснование процедур применения тестов; научное обоснование шкалирования данных тестирования и их интерпретация для применения результатов педагогических изме- рений в управлении качеством образования. Несомненный интерес представляют также анализ и психолого- педагогическая интерпретация латентных характеристик подгото- вленности выпускников, развитие моделей содержательной преемст- венности тестовых материалов для итогового контроля на различных ступенях обучения (дошкольное, начальное, основное, среднее, выс- шее), необходимость разработки которых резко возросла в наше вре- мя в связи с созданием Общероссийской системы оценки качества об- разования (ОСОКО). Проведение исследований по выделенным на- правлениям в нашей стране, безусловно, позволит значительно повы- сить качество используемых в образовании измерителей и тем самым будет способствовать повышению качества образования. В современных зарубежных исследованиях в теории пе- дагогических измерений к приоритетным направлениям исследовательских работ от- носятся: развитие методологии сочетания качественных и количест- венных методов при эвалюации в образовании; оптимизация методов интеграции данных педагогических из- мерений, полученных с помощью инновационных форм заданий тес- тов; развитие параметрических и непараметрических моделей IRT; разработка методик, алгоритмов и математико-статистичес- кого аппарата теории педагогических измерений для создания про- граммного обеспечения и практического использования новых моде- лей IRT; Почему IRT заняла лидирующее положение в сфере конструиро- вания и применения педаго- гических тестов за рубежом? 48 исследования психологических и этических проблем в тести- ровании; разработка научно-методических подходов к построению уровневых шкал в образовании, разработка новых методов выравни- вания; развитие специальных процедур и подходов для выявления размерности пространства измерений и её адекватности поставлен- ным целям тестирования и т.д. Многие зарубежные исследования посвящены аппарату и ме- тодам теории IRT, которая широко используется в практике тести- рования, а результаты, полученные такими исследователями, как Ф. Лорд, M. Новик, Е. Самсджим, Д. Вэйс, Б. Райт, Ури и другими, внедрены в практику разработки и применения тестов. 3.4. Тестирование в психологии и образовании Взаимодействие психологов и педагогов в области разработки тестов имеет свои исторические причины и научные предпосылки. В научном плане оно предопределено близостью методологий измерений в эмпирических науках и единством методик разработки тестов, общно- стью объекта исследования, тесной взаимосвязью и частичным пересечением субъектов измерения. Ис- торические аспекты этого взаимодействия обусловлены особенностя- ми становления теории педагогических измерений, сложившимися за рубежом в 20 – 40-е гг. XX в. В то время потребность в стандартизи- рованных педагогических тестах постоянно увеличивалась, а сообще- ство тестологов в сфере образования практически еще не сложилось, поэтому психологи зачастую привлекались к работе над педагогиче- скими тестами. В наши дни область совместных работ педагогов и психологов расширяется. Во многих учебных заведениях в России и за рубежом работают психологи, создаются специальные службы консультиро- вания школьников и студентов. В их функции входит не только пси- хологическая поддержка учащихся в проблемных ситуациях, но и участие в проведении мониторинга, анкетных опросов и в подготовке учебного заведения к государственной аттестации. Педагоги, в свою очередь, проявляют интерес к оцениванию способностей обучающих- Существует ли взаимо- связь психологических и педагогических измерений? 49 ся, когнитивных аспектов подготовленности, психологических осо- бенностей учащихся в усвоении знаний и нередко выполняют свои исследования на стыке психодиагностики и измерений в образовании. Тенденция вхождения психологов в педагогические измерения в нашей стране наметилась в середине 90-х гг. XX в. В это время воз- рос интерес к педагогическим тестам и отсутствие тестологов в обра- зовании ощутилось особенно остро. Образовавшийся кадровый ваку- ум в значительной степени заполнили психологи. Попутно, сами того не желая, они привнесли в образовательную среду устойчивые пред- ставления о тестах как о наборе довольно тривиальных по содержа- нию заданий, носящих косвенный характер и имеющих форму с вы- бором ответа. Несмотря на имеющиеся точки соприкосновения, между педаго- гическими и психологическими теста- ми есть существенные различия. Педа- гогические тесты оценивают результа- ты усвоения общего для всех обучае- мых программного курса, а психологи- ческие отражают индивидуальное восприятие жизненного опыта, различающегося по социальным и экономическим условиям его при- обретения. Результаты тестирования в психологии используются в основном для прогнозирования успешности какой-либо деятельности в зависимости от оценок личностных характеристик и склонностей или носят рекомендательный характер при выявлении личностных проблем. Педагогические тесты в итоговом контроле дают количест- венные оценки уровня подготовленности обучаемых, которые неред- ко служат основой для принятия административно-управленческих решений в образовании, поэтому к качеству результатов педагогиче- ских измерений и их сопоставимости должны предъявляться повы- шенные требования, обеспечивающие корректность управленческих выводов и административных решений. Внешние различия между тестами в психологии и в образовании проявляются в формулировках заданий, которые в педагогических тестах всегда носят прямой, а в психологических тестах, чаще всего, косвенный характер. В чём различия между психологическими и педа- гогическими тестами? 50 Вопросы и задания 1. Какие периоды можно выделить в отечественной и зарубежной ис- тории развития тестов? Каковы характерные особенности каждого этапа? 2. Составьте галерею образов учёных, которые внесли особый вклад в развитие отечественной и зарубежной тестологии. 3. В чём различие педагогических и психологических тестов? Подбе- рите педагогический и психологический тест для их сравнения по формулировкам заданий, спрогнозируйте параметры их результа- тивности. 4. Приведите примеры современных исследований отечественных учёных по проблемам измерения и тестирования в образовании. 5. Существует ли тестовая культура? Приведите аргументы в пользу следующего высказывания «Тестовая культура – феномен челове- ческой цивилизации». Список рекомендуемой литературы 1. Аванесов, В. С. Основные понятия педагогической тестологии / В. С. Аванесов // Научные проблемы тестового контроля знаний : тез. докл. участников школы-семинара. 4–18 марта 1994 г. – М. : Исслед. центр проблем качества подготовки специалистов, 1994. – С. 105 – 108. 2. Кадневский, В. М. История тестов : монография / В. М. Кадневский. – М. : Народное образование, 2004. – 464 с. – ISBN 5-87953-188-0. 3. Он же. Тесты, история становления / В. М. Кадневский // Педаго- гическая диагностика. – 2002. – № 1. – С. 9 – 15. 4. Он же. Тестовая культура как феномен человеческой цивилизации / В. М. Кадневский // Культурологические исследования в Сибири. – 2003. – № 1(9). – С. 54 – 67. 5. Современные средства оценивания результатов обучения : учеб. пособие / сост. Е. В. Телеева. – Шадринск : Изд-во Шадрин. пед. ин-та, 2009. – С. 32 – 34. 51 |