Научно-исследовательская деятельность 2. Физической культуры и спорта в. Н. Попков научноисследовательская
Скачать 2.55 Mb.
|
Эмпирическая оценка информативности по составному критерию В тех случаях, когда единичный критерий отсутствует, информативность теста может быть оценена по составному, сложному критерию, синтезированному из элементов деятельности, способность к которой предстоит оценить. Например, для оценки уровня специальной физической подготовленности хоккеистов нельзя предложить какой-то один критерий, но можно логическим путём отобрать ряд критериальных элементов игровой деятельности (ускорения, броски, обводка). Затем результаты теста, подлежащего проверке на информативность, коррелируют с количественной оценкой каждого из элементов, или с их обобщённой оценкой. В случае использования обобщённой оценки результатов измерения всех критериальных элементов, их переводят в одну из стандартных шкал, определяют весовой коэффициент каждого из них, затем с учётом весовых коэффициентов определяют суммарную критериальную оценку для каждого испытуемого. Мерой информативности теста может служить коэффициент корреляции между результатом теста и суммарной оценкой составного критерия. Практический эффект такого анализа может выразиться в том, что в случае высокого весь комплекс может быть заменён одним тестом. Основная трудность в реализации данного подхода заключается в определении весовых коэффициентов элементов составного критерия. Другой подход основан на использовании факторного анализа, с помощью которого можно выявить весовые коэффициенты и коэффициент информативности. В таком случае говорят о факторной информативности. Особенно эффективен такой подход, когда составляющие элементы критерия в явном виде выделить затруднительно (например, если критерий определён таким понятием как «общая физическая подготовленность»). Информативность комплекса тестов При анализе пригодности комплекса тестов приходится оценивать информативность как входящих в него тестов, так и всего комплекса в целом. Поскольку при этом используются различные приёмы, то и оценки информативности получаются различными в зависимости от того, какой вид информативности оценивается. 4.7.7 Методические принципы тестирования Чтобы получить достаточно надёжные и объективные результаты (даже при наличии тестов, обладающих высокой информативностью) тестирование должно проводиться с достаточной точностью и возможной тщательностью. При этом затраты времени должны быть минимальными. Поэтому к тестированию необходимо тщательно готовиться. Необходимо предварительно уточнить комплекс тестов, их надёжность и информативность, выяснить возможность выполнения теста в данных условиях; узнать существуют ли нормативы, которые можно использовать для оценки результатов тестирования. Если требуется, то нужно составить и распространить единую инструкцию проведения тестов. Измерения должны выполняться по точной инструкции (сколько попыток, средний или лучший результат и т. п.). Необходимо обеспечить безопасность испытуемых. Перед началом тестирования следует объяснить испытуемым цель тестирования, ознакомить с заданиями, если необходимо и возможно – дать выполнить пробные попытки. При повторных тестированиях особое внимание нужно уделить соблюдению одинаковых условий (время суток, приёма пищи, последовательность выполнения тестов). Природные условия также могут оказать влияние на результаты тестирования (ветер, температура, влажность воздуха, атмосферное давление, высота над уровнем моря, разница во времени при дальних переездах и т. п.). В практике контроля состояния спортсменов используются как лабораторные тесты, так и полевые, проводимые в естественных, близких к соревновательным, условиях двигательной активности спортсмена. В отличие от лабораторных тестирований, проводимых в строго контролируемых условиях, результаты полевых тестирований подвержены влиянию неконтролируемых факторов (скорость ветра, температура, влажность, состояние спортивного покрытия и т. п.). Портативные системы сбора данных, используемые в полевых условиях, обычно менее точны, по сравнению с лабораторными. Поэтому результаты, полученные в ходе проведения полевого тестирования, не так надёжны, как результаты лабораторных тестов, но часто бывают более информативными, так как лучше отражают специфику конкретного вида спорта. Кроме того, в ряде видов спорта исследователь не может эффективно имитировать специфику спортивного упражнения в лабораторных условиях. Учитывая сказанное, следует рассматривать результаты лабораторных и полевых исследований как дополняющие, но не заменяющие друг друга. При организации любого тестирования необходимо соблюдать этические критерии, выполнение которых гарантирует уважение человеческих прав испытуемого (сообщать цели тестирования, давать информацию о возможном риске, связанным с его проведением; если необходимо, то соблюдать конфиденциальность результатов тестирования). Вопросы для самопроверки 1 Раскройте содержание понятия «тест». 2 Перечислите основные требования, предъявляемые к тестам. 3 Что такое «надёжность теста» и каковы её разновидности? 4 Как оценивают воспроизводимость теста? 5 Что такое стабильность теста и как ее оценивают? 6 Что такое согласованность результатов тестирования и как ее оценивают? 7 Что понимают под информативностью теста и каковы основные ее разновидности? 8. Перечислите основные критерии оценки информативности тестов. 9. Комплексы тестов и их разновидности. 10 В чем заключаются методически принципы проведения тестирования? Литература 1 Анастази, А. Психологическое тестирование : в 2 кн., пер с англ. / А. Анастази. – М. : Педагогика, – 1982. – 320 с.; 296 с. 2 Ашмарин, Б. А. Теория и методика педагогических исследований в физическом воспитании : учеб. пособие для студентов и преподавателей ин-тов физ. культ. / Б. А. Ашмарин. – М. : Физкультура и спорт, 1978. – 223 с. 3 Бешелев, С. Д. Математико-статистические методы экспертных оценок / С. Д. Бешелев, Ф. Г. Гурвич. – М. : Статистика, 1974. – 156 с. 4 Благуш, П. К. теории тестирования двигательных способностей: сокр. пер. с чешск. / П. Благуш. – М. : Физкультура и спорт, 1982. – 165 с. 5 Годик, М. А. Спортивная метрология : учебник для ин-тов физ. культ. / М. А. Годик. – М. : Физкультура и спорт, 1988. – 192 с. 6 Зациорский, В. М. Основы спортивной метрологии / В. М. Зациорский. – М. : Физкультура и спорт, 1979. – 152 с. 7 Измерения и вычисления в спортивно-педагогической практике : учеб. пособие для вузов физической культуры / В. П. Губа, [и др.] – 2-е изд. – Физкультура и спорт, 2006 – 220 с. 8 Лях, В. И. Тесты в физическом воспитании школьников : пособие для учителя / В. И. Лях. – М. : АСТ, 1998. – 271 с. 9 Миркин, Б. Г. Анализ качественных признаков и структур / Б. Г. Миркин. – М. : Статистика, 1980. – 319 с. 10 Моделирование и комплексное тестирование в оздоровительной физической культуре : сб. науч. тр. / под ред. В. Д. Сонькина. – М. : [Б. и.], 1991. – 188 с. 11 Платонов, В. Н. Система подготовки спортсменов в олимпийском спорте. Общая теория и её практические приложения / В. Н. Платонов. – Киев: Олимп. литература, 2004. – 808с. 12 Попков, В. Н. Спортивная метрология : Курс лекций / В. Н. Попков. – Омск : Изд-во СибГУФК, 2004. – 184с. 13 Попков, В. Н. Тестирование и оценивание / В. Н. Попков. – Омск : Изд-во СибГУФК, 2004. – 73 с. 14 Рабочая книга социолога / М. Н. Руткевич [и др.]; ред. Г. В. Осипов. – M. : Наука, 1983. – 506 с. 15 Спортивная метрология : учеб. для ин-тов физ. культ. / под. ред. В. М. Зациорского. – М. : Физкультура и спорт, 1982. – 256 с. 16 Статистические методы анализа информации в социологических исследованиях / Г. В. Осипов [и др.] – М. : Наука, 1979. –319 с. 17 Тесты в спортивной практике / Х. Бубэ [и др.]. – М. : Физкультура и спорт, 1968. – 240 с. 18 Уткин, В. Л. Измерения в спорте: (введение в спортивную метрологию) : учеб. пособие / В. Л. Уткин. – М. : [Б. и.], 1978. – 199 с. 19 Челышкова, М. Б. Теория и практика конструирования педагогических тестов : учеб. пособие / М. Б. Челышкова. – М. : Логос, 2002. – 432 с. 4.8 ОЦЕНИВАНИЕ 4.8.1 Проблема оценивания. Понятие «оценка». Задачи оценивания. Процедура оценивания В самом общем виде целью измерений различных свойств и качеств человека является оценка его состояния (оперативного, текущего или перманентного). Для оценки состояния человека, занимающегося физической культурой или спортом, могут использоваться самые различные характеристики, так или иначе отражающие его здоровье, физическое развитие, психическое состояние, общую и специальную физическую подготовленность и т. п. Некоторые из этих характеристик оцениваются на основе экспертизы (например, результаты выступлений гимнастов, фигуристов), однако в большинстве случаев основой для такой оценки служат результаты объективных измерений различных характеристик. Сами по себе результаты таких измерений или тестов (несмотря на объективный характер, обеспеченный необходимой точностью и надёжностью измерений) не содержат в себе указания на то, является зафиксированный уровень свойства «хорошим или плохим», «нормальным или нет», а содержит только объективную основу для подобных оценок. Например, один и тот же результат в беге на 100 м, равный 13,2 с, в зависимости от пола, возраста, спортивной специализации и квалификации человека, может рассматриваться и как очень хороший, и как очень плохой. Поэтому для ответа на вопросы: «здоров человек или болен», «соответствует ли уровень данного качества полу и возрасту человека», «какова тренированность спортсмена» и т. п. результат измерения должен быть обязательно преобразован в оценку. Кроме того, результаты измерения различных характеристик выражаются в разных единицах измерения (секундах, метрах, килограммах и т. д.) и поэтому не сопоставимы друг с другом. Поэтому для сравнительной оценки результатов, измеренных в различных единицах, их приходится превращать в оценки (очки баллы и т. д.). В зависимости от задач, стоящих перед человеком, производящим оценку, могут быть использованы различные процедуры (способы) и критерии оценивания. Отсюда следует, что процессу оценивания всегда предшествует некоторый субъективный момент, связанный с выбором критерия и способа оценки. Следовательно, любой исследователь мог бы предложить свой вариант оценивания. В таком случае процедура оценивания потеряла бы смысл, т. к. её результат зависел бы не только и не столько от уровня измеренного свойства, сколько от того, кто и как проводит оценивание. Оценки стали бы трудно сопоставимыми. Например, один врач оценивал бы человека как здорового, а другой как больного; один специалист говорил бы, что ребёнок имеет нормальное развитие, а другой – считал бы его отстающим; один преподаватель устанавливал бы свой зачётный норматив, а другой – свой. Поэтому, значение имеет не только стандартизация процедур измерения и тестирования, но и стандартизация приёмов и способов оценивания. 4.8.2 Понятие «оценка». Задачи оценивания. Процедура оценивания Понятие «оценка». Оценкой (или педагогической оценкой) называется унифицированная мера успеха в выполнении какого-либо задания (теста). Процесс перевода результата измерения в оценку называют оцениванием. Оценка может быть выражена в качественной (словесной) форме (например, «зачтено» или «не зачтено», «сдано», «не сдано», «неудовлетворительно», «удовлетворительно», «хорошо», «отлично») или в количественной форме (например, баллы в школьных оценках или очки, набранные в многоборье). Различают учебные оценки, выставляемые преподавателем в процессе обучения, и квалификационные оценки, свидетельствующие о квалификации человека в том или ином виде деятельности (спортивной, производственной, научной и др.). Задачи оценивания. Основными задачами, решаемыми в процессе оценивания, являются: 1 Сопоставление уровня различных достижений в одном и том же задании (например, при оценивании результатов в командном зачёте может возникнуть вопрос: сколько начислить команде за результат мастера спорта, а сколько за результат первого разряда). 2 Сопоставление уровня достижений в разных заданиях. Главной трудностью при решении таких задач является уравнивание оценок за достижения одинаковой трудности в разных упражнениях или разных видах спорта (например, на сколько метров должен прыгнуть с трамплина лыжник-двоеборец чтобы получить столько же очков, сколько он набрал в лыжной гонке). 3 Определение норм. Например, каким должен быть зачетный норматив для получения зачёта по физической культуре для отбора в ДЮСШ, каким должен быть норматив мастера спорта и т. п. В отдельных случаях (например, в школьных оценках) нормы совпадают с градациями шкалы оценок. Процедура оценивания. Процедура оценивания может выполняться в один и в два этапа. В первом случае результат измерения (теста) сравнивается с заранее установленной нормой (критерием). Во втором – результат измерения сначала на основе так называемых шкал оценок превращают в очки (промежуточная оценка), а затем набранные очки сравниваются с заранее установленной нормой (критерием) и определяют итоговую оценку. Например, во всех многоборьях вначале результаты отдельных упражнений переводят в очки, а затем, после сравнения их с нормами спортивной классификации, выводят итоговую оценку – присваивают спортивный разряд. 4.8.3 Шкалы оценок и их разновидности. Критерии эквивалентности шкал. Критерии пригодности шкал. Нормы Правило преобразования результата теста (или спортивного результата) в очки называется шкалой оценок. Шкала оценок может быть задана в виде зависимости, представленной формулой, графиком или таблицей. Любая оценка может быть сделана на основе некоторой шкалы. Наличие шкалы не всегда очевидно. Шкала может существовать в процедуре оценивания как логический элемент (даже не осознанный). Шкала может быть явной (например, таблица очков по какому-либо виду спорта), либо не явной (например, школьные оценки). Но в процессе оценивания она всегда присутствует. Поскольку результаты различных тестов могут выражаться в разных единицах измерения, то для определения итоговой оценки их необходимо сначала преобразовать в условные (безразмерные) единицы – очки. Перевести результат теста в очки можно разными способами. Наиболее простой способ – ранжирование, т. е. количество очков, которое получают испытуемые (или команды) равно занятому ими месту. Основной недостаток этого способа заключается в том, что он не учитывает различие между результатами испытуемых, занявших смежные места. Независимо от этого различия разница в оценках всегда будет равна одному очку. Поэтому для перевода результата в очки лучше использовать шкалу оценок, в которой разрыв между результатом и очками находятся в определенной зависимости. В принципе, можно предложить бесчисленное множество вариантов шкал оценок. Однако все они распадаются на 4 основных типа: пропорциональные, прогрессирующие, регрессирующие и S-образные. Особенности каждого типа шкал и их разновидностей подробно рассмотрены в учебной литературе [1, 2, 5, 7, 10, 12, 15]. Поэтому здесь мы остановимся только на стандартных и персентильных шкалах. Стандартные шкалы являются одной из разновидностей пропорциональных шкал. Эти шкалы названы так потому, что в качестве масштаба при начислении очков в них используются стандартные (средние квадратические) отклонения. Шкалы пригодны в том случае, если распределение результатов близко к нормальному. В этом случае одинаковые оценки, полученные в стандартной шкале за разные задания, свидетельствуют об одинаковых (эквивалентных) достижениях. Кроме того, используя таблицу нормального распределения, всегда можно определить процент лиц, которому доступны достижения выше, ниже какой-либо оценки (или в любом диапазоне стандартной шкалы). Простейшей стандартной шкалой является – шкала, в которой очки равны нормированному отклонению t: (1), где, Xi – оцениваемый результат, – среднее арифметическое значение результата, – стандартное отклонение, Z – оценка результата в очках. Средний результат в этой шкале приравнивается к 0 очков. Результаты выше среднего получают положительные оценки, а результаты ниже среднего – отрицательные. Для нормально распределённых результатов очки 99,7 % оценок лежат в интервале от –3 до +3. Эта шкала не совсем удобна из-за нулевой и отрицательных значений оценок. Это неудобство легко преодолевается во всех остальных стандартных шкалах с помощью следующего приёма: среднее арифметическое значение результата и стандартное отклонение приравниваются к некоторым числам, выбранным таким образом, чтобы получить удобные градации шкалы. Так, в наиболее популярной Т – шкале среднее значение результата приравнено к 50, а стандартное отклонение – к 10 очкам. В результате чего формула для перевода результата в очки приобретает следующий вид: Т = 50 + 10 t (2). При массовых обследованиях, когда не требуется большой точности, используется стандартная шкала С: С = 5 + 2 t (3). При проведении психологических исследований интеллекта применяют шкалу Бине: В = 100 + 16 t (4). В ряде школ Европы для школьных отметок используют шкалу Н: Н = 3 – t (5). Персентильные (процентные) шкалы представляют собой график накопленных частот, выраженных в процентах (кумуляту). По этой шкале оценка, полученная испытуемым в очках, соответствует теоретически ожидаемому проценту конкурентов, которых он мог бы опередить, показав данный результат. Таким образом, одно очко – это один процент испытуемых. Если прирост в одно очко приравнивается к интервалу, включающему 10 % испытуемых, то такой интервал называют децилем. Если на одно очко приходится интервал, содержащий 25 % испытуемых, то такой интервал называют квартилем. На рис. 3 приведены наиболее распространённые шкалы и их связь с нормальным распределением. Рис. 3 Наиболее распространённые шкалы оценок (по А. Н. Петросяну) |