Главная страница
Навигация по странице:

  • ЛЕКЦИЯ 6. Тема: Математико-статистические основы теории тестов. Вопросы для рассмотрения:1. Понятие и классификация тестов.

  • ЛЕКЦИЯ 7. Тема: Основы теории педагогических оценок. Вопросы для рассмотрения:1. Понятие оценки. 2. Типы шкал оценок.

  • Спортивная метрология как учебная дисциплина. Основы теории спортивных измерений


    Скачать 192.69 Kb.
    НазваниеСпортивная метрология как учебная дисциплина. Основы теории спортивных измерений
    Дата16.03.2022
    Размер192.69 Kb.
    Формат файлаdocx
    Имя файлаKratkij-tekst-lektsij-po-sportivnoj-metrologii.docx
    ТипЛекция
    #399801
    страница4 из 6
    1   2   3   4   5   6

    5. Для рассмотрения этого вопроса используется пример с двумя группами велосипедистов, прошедших подготовку с использованием разных методик (Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 38 – 43)
    Контрольные вопросы для самопроверки:

    1. Что называют статистической гипотезой?

    2. Принцип выдвижения статистических гипотез.

    3. В чём заключается основной принцип проверки статистических гипотез?

    4. Односторонняя и двусторонняя критическая область.

    5. Ошибки при проверке гипотез. Уровень значимости.

    6. Основные этапы проверки статистических гипотез.

    7. Параметрические и непараметрические методы проверки статистических гипотез.

    8. Какие условия определяют выбор критерия для сравнения средних арифметических двух выборок?

    9. Какие параметрические и непараметрические критерии используются для сравнения средних арифметических двух выборок?

    10. Какие критерии в каких случаях используются для сравнения средних независимых выборок?

    11. Какие критерии в каких случаях используются для сравнения средних попарно зависимых выборок?

    12. Что такое доверительный интервал, доверительная вероятность?

    13. Порядок построения доверительного интервала.

    14. В каких случаях можно точно определить границы доверительного интервала?
    Литература:

    1. Основы математической статистики. Уч. пособие для ин-тов физической культуры (под общ. ред. В.С. Иванова). – М.: Физкультура и спорт, 1990. – С. 74 – 78, 81 – 103.

    2. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. – Минск: БГУФК, 2006. – С. 49 – 51, 62, 67 – 68.

    3. Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 34 – 51.

    ЛЕКЦИЯ 6.
    Тема: Математико-статистические основы теории тестов.
    Вопросы для рассмотрения:

    1. Понятие и классификация тестов.

    2. Требования к тестам.
    1. Тестом называется измерение или испытание, проводимое с целью определение состояния или способностей спортсмена.

    Тесты, в основе которых лежат двигательные задания, называют двигательными или моторными.

    Тест, в основе которого лежат двигательные задания, называется двигательным. Существует три группы двигательных тестов:

    1) Контрольные упражнения, выполняя которые спортсмен получает задание показать максимальный результат. Результатом теста является двигательное достижение. Например, время, за которое спортсмен пробегает дистанцию 100 м.

    2) Стандартные функциональные пробы, в ходе которых задание, одинаковое для всех, дозируется либо по величине выполненной работы, либо по величине физиологических сдвигов. Результатом теста являются физиологические или биохимические показатели при стандартной работе либо двигательные достижения при стандартной величине физиологических сдвигов. Например, процент увеличения ЧСС после 20 приседаний или скорость, с которой бежит спортсмен при фиксируемой величине ЧСС 160 ударов в минуту.

    3) Максимальные функциональные пробы, в ходе которых спортсмен должен показать максимальный результат. Результатом теста являются физиологические или биохимические показатели при максимальной работе. Например, максимальное потребление кислорода или максимальная величина кислородного долга.

    2. Тестами могут считаться только те измерения, которые отвечают специальным требованиям:

    1) цель тестирования;

    2) стандартность (процедура и условия тестирования должны быть одинаковыми во всех случаях применения теста);

    3) наличие системы оценок;

    4) надежность – качество, характеризующее повторяемость результатов теста при одинаковых условиях тестирования с одними и теми же испытуемыми;

    5) информативность – степень точности, с которой тест измеряет свойство, для оценки которого используется.

    Тест, удовлетворяющий требованиям надёжности и информативности называется добротным.

    Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей (или других объектов) в одинаковых условиях. Вариацию результатов при повторных измерениях называют внутрииндивидуальной или (используя более общую терминологию математической статистики) внутригрупповой либо внутриклассовой. Четыре основные причины вызывают эту вариацию.

    1) Изменение состояния испытуемых (утомление, врабатывание, научение, изменение мотивации, концентрации внимания и т.п.)

    2) Неконтролируемые изменения внешних условий и аппаратуры (температура, ветер, влажность, напряжение в электросети, присутствие посторонних лиц и т.п.), т.е. все то, что объединяется термином «случайная ошибка измерения».

    3) Изменение состояния человека, проводящего или оценивающего тест (и, конечно, замена одного экспериментатора другим или замена судьи).

    4) Несовершенство теста (есть такие тесты, которые заведомо малонадежны, например, штрафные броски в баскетбольную корзину до первого промаха. Даже баскетболист, имеющий высокий процент попадания, может случайно ошибиться при первых бросках).

    Говоря о надежности тестов, различают их стабильность (воспроизводимость), согласованность, эквивалентность.

    Под стабильностью теста понимают воспроизводимость результатов при его повторении через определенное время в одинаковых условиях. Повторное тестирование обычно называют ретестом.

    Степень надежности тестов определяется с помощью коэффициентов взаимосвязи, полученных из корреляционного или дисперсионного анализа.

    Выбор коэффициента взаимосвязи зависит от типа применяемой шкалы измерений, от числа выполненных попыток (попыткой считается, например, исходное или повторное тестирование) и количества факторов, влияние которых надо исследовать.

    Если изучается влияние только одного фактора и при этом количество попыток не более двух, то надежность теста может быть приближенно оценена с помощью коэффициента корреляции между тестом и ретестом. В остальных случаях рекомендуется использовать дисперсионный анализ.

    Стабильность теста зависит от:

    1) вида теста;

    2) контингента испытуемых;

    3) временного интервала между тестом и ретестом.

    Например, морфологические характеристики при небольших временных интервалах весьма стабильны; наименьшую стабильность имеют тесты на точность движений (например, броски в цель).

    У взрослых результаты тестирования более стабильны, чем у детей; у спортсменовболее стабильны, чем у не занимающихся спортом.

    С увеличением временного интервала между тестом и ретестом стабильность теста снижается.

    Согласованность характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Согласованность определяется по степени совпадения результатов, полученных на одних и тех же испытуемых разными экспериментаторами, судьями, экспертами. При этом возможны два варианта:

    1) лицо, проводящее тест, только оценивает его результаты, не влияя на них. Например, одну и ту же письменную работу разные экзаменаторы могут оценивать по-разному. Нередко различаются оценки судей в гимнастике, фигурном катании на коньках, боксе, показатели ручного хронометрирования, оценка электрокардиограммы или рентгенограммы разными врачами и т.п.;

    2) лицо, проводящее тест, влияет на его результаты. Например, некоторые экспериментаторы более настойчивы и требовательны, чем другие, лучше мотивируют испытуемых. Это сказывается на результатах (которые сами по себе могут измеряться вполне объективно).

    Согласованность тестаэто, по существу, надежность оценки его результатов при проведении теста разными людьми.

    Особенно актуальна задача оценки согласованности при количественном определении качественных показателей. Для этого разработаны специальные методы.

    Нередко тест выбирают из определенного числа однотипных тестов. Например, броски в баскетбольную корзину можно выполнять с разных точек; спринтерский бег может проводиться на дистанции, скажем, 50, 60 или 100 м; подтягивания можно выполнять на кольцах или перекладине, хватом сверху или снизу и т.п. В таких случаях может использоваться так называемый метод параллельных форм, когда испытуемым предлагают выполнить две разновидности одного и того же теста и затем оценивают степень совпадения результатов.

    Рассчитанный между результатами тестирования коэффициент корреляции называют коэффициентом эквивалентности. Отношение к эквивалентности тестов зависит от конкретной ситуации. С одной стороны, если два или больше тестов эквивалентны, их совместное применение повышает надежность оценок; с другойможет оказаться полезным применять только один эквивалентный тест: это упростит тестирование и лишь незначительно снизит информативность батареи тестов. Решение этого вопроса зависит от таких причин, как сложность и громоздкость тестов, степень необходимой точности тестирования и т.п.

    Если же тесты, входящие в какой-либо комплекс тестов, высокоэквивалентны, он называется гомогенным. Весь этот комплекс измеряет одно какое-то свойство моторики человека. Скажем, комплекс, состоящий из прыжков с места в длину, вверх и тройного, вероятно, будет гомогенным. Наоборот, если в комплексе нет эквивалентных тестов, то все тесты, входящие в него, измеряют разные свойства. Такой комплекс называется гетерогенным. Пример гетерогенной батареи тестов: подтягивание на перекладине, наклон вперед (для проверки гибкости), бег на 1500 м.

    Информативность теста - это степень точности, с какой он измеряет свойство (качество, способность, характеристику и т.п.), для оценки которого используется. Информативность нередко называют валидностью (обоснованность, действительность, законность).

    Вопрос об информативности теста распадается на 2 частных вопроса:

    1) Что измеряет данный тест?

    2) Как точно он измеряет?

    Если тест используется для определения состояния спортсмена в момент обследования, то говорят о диагностической информативности теста. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена, - о прогностической информативности. Тест может быть диагностически информативен, а прогностически - нет, и наоборот.

    Степень информативности может характеризоваться количественно на основе опытных данных (так называемая эмпирическая информативность) и качественно  на основе содержательного анализа ситуации (содержательная, или логическая информативность). Хотя в практической работе содержательный анализ всегда должен предшествовать математическому, здесь для удобства изложения рассматриваются сначала методы расчета эмпирической информативности.

    Идея определения эмпирической информативности состоит в том, что результаты теста сравнивают с некоторым критерием. Для этого рассчитывают коэффициент корреляции между критерием и тестом (и такой коэффициент называют коэффициентом информативности и обозначают rtk, где t  первая буква в слове «тест»; k  в слове «критерий»).

    В качестве критерия берется показатель, заведомо и бесспорно содержащий то свойство, которое собираются измерять с помощью теста.

    Чаще всего в спортивной метрологии критериями служат:

    1) Спортивный результат.

    2) Какая-либо количественная характеристика соревновательной деятельности (например, длина шага в беге, сила отталкивания в прыжках, успешность борьба под щитом в баскетболе, выполнение подачи в теннисе или волейболе, процент точных длинных передач в футболе).

    3) Результаты другого теста, информативность которого доказана если проведение теста-критерия громоздко и сложно и можно подобрать другой тест, столь же информативный, но более простой. Например, вместо газообмена определять ЧСС). Этот частный случай, когда критерием является другой тест, называют конкурентной информативностью.

    4) Принадлежность к определенной группе. Например, можно сравнивать мастеров спорта и спортсменов низших разрядов. Принадлежность к одной из этих групп является критерием. В данном случае используются специальные разновидности корреляционного анализа.

    5) Так называемый составной критерий. Например, сумма очков в многоборье. При этом виды многоборья и таблицы очков могут быть как общепринятыми, так и заново составленные экспериментатором. Составным критерием пользуются, когда нет единичного критерия (например, если стоит задача оценить общую физическую подготовленность, мастерство игрока в спортивных играх и т.п., ни один показатель, взятый сам по себе, не может служить критерием).

    При практическом использовании показателей эмпирической информативности следует иметь в виду, что они справедливы лишь по отношению к тем испытуемым и условиям, для которых они рассчитаны.

    Информативность теста не всегда может быть установлена с помощью эксперимента и статистической обработки его результатов. Например, требуется подготовить билеты для экзамена или темы дипломных работ и т.д. При этом надо отобрать наиболее информативные вопросы, по которым можно точнее всего оценить знания учащихся и подготовленность к практической работе. В этом случае опираются на содержательный (логический) анализ.
    Контрольные вопросы для самопроверки:

    1. Что называют тестом?

    2. Классификация двигательных тестов.

    3. Требования, предъявляемые к тестам.

    4. Добротность тестов.

    5. Надёжность тестов.

    6. Стабильность тестов.

    7. Согласованность тестов.

    8. Эквивалентность тестов.

    9. Информативность тестов.

    10. Диагностическая и прогностическая информативность.

    11. Эмпирическая и логическая информативность.

    12. Критерии информативности.
    Литература:

    1. Годик М.А. Спортивная метрология. Учебник для ин-тов физической культуры. – М.: Физкультура и спорт, 1988. – С. 17 – 36.

    2. Спортивная метрология. Учебник для ин-тов физической культуры (под общ. ред. В.М. Зациорского). – М.: Физкультура и спорт, 1982. – С. 63 – 80/

    3. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. – Минск: БГУФК, 2006. – С. 8, 51 – 56.
    ЛЕКЦИЯ 7.
    Тема: Основы теории педагогических оценок.
    Вопросы для рассмотрения:

    1. Понятие оценки.

    2. Типы шкал оценок.

    3. Оценка комплекса тестов.

    4. Нормы.
    1. Показанные спортсменами результаты выражаются в разных единицах измерения и поэтому непосредственно не сопоставимы друг с другом. Кроме того, сами по себе они не указывают, насколько они удовлетворительны. Поэтому результаты превращаются в оценки (очки, баллы, отметки, разряды и т.п.) Исходя из этого основными задачами оценивания являются следующие:

    1) Сопоставить разные достижения в одном и том же задании (тесте, спортивной дисциплине, упражнении, виде многоборья).

    2) Сопоставить достижения в разных заданиях. Главным здесь является уравнивание оценок за достижения одинаковой трудности в разных видах спорта или разных дисциплинах соревнований. Такие равно трудные достижения называются эквивалентные.

    3) Определить нормы. В отдельных случаях нормы совпадают с градациями шкалы оценок.

    Оценкой (педагогической оценкой) называется унифицированная мера успеха в каком-либо задании. Процесс выведения оценки называют оцениванием. Различают учебные оценки, которые выставляет преподаватель ученикам по ходу учебного процесса, и квалификационные, под которыми понимаются все прочие виды оценок (результаты официальных соревнований, тестирования и т.д.).

    2. Закон преобразования спортивных результатов в очки называется шкалой оценок. Шкала может быть задана в виде математического выражения (формулы), таблицы или графика.

    В физическом воспитании и спорте наиболее часто встречаются следующие типы шкал:

    1) Пропорциональные шкалы. Этот тип шкал предполагает начисление одинакового числа очков за равный прирост результатов.

    2) Регрессирующие шкалы. В этом случае за одни и тот же прирост результата начисляют по мере возрастания спортивных достижений всё меньшее количество очков. Такие шкалы, кажутся несправедливыми, но они полезны. Применяются в командных видах спорта, где стимулируют массовость в ущерб мастерству.

    3) Прогрессирующие шкалы. Здесь чем выше спортивный результат, тем большей прибавкой очков оценивается его улучшение.

    4) Сигмовидные (S-образные) шкалы. Здесь улучшение результатов в зонах очень низких и очень высоких достижений поощряется скупо; больше всего очков приносит прирост результатов в средней зоне.

    В большинстве случаев непосредственно сопоставлять достижения в разных заданиях нельзя. В таких случаях используют косвенные подходы. Наиболее распространёнными считают шкалы, где эквивалентными считают достижения, доступные одинаковому числу людей одного возраста и пола. На этом критерии основаны: стандартные шкалы оценок, перцентильная шкала, шкалы выбранных точек.

    3. Оценивание спортсменов, проходящих испытание в батарее тестов, можно проводить двумя основными способами:

    1) Общая оценка по всему комплексу тестов не выводится, а в процессе последующего анализа используются оценки, полученные отдельно по каждому тесту.

    2) Выводится итоговая оценка по всему комплексу тестов. Здесь возможны два варианта:

    1) суммируют оценки, полученные по отдельным тестам, входящим в комплекс;

    2) оценки, полученные за отдельные виды, сначала умножают на коэффициенты («веса»), различные для каждого теста, а потом складывают. Такая итоговая оценка по комплексу тестов, называется взвешенной оценкой.
    1   2   3   4   5   6


    написать администратору сайта