Главная страница
Навигация по странице:

  • Стабильность теста

  • Согласованность теста

  • Способы повышения надёжности тестов

  • Научно-исследовательская деятельность 2. Физической культуры и спорта в. Н. Попков научноисследовательская


    Скачать 2.55 Mb.
    НазваниеФизической культуры и спорта в. Н. Попков научноисследовательская
    Дата27.12.2019
    Размер2.55 Mb.
    Формат файлаdoc
    Имя файлаНаучно-исследовательская деятельность 2.doc
    ТипРеферат
    #102386
    страница18 из 34
    1   ...   14   15   16   17   18   19   20   21   ...   34

    Воспроизводимость теста и способы её оценки
    Под воспроизводимостью теста понимают степень совпадения результатов повторного тестирования одних и тех же лиц, находящихся в одном и том же состоянии, полученных одним и тем же исследователем при минимальном временном интервале между первым и вторым измерениями. Зачастую говоря о надёжности теста, имеют в виду именно его воспроизводимость.

    В принципе, при оценке воспроизводимости теста исследователя могут интересовать два вопроса: изменяются ли ранги испытуемых от первого ко второму измерению (т. е. их положение в группе относительно друг друга) и изменяется ли уровень результата от первого ко второму измерению.

    Простейший способ ответа на первый вопрос заключается в вычислении коэффициента корреляции между двумя повторными измерениями, проведёнными на одной и той же выборке (n > 20). Эта процедура называется «тест-ретест метод». Первое измерение называют тестом, а второе – ретестом. Полученный при этом коэффициент обозначается rtt и служит количественной мерой воспроизводимости теста.

    Общепринятых критериев надёжности не существует, однако можно использовать следующие градации оценки:

    0,95 и > – отличная надёжность 0,90–0,95 – высокая,

    0,80–0,90 – удовлетворительная,

    0,70–0,80 – приемлемая,

    менее 0,70 – низкая.

    Если rtt < 0,7, то использовать тест для индивидуальной оценки не следует, такой тест может быть применён только для оценки группы по среднему арифметическому значению результатов испытуемых.
    Стабильность теста
    Одной из разновидностей надёжности теста является его стабильность. Под стабильностью понимают воспроизводимость результатов при повторном тестировании, проводимом одним и тем же лицом в одних и тех же условиях, когда первое и повторное измерения проводятся не подряд, а разделены определённым временным интервалом. Не трудно заметить, что стабильность теста отличается от обычной воспроизводимости только наличием более продолжительного интервала между тестом и ретестом. Таким образом, речь идёт в основном о влиянии длительности временного интервала на воспроизводимость теста.

    Стабильность теста зависит:

    от вида теста;

    от контингента испытуемых;

    от временного интервала между тестом и ретестом.

    Исследователя могут интересовать два вопроса:

    1) в какой мере сохраняется уровень показателя;

    2) в какой мере совпадают порядковые места, занимаемые испытуемыми по результату теста и ретеста.

    Первый вопрос решается с помощью дисперсионного, а второй – с помощью корреляционного анализа.
    Согласованность теста
    Согласованностью называется независимость результата теста от свойств лица, проводящего измерение. Таким образом, речь идёт о воспроизводимости теста при проведении его на одном и том же контингенте, в одно и то же время разными исследователями (или о совпадении экспертных оценок результата теста). В некоторых литературных источниках эту разновидность надёжности называют объективностью. Возможны два варианта влияния субъективных свойств исследователя на результат тестирования:

    1) различие в оценке вызвано разным отношением исследователей к одному и тому же результату;

    2) исследователи по-разному влияют на результат (например, один побуждает испытуемого, а другой относится нейтрально).

    Нетрудно заметить, что эта разновидность надёжности теста особенно важна в тех случаях, когда результат теста является итогом экспертной оценки, хотя и при объективных измерениях возможно влияние субъективных свойств исследователя.

    В том случае, если исследователей только два, согласованность оценивается по коэффициенту корреляции между полученными ими результатами при тестировании (или оценивании) одной и той же группы испытуемых. В том случае, когда нужно оценить согласованность оценок нескольких исследователей (например, бригады судей в гимнастике или фигурном катании), то используется коэффициент конкордации (пример вычисления и оценки коэффициента конкордации см. [15, с. 98–99]).
    Способы повышения надёжности тестов
    Для повышения надёжности теста используются различные приёмы:

    1) стандартизация условий и инструмента измерений;

    2) увеличение числа исследователей (экспертов, судей);

    3) увеличение числа эквивалентных тестов: повышение мотивации испытуемых;

    4) увеличение числа измерений (попыток);

    5) выбор оптимальных значений трудности, длины, скорости теста.

    Если тест нетрудоёмкий, то повышение его надёжности может быть достигнуто за счёт увеличения «длины» теста (количества измерений, попыток). При этом лучшую надёжность, как правило, даёт среднее арифметическое (X), менее надёжна медиана (Ме) и ещё менее надёжна лучшая попытка.

    Однако в тех случаях, когда дисперсия индивидуальных результатов намного меньше, чем дисперсия межиндивидуальная, можно использовать и лучший результат.

    Для определения числа измерений (попыток), обеспечивающего необходимую надёжность, необходимо:

    1 Провести эмпирическую оценку надёжности теста ();

    2 Выбрать необходимую (желаемую) надёжность ();

    3 По формуле (3) вычислить коэффициент К, показывающий во сколько раз нужно увеличить число измерений.

    (3).

    Например, при трёх измерениях rtt = 0,5 (т. е. каждый испытуемый выполнил 2 серии по 3 попытки, от каждой серии получена средняя арифметическая и коэффициент корреляции между ними оказался равным 0,5). Необходимая надёжность rtt* выбрана = 0,9. Рассчитаем, во сколько раз нужно увеличить число измерений, чтобы rtt равнялась 0,9 (т. е. чему равно К).

    .

    Следовательно, для достижения необходимой надёжности число измерений нужно увеличить в 9 раз, т. е. вместо трёх следует выполнить 27 попыток, а в качестве итогового результата теста каждого испытуемого использовать среднее значение от 27 его попыток. Разумеется, что возможности увеличения числа измерений зависят от характера теста, в частности от того, насколько продолжительна (или утомительна) для испытуемого процедура тестирования.
    1   ...   14   15   16   17   18   19   20   21   ...   34


    написать администратору сайта