Главная страница
Навигация по странице:

  • 2. Основные задачи корреляционного анализа. 3. Коэффициент корреляции и его свойства. 4. Методы вычисления коэффициентов взаимосвязи. 1

  • Статистические гипотезы и достоверность статистических характеристик. Сравнение средних арифметических по данным малых выборок. Расчёт и построение доверительных интервалов.

  • 1. Понятие статистической гипотезы. 2. Принцип проверки гипотез. 3. Алгоритм выбора критерия для сравнения средних арифметических по данным малых выборок.

  • 4. Расчёт и построение доверительных интервалов. 5. Пример сравнения средних арифметических, расчёта и построения доверительного интервала. 1

  • Математико-статистические основы теории тестов. Вопросы для рассмотрения: 1. Понятие и классификация тестов. 2. Требования к тестам. 1

  • Взаимосвязь результатов измерения. Методы вычисления коэффициентов взаимосвязи


    Скачать 408.79 Kb.
    НазваниеВзаимосвязь результатов измерения. Методы вычисления коэффициентов взаимосвязи
    Дата15.03.2023
    Размер408.79 Kb.
    Формат файлаpdf
    Имя файлаLEKCHIA-9-METROLOGIA.pdf
    ТипЛекция
    #992688

    ЛЕКЦИЯ 9.
    Тема: Взаимосвязь результатов измерения. Методы вычисления
    коэффициентов взаимосвязи.
    Вопросы для рассмотрения:
    1. Виды взаимосвязи.
    2. Основные задачи корреляционного анализа.
    3. Коэффициент корреляции и его свойства.
    4. Методы вычисления коэффициентов взаимосвязи.
    1. В спортивных исследованиях между изучаемыми показателями часто обнаруживается взаимосвязь. Вид ее бывает различным. Например, определение ускорения по известным данным скорости в биомеханике, закон
    Фехнера в психологии, закон Хилла в физиологии и другие характеризуют так называемую функциональную зависимость, или взаимосвязь, при которой каждому значению одного показателя соответствует строго определенное значение другого.
    К другому виду взаимосвязи относят, например, зависимость веса от длины тела. Одному значению длины тела может соответствовать несколько значений веса и наоборот. В таких случаях, когда одному значению одного показателя соответствует несколько значений другого, взаимосвязь называют статистической.
    Изучению статистической взаимосвязи между различными показателями в спортивных исследованиях уделяют большое внимание, поскольку это позволяет вскрыть некоторые закономерности и в дальнейшем описать их как словесно, так и математически с целью использования в практической работе тренера и педагога.
    Среди статистических взаимосвязей наиболее важны корреляционные.
    Корреляция заключается в том, что средняя величина одного показателя изменяется в зависимости от значения другого.
    2. Статистический метод, который используется для исследования взаимосвязей, называется корреляционным анализом. Основной задачей его является определение формы, тесноты и направленности взаимосвязи изучаемых показателей. Корреляционный анализ позволяет исследовать только статистическую взаимосвязь. Он широко используется в теории тестов для оценки их надежности и информативности. Различные шкалы измерений требуют разных вариантов корреляционного анализа.
    Анализ взаимосвязи начинается с графического представления результатов измерений в прямоугольной системе координат. Строится график, на оси абсцисс которого откладываются результаты X, а на оси ординат

    результаты
    Y. Таким образом, каждая пара результатов в прямоугольной системе координат будет отображаться точкой. Полученная совокупность точек обводится замкнутой кривой.

    Такая графическая зависимость называется диаграммой рассеивания или корреляционным полем. Визуальный анализ графика позволяет выявить форму зависимости (по крайней мере, сделать предположение). Если форма корреляционного поля близка к эллипсу, такую форму взаимосвязи называют линейной зависимостью или линейной формой взаимосвязи.
    Однако, на практике можно встретить и иную форму взаимосвязи.
    Зависимость, экспериментально полученная при подачах в теннисе, является характерной для нелинейной формы взаимосвязи, или нелинейной зависимости.
    Таким образом, визуальный анализ корреляционного поля позволяет выявить форму статистической зависимости

    линейную или нелинейную.
    Это имеет существенное значение для следующего шага в анализе

    выбора и вычисления соответствующего коэффициента корреляции.
    3. Если измерения происходят в шкале отношений или интервалов и наблюдается линейная форма взаимосвязи, для количественной оценки тесноты взаимосвязи используется коэффициент корреляции Бравэ-Пирсона.
    Обозначается буквой r. Вычисляется по формуле:
    y
    x
    n
    i
    i
    i
    n
    y
    y
    x
    x
    r







    1
    )
    )(
    (
    , где
    x
    и
    y
    – средние арифметические значения показателей x и y; σ
    x и σ
    y
    – средние квадратические отклонения; n – число измерений (испытуемых).
    Его свойства:
    1) Значения r могут изменяться от –1 до 1.
    2) В случае r=-1 и r=1 взаимосвязь функциональная, соответственно, отрицательная и положительная.
    3) При r=0 линейная взаимосвязь не установлена, но при этом может наблюдаться взаимосвязь другой формы.
    4) При r<0 взаимосвязь отрицательная, при r>0 – положительная.
    Для оценки тесноты взаимосвязи в корреляционном анализе используется значение (абсолютная величина) коэффициента корреляции.
    Абсолютное значение любого коэффициента корреляции лежит в пределах от
    0 до 1. Объясняют (интерпретируют) значение этого коэффициента следующим образом:

    коэффициент корреляции равен 1,00 (функциональная взаимосвязь, т.к. значению одного показателя соответствует только одно значение другого показателя);

    коэффициент корреляции равен 0,99

    0,7 (сильная статистическая взаимосвязь);

    коэффициент корреляции равен 0,69

    0,5 (средняя статистическая взаимосвязь);

    коэффициент корреляции равен 0,49

    0,2 (слабая статистическая взаимосвязь);


    коэффициент корреляции равен 0,19

    0,01
    (очень слабая статистическая взаимосвязь);

    коэффициент корреляции равен 0,00 (корреляции нет).
    4. Прежде, чем начать механическую процедуру вычисления коэффициента корреляции, необходимо ответить на некоторые вопросы:
    1) В какой шкале измеряется изучаемый показатель?
    2) Как много измерений этого показателя выполнено?
    3) Можно ли считать ряд измерений показателя выборкой, имеющей нормальный закон распределения?
    И т.д.
    От ответов на эти вопросы зависит, какой именно коэффициент взаимосвязи будет вычисляться.
    В частности, в том случае, когда измерения проводятся в шкале интервалов или отношений, для оценки тесноты взаимосвязи вычисляют коэффициент корреляции Бравэ-Пирсона; в ранговой шкале вычисляют ранговый коэффициент корреляции Спирмэна; а в шкале наименований, когда интересующие признак варьирует альтернативно, используют тетрахорический коэффициент сопряженности.
    Ранговый коэффициент корреляции Спирмэна вычисляют по формуле:
    )
    1
    (
    6 1
    2 2





    n
    n
    d

    , где d=d
    x
    -d
    y
    – разность рангов данной пары показателей X и Y; n – объем выборки.
    Применяется, когда показатели измерены в шкале наименований (т.е. им присвоены числа, но нельзя сказать, что один из них больше другого), а показатели варьируют альтернативно (пол мужской/женский, выполнение или невыполнение задания и т.д., иначе говоря, есть два состояния: 0 и 1).
    Обозначается Т
    4
    и вычисляется по формуле:
    )
    )(
    )(
    )(
    (
    5 0
    4
    D
    B
    C
    A
    D
    C
    B
    A
    n
    C
    B
    D
    A
    T









    , где A – значение, которое соответствует числу испытуемых (попыток), совпадающих по обоим показателям X и Y, т.е. 1 и 1; B – значение, которое соответствует числу совпадений 0 – X и 1 – Y; C – значение, соответствующее числу совпадений 1 – X и 0 – Y; D – значение совпадений 0 и 0; n – объем выборки.
    Контрольные вопросы для самопроверки:
    1. Функциональная взаимосвязь. Определение и примеры.
    2. Статистическая взаимосвязь. Определение и примеры. Корреляционная взаимосвязь.
    3. Основные задачи корреляционного анализа.
    4. Корреляционное поле. Порядок построения, анализ изображения.
    5. Направленность взаимосвязи.
    6. Коэффициент корреляции Браве-Пирсона и его свойства.

    7. Правила выбора коэффициента взаимосвязи.
    Литература:
    1. Основы математической статистики. Уч. пособие для ин-тов физической культуры (под общ. ред. В.С. Иванова). – М.: Физкультура и спорт, 1990. – С. 124 – 126, 142 – 150, 155 – 162.
    2. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. –
    Минск: БГУФК, 2006. – С. 42 – 48.
    3. Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 51 – 60.
    Тема: Статистические гипотезы и достоверность статистических
    характеристик. Сравнение средних арифметических по данным малых
    выборок. Расчёт и построение доверительных интервалов.
    Вопросы для рассмотрения:
    1. Понятие статистической гипотезы.
    2. Принцип проверки гипотез.
    3. Алгоритм выбора критерия для сравнения средних арифметических по
    данным малых выборок.
    4. Расчёт и построение доверительных интервалов.
    5. Пример сравнения средних арифметических, расчёта и построения
    доверительного интервала.
    1. В физическом воспитании и спорте часто приходится делать вывод об общих закономерностях проявления какого-либо показателя: нормально или нет распределены результаты измерений этого показателя в генеральной совокупности, отличается ли среднее арифметическое значение результатов измерения в генеральной совокупности после тренировок от аналогичного параметра до тренировок, а обнаруженное расхождение между результатами не выходит за пределы случайных ошибок (эффективна или нет методика тренировок), отличается ли дисперсия генеральной совокупности результатов измерения показателя после тренировок от такого же показателя до тренировок (изменилась или нет стабильность результатов спортсмена) и т.д.
    Так как указанные выводы делаются на основании относительно небольшого числа результатов измерения показателя (n = 30), необходима проверка достоверности (бесспорности) таких выводов.
    Для этого применяются статистические гипотезы.
    Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Статистическую гипотезу обозначают символом H.
    Обычно выдвигают и проверяют две противоречащие друг другу гипотезы:

    1) нулевую (основную) H
    0
    ;
    2) конкурирующую (альтернативную) H
    1
    Примеры статистических гипотез:
    1) Нулевая гипотеза H
    0
    : закон распределения результатов измерения является нормальным. Конкурирующая гипотеза H
    1
    : закон распределения результатов измерения отличен от нормального.
    2) Нулевая гипотеза H
    0
    : среднее арифметическое значение генеральной совокупности результатов измерения показателя после цикла тренировок не изменилось. Конкурирующая гипотеза H
    1
    : среднее арифметическое значение увеличилось.
    2.
    Для проверки выдвинутых нулевых гипотез применяют статистические критерии, разработанные математиками и носящие, как правило, их имена.
    Статистическим критерием называют определенное правило, задающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо принять. При отклонении нулевой гипотезы принимается конкурирующая. Критерий обозначается буквой К.
    Значение критерия, вычисленное по данным выборки, называют
    наблюдаемым значением критерия (К
    набл
    ). Совокупность значений критерия, при которых отвергают нулевую гипотезу, называют критической областью.
    Совокупность значений критерия, при которых нулевую гипотезу принимают, называют областью принятия гипотезы (областью допустимых значений).
    Указанные области разграничены критическим (граничным) значением
    критерия, который находится по соответствующей таблице.
    Односторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть только больше (или только меньше) другой величины.
    Двусторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть как больше, так и меньше (не равна) другой.
    Отклонение нулевой гипотезы, когда она фактически верна, называется
    ошибкой первого рода. Принятие нулевой гипотезы, когда фактически она не верна, называется ошибкой второго рода.
    Уровень значимости

    – это вероятность попадания критерия К в критическую область, если верна нулевая гипотеза, другими словами, уровень значимости – это вероятность ошибки первого рода. Он служит для определения по таблицам критических значений критерия (К
    крит
    ), которые указывают положение критических точек, отделяющих критическую область от области принятия гипотезы. Обычно величина

    выбирается малой.
    Поэтому попадание критерия К в критическую область при справедливости нулевой гипотезы мало вероятно. В этом случае, при попадании критерия К в критическую область считают, что должна быть принята конкурирующая гипотеза.

    Часто

    принимают равной 0,05. Это означает, что вероятность ошибочно принять гипотезу H
    1
    , если справедлива гипотеза H
    0
    , равна только
    5 %.
    Сформулируем основные этапы проверки статистических гипотез:
    1) Исходя из задач исследования, формулируются статистические гипотезы.
    2) Выбирается уровень значимости, на котором будут проверяться гипотезы.
    3) На основе выборки, полученной из результатов измерения, определяется статистическая характеристика гипотезы.
    4) Определяется критическое значение статистического критерия по соответствующей таблице на основании выбранного уровня значимости и объема выборки.
    5) Вычисляется наблюдаемое (фактическое) значение статистического критерия.
    6) На основе сравнения наблюдаемого и критического значения критерия в зависимости от результатов проверки нулевая гипотеза либо принимается, либо отклоняется в пользу альтернативной.
    Для проверки статистических гипотез используются параметрические и непараметрические методы.
    Параметрические методы служат для проверки гипотез о неизвестных параметрах генеральной совокупности, когда закон распределения случайной величины известен.
    Непараметрические методы применяются в тех случаях, когда закон распределения случайной величины неизвестен, или когда условия применения параметрических методов не выполняются.
    Параметрические методы эффективнее непараметрических.
    Перейдем к ознакомлению с основными положениями теории надежности тестов.
    3.
    В математической статистике разработан ряд критериев
    (параметрических и непараметрических) для сравнения средних арифметических.
    Выбор критерия зависит от следующих условий:
    1) объёма выборки (большие или малые);
    2) законов распределения исследуемых совокупностей (нормальные, другие);
    3) степени независимости выборок (зависимые, независимые);
    4) известны или неизвестны генеральные дисперсии;
    5) одинаковы или различны генеральные дисперсии;
    6) возможна ли количественная или только качественная оценка рассматриваемого явления.
    К параметрическим критериям для сравнения двух средних арифметических относятся критерии t для независимых и попарно зависимых выборок, имеющие распределение Стьюдента, а также критерий z, имеющий нормальное распределение. Последний разработан для сравнения двух
    средних арифметических независимых нормальных генеральных совокупностей, дисперсии которых известны. Так как в задачах из области физической культуры и спорта дисперсии генеральных совокупностей обычно неизвестны, критерий z для малых выборок не используется. Его рекомендуется использовать в качестве приближённого критерия для сравнения больших независимых выборок, имеющих любой закон распределения, так как для больших выборок (n≥30) выборочные средние арифметические распределены приближённо нормально, а выборочные дисперсии приближённо равны генеральным дисперсиям.
    Из существующих непараметрических критериев наиболее мощными являются X-критерий Ван дер Вардена для независимых выборок и U- критерий Уилкоксона для попарно зависимых выборок.
    При сравнении средних независимых выборок рекомендуется поступать следующим образом:
    1) Каждая в отдельности выборка проверяется на нормальность распределения по критерию Шапиро и Уилка
     
    2 2



    x
    x
    b
    W
    i
    набл
    В случае, если обе выборки распределены нормально, следует переходить к следующему пункту, в противном случае – к п. 4.
    2) Сравниваются дисперсии выборок
    2 2
    меньш
    больш
    набл
    F



    В случае равенства дисперсий следует переходить к следующему пункту, в противном случае – к п. 4.
    3) Для сравнения средних арифметических используется критерий
    Стьюдента
    2 2
    y
    x
    набл
    n
    y
    x
    t






    Сравнение окончено.
    4) Для сравнения средних арифметических используется критерий Ван дер Вардена


    конечн
    набл
    X

    Сравнение окончено.
    При сравнении средних попарно зависимых выборок рекомендуется поступать следующим образом:
    1) Составляется выборка разностей парных значений
    i
    i
    i
    x
    y
    d


    2) Составленная выборка проверяется на нормальность распределения по критерию Шапиро и Уилка. В случае, если выборка распределена нормально, переходим к следующему пункту, в противном случае – к п. 4.
    3) Для сравнения средних арифметических используется критерий
    Стьюдента

    d
    набл
    n
    d
    t



    Сравнение окончено.
    4) Для сравнения средних арифметических используется U-критерий
    Уилкоксона. Сравнение окончено.
    4. По найденным характеристикам выборки судят о неизвестных характеристиках генеральной совокупности. Очевидно, что в общем случае они не будут точно совпадать друг с другом: истинное значение характеристики

    может быть больше или меньше выборочного значения характеристики

    *.
    Чтобы статистически оценить искомое истинное значение характеристики

    , поступают следующим образом:
    1) Задаются некоторой достаточно большой вероятностью p (например, p = 0,9; 0,95; 0,99; 0,999), чтобы событие, заключающееся в нахождении искомого значения

    с этой вероятностью в соответствующем интервале можно было считать статистически достоверным. Эту вероятность называют доверительной вероятностью. В спортивных исследованиях обычно принимают p = 0,95 (иногда 0,99).
    2) Затем для заданной величины p рассчитывают по формулам математической статистики нижнюю

    1
    и верхнюю

    2
    границы интервала J
    p
    Доверительным интервалом J
    p называют случайный интервал (

    1
    ,

    2
    ), который накрывает неизвестную характеристику

    с доверительной вероятность p.
    Границы доверительного интервала J
    p называют:

    1
    =

    * -

    1

    нижней доверительной границей;

    2
    =

    * -

    2

    верхней доверительной границей.
    Значения

    1
    и

    2
    могут совпадать (при симметричном распределении

    *) и быть разными (при несимметричном распределении

    *). Они характеризуют точность, а вероятность p

    надежность определения

    . Между надежностью и точностью существует обратная зависимость: чем выше надежность, тем ниже точность определения

    и наоборот.
    С увеличением числа измерений при заданном p повышается точность определения

    (уменьшаются

    1
    и

    2
    ).
    Для точного расчета границ доверительного интервала необходимо знать закон распределения выборочной характеристики

    *.
    Задача определения доверительных интервалов для оценки генерального среднего арифметического значения x г
    нормального распределения решена математической статистикой для следующих двух случаев:

    *

    J
    p

    1

    2
    а) генеральная дисперсия известна; б) генеральная дисперсия неизвестна.
    Рассмотрим второй случай.
    В этом случае искомое генеральное среднее арифметическое находится в следующем доверительном интервале:
    x
    ген
    x
    S
    t
    x
    x
    S
    t
    x






    , где
    x
    – среднее арифметическое значение выборки; t

    – величина, которая находится по таблицам распределения Стьюдента в зависимости от числа степеней свободы k = n - 1, уровня значимости

    ;
    x
    S
    – стандартная ошибка среднего арифметического, рассчитывается по формуле:
    n
    S
    x


    Примечание: В практике научных исследований, когда закон распределения малой выборочной совокупности (n < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для приближенной оценки доверительных интервалов.
    5. Для рассмотрения этого вопроса используется пример с двумя группами велосипедистов, прошедших подготовку с использованием разных методик (Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 38 – 43)
    Контрольные вопросы для самопроверки:
    1. Что называют статистической гипотезой?
    2. Принцип выдвижения статистических гипотез.
    3. В чём заключается основной принцип проверки статистических гипотез?
    4. Односторонняя и двусторонняя критическая область.
    5. Ошибки при проверке гипотез. Уровень значимости.
    6. Основные этапы проверки статистических гипотез.
    7. Параметрические и непараметрические методы проверки статистических гипотез.
    8. Какие условия определяют выбор критерия для сравнения средних арифметических двух выборок?
    9. Какие параметрические и непараметрические критерии используются для сравнения средних арифметических двух выборок?
    10. Какие критерии в каких случаях используются для сравнения средних независимых выборок?
    11. Какие критерии в каких случаях используются для сравнения средних попарно зависимых выборок?
    12. Что такое доверительный интервал, доверительная вероятность?
    13. Порядок построения доверительного интервала.
    14. В каких случаях можно точно определить границы доверительного интервала?
    Литература:

    1. Основы математической статистики. Уч. пособие для ин-тов физической культуры (под общ. ред. В.С. Иванова). – М.: Физкультура и спорт, 1990. – С. 74 – 78, 81 – 103.
    2. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. –
    Минск: БГУФК, 2006. – С. 49 – 51, 62, 67 – 68.
    3. Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 34 – 51.
    Тема: Математико-статистические основы теории тестов.
    Вопросы для рассмотрения:
    1. Понятие и классификация тестов.
    2. Требования к тестам.
    1. Тестом называется измерение или испытание, проводимое с целью определение состояния или способностей спортсмена.
    Тесты, в основе которых лежат двигательные задания, называют двигательными или моторными.
    Тест, в основе которого лежат двигательные задания, называется двигательным. Существует три группы двигательных тестов:
    1) Контрольные упражнения, выполняя которые спортсмен получает задание показать максимальный результат. Результатом теста является двигательное достижение. Например, время, за которое спортсмен пробегает дистанцию 100 м.
    2) Стандартные функциональные пробы, в ходе которых задание, одинаковое для всех, дозируется либо по величине выполненной работы, либо по величине физиологических сдвигов. Результатом теста являются физиологические или биохимические показатели при стандартной работе либо двигательные достижения при стандартной величине физиологических сдвигов. Например, процент увеличения ЧСС после 20 приседаний или скорость, с которой бежит спортсмен при фиксируемой величине ЧСС 160 ударов в минуту.
    3) Максимальные функциональные пробы, в ходе которых спортсмен должен показать максимальный результат. Результатом теста являются физиологические или биохимические показатели при максимальной работе.
    Например, максимальное потребление кислорода или максимальная величина кислородного долга.
    2. Тестами могут считаться только те измерения, которые отвечают специальным требованиям:
    1) цель тестирования;
    2) стандартность (процедура и условия тестирования должны быть одинаковыми во всех случаях применения теста);
    3) наличие системы оценок;

    4) надежность – качество, характеризующее повторяемость результатов теста при одинаковых условиях тестирования с одними и теми же испытуемыми;
    5) информативность – степень точности, с которой тест измеряет свойство, для оценки которого используется.
    Тест, удовлетворяющий требованиям надёжности и информативности называется добротным.
    Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей (или других объектов) в одинаковых условиях. Вариацию результатов при повторных измерениях называют внутрииндивидуальной или (используя более общую терминологию математической статистики) внутригрупповой либо внутриклассовой. Четыре основные причины вызывают эту вариацию.
    1) Изменение состояния испытуемых (утомление, врабатывание, научение, изменение мотивации, концентрации внимания и т.п.)
    2) Неконтролируемые изменения внешних условий и аппаратуры
    (температура, ветер, влажность, напряжение в электросети, присутствие посторонних лиц и т.п.), т.е. все то, что объединяется термином «случайная ошибка измерения».
    3) Изменение состояния человека, проводящего или оценивающего тест
    (и, конечно, замена одного экспериментатора другим или замена судьи).
    4) Несовершенство теста (есть такие тесты, которые заведомо малонадежны, например, штрафные броски в баскетбольную корзину до первого промаха. Даже баскетболист, имеющий высокий процент попадания, может случайно ошибиться при первых бросках).
    Говоря о надежности тестов, различают их стабильность
    (воспроизводимость), согласованность, эквивалентность.
    Под стабильностью теста понимают воспроизводимость результатов при его повторении через определенное время в одинаковых условиях.
    Повторное тестирование обычно называют ретестом.
    Степень надежности тестов определяется с помощью коэффициентов взаимосвязи, полученных из корреляционного или дисперсионного анализа.
    Выбор коэффициента взаимосвязи зависит от типа применяемой шкалы измерений, от числа выполненных попыток (попыткой считается, например, исходное или повторное тестирование) и количества факторов, влияние которых надо исследовать.
    Если изучается влияние только одного фактора и при этом количество попыток не более двух, то надежность теста может быть приближенно оценена с помощью коэффициента корреляции между тестом и ретестом. В остальных случаях рекомендуется использовать дисперсионный анализ.
    Стабильность теста зависит от:
    1) вида теста;
    2) контингента испытуемых;
    3) временного интервала между тестом и ретестом.

    Например, морфологические характеристики при небольших временных интервалах весьма стабильны; наименьшую стабильность имеют тесты на точность движений (например, броски в цель).
    У взрослых результаты тестирования более стабильны, чем у детей; у спортсменов

    более стабильны, чем у не занимающихся спортом.
    С увеличением временного интервала между тестом и ретестом стабильность теста снижается.
    Согласованность
    характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест.
    Согласованность определяется по степени совпадения результатов, полученных на одних и тех же испытуемых разными экспериментаторами, судьями, экспертами. При этом возможны два варианта:
    1) лицо, проводящее тест, только оценивает его результаты, не влияя на них. Например, одну и ту же письменную работу разные экзаменаторы могут оценивать по-разному. Нередко различаются оценки судей в гимнастике, фигурном катании на коньках, боксе, показатели ручного хронометрирования, оценка электрокардиограммы или рентгенограммы разными врачами и т.п.;
    2) лицо, проводящее тест, влияет на его результаты. Например, некоторые экспериментаторы более настойчивы и требовательны, чем другие, лучше мотивируют испытуемых. Это сказывается на результатах (которые сами по себе могут измеряться вполне объективно).
    Согласованность теста

    это, по существу, надежность оценки его результатов при проведении теста разными людьми.
    Особенно актуальна задача оценки согласованности при количественном определении качественных показателей. Для этого разработаны специальные методы.
    Нередко тест выбирают из определенного числа однотипных тестов.
    Например, броски в баскетбольную корзину можно выполнять с разных точек; спринтерский бег может проводиться на дистанции, скажем, 50, 60 или 100 м; подтягивания можно выполнять на кольцах или перекладине, хватом сверху или снизу и т.п. В таких случаях может использоваться так называемый метод
    параллельных форм, когда испытуемым предлагают выполнить две разновидности одного и того же теста и затем оценивают степень совпадения результатов.
    Рассчитанный между результатами тестирования коэффициент корреляции называют коэффициентом эквивалентности. Отношение к эквивалентности тестов зависит от конкретной ситуации. С одной стороны, если два или больше тестов эквивалентны, их совместное применение повышает надежность оценок; с другой

    может оказаться полезным применять только один эквивалентный тест: это упростит тестирование и лишь незначительно снизит информативность батареи тестов. Решение этого вопроса зависит от таких причин, как сложность и громоздкость тестов, степень необходимой точности тестирования и т.п.
    Если же тесты, входящие в какой-либо комплекс тестов, высокоэквивалентны, он называется гомогенным. Весь этот комплекс
    измеряет одно какое-то свойство моторики человека. Скажем, комплекс, состоящий из прыжков с места в длину, вверх и тройного, вероятно, будет гомогенным. Наоборот, если в комплексе нет эквивалентных тестов, то все тесты, входящие в него, измеряют разные свойства. Такой комплекс называется гетерогенным. Пример гетерогенной батареи тестов: подтягивание на перекладине, наклон вперед (для проверки гибкости), бег на 1500 м.
    Информативность теста - это степень точности, с какой он измеряет свойство (качество, способность, характеристику и т.п.), для оценки которого используется.
    Информативность нередко называют валидностью
    (обоснованность, действительность, законность).
    Вопрос об информативности теста распадается на 2 частных вопроса:
    1) Что измеряет данный тест?
    2) Как точно он измеряет?
    Если тест используется для определения состояния спортсмена в момент обследования, то говорят о диагностической информативности теста. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена, - о прогностической информативности.
    Тест может быть диагностически информативен, а прогностически - нет, и наоборот.
    Степень информативности может характеризоваться количественно на основе опытных данных (так называемая эмпирическая информативность) и качественно

    на основе содержательного анализа ситуации
    (содержательная, или логическая информативность). Хотя в практической работе содержательный анализ всегда должен предшествовать математическому, здесь для удобства изложения рассматриваются сначала методы расчета эмпирической информативности.
    Идея определения эмпирической информативности состоит в том, что результаты теста сравнивают с некоторым критерием. Для этого рассчитывают коэффициент корреляции между критерием и тестом (и такой коэффициент называют коэффициентом информативности и обозначают r tk
    , где t

    первая буква в слове «тест»; k

    в слове «критерий»).
    В качестве критерия берется показатель, заведомо и бесспорно содержащий то свойство, которое собираются измерять с помощью теста.
    Чаще всего в спортивной метрологии критериями служат:
    1) Спортивный результат.
    2) Какая-либо количественная характеристика соревновательной деятельности (например, длина шага в беге, сила отталкивания в прыжках, успешность борьба под щитом в баскетболе, выполнение подачи в теннисе или волейболе, процент точных длинных передач в футболе).
    3) Результаты другого теста, информативность которого доказана если проведение теста-критерия громоздко и сложно и можно подобрать другой тест, столь же информативный, но более простой. Например, вместо газообмена определять ЧСС). Этот частный случай, когда критерием является другой тест, называют конкурентной информативностью.

    4) Принадлежность к определенной группе. Например, можно сравнивать мастеров спорта и спортсменов низших разрядов. Принадлежность к одной из этих групп является критерием. В данном случае используются специальные разновидности корреляционного анализа.
    5) Так называемый составной критерий. Например, сумма очков в многоборье. При этом виды многоборья и таблицы очков могут быть как общепринятыми, так и заново составленные экспериментатором. Составным критерием пользуются, когда нет единичного критерия (например, если стоит задача оценить общую физическую подготовленность, мастерство игрока в спортивных играх и т.п., ни один показатель, взятый сам по себе, не может служить критерием).
    При практическом использовании показателей эмпирической информативности следует иметь в виду, что они справедливы лишь по отношению к тем испытуемым и условиям, для которых они рассчитаны.
    Информативность теста не всегда может быть установлена с помощью эксперимента и статистической обработки его результатов. Например, требуется подготовить билеты для экзамена или темы дипломных работ и т.д.
    При этом надо отобрать наиболее информативные вопросы, по которым можно точнее всего оценить знания учащихся и подготовленность к практической работе. В этом случае опираются на содержательный
    (логический) анализ.
    Контрольные вопросы для самопроверки:
    1. Что называют тестом?
    2. Классификация двигательных тестов.
    3. Требования, предъявляемые к тестам.
    4. Добротность тестов.
    5. Надёжность тестов.
    6. Стабильность тестов.
    7. Согласованность тестов.
    8. Эквивалентность тестов.
    9. Информативность тестов.
    10. Диагностическая и прогностическая информативность.
    11. Эмпирическая и логическая информативность.
    12. Критерии информативности.
    Литература:
    1. Годик М.А. Спортивная метрология. Учебник для ин-тов физической культуры. – М.: Физкультура и спорт, 1988. – С. 17 – 36.
    2. Спортивная метрология. Учебник для ин-тов физической культуры
    (под общ. ред. В.М. Зациорского). – М.: Физкультура и спорт, 1982. – С. 63 –
    80/
    3. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением
    методов математической статистики. Практикум для студентов БГУФК. –
    Минск: БГУФК, 2006. – С. 8, 51 – 56.


    написать администратору сайта