Научно-исследовательская деятельность 2. Физической культуры и спорта в. Н. Попков научноисследовательская

Название	Физической культуры и спорта в. Н. Попков научноисследовательская
Дата	27.12.2019
Размер	2.55 Mb.
Формат файла
Имя файла	Научно-исследовательская деятельность 2.doc
Тип	Реферат #102386
страница	21 из 34

1 ... 17 18 19 20 21 22 23 24 ... 34

Критерии эквивалентности шкал
Одной из наиболее сложных метрологических проблем является разработка эквивалентных шкал, оценивающих равные достижения в разных заданиях (или равный уровень различных в качественном отношении характеристик) равным количеством очков.

Существуют различные подходы к определению эквивалентности шкал. Выбор критерия эквивалентности осуществляется не математическим путём, а на основе логического анализа целей, ради которых разрабатывается шкала. Наиболее часто в качестве критерия используются: одинаковый процент людей, которым доступен результат в этих заданиях. На этом принципе построены так называемые центильные шкалы. Эти шкалы представляют собой точки, разбивающие распределение на n частей равного объёма (квартили – 4 части, децили – 10 частей, перцентили – 100 частей);

- расчет так называемых «должных величин»;

- мнение специалистов (экспертов) об эквивалентности достижений. Этот подход всегда имеет субъективную окраску.
Критерии пригодности шкал
Вопрос о том, какая из них лучше имеет смысл только в том случае, если заранее определена цель оценивания. Тем не менее, любая шкала должна отвечать следующим критериям:

быть справедливой, т. е. оценивать достижения одинаковой трудности (эквивалентные) одинаковым количеством очков, а более высокие достижения – большим количеством очков;

использование шкалы должно приводить к полезному, с точки зрения практики, результату.

В тех случаях, когда возможно, следует сочетать эти критерии. Однако они не всегда совместимы.
Оценка результата по комплексу тестов
Если тестирование проводится по комплексу тестов, то его результаты могут использоваться для решения двух задач:

для сравнительной оценки результатов каждого теста у одного испытуемого;

для сравнительной суммарной оценки разных испытуемых по всему комплексу тестов.

Рассмотрим первую задачу. При её решении необходимо преодолеть две трудности метрологического характера:

избавиться от размерности;

сделать результаты разных тестов сопоставимыми, приведя их к одному масштабу.

Если распределение результатов тестов не имеет значительного отклонения от нормального, то обе эти трудности можно преодолеть, используя стандартную шкалу оценок. Наиболее распространённым приёмом является использование рассмотренной выше шкалы Z для результата каждого теста. Для этого нужно предварительно рассчитать значения Х и σ для людей данного типа (пола, возраста, вида спорта, квалификации). При необходимости можно использовать любую другую стандартную шкалу.

В том случае, когда результаты тестов имеют распределение, значительно отклоняющееся от нормального, их можно сопоставить по персентильным шкалам.

Вторая задача заключается в выведении суммарной оценки каждого испытуемого по комплексу тестов. Процедура выведения такой оценки заключается в том, что сначала по избранной шкале результат каждого теста переводится в очки, а затем эти очки суммируются. Так поступают, если все измеряемые признаки считаются равноценными (равновесомыми).

Если же результату каждого из тестов необходимо придать различный «вес», соответствующий его значимости в суммарной оценке, то очки, набранные испытуемым по каждому тесту, сначала умножают на соответствующий весовой коэффициент, а уже после этого их суммируют. Такая суммарная оценка называется взвешенной. Наибольшую трудность в этом случае представляет определение весовых коэффициентов отдельных тестов. Существует несколько различных подходов для определения этих коэффициентов:

- первый заключается в том, что группе квалифицированных специалистов (экспертов) предлагают независимо друг от друга, определить весовой коэффициент для каждого теста, затем находят среднее арифметическое значение коэффициента для каждого теста;

- второй способ получения весовых коэффициентов – использование факторного анализа. В этом случае в качестве коэффициентов используются факторные веса;

- третий способ может быть использован в том случае, если имеется объективный количественный критерий информативности всего комплекса тестов (например, спортивный результат). В этом случае в качестве «веса» для каждого теста может быть использован коэффициент корреляции его результата с критерием (коэффициент информативности);

- четвертый способ заключается в расчёте уравнения множественной регрессии, позволяющего не только получить весовые коэффициенты для каждого теста, но и осуществить прогноз критериального результата.

Нормы. Понятие «норма». Разрабатывая нормы, мы сталкивается с необходимостью решения «проблемы классификации», решение которой предполагает определение понятия «норма» и количественного описания этой нормы.

Понятие «норма» используется в самых различных областях: в биологии, медицине, психологии, физиологии, педагогике, физической культуре и др. Вокруг толкования этого понятия в биологии и медицине идут дискуссии. При этом «норма» чаще всего понимается как некоторый образец, эталон и противопоставляется таким понятиям как «аномалия», «уродство», «патология», «болезнь». В педагогике и физическом воспитании норма имеет несколько иной смысл, так как, кроме оценивающей функции, она выполняет ещё и стимулирующую роль. Понятие «норма» в физиологии и медицине определяется как «…условное обозначение равновесия организма человека, отдельных его органов в условиях внешней среды» (Большая медицинская энциклопедия,1961).

Нормой в спортивной метрологии называют граничные значения признака, позволяющие отнести испытуемого к одной из классификационных групп. Классификационными признаками помимо пола и возраста могут служить: уровень физического развития, физической подготовленности, спортивного мастерства и др.

Разновидности норм. Принято различать 3 разновидности норм: сопоставительные, индивидуальные и должные.

Сопоставительные нормы предназначены для оценки какого-либо свойства или способности человека путём его сравнения с характеристикой той генеральной совокупности, к которой он принадлежит. Чаще всего такие нормы строятся на основе стандартной шкалы. При этом в зависимости от строгости подхода за нормальные значения могут приниматься различные интервалы. Количественно норма обычно связывается с типичным, устойчивым значением признака, выраженным в виде среднего арифметического и некоторой областью отклонений от этого среднего. Важно заметить, что если среднее значение признака для данной популяции является относительно устойчивым и с течением времени изменяется мало, то в отношении зоны индивидуальных отклонений, которые следует относить к норме единства мнений не существует. Так, для оценки физического развития человека Р. Мартин предлагает 7 градаций, а к нормальному уровню относит интервал Х0,5σ (38 %); П. Башкиров предлагает 5 градаций, относя к норме Х0,7σ (50 %); В. Штефко также предлагает 5 градаций и считает нормальными значения в интервале Хσ (68 %), именно этот последний поход чаще всего используется биологами и психологами.

В качестве аргумента в доказательство целесообразности того или иного подхода делаются ссылки на математико-статистическую обоснованность его справедливости. Совершенно очевидно, что обоснование границ нормы биологических показателей должно опираться на медицинскую или биологическую аргументацию. Так, при оценке верхней и нижней границ физиологической нормы для человека, по-видимому, следует считать такие уровни признака при которых большинство людей не испытывает чувства субъективного дискомфорта, не жалуется на пониженную работоспособность, быструю утомляемость, болезненные симптомы, свидетельствующие о нарушении коадаптации функций организма. Параметры этих границ, выявленные по результатам одновременной объективной регистрации свойства (качества, способности) должны служить основой для последующего статистического описания нормы.

В педагогике под «должной нормой» понимают то, что человек должен знать или уметь, для того чтобы успешно справляться с какой-либо деятельностью. Например, для того чтобы получить водительское удостоверение человек должен знать правила уличного движения и уметь управлять автомобилем.

Одним из наиболее сложных вопросов при конструировании норм является выбор её трудности (степени доступности норматива) и установление градаций нормы. Например, какой уровень результата в тесте физической подготовленности считать нормальным, какой выше, а какой значительно выше нормы. Решение этих вопросов лежит вне области метрологии и математики, их необходимо решать, опираясь на содержательный анализ роли изучаемых признаков. В любом случае основным критерием правильности выбранных градаций нормы должен являться полезный эффект от применения нормативов в той области практики, для которой они созданы. Например, завышенные нормы при оценке состояния здоровья человека могут привести к тому, что неоправданно большой процент людей будет отнесен в категорию больных. Ещё хуже будет, если при оценке здоровья человека будут использоваться заниженные нормативы.

При конструировании педагогических норм (например, для оценки физической подготовленности детей) слишком лёгкие и неоправданно завышенные нормы могут привести к одинаково нежелательному результату – потере интереса занимающихся к физическим упражнениям.

При использовании сопоставительных норм следует учитывать, что они позволяют сравнивать испытуемых внутри данной совокупности (и по отношению к данной совокупности), но никак не характеризуют уровень самой совокупности. В связи с этим, если в каком-то регионе в силу влияния неблагоприятных факторов может снизиться уровень физического развития или физической подготовленности людей, нормы, рассчитанные на основе средних значений данного региона, позволят считать заведомо неприемлемый уровень характеристик нормальным. Поэтому сопоставительные нормы, разработанные для данного региона должны сравниваться с нормами других регионов для внесения соответствующих поправок.

Возрастные нормы.

Одной из разновидностей сопоставительных норм являются возрастные нормы. Наиболее распространёнными являются нормы, разрабатываемые на основе

σ, полученных на больших выборках людей одного пола и возраста. Например, нормы для оценки физического развития детей и подростков. При этом, как правило, используется стандартная или персентильная шкала.

Другой разновидностью сопоставительных норм являются нормы для оценки биологического возраста. В эти нормах определяется степень биологической зрелости подростка и тот возраст, которому эта степень соответствует (например, мальчик, имеющий календарный возраст 13 лет, может быть отнесён по биологическому возрасту к 11-летним, если его развитие отстаёт; и к 14–15-летним, если он опережает в развитии своих сверстников).

По такому же принципу определяют так называемый двигательный возраст. В этом случае измеряют результат в двигательном тесте и смотрят, какому возрасту он соответствует. Если испытуемый по биологическому или двигательному возрасту опережает своих сверстников, то его называют акселерантом, а если отстаёт – то ретардантом. Из-за гетерохронности (неодновременности) развития различных функций человека может получиться, что по одному показателю испытуемый относится к акселерантам, а по другому – к ретардантам. В связи с этим оценка уровня физического развития и физической подготовленности должна осуществляться по комплексу показателей (тестов).

Построение возрастных норм предполагает группировку людей по возрастным группам. В детском и подростковом возрасте из-за быстро происходящих изменений избирают более частые возрастные градации (через один, три месяца, полгода или год), для взрослых людей допустимо объединять в одну группу несколько смежных возрастов. В научных исследованиях принято определять возрастные градации в 1 год5 месяцев и 29 дней (например, мальчик, которому исполнилось 7 лет и 6 месяцев считается 8-летним, а 7 лет 5 месяцев и 29 дней – семилетним).

Международные стандарты предполагают использование десятичной системы для определения возраста.

Учёт особенностей телосложения при построении нормативов.

Характеристики телосложения – рост, вес тела влияют на возможности людей при выполнении двигательных тестов. Например, люди с большим ростом и весом имеют преимущество в метаниях, с большим ростом и относительно небольшим весом – в прыжках в высоту. Поэтому нормативы в отдельных двигательных тестах представляют различную трудность для людей с различными особенностями телосложения. В такой ситуации было бы не только справедливо, но и полезно установить нормативы не только с учётом возраста, но и особенностей телосложения. Такие нормативы устанавливают с помощью уравнений множественной регрессии. Например, в США и Канаде для определения норматива в прыжке в длину с места используется формула

Y = 20 X1 + 2,5 X2 + 2,0X3 – 12,

где Y – норматив в прыжке; X1 – возраст в десятичной шкале; X2 – рост, см; X3 – вес тела, кг [13].
Индивидуальные нормы.

Индивидуальные нормы разрабатываются на основе данных, полученных от одного и того же человека в разных состояниях, и служат для оценки состояния этого человека путём сравнения с типичным для него уровнем. Например, наблюдая ежедневно за частотой сердечных сокращений человека в покое в течение 2–3 месяцев, можно рассчитать

и σ и использовать их для оценки его состояния. Точно так же можно построить индивидуальную норму и по другим показателям. Такие нормы необходимы для осуществления текущего контроля за состоянием человека.

Совершенно очевидно, что индивидуальные нормы должны сопоставляться с популяционными, в противном случае заведомо неприемлемый уровень признака можно принять за индивидуальную норму. Например, если мужчина 24 лет при росте 173 см имеет вес тела 98 кг и систолическое артериальное давление 180 мм. рт. ст., то совершенно очевидно, что он имеет избыточный вес и страдает гипертонической болезнью. Принять такие индивидуальные средние значения веса тела и артериального давления за индивидуальную норму никак нельзя.

Должные нормы.

В ряде случаев, оправданным является представление нормы в виде так называемой «должной величины» – наиболее вероятного значения оцениваемого признака, рассчитанного в зависимости от значений других характеристик испытуемого. Так в медико-биологических исследованиях на основе регрессионного анализа определяют должные величины массы тела в зависимости от длины тела, или должные величины жизненной ёмкости лёгких в зависимости от массы тела и т. п. В ряде случаев должная величина рассчитывается в зависимости от значения нескольких признаков (в этом случае строятся уравнения множественной регрессии). Должные нормы по некоторым биологическим и физиологическим показателям представлены в разделе 4.9.

Критерии пригодности норм.

Нормы составляются всегда для определённой совокупности людей и пригодны только для данной оценки представителей этой совокупности. Это свойство норм называется релевантностью.

Нормы разрабатываются по результатам выборочных исследований. И только в том случае будут пригодны для всей совокупности, если они построены по данным, полученным на репрезентативной выборке. Следовательно, вторым требованием к нормам является репрезентативность.

И, наконец, следует учитывать, что со временем нормы устаревают и требуют пересмотра. Отсюда третье требование к нормам – современность.

Методы количественной оценки качественных показателей.

Качество – это существенные свойства объекта, которые позволяют отличать его от других объектов. Качественными называют характеристики, не имеющие определенных единиц измерения. Таких характеристик в физическом воспитании и спорте много (выносливость, артистичность и выразительность движений, эффективность соревновательной деятельности, качество спортивного инвентаря и т. п.). При решении различных задач, связанных с оценкой состояния спортсмена, определением спортивных результатов в фигурном катании, гимнастике, прыжках в воду возникает необходимость количественной оценки различных свойств человека, не поддающихся объективному измерению. Раздел метрологии, в котором рассматриваются методы количественной оценки качественных характеристик, называется квалиметрией. В процессе оценки качества происходит его сопоставление с некоторым «эталоном качества», который не всегда может быть однозначно выражен. Так, для количественной оценки артистичности выступления фигуриста судья вынужден сопоставлять то, что он увидел, со своим представлением об артистичности. При этом оценка происходит не по одному, а по многим признакам, а наивысшая обобщённая оценка не обязательно соответствует максимально возможному уровню каждого признака. Разумеется, что такая оценка всегда носит субъективную окраску (не случайно оценки, выставленные разными судьями одному и тому же спортсмену, часто не совпадают). Такую оценку часто называют измерением, при этом термин «измерение» – понимают как процесс установления соответствия между свойствами объектов и их числовыми оценками.

В основе квалиметрии лежат следующие положения:

любое качество можно измерить;

качество зависит от ряда свойств, образующих «дерево качества»;

каждое качество определяется двумя числами: относительным показателем К и весомостью М. Относительный показатель характеризует выявленный уровень измеряемого свойства (в процентах от его максимально возможного уровня), а весомость – сравнительную важность разных характеристик оцениваемого качества;

сумма весомостей свойств на каждом уровне равна единице (или100%).

Общая Q оценка выводится по формуле

Q =

Ki Mi (6),

где Q – оценка качества;

Mi – весомость показателя;

Ki – относительный показатель.

Например, фигурист получил за технику исполнения оценку Kт=5,6 балла, за артистизм – оценку Kс= 5,4 балла. Весомости техники исполнения и артистизма в фигурном катании на коньках признаны одинаковыми (Mт = Mс= 1,0).

Поэтому общая оценка Q = Kт Mт + Kс Mс составила 11,0 балла.

Наиболее широко используемыми в квалиметрии методами оценивания являются экспертное оценивание и анкетирование. Проведение экспертизы и анкетирования – это отчасти техническая работа, предполагающая строгое соблюдение определённых правил, а отчасти – искусство, требующее интуиции и опыта.

Метод экспертных оценок.

Экспертной называется оценка, получаемая путём выяснения мнений специалистов. К мнению специалистов обращаются в том случае, когда осуществить точное, объективное измерение качества невозможно или затруднительно.

С

убъективная оценка эксперта в значительной мере зависит от его индивидуальных особенностей, квалификации, опыта, эрудиции, самостоятельности и т. п.

Несовпадающие индивидуальные оценки экспертов рассматриваются как случайные величины и обрабатываются статистическими методами.

Проведение экспертизы включает следующие основные этапы: формирование цели, подбор экспертов, выбор методики, проведение опроса и обработку полученной информации, в том числе и оценку согласованности индивидуальных экспертных оценок.

Подбор экспертов – важный этап экспертизы, так как не от всякого специалиста можно получить достоверные данные. Экспертом может быть человек: 1) обладающий высоким уровнем профессиональной подготовленности; 2) беспристрастный; 3) обладающий интуицией; 4) не склонный к соглашательству.

Для объективной оценки компетентности экспертов могут быть применены специальные анкеты, отвечая на которые в течение строго определённого времени кандидаты в эксперты должны продемонстрировать свои знания.

Другой подход к отбору экспертов основан на определении эффективности их деятельности. Абсолютная эффективность определяется отношением правильных оценок к общему числу оценок, сделанных экспертом. Относительная эффективность оценивается по отношению абсолютной эффективности эксперта к средней абсолютной эффективности группы экспертов. Очевидно, что эксперты представляют тем большую ценность, чем выше абсолютная и относительная эффективность их деятельности.

Большое значение для достоверности экспертизы имеет степень согласованности мнений экспертов. Если в экспертизе участвовали только 2 эксперта, то согласованность их оценок можно оценить по коэффициенту ранговой корреляции, если экспертов более двух, то для этой цели используют коэффициент конкордации:

,

где W – коэффициент конкордации;

m – количество экспертов;

n – количество оцениваемых объектов;

S – сумма квадратов отклонений сумм рангов, полученных каждым объектом (испытуемым), от средней суммы рангов.

Коэффициент конкордации может принимать значения от 0 (при полном отсутствии согласованности) до 1 (при полном совпадении оценок экспертов)*. Следует заметить, что речь идет о согласованности мнений экспертов, а не правильности этих мнений. Теоретически нельзя исключить вариант, когда хорошо совпадающие мнения являются результатом широко распространённой, неверной (или устаревшей) точки зрения. По этой же причине широко используемое на практике определение квалификации эксперта по отклонению его оценок от средних оценок группы экспертов, также не является, безусловно, достаточным критерием.
* Процедуру вычисления коэффициента конкордации см. [12. стр. 98–99].
Точность экспертизы зависит от количества экспертов. При уменьшении количества экспертов гипертрофируется роль каждого из них. При очень большом количестве экспертов трудно добиться согласованного мнения. Оптимальное количество экспертов можно установить по графику на рис. 4.

погрешость

о

ценки

Рис. 4 Зависимость точности оценки от количества экспертов (Даклей, 1969)

1 ... 17 18 19 20 21 22 23 24 ... 34