Научно-исследовательская деятельность 2. Физической культуры и спорта в. Н. Попков научноисследовательская
Скачать 2.55 Mb.
|
Точность вычислений и записи результатов измерений Точность вычислений, выполняемых в ходе математических расчетов и статистической обработки данных, должна быть согласована с точностью измерений. При использовании современных вычислительных средств число десятичных знаков при вычислении может значительно превышать реальную потребность. В то же время, грубые округления, допускаемые при вычислениях, искусственно снижают точность итоговых результатов. Поэтому следует придерживаться следующего правила: ошибка, полученная в результате вычислений, должна быть на порядок (т. е. в 10 раз) меньше суммарной ошибки измерений. В таком случае вычислительные процедуры не искажают результаты измерений. При окончательной записи результатов вычислений необходимо производить округления, т. к. излишнее число приведенных десятичных знаков создает ложное представление о большой точности результата. Не следует приводить среднее арифметическое с числом знаков, превышающим точность измерения. Например, если время измеряется с точностью до 0,1 с бессмысленно указывать среднее значение с более высокой точностью. Человек как объект измерений Рассмотренные выше вопросы и положения относятся к любым измерениям, в том числе и к измерениям на человеке. Однако измерения, выполняемые на человеке имеют и свои особенности, на которые исследователь должен обратить внимание, т. к. они создают специфические трудности в процессе измерений и могут стать источником дополнительных погрешностей. К таким особенностям В. Л. Уткин [7] относит: изменчивость, адаптивность, многомерность, неполную наблюдаемость и подвижность. Автор характеризует их следующим образом. Изменчивость является проявлением одного из фундаментальных свойств биологических объектов. Практически ни одна измеряемая нами характеристика человека не остаётся постоянной (рост, вес, ЖЕЛ, ЧСС, МПК и др.). Все они проявляют ту или иную форму изменчивости, разница только в том, что некоторые из них изменяются очень быстро, чутко реагируя на изменение внешней и внутренней среды, другие – реагируют медленнее. Изменчивость характеристик человека делает необходимыми многократные измерения показателей его жизнедеятельности и анализ результатов этих измерений методами математической статистики. С формальной математико-статистической точки зрения для ответа на вопрос чему же равно истинное значение измеряемой величины мы вынуждены использовать уже известный приём – указывать доверительный интервал и доверительную вероятность того, что истинное значение лежит в данном интервале. При измерении неживых объектов ширина доверительного интервала определяется ошибкой измерения и доверительной вероятностью. При измерении биологических характеристик к ошибкам измерения добавляются варьирование измеряемого признака, вызванное изменчивостью самого объекта. В реальном измерении может быть ситуация, когда случайная погрешность измерения соизмерима с индивидуальными колебаниями измеряемой величины. В таком случае невозможно сказать, чем объясняется общая вариация, а значит, и ответить на вопрос – чем объясняется расхождение повторного измерения одного и того же человека – погрешностью измерения или изменением состояния самого испытуемого. Знание естественной индивидуальной вариации необходимо при решении двух основных задач, которые приходится решать в практике физического воспитания и спортивной тренировки. Первая задача заключается в оценке изменений, происшедших в уровне изучаемого показателя человека. Для того чтобы в процессе контроля за показателем человека можно было с достаточной вероятностью считать, что изменение действительно произошло, оно должно существенно превышать величину естественной индивидуальной вариации этого показателя. Вторая задача заключается в сравнении уровня показателя у разных людей (например, при отборе в команду). В этом случае говорить о том, что уровень показателя у одного человека действительно выше, чем у другого можно только в том случае, если эти различия существенно превышают его естественные индивидуальные колебания. Адаптивность. Одной из причин непрерывного изменения показателей спортсмена является его адаптивность, или приспособляемость. Это биологическое свойство, обеспечивающее сохранение вида, лежит в основе обучаемости и даёт возможность спортсмену осваивать новые элементы движений, расширять функциональные возможности. Но вместе с тем приспособляемость человека значительно усложняет задачу измерения его свойств. При многочисленных измерениях человек привыкает к процедуре исследования «учится быть исследуемым» и по мере такого обучения начинает демонстрировать иные результаты, чем вначале, хотя возможности исследуемой функции при этом могут не измениться. Например, рост работоспособности может быть обеспечен не увеличением аэробных возможностей (которые интересуют исследователя) спортсмена, а освоением техники движения. Многомерность. Контроль за состоянием спортсмена предполагает одновременное измерение большого числа показателей физической, функциональной, технической, психологической подготовленности. Сложность исследования многомерных объектов заключается не только в том, что трудно организовать одновременное измерение многих переменных, но и в том, что с ростом числа переменных резко возрастает трудоёмкость их одновременного анализа. Так, анализ по 4 характеристикам примерно в 7 раз более трудоёмок, чем по двум и в 20 раз больше, чем по одной характеристике. Неполная наблюдаемость. Не все показатели спортсмена могут быть измерены непосредственно. Так, невозможно непосредственно, прямым способом измерить выносливость, ловкость, выразительность движений. Вместо этого измеряют другие характеристики, которые косвенно характеризуют интересующие нас качества, используя различные тесты. Точность таких опосредованных измерений (точнее сказать, оценок) всегда ниже, чем у прямых измерений. Повышение точности в этом случае связано с усложнением тестирующей процедуры. Подвижность. Наиболее ценную информацию о подготовленности спортсмена можно получить в процессе выполнения соревновательного упражнения. Подвижность спортсмена создаёт дополнительные трудности по сравнению с медицинскими, авиационными или даже космическими исследованиями, в которых человек исследуется преимущественно в состоянии покоя. До недавнего времени спортсмены также обследовались в состоянии покоя, либо в лабораторных условиях при выполнении физической нагрузки на велоэргометре или тредбане. Однако для исследователя и тренера наибольший интерес представляет информация о состоянии и возможностях спортсмена при выполнении экстремальных нагрузок в естественных условиях спортивной тренировки или спортивных соревнований. То обстоятельство, что в таких условиях спортсмен находится в непрерывном движении и выполняет тяжёлую физическую работу, создает дополнительные трудности, помехи при измерениях и искажает их результаты. В заключение этой темы хотелось бы еще раз подчеркнуть, что ни одно измерение не может быть практически выполнено с абсолютной точностью. Отсюда следуют два положения: - результат любого измерения дает только относительный, вероятностный характер знания об истинном значении измеренной величины; - любое измерение, выполняемое исследователем, должно сопровождаться оценкой возникающих в его процессе погрешностей. Первое положение должно послужить предостережением от излишней абсолютизации результатов измерения. Второе – обязывает исследователя уметь выбрать величину допустимой погрешности и оценить пригодность измерительного средства. Наибольшую опасность представляет ситуация, когда исследователь слепо доверяет измерительному средству, погрешность которого может оказаться больше тех изменений измеряемой величины, которые предстоит зафиксировать в исследовании. При проведении исследований желательно использовать международную систему единиц измерения. Вопросы для самопроверки 1 В чем особенности качественного и количественного способов описания свойств объектов? 2 Что называют измерением? 3 Назовите основные шкалы измерений и их особенности. 4 Какие вы знаете способы получения единиц измерения? 5 Каковы требования к единицам измерения? 6 Назовите основные и дополнительные единицы системы СИ. 7 Какие единицы измерения называют внесистемными? 8 Что понимается под поверкой средства измерения? 9 Что называют погрешностью (ошибкой) измерений? 10 Каковы причины погрешностей измерений? 11 По каким признакам могут быть классифицированы погрешности измерений? 12 Для чего используются относительные погрешности? 13 Что такое «промахи», как их выявляют? 14 Какие погрешности называют систематическими и как их выявляют? 15 Какие погрешности называют случайными? 16 Как выявляют систематические и случайные погрешности? 17 Что нужно указать для количественного описания случайной погрешности? 18 Как уменьшить влияние случайной погрешности? 19 На какой вопрос отвечает доверительный интервал для истинного значения результата измерений? 20 Как выбрать измерительное устройство, обеспечивающее «достаточную» точность измерений? 21 С какой точностью следует приводить окончательный результат измерения? 22 В чем заключаются особенности проведения измерений на человеке? Литература 1 Иванов, В. В. Комплексный контроль в подготовке спортсменов / В. В. Иванов. – М. : Физкультура и спорт, 1987. – 256 с. 2 Измерения и вычисления в спортивно-педагогической практике : учеб. пособие для вузов физической культуры / В. П. Губа [и др.] – 2-е изд. – Физкультура и спорт, 2006 – 220 с. 3 Коренберг, В. Б. Учебный справочник-словарь по спортивной метрологии : в 2 ч. : учеб. пособие для студентов / В. Б. Коренберг. – Малаховка : [Б. и.], 1996. – 74 с. 4 Попков, В. Н. Спортивная метрология : курс лекций / В. Н. Попков. – Омск : Изд-во СибГУФК, 2004. – 184 с. 5 Смирнов, Ю. И. Спортивная метрология : учеб. для студ. пед. вузов. / Ю. И. Смирнов, М. М. Полевщиков. – М. : «Академия», 2000. – 232 с. 6 Спортивная метрология : учебник для ин-тов физ. культ. / под ред. В. М. Зациорского. – М. : Физкультура и спорт. – 1982. – 256 с. 7 Уткин, В. Л. Измерения в спорте: (введение в спортивную метрологию) : учеб. пособие / В. Л. Уткин. – М. : [Б. и.], 1978. – 199 с. 8 Чертов, А. Г. Международная система единиц измерения / А. Г. Чертов. – М. : Росвузиздат, 1963. – 165 с. 4.7 ТЕСТИРОВАНИЕ Ни одно эмпирическое исследование, касающееся методических аспектов физической культуры и спорта, не обходится без использования разнообразных тестов. Специалисты различного профиля: педагоги-преподаватели, психологи, врачи, биологи, физиологи, биохимики, стремясь получить объективную и точную количественную информацию о различных сторонах подготовленности человека, используют огромный арсенал различного рода контрольных упражнений, функциональных проб и т. п., которые обобщённо можно назвать тестами. При этом зачастую к процедуре оценки пригодности теста для решения конкретной практической задачи не уделяется должного внимания. Причиной многих связанных с этим иллюзий и необоснованных практических решений, как правило, является поверхностное знакомство с теоретическими основами тестирования. Умение оценить пригодность теста необходимо специалисту любой научной дисциплины в связи с тем, что эта пригодность зависит не только (а порой и не столько) от характера самого теста, сколько от цели тестирования, точности измерительной аппаратуры, пола, возраста, спортивной квалификации испытуемых и ряда других причин. В этом разделе рассматриваются общие вопросы, связанные с оценкой пригодности тестов. Что касается тестов и характеристик, чаще всего используемых для оценки физического развития, физического и функционального состояния человека, то краткое их описание приводится в разделе 4.9. 4.7.1 Тесты и их применение В широком смысле слово «тест» (test) в переводе с латинского, английского, французского языков означает пробу, испытание, определение ценности, качественное или количественное испытание. В более узком смысле это слово используется как термин для обозначения исследовательской процедуры, в ходе которой с помощью наблюдения, измерения или подсчёта определяется уровень какого-либо свойства изучаемого объекта. Процесс испытания или измерения называют тестированием, а полученное в результате тестирования числовое значение – результатом теста. С формальной точки зрения всё многообразие педагогических задач, решаемых с помощью самых различных тестов, сводится к получению ответов на следующие вопросы: 1 Каков уровень качества (свойства) у данного индивида в данный момент? 2 Изменилось ли состояние данного индивида (по сравнению с предыдущим измерением)? 3 Каков будет уровень качества (свойства) индивида в будущем? 4 Имеются ли различия между испытуемыми в уровне данного свойства? 5 Сохранятся ли различия между испытуемыми на определённом отрезке времени? Для того чтобы ответить на эти вопросы необходимо: 1 Выбрать способ измерения и оценки интересующего нас свойства. 2 Оценить пригодность выбранного способа измерения. 3 Провести измерение и оценку его результатов. Прежде чем измерять, мы должны достаточно чётко представить себе, «что» мы собираемся измерить. Этот вопрос относительно просто решается при проведении прямых измерений физических величин: длины, массы, времени и т. п. (например, измеряя длину дистанции мы не испытываем затруднения с ответом на вопрос, что мы измеряем). Значительно труднее ответить на вопрос что измеряется, когда нужно оценить свойство (качество) человека. Помимо чисто технических сложностей, связанных с изменчивостью, адаптивностью, подвижностью человека, мы, как правило, не можем выполнить прямое измерение интересующих нас свойств. Основная трудность заключается в том, что многие объективно существующие свойства человека не могут быть измерены в силу отсутствия однозначных, объективно измеряемых характеристик этих свойств. Например, по поводу того, что такое «здоровье», «работоспособность», «выносливость» можно привести массу различных несовпадающих определений, каждое из которых отражает субъективное описание некоторой теоретической (гипотетической) модели данного свойства. Для описания такого понятия как «физические (двигательные) качества человека»* можно предложить различные теоретические модели и различные способы описания этих моделей. В силу взаимосвязи многих свойств живого организма, мы никогда не можем быть уверены, что избранная нами теоретическая модель является единственно возможной. * В последнее время некоторые авторы вместо термина «физические (двигательные) качества» предлагают использовать термин «физические способности». В данном пособии используется традиционный, наиболее распространенный термин «физические качества». 4.7.2 Классификация тестов В зависимости от признака, положенного в основу классификации тестов, их можно разделить на различные группы. В зависимости от области применения различают тесты: педагогические, психологические, интеллекта, специальных способностей и т. д. В зависимости от того, как сформулирована цель задания (достижение оптимального или максимального результата), тесты соответственно делят на оптимальные и экстремальные. Тесты, в основе которых лежат двигательные задания, называют двигательными или моторными*. Результатами двигательных тестов служат либо двигательные достижения (время прохождения дистанции, пройденное расстояние, число повторений и т. п.), либо физиологические и биохимические показатели. *Наиболее полное описание различных моторных тестов дано в пособии В. И. Ляха [8]. В зависимости от этого, а также от типа задания, которое ставится перед испытуемым, различают три группы двигательных тестов (табл. 3). В зависимости от того, что из себя представляет содержание теста, и что выражает его результат, тесты разделяют на простые и сложные. Если тест состоит из одного задания, его называют простым. Если тест состоит из нескольких заданий, которые следуют одно за другим и выполняются в слитной последовательности, а результат теста выражается временем выполнения всех заданий (например, полоса препятствий), то тест называют сложным. Таблица 3 Разновидности двигательных тестов (по В. М. Зациорскому)
4.7.3 Комплексы (батареи) тестов В исследовательской и спортивной практике часто используют не один, а несколько тестов, имеющих единую цель. Такая группа называется комплексом, или батареей тестов. Принято различать два вида таких комплексов: гомогенные и гетерогенные. Гомогенными называют комплексы, состоящие из различных тестов, оценивающих одно и то же свойство (например, несколько различных тестов для оценки выносливости). Результаты таких тестов должны иметь высокую корреляцию между собой. Если результаты двух или более тестов имеют высокую корреляцию близкую к единице, они являются в высокой степени гомогенными, или эквивалентными. Эквивалентные тесты являются взаимозаменяемыми, поскольку они как бы дублируют друг друга. Гетерогенными называют комплексы, состоящие из тестов, оценивающих различные свойства. Например, комплекс для оценки общей физической подготовленности, состоящий из тестов, оценивающих: силу, быстроту, ловкость, выносливость, гибкость. Тесты, входящие в гетерогенный комплекс, не должны иметь между собой высокой корреляции. 4.7.4 Критерии пригодности тестов Любой тест не зависимо от его содержания, цели или области применения должен быть оценен с точки зрения его пригодности для решения поставленной задачи. Наиболее общими характеристиками, определяющими пригодность теста, являются: трудность, длина, длительность, скорость, надёжность, информативность. Все эти свойства теста могут быть оценены только в отношении какой-то конкретной статистической совокупности. Это означает, что ни один тест не обладает универсальной пригодностью, она зависит от цели исследования и особенностей исследуемого контингента (таких как пол, возраст, состояние здоровья, физическая подготовленность, квалификация и т. п.). Сначала рассмотрим первые 4 из перечисленных выше характеристик. Трудность теста (Р) характеризует его доступность для испытуемых. Количественной характеристикой трудности теста для данного контингента обычно служит доля лиц (относительная частота), выполнивших задание: (1), где m – число лиц, выполнивших тест, n – общее количество испытуемых. Некоторые авторы называют Р «индексом трудности». Если при проведении теста от испытуемого требуется выполнение какого-то определённого результата (норматива), то говорят не о трудности теста, а о трудности норматива. Один и тот же тест представляет различную трудность для детей и взрослых, для спортсменов и новичков и т. д. Таким образом, понятие «трудность теста» относится не к отдельному испытуемому (для которого тест может оказаться очень лёгким или, напротив, вообще невыполнимым), а к определённой статистической совокупности в целом. Если в одной и той же группе лиц разные тесты имеют неодинаковые значения Р, это свидетельствует о неодинаковой трудности тестов. Если в разных группах одни и те же тесты имеют разные Р, это говорит о разной подготовленности групп. Длина теста (D) в зависимости от его содержания может выражаться в различных мерах. Например, в числе попыток (броски в баскетбольную корзину), в длине пути (дистанция бега), времени выполнения задания (например, за 10 секунд выполнить максимальное количество постукиваний в теппинг-тесте). Таким образом, «длина теста» является понятием относительным, связанным с возможностью удлинения или укорочения теста. Длительность выполнения («тестовое время» t) также является одной из характеристик пригодности теста. Она может совпадать с его результатом (например, время удержания равновесия) или определяться содержанием теста (например, 20 приседаний за 30 секунд). Скорость теста определяется отношением длины теста ко времени его выполнения D/t. Скорость теста может быть задана формулировкой теста и являться одним из условий его выполнения. Например, педалирование на велоэргометре в темпе 60 оборотов в минуту. Изменение скорости теста возможно путём увеличения его длины или продолжительности. В том и другом случае изменяется трудность теста и, как следствие, его надёжность и информативность. Точность результатов тестирования оценивается иначе, чем точность измерений. При оценке точности измерения его результат сравнивается с результатом более точного (эталонного) измерения. При тестировании возможность такого сравнения отсутствует. Поэтому в теории тестов оценивают не точность измерения, а свойства самого теста (при этом подразумевается, что измерение выполняется с достаточной точностью). В теории тестов оценивают не точность измерения, а свойства самого теста (при этом подразумевается, что измерение выполняется с Сравнимость результатов тестирования обеспечивается за счёт соблюдения стандартных условий процедуры тестирования, дающих возможность сопоставления результатов, полученных при повторном тестировании одного и того же испытуемого или различных испытуемых между собой. От всех перечисленных выше характеристик теста прямо или косвенно зависит его пригодность для конкретного контингента, однако большинство авторов к основным метрологическим требованиям, определяющим пригодность теста, относят следующие условия: 1 Должна быть определена цель применения теста. 2 Стандартность процедуры (методика и условия проведения теста должны быть одинаковыми во всех случаях проведения теста). 3 Тест должен обладать достаточной надёжностью. 4 Тест должен быть информативен. 5 Должна быть разработана система оценок результатов теста. Тесты, удовлетворяющие требованиям надёжности и информативности, называют аутентичными (подлинными, добротными). Рассмотрим смысл основных критериев пригодности тестов. Правильное определение цели тестирования способствует более обоснованному выбору тестов. Так, тестирование может проводиться в целях: выявления уровня общей или специальной физической, технической, тактической, психологической или функциональной подготовленности занимающихся. В каждом из этих случаев требуются различные тесты. Кроме того, в зависимости от цели тестирования, требования к свойствам тестов также могут быть различны. Например, требования к тестам, предназначенным для оперативного, текущего или этапного контроля не одинаковы. Различаются и критерии пригодности тестов, предназначенных для оценки состояния спортсмена и для прогнозирования его достижений на отдалённое будущее. Сравнимость результатов тестирования обеспечивается за счёт соблюдения стандартных условий процедуры тестирования, дающих возможность сопоставления результатов, полученных при повторном тестировании одного и того же испытуемого или различных испытуемых между собой. Соблюдение этого требования достигается при выполнении следующих условий: схема выполнения теста должна быть постоянной от одного тестирования к другому; условия, в которых выполняется каждое тестирование, должны быть, по возможности, одинаковыми; режим дня, предшествующего тестированию должен быть для всех испытуемых одинаков; разминка перед выполнением теста (если она необходима) должна быть всегда стандартной. Тестирование, по возможности, должны проводить одни и те же лица: интервалы между повторными попытками выполнения теста должны быть достаточными для восстановления состояния испытуемого после предыдущей попытки; если результат теста требует проявления максимальных возможностей испытуемого, он должен стремиться показать этот максимум. 4.7.5 Надёжность теста Для того чтобы по результатам теста можно было с достаточной уверенностью различать между собой двух (или более) испытуемых, или говорить о том, что несовпадающие результаты двух измерений одного и того же человека свидетельствуют об изменении его состояния, тест должен обладать надёжностью. Под надёжностью теста понимается способность давать неизменные результаты при повторном измерении одних и тех же лиц, находящихся в одном и том же состоянии. По ряду причин ни один тест не может дать абсолютного совпадения результатов при повторном измерении. Теория надёжности тестов исходит из того, что результат любого измерения, проводимого на человеке, – X – есть сумма трёх величин: (2), (1), где Xo – истинное значение измеряемой величины, которое мы хотим зафиксировать; Xe – ошибка, вызванная колебаниями в состоянии испытуемого; Xm – ошибка, привносимая измерительным прибором*. *Теория тестов исходит из предположения, что Xm намного меньше, чем Xe, поэтому значением Xm, как правило, пренебрегают. Разумеется, что это предположение должно быть обоснованным, т. е. необходимая для выполнения этого условия точность измерения должна быть обеспечена. Причины, снижающие надёжность теста, следующие: изменение состояния испытуемых (утомление, врабатываемость и др.); неконтролируемые изменения внешних условий и аппаратуры (изменение температуры, влажности воздуха, скорости ветра, атмосферного давления, колебание напряжения в сети измерительных приборов и др.); изменение состояния лица, проводящего измерение (или замена его другим лицом); несовершенство самого теста (например, броски мяча в баскетбольную корзину до первого промаха). На практике все перечисленные причины могут действовать совместно, но доля их влияния в каждом конкретном случае может быть различной. Без специальных приёмов оценить раздельно влияние каждой из причин невозможно. Следовательно, невозможно с достаточной для принятия практического решения вероятностью вынести суждение о том, чем вызвано несовпадение результатов двух или более выполненных подряд измерений, изменением состояния испытуемого или влиянием второй, третьей или четвёртой причин. Аналогичная ситуация возникает, если необходимо сопоставить результаты теста у разных испытуемых, если при повторных измерениях их результаты (и их ранги) изменяются. Понять, что является причиной этих изменений без специального анализа невозможно, также как невозможно с уверенностью судить о том, у кого из испытуемых измеряемое качество выше. Естественно, что не все тесты обладают достаточной надёжностью, более того, один и тот же тест в разных условиях и на разном контингенте испытуемых может иметь различную надёжность. Таким образом, понятие «надёжность теста» может относиться к различным аспектам. В зависимости от того какая из причин, снижающих надёжность теста является основной, надежность теста можно разделить на несколько разновидностей: воспроизводимость, стабильность и согласованность. |