Методы математической обработки данных педагогического исследования. мат пдф (1). Монография Чебоксары 2019 удк 796799 ббк 75. 1 К72 Рецензенты др экон наук, профессор
Скачать 0.59 Mb.
|
Размах вариации.Размах вариации вычисляется как разность между максимальной и мини- мальной вариантами выборки: R=xmax–xmin. (2.1.6) Как видно из формулы (2.1.6), размах вычисляется очень просто, но инфор- мативность этого показателя невелика, так как можно привести очень много распределений, сильно отличающихся по форме, но имеющих одинаковый раз- мах. Поэтому размах вариации используется иногда в практических исследова- ниях (например, при построении графиков вариационных рядов) при малых (не более 10) объемах выборки. В этом случае по этому показателю легко оценить, например, насколько различаются лучший и худший результаты в группе спортсменов. При больших объемах выборки к его использованию надо отно- ситься очень осторожно. Дисперсия. Дисперсией ( 2) называется средний квадрат отклонения значенийпризнака от среднего арифметического. Это числовая характеристикаслужит для того, чтобы оценить, как рассеяны возможные значенияслучайнойвеличинывокругеесреднегоарифметического. Дисперсия, вычисляемая по выборочным данным, называется выбо-рочнойдисперсией. Выборочную дисперсию вычисляют по приведенным ниже формулам. Для несгруппированных данных: σ2 = 1 ⋅ ∑n (xi — x̄)2, (2.1.7) n i=1 где ∑n (xi — x̄)2 – сумма квадратов отклонений значений признака хiот i=1 среднего арифметического x.Для получения среднего квадрата отклоне- ний эта сумма поделена на объем выборки п. Для сгруппированных в интервальный вариационный ряд данных: σ2 = 1 ⋅ ∑k ni ⋅ (xi — x̄)2, (2.1.8) n i=1 где xi–срединные значения интервалов группировки; ∑ k i=1 ni ⋅ (xi — x̄)2 – взвешенная сумма квадратов отклонений. На практике выборочная дисперсия в виде (2.1.7) или (2.1.8) вычисля- ется редко, а вместо этих формул используются следующие. ⋅ ∑ Для несгруппированных данных: σ2 = 1 n–1 n i=1 ni(xi — x̄)2. (2.1.9) ⋅ ∑ Для данных, сгруппированных в интервалы: σ2 = 1 n–1 k i=1 ni ⋅ (xi — x̄)2. (2.1.10) Различие этих формул от формул расчета выборочной дисперсии в том, что в последних деление сумм квадратов отклонений производится не на объем выборки п,как того требует вычисление среднего квадрата, а на п–1. Поясним смысл такого изменения формулы. Так как выборочное среднее арифметическое xявляется несмещенной оценкой генерального среднего , т. е. не содержит систематической ошибки и стремится к истинному значению соответствующего генераль- ного параметра, то одним из ее свойств то, что сумма квадратов отклонений значений признака от среднего арифметического меньше, чем сумма квад- ратов отклонений от любой другой величины (в том числе и от генераль- ного среднего ), т. е. ∑(xi — x̄)2 < ∑(xi — μ)2 для любой выборки. По- этому вычисление оценки дисперсии по формуле σ2 = 1 ⋅ ∑n (xi — x̄)2 бу- n i=1 дет содержать систематическую ошибку, и такая оценка будет смещенной. Можно также показать, что если использовать оценку σ2 = 1 ⋅ ⋅ ∑n (x — x̄)2, n–1 i=1 i то она будет несмещенной, т. е. при неограниченном по- вторении выборки из генеральной совокупности и усреднении выбороч- ной дисперсии, полученной на основании этой формулы, по всем выбор- кам получается истинное значение генеральной дисперсии. Кроме того, вычисление дисперсии по формулам (2.1.7) – (2.1.10) не- удобно по следующим причинам: При вычислении суммы квадратов отклонений приходится каждый раз вычитать из значений признака (или срединных значений интервалов) хiпредварительно вычисленное xа затем возводить полученные разно- сти в квадрат. При ручных методах вычислений это вызывает трудности, особенно в случаях многоразрядных значений xi. Среднее арифметическое xвходящее в эти формулы, обычно вы- числяется с некоторой погрешностью округления. Она приводит к накоп- лению ошибки округления результатов (дисперсии и стандартного откло- нения). Опасность существенных ошибок округления увеличивается с увеличением объема выборки. Поэтому на практике используют другие расчетные формулы, более удобные как для ручных расчетов, так и для вычислений на ЭВМ. ⋅ (∑ Для несгруппированных данных: i x ) или σ2 = 1 n–1 n i=1 x2 —n ⋅ x̄2) (2.1.11) 1 n 2 (∑n i 2 σ2 = n–1 ⋅ [∑i=1 xi —i=1]. (2.1.12) n ⋅ (∑ Для сгруппированных данных: i или σ2 = 1 n–1 k i=1 ni ⋅ x2 — n ⋅ x̄2) (2.1.13) (∑k 2 n ⋅x i n ⋅ [∑ σ2 = 1 n–1 k i=1 i ⋅ x2 — i=1 i n i) ]. (2.1.14) Формулы (2.1.11) и (2.1.13) применяются для определения дисперсии, если среднее арифметическое уже вычислено. При этом следует иметь в виду, что при подставке xв эти формулы его значение не следует округ- лять, иначе результат может получиться с большой ошибкой. Кроме того, формулы (2.1.12) и (2.1.14) используются в тех случаях, когда среднее и дисперсия вычисляются одновременно. Стандартноеотклонение. Основной мерой статистического измерения изменчивости признакау членов совокупности служит среднее квадратическое отклонение (сигма) или, как часто ее называют, стандартноеотклонение. Теория ва- риационной статистики показала, что для характеристики любой гене- ральной совокупности, имеющей нормальный тип распределения доста- точно знать два параметра: среднюю арифметическую и среднее квадра- тическое отклонение. Эти параметры заранее не известны и их оценивают с помощью выборочной средней арифметической и выборочного стан-дартного отклонения, которые вычисляются при обработке случайной выборки. В основе среднего квадратического отклонения лежит сопоставление каждой варианты (xi) со средней арифметической данной совокупности. Так как в совокупности всегда будут варианты как меньше, так и больше, чем она, то сумма отклонений (xi — x̄), имеющих знак “–”, будет пога- шаться суммой отклонений, имеющих знак “+”, т.е. ∑(xi — x̄) = 0. Отклонение вариант от среднего арифметического в совокупности вы- ражает изменчивость признака. Если бы изменчивость признака у членов совокупности отсутствовала, тогда разность ∑(xi — x̄) = 0. Но т.к. ∑(xi — x̄)всегда равна нулю, то для измерения изменчивости берут отклонение в квадрате, т.е. (xi — x̄)2. Если просуммировать квадраты отклонений, то эта сумма не будет равна нулю. А чтобы получить коэффициент, способный измерить измен- чивость, берут среднее отклонение из выражения: σ2 = 1 ⋅ ∑n (xi — x̄)2. (2.1.15) n i=1 Величина 2в данном случае называется девиатой (или взвешеннойдисперсией), вариансой (или средним квадратом). Тогда среднее квадра- тическое отклонение можно вычислить по следующим формулам: σ = ±√1 ⋅ ∑n (xi — x̄)2 при n> 30; (2.1.16) n i=1 σ = ±√1 ⋅ ∑n (xi — x̄)2 при n 30. (2.1.17) n–1 i=1 Свойства среднего квадратического (стандартного) отклонения: Стандартное отклонение всегда измеряется в тех же единицах изме- рения, что и основные варианты. При вычислении стандартное отклонение определяют с точностью на один десятичный знак больше, чем точность, которую применяют для вычисления средней арифметической для того же ряда. Если каждую варианту совокупности увеличить на одну и ту же вели- чину, то, как и дисперсия, стандартное отклонение от этого не изменяется. При умножении каждой варианты на одно и тоже число Кстандарт- ное отклонение увеличится в К раз. При делении каждой варианты на одно и то же число оно уменьшится в Краз. Чем больше стандартное отклонение, тем больше изменчивость признака, так как среднее квадратическое отклонение характеризует ва- рьирование значений этого признака вокруг центра распределения, т. е. средней арифметической, является мерой степени влияния на признак различных второстепенных причин, вызывающих его варьирование. В вариационных рядах с нормальным распределением частот 99,73% всех членов совокупности, находящихся в границах от х1до х2, которые отстоят от средней арифметической на величину от –3 до +3. За пределами ± 3 находятся только 0,27% всех членов совокупности. |