тест по статистике. Гладун И. В_Статистика СКАН. Учебника для использования в учебном процессе образовательных учреждений, реализующих программы спо
Скачать 1.13 Mb.
|
Ошибки выборкиОшибка выборки (систематическая, случайная) — это отклонение величины изучаемого признака в выборке от величины данного при- знака во всей генеральной совокупности: x xили w p. Систематическая ошибка выборки (преднамеренная, непреднаме- ренная) возникает вследствие нарушения правил беспристрастного, случайного отбора. Она не поддается количественной оценке. Случайная ошибка выборки возникает при проведении любого вы- борочного наблюдения в силу его несплошного характера. Величина случайной ошибки выборки зависит: от объема выборки (чем больше объем, тем меньше ошибка); степени колеблемости изучаемого признака в генеральной сово- купности (чем больше степень колеблемости, тем больше ошиб- ка репрезентативности); способа формирования выборочной совокупности (например, ошибка серийной выборки больше, чем ошибка при другом спо- собе отбора). Если выборка проведена по всем правилам, то ошибка выборочно- го наблюдения может быть меньше ошибки сплошного наблюдения (за счет значительного уменьшения величины ошибки регистрации). Исчисление случайной ошибки репрезентативности основывается на теории вероятности (теоремы П.Л. Чебышева, А.М. Ляпунова). До- казано, что при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней величиной и ограни- ченной дисперсией вероятность того, что расхождение между выбо- рочной и генеральной средней ( x x ) не превзойдет по абсолютной величине некоторую величину t, равна интегралу Лапласа: 218•глава 11. выбОрОчнОе наблюдение 2 1 1 t (t) e2 dt; P x x t (t), где (t) — интеграл Лапласа (нормированная функция Лапласа явля- ется функцией от t); t — коэффициент кратности средней ошибки выборки, зави- сящей от вероятности, с которой гарантируется величина предельной ошибки; — средняя ошибка выборки; Р — принятая доверительная вероятность того, что ошибка вы- борки на превысит заданную величину ; t = — предельная ошибка выборки; x x — доверительные пределы генеральной средней; w p — доверительные пределы генеральной доли. В зависимости от принятой вероятности Р определяется значение коэффициента кратности (t) по удвоенной нормированной функции Лапласа. Величина случайной ошибки определяет надежность данных выбо- рочного наблюдения. Различают среднюю и предельную ошибки выборки. Если несколько раз провести выборку единиц из одной и той же со- вокупности, то ошибки репрезентативности будут по величине разные 1 2 … n, но в среднем ошибка будет равна . На практике выборку проводят только один раз. Величина ошибки данной выборки 1 будет отличаться от средней ошибки (1 < ; 1 > ; 1 = ). Поэтому надо знать пределы, в которых может находиться ошибка выборки 1. Эти пределы зависят от вероятности, с которой можно гарантиро- вать, что ошибка 1 не превысит заданную величину. Такая ошибка на- зывается предельной. Предельная (максимально возможная) ошибка выборки () — это та- кая величина отклонения выборочной средней (или доли) от генераль- ной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала: x tx; p t p, где x— предельная (максимально возможная) ошибка средней ве- личины; Ошибки выборки•219 p— предельная (максимально возможная) ошибка доли; x— средняя ошибка средней величины; p— средняя ошибка доли. Методика расчета средней и предельной ошибок собственно-слу- чайной выборки представлена в табл. 11.3. Таблица 11.3 Формулы ошибок собственно-случайной выборки
На практике показатели генеральной совокупности (дисперсия, доля) неизвестны. В расчетах их значения заменяют показателями, ис- численными по выборочным данным (2 и w), которые получены либо в предшествующих обследованиях, либо в пробных выборках. По- грешность в данном случае увеличивается. Если n очень мало по сравнению с N (меньше 5%), то ошибка бес- повторного отбора практически не отличается от ошибки повторного. Чем ближе n к N, тем больше они различаются. Когда численность генеральной совокупности N неизвестна, при- меняют формулы ошибки случайного повторного отбора, тем самым несколько преувеличивая запас надежности. Исчисление ошибок выборки при проведении механического, ти- пического и других отборов основывается на формулах расчета оши- бок собственно-случайного отбора. Ошибка выборки при механическом отборе находится между ошибкой случайного повторного и бесповторного отбора. Ошибка при бесповторном отборе меньше ошибки повторного отбора. При проведении механической выборки применяют формулы соб- ственно-случайной повторной выборки. 220•глава 11. выбОрОчнОе наблюдение При типическом отборе вместо общей дисперсии 2 используют среднюю из групповых дисперсий 2. Чем сильнее группы отличают- ся друг от друга, тем меньше ошибка выборки. При серийном(групповом) отборе вместо общей дисперсии 2 ис- пользуют межгрупповую дисперсию 2, вместо отобранных единиц (n) — количество отобранных серий. |