Лекции статистика. Учебнометодическое обеспечение курса
Скачать 2.22 Mb.
|
3.5. Необходимая численность выборкиРазрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. Неизвестной остается минимальная численность выборки, обеспечивающая заданную точность. Ее можно получить из формул средней и предельной ошибок в зависимости от типа выборки. Так, подставляя формулы сначала (23) = . ( ) и затем (23) = . ( ) в формулу (24) и решая ее относительно численности выборки, получим следующие формулы: для повторной выборки n= ; (28) для бесповторной выборки n = . (29) Вариация () значений признака к началу выборочного наблюдения как правило неизвестна, поэтому ее берут приближенно одним из способов:
Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 0): Таблица 0. Результаты бесповторного выборочного наблюдения на предприятии Доход, у.е.до 300300-500500-700700-1000более 1000Число рабочих82844173С вероятностью 0,950 определить:
Решение. Для расчета обобщающих характеристик выборки построим вспомогательную таблицу 0. Таблица 0. Вспомогательные расчеты для решения задачи XfХ’X’f(Х’ -)2(Х’ -)2fдо 300820016001376411101128300 - 500284001120029241818748500 - 700446002640084137004700 - 10001785014450778411323297более 10003115034503352411005723Итого100 57100 4285900По формуле ( ) рассчитаем средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу (12) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: = 4285900/100 = 42859. Теперь можно определить среднюю ошибку выборки по формуле (23) = . ( ): = = 19,640 (у.е.). В нашей задаче = 0,950, значит t = 1,96. Тогда предельная ошибка выборки по формуле (24): = 1,96*19,64 = 38,494 (у.е.). Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в ГС необходимо определить их долю: w = 20/100 = 0,2 или 20%, а затем ее дисперсию по формуле = w(1-w) = 0,2*(1–0,2) = 0,16. Тогда можно рассчитать среднюю ошибку выборки по формуле (23) = . ( ): = = 0,038 или 3,8%. А затем и предельную ошибку выборки по формуле (24): = 1,96*0,038 = 0,075 или 7,5%. Доверительный интервал среднего дохода находим по формуле (27): 571-38,494 571+38,494 или 532,506 у.е. 609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е. Аналогично определяем доверительный интервал для доли по формуле ( ): 0,2-0,075 p0,2+0,075 или 0,125 p0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%. В нашей задаче выборка бесповторная, значит, воспользуемся формулой (29), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (= 42859) и доли рабочих с доходами более 700 у.е. (= 0,16): nб/повт = = 62 (чел.), nб/повт= = 197 (чел.). Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%. |