Практикум по теории статистики учеб пособие Р. А. Шмойлова, В. Г. Минашкин, Н. А. Садовникова, Е. Б. Шувалова под ред. Р. А. Шмойловой М. Финансы и статистика, 2006, глава 8, п. 1
Скачать 1.15 Mb.
|
Выборочное наблюдение (Часть 2)Литература
Литература
- гл. 10 Определение границ для генеральной средней и генеральной доли по результатам выборочного обследования
Пример 2. В городе проведено выборочное обследование 1% граждан с помощью случайного бесповторного отбора с целью изучения их доходов в прошлом месяце. Полученные результаты представлены в таблице:
Требуется найти долю жителей города с доходом 60 тыс. руб. и выше, гарантируя результат с вероятностью P=0,997. Решение: Выборочная доля лиц с доходом свыше 60 тыс. руб. в месяц: Решение: Найдем выборочные характеристики. Средний доход респондента по выборочным данным: 57 тыс. руб. Дисперсия дохода по выборочным данным: = Выборочная доля лиц с доходом свыше 60 тыс. руб. в месяц: Средняя ошибка выборки при случайном отборе (для доли признака)повторный отбор: бесповторный отбор: Найдем среднюю и предельную ошибку выборки для доли лиц с доходом свыше 60 тыс. руб. = 0,014 (1,4%) = 0,042 (4,2%) Границы для доли лиц с доходом свыше 60 тыс. руб. в генеральной совокупности жителей города: С вероятностью Р=0,997 доля лиц с доходом свыше 60 тыс. руб. в прошлом месяце находилась в пределах от 37,8 % до 46,2% Определение необходимой численности выборки при случайном отборе
Продолжение примера 2. Через несколько месяцев в городе будет проведено повторное выборочное обследование граждан с помощью случайного бесповторного отбора с целью изучения среднего уровня доходов. Желаемая предельная ошибка выборки – не более 2 тыс. руб., желаемый уровень вероятности Р=0,997. Требуется найти необходимую численность выборки. Будем считать, что дисперсия дохода известна по результатам предыдущего обследования: Необходимая численность выборки составит: Для того, чтобы при определении границ среднего дохода жителей города с вероятностью Р=0,997 и предельной ошибкой выборки не более 2 тыс. руб. необходимо обследовать 765 человек. Оценка дисперсии и доли при отсутствии ранее проведенных обследований(1) Нормальный закон распределения Между 3σ-границами (μ-3σ;μ+3σ) находится 99,73% всех наблюдений Только 0,27% значений находятся за этими границами, а именно 0,135% за границей μ+3σ и 0,135% – за μ-3σ. Таким образом, 99, 73% наблюдений находятся в границах: Комментарий к формуле (1) на предыдущем слайде: Механический отбор; ТИПИЧЕСКИЙ (СТРАТИФИЦИРОВАННЫЙ) ОТБОР; СЕРИЙНЫЙ (ГНЕЗДОВОЙ) ОТБОРФормулы для определения средней ошибки выборки, необходимой численности выборки различаются в зависимости от схемы отбора и от способа отбора. При проведении механического отбора единицы отбираются из генеральной совокупности, разбитой на равные части; из каждой части в выборку попадает одна единица Средняя ошибка выборки при механическом отборе: При проведении типического отбора изначально неоднородная генеральная совокупность разбивается на однородные типы (страты), затем из каждого типа отбираются отдельные единицы с помощью случайного или механического отбора. Отбор пропорционально объему групп: - внутригрупповая дисперсия i – й группы При проведении типического (стратифицированного ) отбора по сравнению с простым случайным отбором снижается ошибка репрезентативности, свойственная любому выборочному наблюдению, но не увеличивается объем выборки. В случае типического отбора из общей дисперсии исследуемого признака исключается межгрупповая дисперсия; единственным источником ошибки репрезентативности остается средняя из внутригрупповых дисперсий. Повторный отбор: - средняя из внутригрупповых дисперсий Бесповторный отбор: Пример 3. Определение границ для генеральной средней при проведении типического отбора. Проведено однопроцентное выборочное обследование жителей района с помощью типического бесповторного отбора пропорционально объему групп. Результаты обследования:
С вероятностью Р=0,997 требуется определить интервальную оценку расходов жителей района на мобильную связь . Решение: Выборочные характеристики: Средняя и предельная ошибка выборки: Границы расходов с вероятностью Р=0,997: Средняя ошибка выборки при типическом отборе (для доли)повторный отбор: бесповторный отбор: - средняя из внутригрупповых дисперсий для доли признака Определение необходимой численности выборки при типическом отборе
При проведении серийного отбора средняя ошибка выборки зависит только от величины среднего квадрата отклонений серийных средних от общей средней (межсерийной дисперсии). Внутригрупповая дисперсия отсутствует, т.к. внутри отобранных серий обследуются все единицы без исключения. Серийный отборR – количество серий в генеральной совокупности; r – количество отобранных серий; - межсерийная (межгрупповая) дисперсия; где - средняя i- й серии; – общая средняя Средняя ошибка выборки при серийном отборе (для среднего значения признака)Повторный отбор: Бесповторный отбор: Средняя ошибка выборки при серийном отборе (для доли)Повторный отбор: Бесповторный отбор: Пример 4. Определение границы для среднего значения признака при серийном отборе. На предприятии проводится проверка качества изделий. Обследуемый параметр – вес изделия. Из 25 партий отобрано 2 партии. Средний вес изделия в отобранных партиях: Средний вес всех обследованных изделий: Найти с вероятностью Р=0,954 границы для среднего веса изделий в генеральной совокупности. Решение: Найдем межсерийную дисперсию: Средняя ошибка выборки: Предельная ошибка выборки: Границы для среднего веса изделий в генеральной совокупности : С вероятностью Р=0,954 средний вес изделия в генеральной совокупности находится в пределах от 626 г. до 774 г. Определение необходимого числа серий при серийном отборе
Малая выборка Малой считается выборка, объем которой меньше той границы, с которой распределение вероятностей ошибок репрезентативности начинает заметно отклоняться от нормального закона распределения. При решении практических задач часто считают выборку малой, если ее объем не превышает 30 единиц. Для малых выборок средняя и предельная ошибка определяются по формулам: Для малых выборок коэффициент доверия t определяется по таблицам распределения Стьюдента Типы априорной информации о генеральной совокупности: а) есть перечень объектов генеральной совокупности и нет сведений о дисперсии изучаемой характеристики; б) нет перечня объектов генеральной совокупности. В случае а) недостаток информации преодолевается путем проведения нескольких пробных исследований. В случае б) применяется ряд приемов формирования выборочных совокупностей, которые строятся по подобию вероятностных, но для которых нельзя строго обосновать, что выборочные характеристики выступают оценками соответствующих характеристик генеральной совокупности. Такие выборки можно назвать эмпирическими, так как они не имеют теоретического вероятностного обоснования. Пример эмпирической выборки – квотная выборка строится как модель, воспроизводящая структуру генеральной совокупности в виде квот (пропорций) распределения изучаемых признаков или взаимосвязанных с ними признаков. Число элементов выборочной совокупности с различным сочетанием изучаемых признаков определяется так, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. На основании квотной выборки устанавливается, сколько лиц и с какими характеристиками следует опросить. Способы задания квот:
Пример задания на проведение квотной выборки. Следует опросить 7 человек со следующими характеристиками:
|