Статистика Курс лекций 22 год. Курс лекций по дисциплине Статистика Ставрополь 2022 Тема 1 Предмет, метод и задачи статистики
Скачать 4.1 Mb.
|
6.1 Понятие о выборочном наблюдении, его задачи 6.2 Принципы образования выборочных совокупностей 6.3 Ошибки выборки 6.4 Распространение выборочных результатов на генеральную совокупность 6.5 Определение необходимого объема выборки 6.1. Понятие о выборочном наблюдении, его задачи В статистической практике самым распространенным видом несплошного наблюдения является выборочное наблюдение.Выборочное наблюдение в настоящее время находит достаточно широкое применение в обследованиях предприятий и организаций малого бизнеса, при изучении цен на потребительском рынке, в обследованиях бюджетов и занятости населения. Выборочный метод является важнейшим источником информации в контроле качества продукции, в маркетинговых и социологических исследованиях. Выборочным наблюдением называется такой вид несплошного наблюдения, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использованием специальных методов, а полученные в процессе обследования результаты с определенным уровнем вероятности распространяются на всю исходную совокупность. Имеется ряд причин, в силу которых, во многих случаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенны из них следующие: • экономия времени и средств в результате сокращения объема работы; • сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность); • необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей); • достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации. Реализация выборочного метода базируется на понятиях генеральной и выборочной совокупностей. Генеральной совокупностью называется исходная изучаемая статистическая совокупность, из которой производится отбор некоторой части единиц совокупности для выборочного обследования, т.е. формируется совокупность выборочная. Совокупность единиц отобранных для выборочного наблюдения называется выборочной совокупностью. По выборочной совокупности рассчитывают две категории обобщающих показателей: относительные величины – применяются для характеристики совокупности в виде доли или удельного веса тех единиц совокупности, которые обладают изучаемыми признаками, т.е рассчитываются относительные величины структуры. Например, при изучении стажа работы работников предприятия может интересовать доля работников, имеющих стаж работы до года, до 5 лет, свыше 20 лет. средние величины, т.е средние значения изучаемого признака. Например, при изучении стажа работы работников предприятия в качестве обобщающей характеристики может использоваться средний стаж работы работников предприятия. Отношение числа единиц генеральной совокупности, обладающих изучаемым признаком ко всему числу единиц генеральной совокупности, называется генеральной долей. Отношение числа единиц выборочной совокупности, обладающих изучаемым признаком ко всему числу единиц выборочной совокупности, называется выборочной долей. Среднее значение изучаемого признака, рассчитанное по всей совокупности, называется генеральной средней, а рассчитанное по выборочной совокупности выборочной средней. Основная задача выборочного наблюдения состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что выборочное наблюдение, как бы грамотно с методологической точки зрения оно не было организовано, всегда связано с определенными, пусть небольшими и измеряемыми ошибками. Эти ошибки называются ошибками репрезентативности (представительности). Ошибки репрезентативности – расхождение значений показателя выборочной совокупности от его величины в генеральной совокупности. Ониобусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную. При этом следует различать систематические и случайные ошибки репрезентативности. Систематические ошибки репрезентативности связаны с нарушением принципов формирования выборочной совокупности. Например, вследствие каких-либо причин, связанных с организацией отбора, в выборку попали единицы, характеризующиеся несколько большими или, наоборот, несколько меньшими по сравнению с другими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными или заниженными. Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Для каждого конкретного выборочного наблюдения значение случайной ошибки репрезентативности может быть определено по со- ответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности. 6.2 Принципы образования выборочных совокупностей Организация формирования выборочной совокупности определяется видом, методом и способомотбора. По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе – группы единиц; а комбинированный отбор предполагает сочетание группового и индивидуального отбора. Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора. Различают повторный и бесповторный методы отбора. При повторнойвыборкеобщая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку. Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме бесповторной выборки. При бесповторной выборкеединица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т. е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц. Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования. Для образования выборочной совокупности используют различные способы, характеризующие конкретный механизм или процедуру отбора единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие способы образования выборочных совокупностей: собственно-случайный, механический, типический, серийный, комбинированный. Собственно-случайной называется такая выборка, при которой отбор единиц для обследования производится из генеральной совокупности непреднамеренно, в случайном порядке (лотерея, жеребьевка). Механическойназывается такая выборка, при которой отбор единиц производится механически, через определенный интервал. Механическая выборка обычно применяется в тех случаях, когда генеральная совокупность каким либо образом упорядочена. Например: в выборку берут каждую 50-ую (2%-ная выборка) или каждую 20-ю (5%-ная выборка) единицы совокупности в зависимости от предполагаемой численности выборки. Типическая выборкаприменяется в тех случаях, когда генеральная совокупность представлена неоднородными, в отношении изучаемого признака, единицами совокупности. В этом случае генеральная совокупность вначале разбивается по определенным признакам на типические группы, а затем, в пределах этих групп производится отбор необходимого числа единиц либо механическим, либо собственно-случайным способом. Например, при изучении уровня заработной платы занятого экономически активного населения необходимо в их составе на первом этапе выделить типичные группы работников - по отраслям экономики, а затем в рамках этих групп осуществить формирование выборочных совокупностей. Серийный отборприменяется в тех случаях, когда единицы совокупности объединены в небольшие группы или серии (упаковки готовой продукции, партии товара, бригады рабочих и т.п.). Сущность серийной выборки заключается в собственно-случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц. Отбор единиц из генеральной совокупности может быть комбинированным, многоступенчатым и многофазным. Комбинированный отбор предполагает объединение нескольких видов выборки. Так, например, можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Ошибка такой выборки определяется ступенчатостью отбора. Многоступенчатым называется отбор, при котором из генеральной совокупности сначала извлекаются укрупненные группы, потом – более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию. Многофазная выборка, в отличие от многоступенчатой, предполагает сохранение одной и той же единицы отбора на всех этапах его проведения; при этом отобранные на каждой стадии единицы подвергаются обследованию, каждый раз – по более расширенной программе. 6.3 Ошибки выборки Как отмечено ранее, применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака). Выборочная доля (w), или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности п: w = т/п (6.1) Например, если из 100 деталей выборки (n=100), 95 деталей оказались стандартными (т =95), то выборочная доля равна: w = 95 /100 = 0,95. Для характеристики надежности выборочных показателей используют среднюю и предельную ошибки выборки. Ошибка выборки или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик. Ошибка выборки свойственна только выборочным наблюдениям. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей. Выборочная средняя и выборочная доля по своей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок — среднюю ошибку выборки. Средняя ошибка выборки зависит: 1) от объема выборки: чем больше численность выборки при прочих равных условиях, тем меньше величина средней ошибки выборки; 2) от степени варьирования изучаемого признака: чем меньше вариация признака, тем меньше средняя ошибка выборки, и наоборот. Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки: Средняя ошибка (µ) выборки при повторном отборерассчитывается по формулам: для средней: n x 2 (6.2) для доли: (1 ) w w w n (6.3) Средняя ошибка выборки при бесповторном отборе рассчитывается по формулам: для средней N n n x 1 2 (6.4) для доли (1 ) (1 ). w w n w n N (6.5) где: 2 x - дисперсия выборочной совокупности; п – численность выборочной совокупности; N – численность генеральной совокупности 6.4 Распространение выборочных результатов на генеральную совокупность Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов. При этом следует учитывать, что выборочные средние и относительные величины не могут быть равны показателям генеральной совокупности. В каждой конкретной выборке расхождение между показателями выборочной и генеральной совокупности может быть меньше средней ошибки выборки, равно ей или больше ее. Причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). Поэтому фактические расхождения между показателями выборочной и генеральной совокупности можно рассматривать как некую предельную ошибку (Δ), связанную со средней ошибкой ( ) и гарантируемую с определенной вероятностью (Р): t (6.6) где t - коэффициент кратности, «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки; - средняя ошибка выборки. Значения вероятности (Р) при различных величинах (t) табулированы и представлены в статистических справочниках. При обобщении результатов выборочного наблюдения наиболее часто используются следующие уровни вероятности и соответствующие им значения t: Р 0,683 0,950 0,954 0,997 t 1,00 1,96 2,00 3,0 Подставляя в общую формулу предельной ошибки (6.6) приведенные ранее формулы средней ошибки выборки (6.2 - 6.5), получим: - при поворотном отборе предельная ошибка: для средней: n t x 2 (6.7) для доли: n w w t w 1 (6.8) - при бесповоротном отборе предельная ошибка: для средней: N n n t x 1 2 (6.9) для доли: N n n w w t w 1 1 (6.10) Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы: для средней: ; ; x x x x x x x x (6.11) для доли: ; p w w p w w w w (6.12) Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от x x до x x . Аналогичным образом может быть записан доверительный интервал генеральной доли: w - Δ w ; w + Δ w Рассмотрим нахождение средних и предельных ошибок выборки, определение доверительных пределов средней и доли на конкретных примерах. Пример 6.1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов (n = 100), по которым средний срок перечисления и получения денег оказался равным 22 дням ( = 22); дисперсия составила 36 дней ( 2 x = 36). С вероятностью Р = 0,954 необходимо определить предельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной корпорации. Среднюю ошибку определяем по формуле повторного отбора (6.2), так как численность генеральной совокупности N неизвестна. Из представленных значений для вероятности Р= 0,954 находим t =2. Следовательно, предельная ошибка выборки, дней: 2 36 2 2 0 6 1 2. 100 S t n x 2 Генеральная средняя будет равна x x x , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства: ; x x x x x 22 1 2 22 1 2; x 20 8 23 2; x Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дней. Пример 6.2. Среди выборочно обследованных 1000 семей региона по уровню душевого дохода (выборка 2%, механическая) малообеспеченных оказалось 300 семей. Требуется с вероятностью 0,997 определить долю малообеспеченных семей во всем регионе. Выборочная доля (доля малообеспеченных семей среди обследованных семей) равна: 300 0 3; 1000 w 0 02 n N или 2% (по условию). По представленным ранее данным для вероятности 0,997 находим t = 3. Предельную ошибку доли определяем по формуле бесповторного отбора (механическая выборка всегда является бесповторной): (1 ) 0, 3(1 0, 3) (1 ) 3 (1 0, 02) 0, 014. 1000 w w n t w n N Генеральная доля р = w ± Δ w , а доверительные пределы генеральной доли исчисляем, исходя из двойного неравенства: w-Δ w ≤ p ≤ w + Δ w . В нашем примере: 0,3-0,014 ≤ р ≤ 0,3 + 0,014; 0,286 ≤ р ≤ 0,314, или 28,6% ≤ р ≤ 31,4%. Таким образом, с вероятностью 0,997 можно утверждать, что доля малообеспеченных семей среди всех семей региона колеблется от 28,6 до 31,4%. 6.5 Определение необходимого объема выборки При проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить численность (объем) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность результатов наблюдения. Формулы для определения необходимой численности выборки (п) легко получить непосредственно из формул ошибок выборки. Так, из формул предельной ошибки выборки для повторного отбора можно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки: для средней: 2 2 2 x x t n (6.13) для доли: 2 (1 ) 2 t w w n w (6.14) Аналогично из формул предельной ошибки выборки для бесповторного отборанаходим, что для средней: 2 2 2 2 2 x x x t N N t n (6.15) для доли: 2 (1 ) 2 2 (1 ) t w w N n N t w w w (6.16) Эти формулы показывают, что с увеличением предполагаемой ошибки выборки значительно уменьшается необходимый объем выборки. Пример 6.3. Для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. Предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годам. Сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года? Рассчитаем необходимую численность выборки, чел., по формуле бесповторного отбора (6.16), учитывая, что t = 2 при Р = 0,954: 2 2 2 2 1200 2 10 480000 43. 2 2 2 2 2 2 11200 3 1200 2 10 t S N n N t S x Таким образом, выборка численностью 47 чел. обеспечивает заданную точность при бесповторном отборе. Контрольные вопросы 1. Определите сущность и задачи выборочного наблюдения. 2. В чем преимущества выборочного наблюдения по сравнению с отчетностью и сплошным наблюдением. 3. В чем различие случайных и систематических ошибок репрезентативности? 4. Назовите виды, методы и способы отбора единиц в выборочную совокупность. 5. Понятие и факторы, определяющие величину средней ошибки выборки. 6. Методика расчета средней ошибки выборки при повторном и бесповторном отборе. 7. Какова методика расчета предельной ошибки выборки? 8. От чего зависит величина коэффициента кратности («коэффициент доверия»)? 9. Как осуществляется распространение выборочных результатов на генеральную совокупность? 10. Охарактеризуйте методику определения необходимой численности выборки. Глоссарий Выборочным наблюдением называется такой вид несплошного наблюдения, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использованием специальных методов, а полученные в процессе обследования результаты с определенным уровнем вероятности распространяются на всю исходную совокупность. Выборочной совокупностьюназывается совокупность единиц отобранных из исходной (генеральной) совокупности для выборочного наблюдения. Генеральной совокупностью называется исходная изучаемая совокупность, из которой производится отбор некоторой части ее единиц для выборочного обследования, т.е. формируется выборочная совокупность. Групповой отбор предполагает формирование выборочной совокупности на основе отбора отдельных единиц генеральной совокупности. Индивидуальный отбор предполагает формирование выборочной совокупности на основе отбора групп единиц генеральной совокупности. Комбинированный отбор предполагает сочетание группового и индивидуального отбора. Ошибки репрезентативности – расхождение значений показателя выборочной совокупности от его величины в генеральной совокупности. Систематические ошибки репрезентативности – ошибки, связанные с нарушением принципов формирования выборочной совокупности. Случайные ошибки репрезентативности – ошибки, обусловленные действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. |