66 Молчанова Статистика УМК без титула (1). I. Теория статистики
Скачать 1.56 Mb.
|
Содержание жира, % 44 45 46 47 48 Итого Количество проб 1 5 9 3 2 20 Определите средний процент содержания жира в твердых сырах и среднее линейное отклонение. 3. Имеются следующие выборочные данные о вкладах населения района: Группы населения Число вкладов, ед. Средний размер вклада, тыс. руб. Коэффициент вариации вклада, % Городское 3500 32 20 Сельское 1500 18 30 Определите тесноту связи между средним размером вклада и типом населения, исчислив эмпирическое корреляционное отношение. 4. Определите среднюю длину пробега такси и вычислите все показатели вариации, если известны: Длина пробега за один рейс, км Число рейсов за месяц до 2 2 – 5 5 – 10 10 – 15 свыше 15 20 25 14 5 3 Всего 67 5. Средний квадрат индивидуальных значений признака равен 930, а его дисперсия – 700. Определить величину средней. 6. Определить среднюю величину, если известно, что коэффициент вариации равен 20%, а дисперсия признака – 650. 7. Имеются следующие данные о распределении сотрудников компании по среднемесячной заработной плате: 147 Группы сотрудников по среднемесячной ЗП, тыс. руб. до 5 5 – 7 7 – 9 9 – 11 11 – 12 12 – 15 свыше 15 Итого Количество сотрудников, чел. 35 30 23 20 11 9 7 135 Определите общую дисперсию двумя способами: а) обычным; б) по формуле ( ) 2 2 2 x х − = σ 8. На конец года текущие коэффициенты ликвидности предприятий-заемщиков составляли: Коэффициент ликвидности до 1,5 1,5 – 1,7 1,7 – 1,9 1,9 – 2,1 2,1 и выше Итого Доля предприятий, % 5 10 20 45 20 100 Определите среднюю, моду и показатели вариации. Сделайте вывод о характере распределения предприятий-заемщиков по уровню ликвидности. 9. По результатам проверки сахаристость свеклы характеризуется следующими данными: Сахаристость, % 12 - 14 14 - 16 16 - 18 18 и выше Итого Количество проб 1 4 3 2 10 Определите средний уровень и дисперсию сахаристости свеклы, долю проб сахарной свеклы с наивысшей сахаристостью и дисперсию этой доли. 10. Исчислить дисперсию, если известно, что средняя величина признака равна 250 руб., а коэффициент вариации – 30%. 11. По данным обследований домохозяйств, общая площадь в расчете на одного члена домохозяйства составляла, м 2 : Общая площадь на одного члена домохозяйства, м 2 до 10 10 – 20 20 – 30 30 – 40 40 и более Итого Число домохозяйств 42 54 47 37 20 200 Определите характеристики распределения: среднюю, медиану, среднее квадратическое отклонение, коэффициент вариации. Сделайте вывод о характере распределения домохозяйств по уровню обеспеченности жильем. Тест 1. Дисперсия - это: 148 а) средний модуль отклонений индивидуальных значений признака от средней; б) средний квадрат этих отклонений; в) сумма квадратов отклонений индивидуальных значений признака от средней. 2. Какой из показателей вариации характеризует абсолютный размер колеблемости признака около средней величины? а) коэффициент вариации; б) дисперсия; в) коэффициент осцилляции; г) относительное линейное отклонение. 3. Средние значения признака в двух совокупностях одинаковы. Может ли быть разной вариация в этих совокупностях? а) да; б) нет. 4. Средние значения признака в двух совокупностях разные. Может ли быть одинаковой вариация признака в этих совокупностях? а) да; б) нет. 5. Какой из показателей вариации характеризует относительный размер колеблемости признака около средней величины? а) квартильное отклонение; б) дисперсия; в) размах вариации; г) среднее квадратическое отклонение; д) относительное линейное отклонение. 6. Если все значения признака увеличить на определенную величину, то дисперсия: а) увеличится на такую же величину; б) уменьшится на такую же величину; в) не изменится; г) предсказать изменение дисперсии невозможно. 7. Если все значения признака увеличить в k раз, то дисперсия: а) увеличится вk раз; б) уменьшится в k раз; в) увеличится в k 2 раз; г) уменьшится в k 2 раз; 8. Выберите правильную взвешенную формулу дисперсии: 149 а) ( ) ∑ ∑ − = i i i f f x x 2 σ ; б) ( ) ∑ ∑ − = i i i f f x x 2 σ ; в) ( ) ∑ ∑ − = i i i f f x x 2 2 σ ; г) ( ) ∑ ∑ − = i i i f f x x 2 2 σ ; д) ( ) ∑ ∑ − = i i i n n x x 2 2 σ 9. Средний модуль отклонений индивидуальных значений признака от средней величины называют: а) дисперсией; б) средним линейным отклонением; в) линейным коэффициентом вариации; г) размахом вариации. 10. Правило сложения дисперсий состоит в том, что: а) общая дисперсия равна сумме групповых дисперсий; б) общая дисперсия равна сумме межгрупповой и средней из групповых дисперсий; в) межгрупповая дисперсия равна сумме групповых дисперсий; г) средняя из групповых дисперсий равна сумме межгрупповой и общей дисперсий. 11. В каких пределах изменяется эмпирическое корреляционное отношение? а) [0; ∝ ]; б) [1; 0]; в) [0; 1]; г) [ ∝ ;0]. 12. Средняя выработка рабочих цеха составляет 12 деталей/час. Определите среднее квадратическое отклонение выработки при условии, что средний квадрат равен 160. а) 12; б) 148; в) 16; г) 4. 13. Определить среднюю величину, если известно, что коэффициент вариации равен 30%, а дисперсия признака – 800. а) 36,67; б) 94,3; в) 26,67; г) 2666,67. 14. При производстве 450 изделий А израсходовано 1350 кг материала В. Определите среднее квадратическое отклонение расхода материала В на единицу изделия А при условии, что сумма квадратов равна 8100. а) 3; б) 4; в) 9; г) 15. 150 15. Налоговой инспекцией одного из районов города проверено 86 коммерческих киосков, в 37 обнаружены финансовые нарушения. Определите дисперсию доли коммерческих киосков, имеющих финансовые нарушения. а) 0,43; б) 0,57; в) 0,245. 16. Средние расходы домохозяйств в расчете на одну потребительскую единицу составляли, руб. в месяц: на питание – 520 при среднем квадратическом отклонении 60; на коммунальные услуги – 240 при среднем квадратическом отклонении 60. Степень вариации расходов на питание и коммунальные услуги: а) одинакова; б) вариация расходов на питание больше; в) вариация расходов на питание .меньше; г) сравнить вариацию невозможно. 17. По данным статистики 60% новообразованных предприятий малого бизнеса прекращают свою деятельность в течение первых двух лет. Определите дисперсию доли таких МП: а) 0,60; б) 0,40; в) 0,24; г) 0,76. 18. Экзамен по информатике сдали 25 человек из 30. Определить дисперсию доли студентов сдавших экзамен: а) 0,141; б) 0,125; в) 0,160; г) 0,175. 19. Определите коэффициент вариации, если известно, что средняя равна 100, а дисперсия 64. а) 36%; б) 64%; в) 8%; г) 5%. 20. Определите дисперсию, если известно, что средняя величина равна 40, а средний квадрат значения признака 2500. а) 2540; б) 2460; в) 4100; г) 900. 151 1.8 Выборочное наблюдение 1.8.1 Понятие о выборочном наблюдении В настоящее время в условиях рыночных отношений в России находит все более широкое применение наиболее совершенный и научно обоснованный способ несплошного наблюдения – выборочное наблюдение, которое используется в работе органов государственной статистики, научно-исследовательских лабораторий и предприятий. Выборочное наблюдение позволяет лучше организовать наблюдение, обеспечивает быстроту проведения, экономию труда и средств на получение и обработку информации. Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц. Совокупность, из которой отбираются элементы для обследования, называют генеральной, а совокупность, которую непосредственно обследуют, – выборочной (выборка).Статистические характеристики выборочной совокупности рассматриваются как оценкисоответствующих характеристик генеральной совокупности. Поскольку выборочная совокупность неточно воспроизводит структуру генеральной, то выборочные оценки также не совпадают с характеристиками генеральной совокупности. Различия между ними называют ошибками выборки. Как и сама выборочная характеристика, ошибка выборки является случайной величиной и зависит: 1) от степени вариации изучаемого признака; 2) от численности выборочной совокупности; 3) от способа формирования выборочной совокупности; 4) от принятого уровня достоверности результата исследования. Достоверность рассчитанных по выборочным данным характеристик в значительной степени определяется репрезентативностью выборочной совокупности, которая, в свою очередь, зависит от способа отбора единиц из генеральной совокупности. В каждом конкретном случае в зависимости от целого ряда условий, а именно, сущности исследуемого явления, объема совокупности, вариации и распределения наблюдаемых признаков, материальных и трудовых ресурсов, выбирают наиболее предпочтительную систему организации отбора, которая определяется видом, методом и способом отбора. 152 По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора. Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора. Различают повторный и бесповторный способы отбора при формировании выборки. При повторном отборе численность генеральной совокупности на каждом этапе отбора не изменяется (попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в генеральную совокупность для участия в дальнейшей процедуре отбора) и вероятность отбора каждой единицы остается постоянной. При бесповторном отборе вероятность попадания каждой единицы в выборку увеличивается по мере процедуры отбора (попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор). 1.8.2 Способы формирования выборочной совокупности Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие выборки: собственно-случайная; механическая; типическая; серийная; многоступенчатая; многофазная. Собственно-случайная выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Однако прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной совокупности таким образом, чтобы включение или невключение в нее отдельных единиц не вызывало сомнений. Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел. Для жеребьевки необходимо подготовить достаточное количество жребиев – фишек, 153 шаров, карточек, соответствующее объему генеральной совокупности. Каждый жребий должен содержать информацию об отдельной единице совокупности – номер, фамилию лица или адрес, название или какой-либо другой отличительный признак. Необходимое в соответствии с установленным процентом отбора количество жребиев извлекается из общей их совокупности в случайном порядке. При отборе по таблицам случайных чисел каждая единица генеральной совокупности должна иметь порядковый номер. Таблицы случайных чисел получаются с помощью датчика случайных чисел на ПК и представляют собой абсолютно произвольные столбцы цифр. В соответствии с объектом генеральной совокупности выбирается любой столбец с числами необходимой значимости. Например, если генеральная совокупность включает 5000 единиц, потребуются четырехзначные столбцы, при этом числа больше 5000 не будут приниматься во внимание. В выборочную совокупность отбираются единицы с порядковыми номерами, соответствующими числам выбранного столбца. Собственно-случайный отбор может быть как повторным, так и бесповторным. Для проведения бесповторного отбора в процессе жеребьевки выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют. При использовании таблиц случайных чисел бесповторность отбора достигается пропуском чисел в случае их повторения в выбранном столбце или столбцах. После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки. Формулы расчета ошибок выборки и основные характеристики параметров генеральной и выборочной совокупности представлены в таблице 1.8.1. Как видно из формул (табл. 1.8.1), размер предельной ошибки зависит от вариации признака 2 σ , объема выборки n и ее доли в генеральной совокупности N n , а также принятого уровня вероятности (р), которому соответствует коэффициент кратности t. Так, t=1 для вероятности 0,683; t=2 для вероятности 0,954; t=3 для вероятности 0,997. Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для генеральной средней такие пределы устанавливаются на основе следующих соотношений: x x x ∆ ± = (1.8.1) x x x x x ∆ ∆ + ≤ ≤ − , (1.8.2) где x и x - генеральная и выборочная средняя соответственно; 154 x ∆ - предельная ошибка генеральной средней. Доверительные интервалы для генеральной доли: ω ω ∆ ± = р (1.8.3) ω ω µ µ ω ω t p t + ≤ ≤ − (1.8.4) Таблица 1.8.1 Формулы расчета ошибок выборки и основные характеристики параметров генеральной и выборочной совокупности Способ отбора единиц Характеристики повторный бесповторный объем сово- куп- ности доля еди- ниц средний размер приз- нака Средняя ошибка ( µ ): для средней для доли Преде- льная ошибка ( ∆ ): для средней для доли n х 2 σ µ = n ) 1 ( ω ω ω µ − = n t х 2 σ = ∆ n t ) 1 ( ω ω ω − = ∆ = − N n n х 1 2 σ µ = − − N n n 1 ) 1 ( ω ω ω µ = ∆ − N n n t х 1 2 σ = − − ∆ N n n t 1 ) 1 ( ω ω ω Генеральная совокупность N p N i x x ∑ = Выборочная совокупность n ω n x x i ∑ = Покажем практическое применение рассмотренной выше методики на следующем примере. Пример: по итогам проведенной 10%-й случайной выборки получено следующее распределение работников фирмы по уровню заработной платы (см. табл. 1.8.2). Таблица 1.8.2 Группы работников по уровню заработной платы, тыс. руб. до 1,0 1,0 – 1,5 1,5 – 2,5 2,5 – 5,0 5,0 и более Итого 155 Число работников 5 12 35 43 15 110 1) Определить с вероятностью 0,954 пределы средней заработной платы работников данной фирмы; 2) С вероятностью 0,95 границы доли работников, имеющих заработную плату не более 1,5 тыс. руб. Решение: 1. Вначале, на основе имеющегося распределения работников, определим выборочные среднюю и дисперсию. Для этого построим дополнительную расчетную таблицу 1.8.3: Таблица 1.8.3 Группы работников по уровню заработной платы, тыс. руб. х i Число работников f i Сере- дина интер- вала ( i х ′ ) i i f х ⋅ ′ ( ) x х i − ′ ( ) i i f x х ⋅ − ′ 2 до 1,0 1,0 – 1,5 1,5 – 2,5 2,5 – 5,0 5,0 и более 5 12 35 43 15 0,75 1,25 2,0 3,75 6,25 3,75 15,0 70,0 161,25 93,75 -2,65 -2,15 -1,40 0,35 2,85 35,1 55,5 68,6 5,27 121,8 Итого 110 343,75 286,3 Определим выборочную среднюю: 4 , 3 110 75 , 343 руб тыс f f х х i i i = = ∑ ∑ = Рассчитаем выборочную дисперсию: ( ) 6 , 2 110 3 , 286 2 2 = = ∑ ∑ − = i i i f f x x σ Рассчитаем среднюю ошибку выборки: 1 , 0 1100 110 1 110 6 , 2 1 2 руб тыс N n n х = − = − = σ µ Вычислим теперь предельную ошибку выборки (с учетом того, что при р=0,954 t=2): 2 , 0 1, 0 2 руб тыс t x х = ⋅ = ⋅ = ∆ µ Следовательно, доверительный интервал будет следующим: 2 , 0 4 , 3 ± ± = = ∆ x x x ; 156 6 , 3 2 , 3 руб тыс x ≤ ≤ Таким образом, с вероятностью 0,954 можно утверждать, что средняя заработная плата работников исследуемой фирмы находиться в пределах от 3,2 до 3,6 тыс. руб. 2. Определим выборочную долю: 15 , 0 110 12 5 = + = ω Вычислим среднюю ошибку доли: 03 , 0 1100 110 1 110 ) 15 , 0 1 ( 15 , 0 1 ) 1 ( = − − = − − = N n n ω ω ω µ Рассчитаем предельную ошибку доли: 06 , 0 03 ,0 2 = ⋅ = ⋅ = ∆ ω ω µ t Построим доверительный интервал: 06 , 0 15 , 0 ± = ± = ∆ ω ω р ; % 21 9 ≤ ≤ p Таким образом, с вероятностью 0,95 можно утверждать, что доля работников, имеющих заработную плату не более 1,5 тыс. руб. находится в пределах от 9% до 21%. |