общая теория статистики. Учебное пособие (практикум) Красноярск 2008
Скачать 1.36 Mb.
|
Задание 11. Поданным выборочного обследования семей области получено следующее распределение семей по размеру совокупного дохода на члена семьи. Размер совокупного дохода на члена семьи, руб. Число семей в % к итогу 1000 1500 2000 3000 4500 21,0 20,0 30,0 19,0 10,0 Итого 100 Определите моду среднедушевого дохода семьи. Задание 12. Имеются следующие данные о распределении площади хозяйств района по урожайности зерновых и зернобобовых культур Урожайность зерновых и зернобобовых культур, ц с 1 га Посевная площадь в % к итогу 10-14 14-18 18-22 22-26 26-28 28-30 18 20 25 23 13 1 Итого 100 Определите 1) Среднее значение урожайности зерновых и зернобобовых культур 2) Модальное и медианное значение урожайности Тема 1.5. Показатели вариации признака в совокупности При изучении массовых явлений нельзя ограничиваться только средними величинами их признаков, нужно подвергать всестороннему анализу отклонения от средних, поскольку без этого нельзя увидеть весь процесс в его развитии. Для этого в статистике используются показатели вариации, характеризующие колеблемость признака. К ним относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Размах вариации есть разница между наибольшими наименьшим значениями признака в ряду распределениях х . Среднее линейное отклонение представляет собой среднюю величину отклонений значений признака от их средней величины без учета знака, те. по модулю. Расчет производится по формуле Простое n x x d i - = ; Взвешенное Дисперсия, или средний квадрат отклонений вариантов признака от их средней величины. Существует несколько способов исчисления дисперсии в зависимости от информационной базы. 1 метод вычисления (квадрат отклонений отдельных вариант от средней величины простая n x x i ∑ − = 2 2 ) ( σ (14) взвешенная ∑ ∑ × − = i i i f f x x 2 2 ) ( σ (15) 2 метод вычисления (разница среднего квадрата признака и квадрата средней величины 2 2 2 ) (x x − = σ ; ∑ ∑ = f f x x 2 2 ; 3 метод вычисления (для альтернативного признака Пусть p – доля единиц в совокупности, обладающих признаком q – доля единиц, не обладающих признаком ( ) p - 1 ; дисперсия доли (или альтернативного признака) равна Среднее квадратическое отклонение представляет собой квадратный корень из дисперсии 2 σ σ Коэффициент вариации представляет собой отношение среднего квадратического отклонения и средней величине признака. Он измеряется в виде коэффициентов или процентов. % 100 × = x V σ Расчет групповой, межгрупповой и общей дисперсии (по правилу сложения дисперсий. Если совокупность расчета на группы по изучаемому признаку, то для изучения такой вариации достигается посредством вычисления и анализа различных видов дисперсии общей, групповых (частных, средней из групповых и межгрупповой. Общая дисперсия равна среднему квадрату отклонений отдельных значений признаках от общей средней х. Общая дисперсия отражает вариацию признака за счет всех условий и причин, действующих в совокупности. Групповая (частная или внутригрупповая) дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы от средней арифметической этой группы, эта дисперсия отражает вариацию, происходящую за счет условий и причин, действующих внутри группы. ( ) n x x i i 2 2 − ∑ = σ ; ( ) i f i f x i x i ∑ × − ∑ = 2 Средняя из внутригрупповых дисперсий исчисляется как средняя арифметическая, взвешенная из дисперсий групповых. i i i i f f ∑ ∑ = 2 2 σ σ Межгрупповая дисперсиям) характеризует вариацию результативного признака, возникающую под влиянием фактора, положенного в основании группировки, равна среднему квадрату групповых средних ) x ( i от общей средней м Существует определение соотношение, связывающее три вида дисперсии общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий. 2 2 2 σ σ σ м i + = Данное соотношение называют правилом сложения дисперсий. В статистическом анализе используется показатель, представляющий собой, долю межгрупповой дисперсии в общей, называемый эмпирическим коэффициентом детерминации ) ( 2 η : 2 2 2 σ σ η м = Корень квадратный из эмпирического коэффициента детерминации называется эмпирическим корреляционным отношением ) ( η ; которое характеризует влияние положенного в основании группировки признака на вариацию результативного признака. 2 2 σ σ η м = Эмпирическое корреляционное отношение изменяется от 0 до 1. Если 0 = η , то группировочный признак вообще не оказывает влияние на вариацию результативного, а если 1 = η , то вариация результативного признака происходит только под влиянием группировочного. Теорема сложения дисперсий для дисперсии альтернативного признака. общая дисперсия ( ) ; - 1 2 i i i р n n р р р р = × = σ ; внутригрупповая дисперсия ( ) i i р р р i - 1 2 × = σ ; средняя из внутригрупповых ∑ ∑ × = i i р р n П i i 2 2 σ σ ; межгрупповая дисперсия доли ( ) ∑ ∑ − × = i i i i n n р р 2 Примеры решения типовых заданий Пример 1. Покажем расчет дисперсии и коэффициента вариации в дискретных рядах распределения. Условие Имеются данные о выработке рабочих предприятия Произведено одним рабочим, штук (x) Число рабочих ) ( f f ⋅ Χ Χ − Χ 2 ) ( Χ − Χ f 2 ) ( Χ − Χ 8 7 56 -2 4 28 9 10 90 -1 1 10 10 15 150 0 0 0 11 12 132 1 1 12 12 6 72 2 4 24 ИТОГО 50 500 74 Решение Исчислим среднюю арифметическую взвешенную 138 ) ( 10 50 500 штук f f = = ⋅ Χ = Χ ∑ ∑ Значения отклонений от средней и их квадратов представлены в таблице. Определим дисперсию 48 1 50 74 ) ( 2 Среднее квадратическое отклонение будет равно 216 1 48 1 2 = = = Коэффициент вариации рассчитывается следующим образом % 6 12 100 10 216 1 100 = ⋅ = ⋅ Χ = Таким образом, дисперсия составила 1,48 штук, коэффициент вариации 12,6%, что свидетельствует об однородности совокупности, так как V % 33 ≤ / Пример 2. Условие Имеются данные об урожайности овса на опытных участках Номер участка Урожайность овса, семена не прошедшие предпосевную обработку, ц с 1 га Номер участка Урожайность овса, семена прошедшие предпосевную обработку, ц с 1 га 1 2 3 4 5 6 13 14 15 17 16 15 7 8 9 10 11 12 18 19 22 20 24 23 Исчислим групповые дисперсии среднюю из групповых дисперсий − межгрупповую дисперсию общую дисперсию. Решение Для расчета групповых дисперсий исчислим среднюю по каждой группе 15 = 6 90 = 1 X ; 21 6 126 Далее исчислим групповые дисперсии ( ) ( ) ( ) ( ) ( ) ( ) 67 1 666 1 6 15 15 15 16 15 17 15 15 15 14 15 13 2 2 2 2 2 2 2 1 ≈ = − + − + − + − + − + − = σ 66 4 2 Рассчитаем среднюю из внутригрупповых (частных) дисперсий 139 16 , 3 12 6 66 4 6 67 1 2 Исчислим межгрупповую дисперсию. Для этого предварительно определим общую среднюю 18 12 126 Затем рассчитаем межгрупповую дисперсию ( ) ( ) ( ) 9 12 108 12 6 2 18 21 6 2 18 15 2 2 = = × − + × − = ∑ × − = i i f f x i x м σ Исчислим общую дисперсию согласно правилу сложения дисперсий 16 12 = 9 + 16 3 = 2 + 2 = 2 , , м i σ σ σ Проверим полученный результат, исчислив общую дисперсию обычным способом ( ) 16 12 12 146 Определим эмпирический коэффициент детерминации и корреляционное отношение 74 0 16 12 9 2 = = η ; 86 0 = 74 Таким образом, можно сделать вывод, что связь между урожайностью зерновых и предпосевной обработкой семенного материала достаточно высокая, вариация урожайности на 74% обусловлена влиянием этого фактора. Задания для самостоятельного решения Задание 1. Имеются следующие данные о производительности труда рабочих Табельный номер рабочего Произведено продукции, шт. В дневную смену В ночную смену 1 2 3 4 5 5 8 7 5 6 4 6 4 4 5 Исчислите 1) частные дисперсии 2) межгрупповую дисперсию 3) общую дисперсию (по правилу сложения дисперсий и обычным способом. Сделайте вывод, как влияет вид рабочей смены на производительность рабочих (коэффициент детерминации и корреляционное отношение. Задание 2. Имеются следующие данные о распределении рабочих по проценту допускаемого брака в процессе производства Процент брака Число рабочих Средний % брака Среднее квадратическое отклонение До 1 1-3 3-5 5-7 Свыше 7. 7 20 15 5 3 0,8 2,3 3,7 5,9 7,8 0,67 0,65 0,51 0,48 0,82 Исчислите общую дисперсию допускаемого рабочими брака продукции, применяя правило сложения дисперсий. Задание 3. Определите по нижеприведенным данным общую дисперсию цены на яблоки, а также степень однородности групп Канал сбыта Средняя цена яблок,руб/т Объем продаж,тонн Групповая дисперсия цены рынки 8 300 4.1 Розничная торговля 14 25 9.5 Задание 4. С целью установления зависимости между урожайностью и сортом винограда водном из хозяйств на основе выборки определили урожайна кустах винограда Наименование сорта винограда Число проверенных кустов Урожай винограда с каждого куста, кг Куст №1 Куст №2 Куст №3 Куст №4 Куст №5 Сорт А 3 6 5 7 - - Сорт Б 5 7 6 8 5 9 Сорт В 2 9 7 - - - Исчислите общую, межгрупповую и среднюю из внутригрупповых дисперсий. Определите связь между сортом и его урожайностью. Задание 5. Распределение стоимости продукции, предназначенной для экспортных поставок, представлено следующими данными Цех Стоимость всей произведенной продукции, тыс. руб. В том числе стоимость экспортной продукции, тыс. руб. 1 340 110 2 290 140 3 180 180 итого 810 410 Определите а) общую дисперсию доли экспортной продукции через правило сложения дисперсий б) эмпирический коэффициент детерминации. Тема 1.6. Методы анализа динамики социально-экономических явлений В статистики под понятием ДИНАМИКА подразумевают, изменение показателей общественно-экономических явлений во времени. Для изучения данных изменений строятся хронологические (временные) ряды, которые называются – рядами динамики. Ряд динамики – последовательно расположенные в хронологическом порядке показатели, характеризующие развитие явления во времени. Ряд динамики характеризуется двумя параметрами 1) моментами времени (конкретными датами) или периодами (годы, кварталы, недели и т.д.), к которым относятся статистические данные. 2) непосредственно статистическими данными – уровнями динамического ряда ( Ряды динамики можно подразделить в зависимости 1) от вида приводимых в них статистических показателей- ряды динамики абсолютных величин ряды динамики средних величин ряды динамики относительных величин. Ряды абсолютных величин являются исходными, начальными, а ряды средних и относительных величин – производными. 2) от времени, отображаемому в динамическом ряде − моментные динамические ряды – уровни ряда выражают величину явления на определенный, конкретный момент времени (дату. Особенностью моментных рядов, является то, что суммировать их уровни не имеет смысла, так как суммирование будет включать одну и туже величину несколько раз. В отличие от суммирования моментных уровней их разность имеет некоторый смысл интервальные динамические ряды – уровни ряда отражают размеры изучаемого явления, за какой то промежуток времени (интервал. В отличии от моментных уровней, имеет смысл рассматривать суммы уровней следующих друг за другом, так как это будет являться итогом за более продолжительный период времени. 3) по полноте времени отображаемого в рядах динамики полные ряды – их даты или периоды следуют друг за другом с равным интервалом неполные ряды – их даты или периоды не следуют друг за другом с равным интервалом. Статистические характеристики (показатели) ряда динамики При изучении явления во времени в статистики рассчитывают ряд показателей динамики, которые и будут характеризировать данное изменение. При этом анализу подвергаются уровни динамического ряда. Различают начальный уровень ( ) y ( 1 или ) y ( 0 ), который показывает величину первого члена динамического ряда конечный уровень ) y ( n , который показывает величину конечного члена динамического ряда средний уровень ряда ) ( Статистический анализ динамических рядов основан на сравнении уровней динамического ряда. При этом сравниваемый уровень ряда динамики называется текущим уровнем, а уровень по отношению к которому проводится сравнение – базисным уровнем. В свою очередь базисным уровнем может быть начальный уровень динамического ряда (либо любой другой, постоянно взятый за основу сравнения уровень. При сравнении сданным базисным уровнем текущего уровня получают базисные показатели динамики. уровень предыдущий текущему уровню. При сравнении сданным базисным уровнем текущего уровня получают цепные показатели динамики иногда за базу сравнения принимают средний уровень. Показатели динамики Абсолютный прирост или ) ( i ∆ рассчитывается как разность двух уровней динамического ряда, один из которых принят за базу сравнения. Цепной абсолютный прирост рассчитывается по формуле Цепной абсолютный прирост называют скоростью роста Базисный абсолютный прирост баз i i y y A - = Коэффициент роста ) ( p K – отношение текущего уровня ряда динамики к уровню принятому за базу сравнения. Коэффициент роста, умноженный на 100, называется темпом роста в % ) Т ( р . Коэффициент роста показывает во сколько раз уровень текущего периода выше или ниже уровня базисного периода, темп роста – сколько процентов он составил по отношению к базисному уровню. цепной коэффициент роста рассчитывается как 143 1 = i i i y y K ; базисный коэффициент роста рассчитывается как Коэффициент (темп) прироста ) ( пр пр Т К показывает, насколько частей процентов) увеличился или уменьшился текущий уровень по сравнению с базисным, принятым зато есть, сколько частей (процентов) составляет относительный прирост данного уровня по отношению к базисному уровню. Рассчитывается двумя способами Первый способ – как отношение абсолютного прироста к базисному уровню. цепной коэффициент прироста рассчитывается как 1 пр базисный коэффициент прироста рассчитывается как 1 1 - = y y y K i i пр Второй способ – коэффициент (темп) роста минус 1 (100). 1 − = р пр K K или 100 − = р пр Т Т Абсолютное значение одного процента прироста показывает часть абсолютного прироста, которая обеспечила 1% относительного прироста. Рассчитывается двумя способами. Первый способ – как отношение абсолютного прироста к темпу прироста за тот же период % прi i i Т А = α ; % пр Т А 1 1 1 = α ; % 2 2 2 пр Т А = α ; % пр Т А 3 3 3 = α ; % пр n n n Т А = α Второй способ – как 0,01 часть от предыдущего (базисного) уровня. 1 01 Средние показатели динамики. Для обобщения характеристики динамики, рассчитанной по уровням динамического ряда, определяют средние показатели динамического ряда. Средние показатели динамического ряда подразделяются на 1. Средние уровни ряда. Для интервального ряда динамики с равными интервалами средний уровень ряда рассчитывается как средняя арифметическая простая исходных уровней 144 n y y i = , где n – число уровней динамического ряда. Для расчета среднего уровня моментного ряда динамики с равными отрезками между датами средний уровень определяют как среднюю хронологическую n y y ... y y y y n i 2 1 + + + + + 2 1 = 2 1 0 , где n – порядковый номер последнего уровня, если первый уровень динамического ряда обозначается как 0 y 1 2 1 2 1 3 2 Для интервального ряда динамики с неравными интервалами средний уровень ряда y рассчитывается как средняя арифметическая взвешенная = i i i t t y y , где i t – продолжительность периода между датами. 2. Средние показатели изменения уровней ряда (средний абсолютный прирост, средние коэффициенты (темпы) роста и прироста. Средний абсолютный прирост средняя скорость роста) ) , ( ∆ А определяется как средняя арифметическая из показателей абсолютного прироста. А, где n – количество абсолютных приростов. Средний коэффициент (темп) роста рассчитывается по формуле средней геометрической из индивидуальных коэффициентов (темпов) роста, так как необходимо учитывать, то обстоятельство, что скорость развития явления идет по правилам сложных процентов, где накапливается процент на процент. если динамический ряд обозначить как n y y y y , 3 2 1 n рi n рn р р р р K K K K K К 3 2 1 = × × × × = , где – знак произведения n – число коэффициентов роста. Средний коэффициент (темп) прироста рассчитать по индивидуальным коэффициентам (темпам) прироста, с помощью средней геометрической, нельзя, так как темпы прироста могут иметь отрицательные значения, а отрицательные числа логарифмов не имеют. Поэтому средний коэффициент темп) прироста рассчитывают как |