Статистика. Домашнее задание. Вариант 10. Анализ исходных данных, позволяющий установить факторный и результативный показатели Массив исходных данных Среднегод
Скачать 444 Kb.
|
хср - 3 σ ≤ xi ≤ хср + 3 σ т.е. по имеющимся данным, где х – средняя для выборочной совокупности. 488,76-3* 177,01≤ xi ≤488,76+3* 177,01 488,76-531,03≤ xi ≤ 488,76+531,03 -42,27 ≤ xi ≤ 1019,79 Среднегодовая численность населения не может быть отрицательной, следовательно интевал примет следующий вид 0 ≤ xi ≤ 1019,79 Резко выделяющихся единиц в первичной информации нет, т.к. все значения факторного признака попадают в полученный интервал. Коэффициент вариации: V = (σ/хср) * 100% = (177,01/488,76)*100% = 0,36% Так как V < 33% ,следовательно, значение коэффициента вариации свидетельствует о том, что совокупность достаточно однородна и не нужно исключать резко выделяющиеся по факторному признаку регионы. Задание№3 По оставшемуся массиву данных построить ряд распределения регионов РФ по численности занятых в экономике. Величину интервала определить по формуле Стэрджесса. По построенному ряду рассчитать показатели центра распределения, вариации и дифференциации. Решение: Величина интервала i определяется по формуле Стерджэсса, т.к. нет больших перепадов в значении признака: i= R/m гдеR – размах вариации (колебаний) признака (R = x max – x min) , x max – максимальное значение признака, x min - минимальное значение признака; m –число групп (m =1+3,322 lg N), N – число единиц в совокупности. m =1+3,322 lg 30 m =1+3,322 *1,477 m =5,907=6 полученную величину m округляют до целого большего числа, поскольку количество групп не может быть дробным. Подсчитаем величину интервала: i = (664,9 – 329,9) /6 i =335/6 i =112,82 Следовательно, в ряду распределения будет 6 групп (интервалов), вычислим верхние и нижние их границы: Число регионов, входящих в интервал 1-ый: [x min ; x min + i) [329,9 ; 385,9) 4 2-ой: [x min + i ; x min + 2i) [385,9;441,9) 7 3-ий: [x min + 2i ; x min + 3i) [441,9; 497,9) 7 4-ый: [x min + 3i ; x min + 4i) [497,9; 553,9) 3 5-ый: [x min + 4i ; x min + 5i) [553,9; 609,9) 6 6-ой: [x min + 5i ; x min + 6i) [609,9; 665,9) 3 Таким образом, ряд распределения (со всеми вспомогательными данными для последующих расчётов) выглядит следующим образом: Таблица 4 Ряд распределения по факторному признаку
Рассчитаем показатели центра распределения: 1.Средняя арифметическая: Т.к. данные сгруппированные, то СВ будет взвешенная: = (Σ xi * fi) / Σ fi ,, где значение признака xi = (x верх + x нижн)/2; а частота значения признака fi – число регионов в каждом интервале хi 1 = (329,9+385,9)/2 = 357,9; хi 2 = (385,9+441,9)/2 = 413,9; хi 3 = (441,9+497,7)/2 = 469,9; хi 4 = (497,7+ 553,9)/2 = 525,9; хi 5 = (553,9+609,9)/2 = 581,9; хi 6 = (609,9+665,9)/2 = 637,9 хi 1* f 1 = 357,9*4 = 1431,6; хi 2* f 2 = 413,9*7 = 2897,3; хi 3* f 3 = 469,9*7 = 3289,3; хi 4* f 4 = 525,9*3 = 1577,7; хi 5* f 5 = 581,9*6 = 3491,4; хi 6* f 6 = 637,9*3=.1913,7 Σ xi = 357,9+ 413,9+ 469,9 + 525,9+ 581,9+637,9= 2987,4 (понадобится для дальнейших заданий) Σ xi * fi = 1431,6+ 2897,3 +3289,3+ 1577,7+ 3491,4+1913,7= 14601 Таким образом, = 14601/30 ≈ 486,7≈ 486 2. Мода: Т.к. в интервальном ряду модальный интервал находят по наибольшей частоте, то модальным в данном случае является интервал №2. А значение моды находят по следующей формуле: Мо = xo + i*(fMo – f(Mo-1))/[(fMo – f(Mo-1)) + (fMo – f(Mo+1)) ], где xo – нижняя граница модального интервала; fMo – частота модального интервала; f(Mo-1) – частота интервала, предшествующего модальному; f(Mo+1) – частота интервала, следующего за модальным; i – величина модального интервала. Мо = 385,9+ 56(7 – 4)/[(7 – 4) + (7– 7)] = 385,9 + 56 = 441,9 3. Медиана: Номер медианы - NMe = (n + 1)/2 ,где n – число единиц в совокупности NMe = (30+1)/2=15,5 Следовательно, между 15 и 16 значением от начала ряда. Медианным является интервал №2, т.к. в этом интервале находятся номер 15,5. Значение самой медианы находится по следующей формуле: Me = xMe + i*(NMe – S(Me-1))/fMe , где xMe – нижняя граница медианного интервала; i – величина медианного интервала; NMe – номер медианы в совокупности; S(Me-1) – накопленная частота интервала, предшествующего медианному; fMe – частота медианного интервала. Me = 441,9+ 56(15,5 – 11)/18 = 455,9 Рассчитаем показатели вариации (колеблемости) признака: 1. Размах вариации (колебаний): R = xmax – xmin , где xmax , xmin - соответственно максимальное и минимальное значения признака. Рассчитывается только по первичным несгруппированным данным., поэтому расчёт не требуется. 2. Среднее линейное отклонение: для вариационного ряда d =(Σ | xi – хср |*fi)/ Σfi |х1- хср | = 357,9– 486 = 128,1 |х1 - хср|* fi = 128,1*4 = 512,4 |х2 - хср| = 413,9– 486 = 72,1 |х2 - хср|* fi = 72,1* 7 = 504,7 |х3 - хср| = 469,9– 486 = 16,1 |х3 - хср|* fi = 54,5*7 = 112,7 |х4 - хср| = 525,9– 486 = 39,9 |х4 - хср|* fi = 39,9* 3 = 119,7 |х5 - хср| = 581,9– 486 = 95,9 |х5 - хср|* fi = 95,9 * 6 = 575,4 |х6 - хср| = 637,9– 486 = 151,9 |х6 - хср|* fi = 151,9* 6 = 911,4 Σ | xi – x | = 128,1+ 72,1+ 16,1+ 39,9+ 95,9+151,9 = 504 Σ | xi – x |*fi = 512,4+ 504,7 +112,7+ 119,7+ 575,4+ 911,4= 2736,3 d = (Σ | xi – x |*fi)/ Σfi = 2736,3/30 =91,21 3. Дисперсия: для вариационного ряда σ 2 = (Σ (xi - хср)2*fi)/ Σfi (xi - хср )2 = (-128,1)2 = 16409,61 (xi - хср )2*fi = 16409,61* 4= 65638,44 (xi - хср )2 = (-72,1)2 = 5198,41 (xi - хср )2*fi = 5198,41* 7 = 36388,87 (xi - хср )2 = (16,1)2 = 259,21 (xi - хср )2*fi =259,21* 7 = 1814,47 (xi - хср )2 = (39,9)2 = 1592,01 (xi - хср )2*fi = 1592,01* 3 = 4776,03 (xi - хср )2 = (95,9)2 = 9196,81 (xi - хср )2*fi = 9196,81* 6 = 55180,86 (xi - хср )2 = (151,9)2 = 23073,61 (xi - хср )2*fi = 23073,61* 3 = 69220,83 Σ (xi - хср )2 = 16409,61+5198,41+ 259,21+ 1592,01 + 9196,81+ 23073,61= 55729,66 (понадобится для дальнейших заданий). Σ (xi - хср )2*fi = 65638,44+ 36388,87+ 1814,47+ 4776,03+ 55180,86+69220,83= 233019,5 σ 2 = (Σ (xi - хср )2*fi]/ Σfi =233019,5/30 =7767,32 4. Среднее квадратическое отклонение: для вариационного ряда σ = √Σ (xi - хср )2*fi)/ Σfi = √ σ 2 σ = √7767,32= 88,13 Относительные: 1. Коэффициент осцилляции: KR = R / хср * 100% Рассчитывается по несгруппированным данным, поэтому расчёт не требуется. 2. Коэффициент линейного отклонения: Kd = d / хср * 100% , где d – среднее линейное отклонение Kd = (91,21/486) *100% =0,19 * 100% = 19% 3. Коэффициент вариации: V = (σ / хср )* 100% V = (88,13/486)*100% = 18% Рассчитаем показатели дифференциации: Величины положения:
-это значения признака, которые делят ранжированный ряд на четыре равные части по численности; таких величин будет 3: первая квартиль (Q1), вторая квартиль(Q2) и третья квартиль (Q3). Положение и место квартилей: NQ1 = (n+1)/4; NQ2 = (n+1)/2= NMe; NQ3 = ¾*(n+1) Численное значение квартиля находится по следующей формуле: Qi = x Qi + i [(NQi – S ( Qi – 1) ) / fQ1], где x Qi – нижняя граница интервала, в котором находится квартиль; i – величина этого интервала; S(Qi – 1) – накопленная частота интервала, предшествующего тому, в котором находится квартиль; fQ1 – частота интервала, в котором находится квартиль. NQ1 = (30+1)/4 = 7,75 NQ2 = (30+1)/2 = 15,5 NQ3 = ¾*(30+1) = 23,25 Q1 = x Q1 + i [(NQ1 – S ( Q1 – 1) ) / fQ1], Q2 = x Q2 + i [(NQ2 – S ( Q2 – 1) ) / fQ2], Q3 = x Q3 + i [(NQ3 – S ( Q3 – 1) ) / fQ3]. Подсчитаем значения 1-ого, 2-ого и 3-ого квартилей: Q1 = 385,9+ 56 [(7,75 – 4 ) /11] = 404,99; Q2 = 441,9 + 56 [(15,5 – 11 ) /18] =455,9; Q3 = 553,9 + 56 [(23,25 – 21) / 27] = 558,57.
Применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений. dk = Q = (Q3 - Q1)/2, Q3 – третья квартиль, Q1 – первая квартиль. dk = (558,57– 404,99)/2 = 153,57/2 = 76,79
Находится по следующей формуле: |