Статистика. Данные
Скачать 0.67 Mb.
|
Показатели вариации. Абсолютные показатели вариации. Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда. R = xmax - xmin = 5 - 1 = 4 лет. Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности. лет. Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего). лет Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия). лет Среднее квадратическое отклонение. лет. Оценка среднеквадратического отклонения. Относительные показатели вариации. К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение. Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс. Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины. Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней. Рисунок 1- Полигон распределения рабочих строительного треста по стажу работы Рисунок 2- Кумулята распределения рабочих строительного треста по стажу работы Ручные расчеты дополним данными, полученными с помощью надстройки «Описательная статистика» пакета Microsoft Excel (Файл – параметры - надстройки – анализ данных – описательная статистика). Рисунок 3 – Параметры описательной статистики Рисунок 4 - Результаты расчета инструмента Ecxel анализ данных «Описательная статистика» Составим сравнительную таблицу Таблица 4- Сравнительние расчетных параметров
Параметры отличаются несущественно, расчеты сделаны верно. Выводы: Для данного дискретного ряда характерны следующие показатели. Средний стаж рабочих составил 2,82 года. Наиболее часто встречающий стаж работы приходится на 3 года. 50% совокупности имеют стаж работы 3 года. В анализируемом ряду распределения наблюдается несущественная правосторонняя асимметрия (0.271/0.612 = 0.44<3). Среднее значение примерно равно моде и медиане, что свидетельствует о нормальном распределении выборки. Значения As и Ex мало отличаются от нуля. Поэтому можно предположить близость данной выборки к нормальному распределению. Каждое значение ряда отличается от другого в среднем на 1,13 лет. Каждое значение ряда стажа работы отличается от среднего значения 2,82 лет в среднем на 1,355 лет. Поскольку v>30% ,но v<70%, то вариация умеренная. Согласно графическому представлению данных расчетные данные подтверждаются, максимальное количество работников (12 чел.) имеют стаж 3 года, минимальное количество (5 чел.) имеют стаж 4 года. Результаты расчета инструмента Ecxel анализ данных «Описательная статистика» показали совпадение всех расчетных параметров. Расхождение в сотых долях расчета за счет того , что точность расчта в Excel до 7 знаказа после запятой, в ручном расчете до 3 знака, т.е это объясняется тем что мы рассчитываем данные по сгруппированному дискретному, а программа по несргуппированному дискретному ряду. Вариационный ряд. 2. Ряд 2 - Заработная плата за январь Сгруппируем данные по заработной плате за январь, определим абсолютные, относительные и интегральные частоты и представим в таблице 5. По формуле Стэрджесса: n = 1 + 3,2log n n = 1 + 3,2log 45 = 6 Тогда ширина интервала составит: руб Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Таблица 5 – Сгруппированные данные работников строительного треста по заработной плате за январь
Для определения средних арифметических и структурных величин, показателей вариации составим расчетную таблицу 6. Таблица 6 – Расчетные данные
1. Средние показатели Средняя взвешенная (выборочная средняя) руб. Мода. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности. где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота. Выбираем в качестве начала интервала 13325 руб., так как именно на этот интервал приходится наибольшее количество. Медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 13325 - 16180, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот). руб. |