Статистика. Данные
Скачать 0.67 Mb.
|
Задание 1 По исходным данным, представленным в таблице 1, составить два ряда распределения – один дискретный, другой интервальный. По каждому ряду выполнить группировку данных, определить абсолютные, относительные и интегральные частоты, определить средние арифметические и структурные величины, показатели вариации. Сделать обоснованные выводы о качественных особенностях ряда и проиллюстрировать результаты графиками (гистограмма и кумулята для интервального ряда, полигон и кумулята для дискретного ряда). Ручные расчеты дополнить данными, полученными с помощью надстройки «Описательная статистика» пакета Microsoft Excel (Файл – параметры - надстройки – анализ данных – описательная статистика), выявить и пояснить причины расхождения полученных результатов. Таблица 1 - Данные варианта
Таблица 2 - Данные для расчета
Выполнение задания: Дискретный ряд 1. Ряд 1 – Стаж работы Сгруппируем данные по стажу работы, определим абсолютные, относительные и интегральные частоты и представим в таблице 1. Таблица 1 – Сгруппированные данные работников строительного треста по стажу работу
Для определения средних арифметических и структурных величин, показателей вариации составим расчетную таблицу 2. Таблица 2 – Расчетные данные
1. Средние показатели Средняя взвешенная (выборочная средняя) года Мода. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности. Максимальное значение повторений при x = 3 (f = 12). Следовательно, мода равна 3. Медиана. Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 23. Это значение xi = 3года. Таким образом, медиана равна 3 лет. Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных. 2. Структурные показатели. Степень асимметрии. Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии. As = M3/s3 где M3 - центральный момент третьего порядка. s - среднеквадратическое отклонение. M3 = 30.29/45 = 0.67 Положительная величина указывает на наличие правосторонней асимметрии. Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии: Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/sAs > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным. Расчет центральных моментов проводим в аналитической таблице 3 Таблица 3- Расчет центральных моментов
В анализируемом ряду распределения наблюдается несущественная асимметрия (0.271/0.612 = 0.44<3) Применяются также структурные показатели (коэффициенты) асимметрии, характеризующие асимметрию только в центральной части распределения, т.е. основной массы единиц, и независящие от крайних значений признака. Рассчитаем структурный коэффициент асимметрии Пирсона: Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. Чаще всего эксцесс оценивается с помощью показателя: Для распределений более островершинных (вытянутых), чем нормальное, показатель эксцесса положительный (Ex > 0), для более плосковершинных (сплюснутых) - отрицательный (Ex < 0), т.к. для нормального распределения M4/s4 = 3. M4 = 293.84/45 = 6.53 Число 3 вычитается из отношения μ4/ σ4 потому, что для нормального закона распределения μ4/ σ4 = 3. Таким образом, для нормального распределения эксцесс равен нулю. Островершинные кривые обладают положительным эксцессом, кривые более плосковершинные - отрицательным эксцессом. Ex < 0 - плосковершинное распределение Чтобы оценить существенность эксцесса рассчитывают статистику Ex/sEx где sEx - средняя квадратическая ошибка коэффициента эксцесса. Если отношение Ex/sEx > 3, то отклонение от нормального распределения считается существенным. Поскольку sEx < 3, то отклонение от нормального распределения считается не существенным. |