статистика задачи. статка зад 2 12 34 44 54. Задача 2 3 Задача 12 13 Задача 24 16 Задача 34 19 Задача 44 23 Задача 54 26 Список использованной литературы 28
Скачать 226.11 Kb.
|
СОДЕРЖАНИЕЗадача 2 3 Задача 12 13 Задача 24 16 Задача 34 19 Задача 44 23 Задача 54 26 Список использованной литературы 28 Задача 2По исходным данным необходимо: построить интервальный вариационный ряд распределения, дать его графическое изображение; рассчитать показатели центра распределения: среднюю арифметическую, моду и медиану; определить абсолютные и относительные показатели вариации, сделать выводы об однородности совокупности; определить показатели формы распределения; проверить соответствие эмпирического распределения закону нормального распределения, используя критерий согласия Пирсона, изобразить эмпирическое и теоретическое распределения на одном и том же графике. Задача 2. 11 9 2 8 11 5 10 8 4 9 7 6 11 5 18 6 10 7 11 4 12 14 13 8 9 12 5 17 13 17 11 9 1 10 1 5 8 8 0 3 17 3 8 7 4 15 16 3 16 1 Решение 1. Для построения интервального ряда вначале определяем размер интервала: где xmax – максимальное значение признака в совокупности; xmin - минимальное значение признака в совокупности; m – число интервалов п = (18-0)/ Количество интервалов определим с помощью формулы Стерджесса: где n – объем совокупности (количество исходных значений). В нашем случае n=50. Количество интервалов обязательно должно быть целым числом. Поскольку формула Стерджесса дает лишь приблизительную оценку количества интервалов, то можно принять либо m=6, либо m=7. Для удобства дальнейших вычислений примем m=6. Тогда размер интервала будет равен: п= (18-0)/6=3 Нижняя граница первого интервала равна минимальному значению признака в совокупности, т.е. в нашем случае равна 0. Верхняя граница первого интервала равна нижней границе плюс размер интервала, т.е. 0+3=3. Нижняя граница второго интервала равна верхней границе первого, т.е. 3. Верхняя граница второго интервала равна нижней границе второго интервала плюс размер интервала, т.е. 3+3=6 и т.д. В итоге получаем границы для шести интервалов. Заносим границы интервалов в таблицу (табл. 1, колонка 2). Далее подсчитываем количество значений признака из заданной совокупности, попавших в тот или иной интервал и заносим это число в колонку «Частота». Если значение попадает на границу между k-ым и (k+1)-ым интервалами, то его относят в (k+1)-ый интервал. Сумма всех частот обязательно должна совпадать с объемом совокупности (в нашем случае со значением 50). Вычисляем частости, т.е. частоты, выраженные в процентах к общему объему совокупности: Таблица 1 – Группировочная
Накопленная частота показывает, сколько единиц изучаемой совокупности имеет значение признака не более чем некоторое заданное. Последнее значение накопленной частоты должно быть равно объему совокупности. Плотность распределения показывает, сколько единиц совокупности приходятся на единицу длины интервала. Представим графически на рис. 1-2 Рисунок 1- Гистограмма распределения Рисунок 2 – Накопленная частота Видим, что ряд имеет одну вершину в интервале 9-12, поэтому считаем, что распределение нормальное. Перегруппировывать не нужно. 2. К показателям центра распределения относятся: средняя арифметическая, мода и медиана. Таблица 2 – Расчет среднего значения
Средняя арифметическая где xi –середина i-го интервала. Мода – наиболее часто встречающийся признак. – нижняя граница модального интервала; – величина модального интервала; – частота модального интервала; , – частоты интервалов предыдущего модальному и последующего за модальным. Медиана – середина упорядоченного ряда, делит ряд на две равные части. В интервальном ряду медиана рассчитывается так: – нижняя граница медианного интервала; – величина медианного интервала; – накопленная частота предшествующего медианному интервала; – частота медианного интервала. Т.к. не выполняется условие , то совокупность не считаем однородной, а распределение симметричным. Получается, что чаще всего встречается признак 9,375. Середина ряда – 8,727 3. В статистике применяются следующие показатели вариации: Размах вариации R – разница между максимальным и минимальным значением вариационного ряда: =18-0=18 Среднее линейное отклонение – средняя арифметическая из абсолютных значений отклонений отдельных вариантов от средней величины: для ряда с разными частотами: Таблица 3 – Расчет показателей вариации
Дисперсия – средний квадрат отклонений вариантов от среднего значения. Взвешенная: – для сгруппированных данных. Среднее квадратическое отклонение: Коэффициент вариации: . Поскольку коэффициент вариации больше 33%, то совокупность по изучаемому признаку является неоднородной. 4. Распределение не симметрично, т.к. не выполняется условие Величина показателя асимметрии может быть положительной и отрицательной. Положительное значение свидетельствует о наличии правосторонней асимметрии, отрицательное – о наличии левосторонней асимметрии. Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка: , Т.к. , асимметрия правосторонняя со смещением влево. Оценка степени точности этого показателя определяется с помощью средней квадратической ошибки, которая зависит от объема наблюдений. Эксцесс характеризует отклонение вершины эмпирического распределения вверх или вниз от вершины нормального распределения. Наиболее точным является показатель, основанный на определении момента четвертого порядка: Т.к. Eх<3 - распределение плосковершинное. Т.к. |As|<0,25, то асимметрия считается незначительной 5. Проверка соответствия эмпирического распределения нормальному закону Теоретические частоты для нормального распределения вычисляются по формуле Σƒi—сумма накопленных (кумулятивных) эмпирических частот h — разность между двумя соседними вариантами σ — выборочное среднеквадратическое отклонение t–нормированное (стандартизированное) отклонение φ(t)–функция плотности вероятности нормального распределения (находят по таблице значений локальной функции Лапласа для соответствующего значения t) Рисунок 3 - Эмпирическое и теоретическое распределения Критерий согласия Пирсона ( 2) «хи - квадрат» где f и - соответственно частоты эмпирического и теоретического распределений в і – ом интервале. Расчет проводим в табл 4 Рассчитанные значения сравниваются с табличными при соответствующем числе степеней свободы и заданном уровне значимости (а) (величина а принимается 0,05 или 0,01). К= 6-2-1=3 Т.к. , то это свидетельствует о близости эмпирического распределения нормальному.
Таблица 4 – Данные для расчета критерия Пирсона 3> |