Стат анализ 40 вариант. стат анализ 40 вариант. Статистический анализ и планирование эксперимента макет отчета по контрольной работе для обучающихся по заочно форме обучения
Скачать 1.19 Mb.
|
1 2 Министерство науки и высшего образования Российской Федерации ФГБОУ ВПО «Иркутский государственный технический университет» Институт недропользования Кафедра Нефтегазового дела СТАТИСТИЧЕСКИЙ АНАЛИЗ И ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА Макет отчета по контрольной работе для обучающихся по заочно форме обучения Выполнил: ст.гр.НДДбз-18-3 Башуров А.С. Проверил : к.т.н , доцент Шмаков А.К.Иркутск 2021 г. ВВЕДЕНИЕ Настоящий макет предназначен для помощи обучающимся по программе дисциплины «Статистический анализ и планирование эксперимента» при выполнении контрольной работы. Данный мает применяется следующим образом. Текст макета принимается за основу. В свободные места текста, обозначенные различным образом, необходимо внести результаты выполнения контрольной работы в соответствии с индивидуальным заданием. 1 СТАТИСТИЧЕСКИЙ АНАЛИЗ СЛУЧАЙНЫХ ВЕЛИЧИН 1.1. Статистический анализ одномерной последовательности случайных величин Цель работы: приобрести компетенции статистического анализа одномерной последовательности случайных величин. Задание: Подготовить исходные данные. Построить вариационный, статистический, группированный ряды. Построить гистограмму, полигон, кумуляту, огиву. Определить относительные частоты последовательности. Определить: среднее арифметическое (по вариационному ряду), средневзвешенное (по группированному ряду), моду, медиану, дисперсию (по группированному ряду); среднее квадратическое отклонение, коэффициент вариации. Рассчитать в программе Excel характеристики описательной статистики для заданной последовательности случайных величин. Исходные данные В качестве исходных данных принята (назначить самостоятельно числовые характеристики из нефтегазовой сферы или в соответствии с вариантом задания, которые приведены в файле с заданиями) (табл. 1.1). Таблица 1.1- Коэффициент пористости, m
Средствами программы Excel рассчитаны характеристики описательной статистики заданной последовательности значений случайной величины (в качестве исходных данных необходимо применять данные таблицы 1.1), числовые значения которых приведены на рисунке 1.1. Применение Excel для решения статистических задач. Файл ---> параметры ---> надстройки ---> пакет анализа Анализ данных появляется во вкладке данные. Выбираем из списка «анализ данных» пункт «описательная статистика». Результатом будет появление диалогового окна инструмента «описательная статистика». Заполняем поля диалогового окна. Результатом выполнения указанных действий будет формирование отдельного листа, содержащего вычисленные характеристики описательной статистики, для исследуемых данных.
Рисунок 1.1 – Характеристики описательной статистики случайной величины Вариационный ряд Вариационный ряд – последовательность, полученная в результате расположения в порядке не убывания исходной последовательности независимых одинаково распределённых случайных величин Для заданной последовательности случайных величин вариационный ряд показан в таблице 1.2. Таблица 1.2- Вариационный ряд
Характеристики вариационного ряда: максимальное значение ряда Хmax = 24,7; минимальное значение ряда Xmin = 13; размах ряда определяется по формуле: R = Xmax – Xmin = 24,7-13 = 11,7. Характеристики статистических рядов Статистический ряд - это упорядоченный ряд распределения единиц совокупности на группы по определённому варьирующему признаку. Он характеризует состав изучаемого явления, позволяет судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. Группированный статистический ряд Группированный статистический ряд - это упорядоченная совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины. Группированный статистический ряд для заданных исходных данных приведен в табл. 1.3. Таблица 1.3 - Группированный статистический ряд
Графическое представление статистических характеристик группированного ряда Гистограмма для группированного ряда. Гистограмма - это функция, приближающая плотность вероятности некоторого распределения, построенная на основе выборки из него. Гистограмма по заданным значениям группированного ряда показана на рисунке 1.2. Рисунок 1.2 - Гистограмма для группированного ряда Полигон для группированного ряда Полигон – это график, который представляет собой ломаную, соединяющую точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов; предназначен для представления плотности вероятности случайной величины. Полигон для группированного ряда показан на рисунке 1.3. Рисунок 1.3 – Полигон для группированного ряда Кумулята для группированного ряда. Кумулята – это график распределения накопленных частот для порядковых и количественных переменных; имеет вид возрастающей ломаной линии. Кумулята для группированного показан на рисунке 1.4. Рисунок 1.4 – Кумулята для группированного ряда Огива для группированного ряда. Огива – это график, представляющий собой кривую накопленных частот. Огива для группированного ряда показана на рисунке 1.5. Рисунок 1.5 – Огива для группированного ряда Статистические характеристики группированного ряда Объем выборки группированного ряда. Объем выборки – это сумма всех частот повторений. Объём выборки определяется по формуле: N= Σni Где: n- объем выборки ni- частота повторений . При заданных значениях ряда получим: N= 5+5+5+5+5+5+5+5+5+5= 50, При заданных значениях группированного ряда получим: N=50, Относительная частота. Относительна частота - это отношения частот ni к объему выборки n . Относительна частота определяется по формуле: W = ni/n, где ni – частота повторений, n - объем выборки. Для первого значения ряда получим: W = 5/50= 0, 1, При этом ∑ni = n = 5+5+5+5+5=50 Значения относительных частот приведены в таблице 1.4. Таблица 1.4 - Относительные частоты для группированного ряда
Среднее арифметическое группированного ряда. Среднее арифметическое ряда - это сумма всех зафиксированных значений, делённая на их количество. Среднее арифметическое ряда определяется по формуле: Xср= (Σxi*ni)/N, где Xср – среднее арифметическое, Σxi - сумма коэффициентов пористости, ni – частота повторений, N – Общее количество значений коэффициента пористости. Для заданных исходных данных получим: Xср = ((13+14,5+16,5+18+19,5+20,7+21,6+22,7+24+24,7)*5)/50 = 19,52 Средневзвешенное группированного ряда. Средневзвешенное значение статистического ряда – это сумма всех зафиксированных значений, делённая на сумму частот повторения. Средневзвешенное значение статистического ряда определяется по формуле: Xсв=(Σxi* ni)/ Σn. где Xсв - Средневзвешенное значение, Σxi - сумма коэффициентов пористости, Σn – сумма частот повторения. Для заданных исходных данных получим: Xсв= ((13+14,5+16,5+18+19,5+20,7+21,6+22,7+24+24,7)*5)/ (5+5+5+5+5+5+5+5+5+5) = 976/50 = 19,52, Мода группированного ряда Мода – это значение случайной величины, при котором частота повторения этого значения является наибольшей. Мода для группированного ряда и для заданного ряда случайных величин имеет значение: M = 24, 7. Медиана группированного ряда. Выборочной медианой те называется варианта (элемент выборки), которая делит пополам вариационный ряд на две части с одинаковым числом вариант в каждой. Медиана (m0,5) – это значение СВ, которое делит вариационный ряд или площадь, ограниченную кривой распределения, на две равные части. Другими словами – это значение, ниже которого находятся 50% значений, и выше также 50% всех значений в распределении. Медиана для группированного ряда рассчитывается по формуле: Me = xе + i/ƒMe *(n/2 - ƒMe -1), Где Me – медиана xе – нижняя граница интервала, в котором находиться медиана, n – Число наблюдений, ƒMe – частота в медианном интервале, ƒMe -1 – накопленная частота в интервале, предшествующем медиан ному, i – Величина интервала. Но, если совокупность всех наблюдений содержит четное количество чисел, соответственно берем из группированного статистического ряда пятое, и шестое значение, суммируем их и делим на два: Mе = (x5+ x6)/2 При заданных значениях получим: Me = (19,5 + 20,7)/2 = 20,1 , Дисперсия группированного ряда. Дисперсия – это среднее арифметическое значение квадратов отклонений отдельных вариант от их средней арифметической. Дисперсия может быть рассчитана по формуле: D = Σ (xi – )2/n-1 где D – дисперсия, n – количество в интервале, xi –сумма коэффициентов пористости. Данные для расчета дисперсии для других групп ряда приведены в таблице 1.5. Таблица 1.5 – Данные для расчета дисперсии ряда
Тогда дисперсия для группированного ряда определится так: D = ((13-19,52)²*5+(14,5 -19,52)²*5+(16,5-19,52)²*5+ +(18 -19,52)²*5+(19,5-19,52)²*5+(20,7-19,52)²*5+(21,6-19,52)²*5+(22,7 -19,52)²*5+(24 -19,52)²*5+(24,7-19,52)2)/50-1 = ((42,51)*5+(25,2)*5+(9,12)*5+(2,31)*5(0,0004)*5+(1,39)*5+(4,32)*5+(10,11)*5+(20,07)*5+(26,83)*5)/49 = (212,55+126+45,6+11,5+0,002+6,95+21,6+50,55+100,35+134,15)/49 = 709,252/49 = 14,474 . Среднее квадратическое отклонение группированного ряда. Среднее квадратическое отклонение – это значение корня квадратного из дисперсии. Среднее квадратическое отклонение рассчитывается по формуле: = где D – дисперсия ряда, σ - среднее квадратическое отклонение ряда. n – объем выборки. Для заданных исходных данных получим: σ = = 3,80. Коэффициент вариации группированного ряда Коэффициент вариации – это отношение среднего квадратического отклонения к среднему значению СВ, выраженное в процентах. Коэффициент вариации определяется по формуле: где σ - среднее квадратическое отклонение ряда. - Среднее арифметическое, - Коэффициент вариации Для заданных исходных данных получим: = (3,80/19,52)*100 =19 %. По полученному коэффициенту вариации, установлен класс точности 3 Средствами программы Excel рассчитаны характеристики описательной статистики группированного ряда (в качестве исходных данных необходимо применять данные таблицы 1.3), числовые значения которых приведены на рисунке 1.6.
Рисунок 1.6 – Характеристики описательной статистики Вывод : Сравним расчетные значения, выполненных вручную и выполненной с помощью ПК.
Интервальный статистический ряд Интервальный ряд – содержит в качестве значений интервалы (могут быть Равными или неравными) и частоты значений, попадающих в этот интервал . Для построения интервального ряда примем количество интервалов t = 10 Ширина интервалов определяется по формуле: rt = (xmax-xmin) /10, где - xi – числовые значения, rt – ширина интервалов. При заданных исходных данных получим: rt = (24,7-13)/10 = 1,17 В таблице 1.6 показаны значения границ интервалов и средние значения величин каждого интервала. Таблица 1.6 – Значения границ интервалов
Интервальный ряд представлен в таблице 1.7. Таблица 1.7 - Интервальный ряд
Графическое представление статистических характеристик ряда Гистограмма интервального ряда. Гистограмма по средним значениям интервального ряда показана на рисунке 1.7. Полигон интервального ряда. Полигон для интервального ряда показан на рис. 1.8 Кумулята интервального ряда. Кумулята для интервального ряда показан на рисунке 1.9. Огива интервального ряда. Огива для интервального ряда показана на рисунке 1.10. Рисунок 1.7 - Гистограмма для интервального ряда Рисунок 1.8 – Полигон для интервального ряда Рисунок 1.9 – Кумулята для группированного ряда Рисунок 1.10 – Огива для интервального ряда Статистические характеристики интервального ряда. Объем выборки интервального ряда. При заданных значениях интервального ряда получим объём выборки: N= Σni = 5+5+5+5+5+5+5+5+5+5 = 50, Относительная частота интервального ряда. Для первого значения интервального ряда получим: W = ni/n .= 5/50 = 0.1, Значения относительных частот приведены в таблице 1.8. Таблица 1.8- Относительные частоты для группированного ряда
Среднее арифметическое интервального ряда. Для заданных исходных данных получим: Xср= (Σxi*ni)/N= ((13,85+14,75+15,92,17,09+18,26+19,43+20,60+21,77+22,94+ +24,10)*5)/50 = 18,871. Средневзвешенное интервального ряда. Для заданных исходных данных получим: Xсв = (Σxi* ni)/ Σn = = ((13,85+14,75+15,92,17,09+18,26+19,43+20,60+21,77+22,94+ +24,10)*5)/ /(5+5+0+0+5+5+5+10+5+10) = 943,55/50 =18,871. Мода интервального ряда. Мода для интервального ряда и для заданного ряда случайных величин имеет значение: M = 13,85, 14,75, 15,92, 17,09, 18,26, 19,43, 20,6, 21,77, 22,94, 24,1. Медиана интервального ряда. Медиана для интервального ряда имеет значение: Me = (x5+ x6)/2 = (18,26 + 19,43)/2 = 18,845. Дисперсия интервального ряда. Расчетные значения дисперсии для группированного ряда приведены в таблице 1.9. Таблица 1.9 – Расчет дисперсии ряда
Тогда дисперсия для интервального ряда примет значение: D = ((13,85-18,871)²*5+(14,75 -18,871)²*5+(15,92-18,871)²*0+ +(17,09 -18,871)²*0+(18,26-18,871)²*5+(19,43-18,871)²*5+(20,6-18,871)²*5+(21,77 -18,871)²*10+(22,94 -18,871)²*5+(24,1-18,871)2*10)/50-1 = =669,5919/49 = 13,665. Среднее квадратическое отклонение интервального ряда Для заданных исходных данных получим: = . Коэффициент вариации интервального ряда Для заданных исходных данных получим: δ = = 3,69. Характеристики описательной статистики интервального ряда. Средствами программы Excel рассчитаны характеристики описательной статистики заданного ряда (для корректного расчета данных характеристик необходимо построить полный интервальный ряд для средних значений случайной величины в табл. 1.10). Таблица 1. 10- Полный интервальный ряд
Числовые значения, рассчитанные в программе Excel, приведены на рисунке 1.11.
Рисунок 1.11 – Характеристики описательной статистики Вывод. Сравним расчетные значения, выполненных вручную и выполненной с помощью ПК.
2.1 Статистический анализ двумерной последовательности случайных величин 1 2 |