Лаба_1. санктпетербургский горный университет
Скачать 141.69 Kb.
|
ПЕРВОЕ ВЫСШЕЕ ТЕХНИЧЕСКОЕ УЧЕБНОЕ ЗАВЕДЕНИЕ РОССИИ МИНИСТЕРСТВО науки и высшего ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ федеральное государственное бюджетное образовательное учреждение высшего образования «САНКТ-ПЕТЕРБУРГСКИЙ ГОРНЫЙ УНИВЕРСИТЕТ» Кафедра транспорта и хранения нефти и газа Практическая работа 1 Вариационные ряды и их характеристики. Предварительный анализ статистических данных По дисциплине Математические методы анализа процессов транспорта и хранения углеводородов (наименование учебной дисциплины согласно учебному плану) Выполнил: студент гр. ТНГ-18 Пунченко Г.С. (шифр группы) (подпись) (Ф.И.О.) Проверил руководитель работы: Доцент Иваник С.А. (должность) (подпись) (Ф.И.О.) Санкт-Петербург 2021 1 Цель работыОсвоить способы построения рядов распределения и методики расчета основных характеристик случайной величины статистического распределения. 2 Основные теоретические сведенияСлучайная величина – величина, которая принимает то или иное значение, заранее неизвестное Генеральная совокупность – полный набор всех значений, которая принимает значение случайной величины. Выборка – часть генеральной совокупности, выделенная для оценки характеристик случайной величины. Объем – число значений случайной величины, входящей в выборку. Варианты – различные элементы выборки. Вариационный ряд – ряд вариант, расположенный в порядке возрастания. Размах – диапазон изменения признака. Частота – количество элементов в интервале. Частость – относительная частота – отношение частоты к объему выборки. Интервальный ряд распределения – ряд распределения единиц по признаку, заключенному в интервалы, с указанием частот в каждом интервале. Гистограмма – график интервального распределения ряда. Дисперсия – среднее арифметическое значение квадратов отклонений вариант от их средней арифметической. Мода – значение варианты с наибольшей частотой. Медиана – варианта, которая делит вариационный ряд пополам по числу вариант. Закон распределения – математическое соотношение, связывающее случайную величину и вероятность. Доверительная вероятность – вероятность того, что действительное значение измеряемой величины лежит в пределах доверительного интервала. Число степеней свободны – число независимых измерений за вычетом числа связей, которые наложены на эти измерения. Коэффициент вариации – это отношение среднего квадратичного отклонения к среднему значению случайной величины, выраженное в процентах Оценка коэффициента асимметрии As характеризует симметричность распределения относительно среднего . Оценка эксцесса Ex – мера островершинности распределения по сравнению с нормальным распределением. Если то вершина более острая, а если , то более плоская, чем у нормального распределения. У нормального распределения . Размах варьирования признака: , (1) где – вариант с наибольшим значением, – вариант с наименьшим значением. Определение количества интервалов (формула Стерджеса): . (2) где – объем выборки, Длина интервала разбиения: . (3) Отношение частоты ni к объему n выборки называют относительной частотой (частостью) варианты хi : , (4) где ni – частота; n – объем выборки. Среднее арифметическое значение случайной величины : , (6) Вычисление дисперсии D: , (7) где – значение случайной величины в середине i-го интервала. Выборочное среднее квадратичное отклонение: . (8) Коэффициент вариации ν: . (9) Формула для вычисления моды: , (10) где – нижняя граница модального интервала, т.е. интервала, имеющего наибольшую частоту; – частота модального интервала; – частота интервала, предшествующего модальному интервалу; – частота интервала, следующего за модальным интервалом. При нечетном объеме выборки медиана определяется по формуле 11: , (11) где - средний член упорядоченного ряда значений. При четном объеме выборки медиана определяется по формуле 12: , (12) где – варианта, которая находится слева от середины вариационного ряда, а – справа от нее. Оценка коэффициента асимметрии As: . (13) Оценка эксцесса Ex: . (14) Нормальный закон распределения выполняется, если справедливы два условия: (15) , (16) где σАи σЕ – соответственно среднеквадратическое отклонение ассиметрии и эксцесса нормального закона распределения, которые можно определить по формулам 17-18: (17) . (18) Если среднее взвешенное значение , найденное по результатам анализа выборки объемом n, является точечной оценкой математического ожидания , то чем меньше разность , тем точнее оценка. Точность этой оценки можно выразить неравенством: , (19) где величина Δ, являющаяся пределом, который с определенной вероятностью не превосходит разность и называется предельной ошибкой выборки. Вероятность того, что действительное значение измеряемой величины лежит в пределах от до , представляет собой доверительную вероятность Р, определяемую по формуле 20: , (20) где – доверительная вероятность (статистическая надежность), в технике принимается равной 0,9-0,95 (90-95%); α – уровень значимости, для надежности, равной 0,9 и 0,95, соответствуют уровни значимости 0,1 (10%) и 0,05 (5%), соответственно; – математическое ожидание (или истинное значение случайной величины). Интервал ; , который с заданной доверительной вероятностью или надёжностью покрывает оцениваемый параметр, называется доверительным интервалом. Таким образом, зная предельную ошибку выборки Δ, можно определить доверительный интервал, в котором заключена генеральная средняя, из неравенства 19: . (21) Предельную ошибку выборки определяют по формуле 22: , (22) где – коэффициент Стьюдента, зависящий от принятого уровня значимости α и числа степеней свободы m. Число степеней свободы вычисляется по формуле: , (23) С помощью математической аппроксимации табличных данных удалось получить формулы для расчета значений коэффициента Стьюдента. При α=0,05 определяем по формуле 22: . (24) При α=0,1 определяем по формуле 23: . (25) При объеме выборки n>50 для отбраковки резко выделяющихся замеров можно использовать правило «трех сигм»: вероятность попадания случайной величины в интервал 26: до (26) 3 Исходные данныеВариант 28. 4 Обработка экспериментальных данныхОбъем выборки n = 51. Запишем ряд чисел в порядке возрастания и определим размах по формуле 1: . По формуле 2 найдём количество интервалов : . Округляя в большую сторону, получим k=7. По формуле 3 определяем шаг h: . Найдем границы интервалов, частоту ni и частость mi по формуле 4 и внесем данные в таблицу 1: Таблица 1 Интервальный вариационный ряд
Построим гистограмму распределения и полигон рассеивания случайной величины (рисунок 1). Рисунок 1 – Гистограмма распределения и полигон рассеивания случайной величины Данная выборка является большой, поэтому для нахождения среднего арифметического нужно использовать формулу 6: . По формулам 7 и 8 найдем дисперсиюDи среднее квадратичное отклонение σ: ; . Теперь произведём отбраковку резко выделяющихся результатов по правилу «трёх сигм» (26): 27,944 до Из полученного интервала можно сделать вывод, что все числа выборки прошли отбраковку и пересчёта делать не нужно. По формуле 9 найдём коэффициент вариации ν: . Из полученного коэффициента вариации можно сделать вывод, что разброс данных выборки небольшой и данные значения можно отнести к инструментальным лабораторным исследованиям. По формуле 10 определяется значение моды m0: . По формуле 11 находится медианна: . Вычисление коэффициента асимметрии As выполняется по формуле 13: . Из полученного коэффициента асимметрии можно сделать вывод, что асимметрия левосторонняя. Вычисление эксцесса Ex производится по формуле 14: . Из полученного коэффициента эксцесса делаем вывод, что вершина более плоская, чем у нормального распределения. Определим среднеквадратические отклонения σА и σЕ по формулам 17-18 для проверки на соответствие нормальному закону распределения по условиям 15-16: , , Неравенства верны, значит выборка подчиняется нормальному закону распределения. Число степеней свободы по формуле 23: . Теперь определим критерий Стьюдента при уровне значимости равной 10% и 5% по формулам 24 и 25: при α=0,05: ; при α=0,1: . Предельную ошибка выборки определятся по формуле 22: . Доверительный интервал по формуле 21 будет следующим: При 95% доверительной вероятности доверительный интервал получился шире на одно значение, чем при 90%. 5 ВыводВ ходе выполнения работы освоены способы построения рядов распределения и методики расчёта основных характеристик случайной величины статистического распределения. Предложенная выборка подчиняется нормальному закону распределения. |