Главная страница

Стат анализ 40 вариант. стат анализ 40 вариант. Статистический анализ и планирование эксперимента макет отчета по контрольной работе для обучающихся по заочно форме обучения


Скачать 1.19 Mb.
НазваниеСтатистический анализ и планирование эксперимента макет отчета по контрольной работе для обучающихся по заочно форме обучения
АнкорСтат анализ 40 вариант
Дата30.01.2022
Размер1.19 Mb.
Формат файлаdocx
Имя файластат анализ 40 вариант.docx
ТипОтчет
#346033
страница1 из 2
  1   2

Министерство науки и высшего образования Российской Федерации

ФГБОУ ВПО

«Иркутский государственный технический университет»
Институт недропользования
Кафедра Нефтегазового дела


СТАТИСТИЧЕСКИЙ АНАЛИЗ И ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
Макет отчета по контрольной работе

для обучающихся по заочно форме обучения

Выполнил: ст.гр.НДДбз-18-3 Башуров А.С.


Проверил : к.т.н , доцент Шмаков А.К.



Иркутск

2021 г.
ВВЕДЕНИЕ
Настоящий макет предназначен для помощи обучающимся по программе дисциплины «Статистический анализ и планирование эксперимента» при выполнении контрольной работы.

Данный мает применяется следующим образом.

Текст макета принимается за основу.

В свободные места текста, обозначенные различным образом, необходимо внести результаты выполнения контрольной работы в соответствии с индивидуальным заданием.
1 СТАТИСТИЧЕСКИЙ АНАЛИЗ СЛУЧАЙНЫХ ВЕЛИЧИН
1.1. Статистический анализ одномерной последовательности случайных величин
Цель работы: приобрести компетенции статистического анализа одномерной последовательности случайных величин.
Задание:

  1. Подготовить исходные данные.

  2. Построить вариационный, статистический, группированный ряды.

  3. Построить гистограмму, полигон, кумуляту, огиву.

  4. Определить относительные частоты последовательности.

  5. Определить: среднее арифметическое (по вариационному ряду), средневзвешенное (по группированному ряду), моду, медиану, дисперсию (по группированному ряду); среднее квадратическое отклонение, коэффициент вариации.

  6. Рассчитать в программе Excel характеристики описательной статистики для заданной последовательности случайных величин.




  1. Исходные данные


В качестве исходных данных принята (назначить самостоятельно числовые характеристики из нефтегазовой сферы или в соответствии с вариантом задания, которые приведены в файле с заданиями) (табл. 1.1).
Таблица 1.1- Коэффициент пористости, m

19,5

22,7

19,5

22,7

19,5

22,7

19,5

22,7

19,5

22,7

24,7

14,5

24,7

14,5

24,7

14,5

24,7

14,5

24,7

14,5

18

21,6

18

21,6

18

21,6

18

21,6

18

21,6

24

20,7

24

20,7

24

20,7

24

20,7

24

20,7

16,5

13

16,5

13

16,5

13

16,5

13

16,5

13


Средствами программы Excel рассчитаны характеристики описательной статистики заданной последовательности значений случайной величины (в качестве исходных данных необходимо применять данные таблицы 1.1), числовые значения которых приведены на рисунке 1.1.
Применение Excel для решения статистических задач.

Файл ---> параметры ---> надстройки ---> пакет анализа

Анализ данных появляется во вкладке данные.

Выбираем из списка «анализ данных» пункт «описательная статистика».

Результатом будет появление диалогового окна инструмента «описательная статистика».

Заполняем поля диалогового окна.

Результатом выполнения указанных действий будет формирование отдельного листа, содержащего вычисленные характеристики описательной статистики, для исследуемых данных.


Среднее

19,52040816

Стандартная ошибка

0,549187554

Медиана

20,7

Мода

24,7

Стандартное отклонение

3,844312877

Дисперсия выборки

14,7787415

Эксцесс

-1,155883366

Асимметричность

-0,311947341

Интервал

11,7

Минимум

13

Максимум

24,7

Сумма

956,5

Счет

49

Наибольший(1)

24,7

Наименьший(1)

13


Рисунок 1.1 – Характеристики описательной статистики случайной величины


  1. Вариационный ряд


Вариационный ряд – последовательность, полученная в результате расположения в порядке не убывания исходной последовательности независимых одинаково распределённых случайных величин

Для заданной последовательности случайных величин вариационный ряд показан в таблице 1.2.
Таблица 1.2- Вариационный ряд


13

14,5

16,5

18

19,5

20,7

21,6

22,7

24

24,7

13

14,5

16,5

18

19,5

20,7

21,6

22,7

24

24,7

13

14,5

16,5

18

19,5

20,7

21,6

22,7

24

24,7

13

14,5

16,5

18

19,5

20,7

21,6

22,7

24

24,7

13

14,5

16,5

18

19,5

20,7

21,6

22,7

24

24,7



Характеристики вариационного ряда:

  • максимальное значение ряда Хmax = 24,7;

  • минимальное значение ряда Xmin = 13;

  • размах ряда определяется по формуле:


R = Xmax – Xmin = 24,7-13 = 11,7.


  1. Характеристики статистических рядов


Статистический ряд - это упорядоченный ряд распределения единиц совокупности на группы по определённому варьирующему признаку. Он характеризует состав изучаемого явления, позволяет судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.


    1. Группированный статистический ряд


Группированный статистический ряд - это упорядоченная совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины.
Группированный статистический ряд для заданных исходных данных приведен в табл. 1.3.

Таблица 1.3 - Группированный статистический ряд

_________Хi_______

__________ni________

13

5

14,5

5

16,5

5

18

5

19,5

5

20,7

5

21,6

5

22,7

5

24

5

24,7

5


Графическое представление статистических характеристик группированного ряда
Гистограмма для группированного ряда.

Гистограмма - это функция, приближающая плотность вероятности некоторого распределения, построенная на основе выборки из него.

Гистограмма по заданным значениям группированного ряда показана на рисунке 1.2.



Рисунок 1.2 - Гистограмма для группированного ряда
Полигон для группированного ряда

Полигон – это график, который представляет собой ломаную, соединяющую точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов; предназначен для представления плотности вероятности случайной величины.

Полигон для группированного ряда показан на рисунке 1.3.


Рисунок 1.3 – Полигон для группированного ряда
Кумулята для группированного ряда.

Кумулята – это график распределения накопленных частот для порядковых и количественных переменных; имеет вид возрастающей ломаной линии.

Кумулята для группированного показан на рисунке 1.4.


Рисунок 1.4 – Кумулята для группированного ряда
Огива для группированного ряда.

Огива – это график, представляющий собой кривую накопленных частот.

Огива для группированного ряда показана на рисунке 1.5.




Рисунок 1.5 – Огива для группированного ряда

Статистические характеристики группированного ряда
Объем выборки группированного ряда.

Объем выборки – это сумма всех частот повторений.

Объём выборки определяется по формуле:
N= Σni 

Где: n- объем выборки
ni- частота повторений .

При заданных значениях ряда получим:

N= 5+5+5+5+5+5+5+5+5+5= 50,

При заданных значениях группированного ряда получим: N=50,
Относительная частота.

Относительна частота - это отношения частот n к объему выборки n .

Относительна частота определяется по формуле:
W =  ni/n,

где n– частота повторений,

n - объем выборки.



Для первого значения ряда получим:
W = 5/50= 0, 1,

При этом ∑ni = n = 5+5+5+5+5=50

Значения относительных частот приведены в таблице 1.4.
Таблица 1.4 - Относительные частоты для группированного ряда

Частота повторений

Сумма n

Относительная частота W

Сумма относительной частоты

5

50

0,1

1

5

0,1

5

0,1

5

0,1

5

0,1

5

0,1

5

0,1

5

0,1

5

0,1

5

0,1


Среднее арифметическое группированного ряда.

Среднее арифметическое ряда - это сумма всех зафиксированных значений, делённая на их количество.

Среднее арифметическое ряда определяется по формуле:
Xср= (Σxi*ni)/N,

где Xср – среднее арифметическое,

Σxi - сумма коэффициентов пористости,

niчастота повторений,

N – Общее количество значений коэффициента пористости.


Для заданных исходных данных получим:
Xср = ((13+14,5+16,5+18+19,5+20,7+21,6+22,7+24+24,7)*5)/50 = 19,52
Средневзвешенное группированного ряда.

Средневзвешенное значение статистического ряда – это сумма всех зафиксированных значений, делённая на сумму частот повторения.

Средневзвешенное значение статистического ряда определяется по формуле:

Xсв=(Σxi* ni)/ Σn.

где Xсв - Средневзвешенное значение,

Σxi - сумма коэффициентов пористости,

Σn – сумма частот повторения.

Для заданных исходных данных получим:
Xсв= ((13+14,5+16,5+18+19,5+20,7+21,6+22,7+24+24,7)*5)/

(5+5+5+5+5+5+5+5+5+5) = 976/50 = 19,52,
Мода группированного ряда

Мода – это значение случайной величины, при котором частота повторения этого значения является наибольшей.

Мода для группированного ряда и для заданного ряда случайных величин имеет значение:
M = 24, 7.
Медиана группированного ряда.

Выборочной медианой те называется варианта (элемент выборки), которая делит пополам вариационный ряд на две части с одинаковым числом вариант в каждой.

Медиана (m0,5) – это значение СВ, которое делит вариационный ряд или площадь, ограниченную кривой распределения, на две равные части.

Другими словами – это значение, ниже которого находятся 50% значений, и выше также 50% всех значений в распределении.
Медиана для группированного ряда рассчитывается по формуле:
Me = xе + i/ƒMe *(n/2 - ƒMe -1),
Где Me – медиана

xе – нижняя граница интервала, в котором находиться медиана,

n – Число наблюдений,

ƒMe – частота в медианном интервале,

ƒMe -1 – накопленная частота в интервале, предшествующем медиан

ному,

i – Величина интервала.
Но, если совокупность всех наблюдений содержит четное количество чисел, соответственно берем из группированного статистического ряда пятое, и шестое значение, суммируем их и делим на два:

Mе = (x5+ x6)/2

При заданных значениях получим:
Me = (19,5 + 20,7)/2 = 20,1 ,

Дисперсия группированного ряда.

Дисперсия – это среднее арифметическое значение квадратов отклонений отдельных вариант от их средней арифметической.

Дисперсия может быть рассчитана по формуле:
D = Σ (xi )2/n-1
где D – дисперсия,

n – количество в интервале,

xi –сумма коэффициентов пористости.

Данные для расчета дисперсии для других групп ряда приведены в таблице 1.5.

Таблица 1.5 – Данные для расчета дисперсии ряда

Номер группировки ряда

Значения СВ, Хi

Частоты ni

Среднее арифметическое

(xi-xср)2*nt

1/(n-1)

1

13

5

19,52

19,52

19,52

19,52

19,52

19,52

19,52

19,52

19,52

19,52

212,55

0,02

0,02

0,02

0,02

0,02

0,02

0,02

0,02

0,02

0,02

2

14,5

5

126

3

16,5

5

45,6

4

18

5

11,5

5

19,5

5

0,002

6

20,7

5

6,95

7

21,6

5

21,6

8

22,7

5

50,55

9

24

5

100,35

10

24,7

5

134,15


Тогда дисперсия для группированного ряда определится так:
D = ((13-19,52)²*5+(14,5 -19,52)²*5+(16,5-19,52)²*5+

+(18 -19,52)²*5+(19,5-19,52)²*5+(20,7-19,52)²*5+(21,6-19,52)²*5+(22,7 -19,52)²*5+(24 -19,52)²*5+(24,7-19,52)2)/50-1 = ((42,51)*5+(25,2)*5+(9,12)*5+(2,31)*5(0,0004)*5+(1,39)*5+(4,32)*5+(10,11)*5+(20,07)*5+(26,83)*5)/49 = (212,55+126+45,6+11,5+0,002+6,95+21,6+50,55+100,35+134,15)/49 = 709,252/49 = 14,474 .


Среднее квадратическое отклонение группированного ряда.

Среднее квадратическое отклонение – это значение корня квадратного из дисперсии.

Среднее квадратическое отклонение рассчитывается по формуле:
=
где D – дисперсия ряда,

σ - среднее квадратическое отклонение ряда.

n – объем выборки.

Для заданных исходных данных получим:
σ = = 3,80.
Коэффициент вариации группированного ряда

Коэффициент вариации – это отношение среднего квадратического отклонения к среднему значению СВ, выраженное в процентах.
Коэффициент вариации определяется по формуле:

где σ - среднее квадратическое отклонение ряда.

- Среднее арифметическое,

- Коэффициент вариации

Для заданных исходных данных получим:
= (3,80/19,52)*100 =19 %.
По полученному коэффициенту вариации, установлен класс точности 3
Средствами программы Excel рассчитаны характеристики описательной статистики группированного ряда (в качестве исходных данных необходимо применять данные таблицы 1.3), числовые значения которых приведены на рисунке 1.6.



Среднее

19,52040816

Стандартная ошибка

0,549187554

Медиана

20,7

Мода

24,7

Стандартное отклонение

3,844312877

Дисперсия выборки

14,7787415

Эксцесс

-1,155883366

Асимметричность

-0,311947341

Интервал

11,7

Минимум

13

Максимум

24,7

Сумма

956,5

Счет

49

Наибольший(1)

24,7

Наименьший(1)

13



Рисунок 1.6 – Характеристики описательной статистики
Вывод : Сравним расчетные значения, выполненных вручную и выполненной с помощью ПК.

Наименование значений

пк

Расчеты вручную

среднее

19,52

19,52

медиана

20,7

20,1

мода

24,7

24,7

Стандартное отклонение

3,8

3,8

Дисперсия выборки

14,7

14,4

Максимальное значение

24,7

24,7

Минимальное значение

13

13



    1. Интервальный статистический ряд


Интервальный ряд – содержит в качестве значений интервалы (могут быть

Равными или неравными) и частоты значений, попадающих в этот интервал

.

Для построения интервального ряда примем количество интервалов
t = 10
Ширина интервалов определяется по формуле:
rt = (xmax-xmin) /10,
где - xiчисловые значения,

rtширина интервалов.

При заданных исходных данных получим:

rt = (24,7-13)/10 = 1,17
В таблице 1.6 показаны значения границ интервалов и средние значения величин каждого интервала.
Таблица 1.6 – Значения границ интервалов

Номер интервала, t

Значение левой границе интервала

Значение правой границе интервала

Среднее значение случайной величины в интервале

1

13

14.17

13.85

2

14.17

15.34

14.75

3

15.34

16.51

15.92

4

16.51

17.68

17.09

5

17.68

18.85

18.26

6

18.85

20.02

19.43

7

20.02

21.19

20.6

8

21.19

22.36

21.77

9

22.36

23.53

22.94

10

23.53

24.7

24.1

Интервальный ряд представлен в таблице 1.7.
Таблица 1.7 - Интервальный ряд

Номер интервала

Среднее значение xi

Частоты попадания в интервал

Накопленная частота

1

13.85

5

5

2

14.75

5

10

3

15.92

0

10

4

17.09

0

10

5

18.26

5

15

6

19.43

5

20

7

20.6

5

25

8

21.77

10

35

9

22.94

5

40

10

24.1

10

50


Графическое представление статистических характеристик ряда
Гистограмма интервального ряда.

Гистограмма по средним значениям интервального ряда показана на рисунке 1.7.
Полигон интервального ряда.

Полигон для интервального ряда показан на рис. 1.8
Кумулята интервального ряда.

Кумулята для интервального ряда показан на рисунке 1.9.
Огива интервального ряда.

Огива для интервального ряда показана на рисунке 1.10.


Рисунок 1.7 - Гистограмма для интервального ряда


Рисунок 1.8 – Полигон для интервального ряда


Рисунок 1.9 – Кумулята для группированного ряда


Рисунок 1.10 – Огива для интервального ряда

Статистические характеристики интервального ряда.
Объем выборки интервального ряда.

При заданных значениях интервального ряда получим объём выборки:
N= Σni  = 5+5+5+5+5+5+5+5+5+5 = 50,
Относительная частота интервального ряда.

Для первого значения интервального ряда получим:
W = ni/n .= 5/50 = 0.1,
Значения относительных частот приведены в таблице 1.8.
Таблица 1.8- Относительные частоты для группированного ряда

Частота

Сумма n

Относительная частота W

Сумма относительной частоты

5

50

0.1

1

5

0.1

5

0.1

5

0.1

5

0.1

5

0.1

5

0.1

5

0.1

5

0.1

5

0.1



Среднее арифметическое интервального ряда.

Для заданных исходных данных получим:
Xср= (Σxi*ni)/N=

((13,85+14,75+15,92,17,09+18,26+19,43+20,60+21,77+22,94+

+24,10)*5)/50 = 18,871.
Средневзвешенное интервального ряда.

Для заданных исходных данных получим:
Xсв = (Σxi* ni)/ Σn =

= ((13,85+14,75+15,92,17,09+18,26+19,43+20,60+21,77+22,94+

+24,10)*5)/

/(5+5+0+0+5+5+5+10+5+10) = 943,55/50 =18,871.

Мода интервального ряда.

Мода для интервального ряда и для заданного ряда случайных величин имеет значение:
M = 13,85, 14,75, 15,92, 17,09, 18,26, 19,43, 20,6, 21,77, 22,94, 24,1.
Медиана интервального ряда.

Медиана для интервального ряда имеет значение:
Me = (x5+ x6)/2 = (18,26 + 19,43)/2 = 18,845.

Дисперсия интервального ряда.

Расчетные значения дисперсии для группированного ряда приведены в таблице 1.9.
Таблица 1.9 – Расчет дисперсии ряда

Номер интервала

Среднее значение xt

Частоты ni

Среднее арифметическое

(xi-xср.ар)2*nt

1/(n-1)

1

13.85

5

18,871


126,05

0,25

0,25

-1

-1

0,25

0,25

0,25

0,11

0,25

0,11

2

14.75

5

84,91

3

15.92

0

0

4

17.09

0

0

5

18.26

5

1,866

6

19.43

5

1,562

7

20.6

5

14,947

8

21.77

10

84,042

9

22.94

5

82,783

10

24.1

10

273,424


Тогда дисперсия для интервального ряда примет значение:
D = ((13,85-18,871)²*5+(14,75 -18,871)²*5+(15,92-18,871)²*0+

+(17,09 -18,871)²*0+(18,26-18,871)²*5+(19,43-18,871)²*5+(20,6-18,871)²*5+(21,77 -18,871)²*10+(22,94 -18,871)²*5+(24,1-18,871)2*10)/50-1 = =669,5919/49 = 13,665.
Среднее квадратическое отклонение интервального ряда

Для заданных исходных данных получим:

= .
Коэффициент вариации интервального ряда

Для заданных исходных данных получим:

δ = = 3,69.

Характеристики описательной статистики интервального ряда.

Средствами программы Excel рассчитаны характеристики описательной статистики заданного ряда (для корректного расчета данных характеристик необходимо построить полный интервальный ряд для средних значений случайной величины в табл. 1.10).

Таблица 1. 10- Полный интервальный ряд

Численные средние значения интервального ряда

13.85

14.75

15.92

17.09

18.26

19.43

20.6

21.77

22.94

24.7





































Числовые значения, рассчитанные в программе Excel, приведены на рисунке 1.11.

Среднее

18,871

Стандартная ошибка

1,105803328

Медиана

18,845

Мода

#Н/Д

Стандартное отклонение

3,49685716

Дисперсия выборки

12,22801

Эксцесс

-1,257347464

Асимметричность

0,038676635

Интервал

10,25

Минимум

13,85

Максимум

24,1

Сумма

188,71

Счет

10

Наибольший(1)

24,1

Наименьший(1)

10

Уровень надежности(95,0%)

2,501500919


Рисунок 1.11 – Характеристики описательной статистики

Вывод. Сравним расчетные значения, выполненных вручную и выполненной с помощью ПК.

Наименование значений

пк

Расчеты вручную

среднее

18,871

18,871

медиана

18,845

18,845

мода

Н/Д

13,85,,,,24,10

Стандартное отклонение

3,49

3,69

Дисперсия выборки

12,228

13,665

Максимальное значение

24,10

24,10

Минимальное значение

10

10

2.1 Статистический анализ двумерной последовательности случайных величин
  1   2


написать администратору сайта