Главная страница

Стат анализ 40 вариант. стат анализ 40 вариант. Статистический анализ и планирование эксперимента макет отчета по контрольной работе для обучающихся по заочно форме обучения


Скачать 1.19 Mb.
НазваниеСтатистический анализ и планирование эксперимента макет отчета по контрольной работе для обучающихся по заочно форме обучения
АнкорСтат анализ 40 вариант
Дата30.01.2022
Размер1.19 Mb.
Формат файлаdocx
Имя файластат анализ 40 вариант.docx
ТипОтчет
#346033
страница2 из 2
1   2

Цель работы. Освоить компетенции выполнения статистического анализа двумерных данных, выявить зависимость (связь) между случайными величинами.


2.1.1 Исходные данные

В качестве исходных данных принято двух последовательных случайных величин:

первая – Коэффициент пористости, m;

вторая - Водонасыщенность на фронте,Sф%.

Исходные данные представлены в таблице 2.1.

Таблица 2.1 – Исходные данные

Название (обозначение) 1 случайной величины

Название (обозначение) 2 случайной величины 2




Название (обозначение) 1 случайной величины

Название (обозначение) 2 случайной величины

Коэффициент пористости, m

Водонасыщенность на фронте,Sф%

Коэффициент пористости, m

Водонасыщенность на фронте,Sф%

19,5

71,7

22,7

70,6

24,7

71,9

14,5

66,5

18

70,8

21,6

69,8

24

71,5

20,7

68,6

16,5

69,4

13

62,2

22,7

70,6

19,5

71,7

14,5

66,5

24,7

71,9

21,6

69,8

18

70,8

20,7

68,6

24

71,5

13

62,2

16,5

69,4

19,5

71,7

22,7

70,6

24,7

71,9

14,5

66,5

18

70,8

21,6

69,8

24

71,5

20,7

68,6

16,5

69,4

13

62,2

22,7

70,6

19,5

71,7

14,5

66,5

24,7

71,9

21,6

69,8

18

70,8

20,7

68,6

24

71,5

13

62,2

16,5

69,4

19,5

71,7

22,7

70,6

24,7

71,9

14,5

66,5

18

70,8

21,6

69,8

24

71,5

20,7

68,6

16,5

69,4

13

62,2

Примем:

в качестве аргумента Xi - Коэффициент пористости, m;;

в качестве функции Yi - Водонасыщенность на фронте,Sф%..
Взаимосвязь между двумя случайными величинами может быть оценена следующими методами:

  1. Визуальный метод

  2. Корреляционный анализ

  3. Регрессионный анализ




      1. Визуальный анализ


Визуальный метод –изучении зависимости между двумя переменными.
По данным таблицы 2.1 построен точечный график (рис. 2.1).


Рисунок 2.1 – Точечный график
Вывод: по точечной диаграмме визуально невозможно установить характер связи между заданными последовательностями случайных величин, поэтому необходимо выполнить корреляционный анализ.



      1. Корреляционный анализ


Корреляционная зависимость – является распространенной общей характеристикой двумерных данных в том же смысле, в каком среднее и стандартное отклонение являются важными характеристиками для анализа одномерного набора данных.

Корреляционный анализ выполнен с помощью пакета «Анализ данных» программы Excel, результаты которого показаны в таблице 2.2.

Таблица 2.2 - Результаты корреляционного анализа




Наименование первой характеристики, X

Наименование первой характеристики, Y

Наименование первой характеристики, X

1




Наименование первой характеристики, Y

0.800008816

1


Вывод: связь между значениями сильная. Характер связи положительный.


      1. Регрессионный анализ


Регрессионный анализ – определяет форму (вид) связи между этими переменными. Используется для прогнозирования одной переменной на основании другой (как правило, Y на основании X), или показывает, как можно управлять одной переменной с помощью другой.

Регрессионный анализ заданных последовательностей выполнен с помощью режима Регрессия пакета «Анализ данных» программы MS Excel. Сгенерируются результаты по регрессионной статистике, представленные в таблице 2.3.
Таблица 2.3- Результаты регрессионного анализа

ВЫВОД ИТОГОВ











































Регрессионная статистика

 



















Множественный R

0.800008816



















R-квадрат

0.640014106



















Нормированный R-квадрат

0.6325144



















Стандартная ошибка

2.306543199



















Наблюдения

50




















Дисперсионный анализ



















df

SS

MS

F

Значимость F







Регрессия

1

454.0132067

454.0132067

3.1772674590










Остаток

48

255.3667933

5.320141527













Итого

49

709.38

85.3385581














 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-54.17273973

7.983895249

-6.785251814

1.56975

-70.22543702

-38.12004244

-70.22543702

-38.12004244

Переменная X 1

1.063387298

0.115111528

9.237887101

3.17727

0.831940059

1.294834536

0.831940059

1.294834536


Рассчитанные в таблицах характеристики представляют собой: Стандартная ошибка регрессии (Standard Error of a regression ) показывает насколько велика ошибка предсказания значений переменной Y на основании значений Х.

Регрессия (лат. regressio — обратное движение) в статистике — статистическая зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин; введена Фрэнсисом Гальтоном (1886)

R-квадрат – это коэффициент линейной детерминации. Коэффициент является одной из наиболее эффективных оценок адекватности регрессионной R2модели, мерой качества уравнения регрессии в целом (или, как говорят, мерой качества подгонки регрессионной модели к наблюденным значениям.

Нормированный R-квадрат – скорректированный (адаптированный, поправленный) коэффициент детерминации.

Построение регрессионных моделей выполнено с помощью команды «Построение линии тренда» программы Excel.

На нижеприведенных рисунках (рис. 2.2 - 2.6 показаны различные регрессионные модели, описывающие связь между двумя заданными последовательностями случайных величин.


Рисунок 2.2 – Экспоненциальная модель



Рисунок 2.3 – Линейная модель


Рисунок 2.4 – Логарифмическая модель


Рисунок 2.5 – Полиномиальная модель



Рисунок 2.6 –Степенная модель
В таблице 2.4 показаны сводные данные по всем построенным моделям.
Таблица 2.4 - Сводные данные построенных регрессионных моделей



п/п

Наименование модели

Вид модели

Величина достоверности детерминации, R2

1

Экспоненциальная модель

y = 58,163e0.0089x

0.6347

2

Линейная модель

y = 0.6019x + 57,552

0.64

3

Логарифмическая модель

y=11,576ln(x)+ 35,135

0.6992

4

Полиномиальная модель

y = - 0,0899x2 + 4,0066x + 26,604

0.7985

5

Степенная модель

y = 41,673x0,172

0.6954


Вывод: проанализировав таблицу видим, что уравнение регрессии лучшим образом аппроксимирует уравнение y = -0,0899x2 + 4,0066x + 26,604, т.к. R² = 0,7985.
Заключение: в данной задаче я освоил компетенции выполнения статистического анализа двумерных данных, также выполнил поставленные задачи, а именно: выполнил корреляционный, регрессионный, визуальный анализ двумерной последовательности случайных величин первая – коэффициент пористости, m; вторая - водонасыщенность на фронте, Sф%.

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ
Реалистичное содержание целевой функции.

В качестве целевой функции (функции отклика, зависимой переменной, реакции системы на воздействие факторов Xi) Y принята дебит нефтяной скважины, м³/сутки:
Реалистичное содержание (сущность) факторов.

В качестве факторов функции отклика Xi принимаются:
X1 - Забойное давление, МПа;

X2 - Диаметр штуцера, мм;

Х3 - Температура, °С.
Уровни варьирования значений факторов.

Минимальные и максимальные значения факторов приняты следующие:


Х1 min = 0.1;

X1 max = 6 ;

Х2 min = 4 мм;

X2 max = 20 мм;

Х3 min= 35 °С;

X3 max= 121 °С.


Среднее значение фактора.

Среднее значение фактора определяется по формуле:
.

X10 = 3,05;

X20 = 12;

X30 = 78.
Интервалы варьирования фактора.

Интервал варьирования определяется по формуле:
dx1 = X10 – X1min = 2, 95.

dx2 = X20 – X2min = 8.

dx3 = X30 – X3min = 43.
Корректность определения значений факторов.


Фактор

X1

X2

Х3

Минимальное значение, Хi min

0,1

4

35

Максимальное значение, Xi max

6

20

121

Среднее значение, Xi 0

3,05

12

78

Интервал варьирования dХi

2,95

8

43

Нормированные значения факторов.

Нормированные значения определяются формулой:

.

Хн1 = (6 - 3,05) /2,95 = 1;

Хн2 = (20 – 12) /8 = 1;

Хн3= (121 – 78) /43 = 1.
Матрица планирования полного факторного эксперимента.

Полный двухфакторного эксперимента первый столбец вводится искусственным путем и постоянен, и равен 1.


Номер опыта

Нулевой фактор

Нормированные факторы

Взаимодействия нормированных факторов




Х

Х

Х

Х

Х1нХ2н

Х2нХ3н

Х1нХ3н

Х1нХ2нХ3н




1

1

-1

-1

-1

1

1

1

-1




2

1

1

-1

-1

-1

1

-1

1




3

1

-1

1

-1

-1

-1

1

1




4

1

1

1

-1

1

-1

-1

-1




5

1

-1

-1

1

1

-1

-1

1

6

1

1

-1

1

-1

-1

1

-1

7

1

-1

1

1

-1

1

-1

-1

8

1

1

1

1

1

1

1

1


Экспериментальные значения целевой функции.


Номер опыта

Y1

Y2

Y3

Y4

Y5

1

20,5

20,64

20,7

20,48

20,54

2

21,6

21,85

21,45

21,36

21,22

3

22,7

22,95

22,56

22,63

22,84

4

23,1

23,15

23,9

23,45

23,14

5

24,3

24,46

24,15

24,65

24,35

6

25,9

25,95

25,65

25,3

25,4

7

26

26,32

26,3

26,8

26,1

8

27,4

27,64

27,85

27,6

27,45



Расчет среднего арифметического результатов каждого опыта.


Номер опыта

Y1

Y2

Y3

Y4

Y5

Yср

1

20,5

20,64

20,7

20,48

20,54

20,572

2

21,6

21,85

21,45

21,36

21,22

21,496

3

22,7

22,95

22,56

22,63

22,84

22,736

4

23,1

23,15

23,9

23,45

23,14

23,348

5

24,3

24,46

24,15

24,65

24,35

24,382

6

25,9

25,95

25,65

25,3

25,4

25,64

7

26

26,32

26,3

26,8

26,1

26,304

8

27,4

27,64

27,85

27,6

27,45

27,588


Дисперсия среднего арифметического для каждой строки матрицы эксперимента (каждого опыта).

Дисперсия среднего арифметического определяется формулой:


где m количество параллельных опытов в строке матриц.


Номер опыта

Y1

Y2

Y3

Y4

Y5

Yср

S2y

1

20,5

20,64

20,7

20,48

20,54

20,572

0,00892

2

21,6

21,85

21,45

21,36

21,22

21,496

0,05823

3

22,7

22,95

22,56

22,63

22,84

22,736

0,02503

4

23,1

23,15

23,9

23,45

23,14

23,348

0,11477

5

24,3

24,46

24,15

24,65

24,35

24,382

0,03487

6

25,9

25,95

25,65

25,3

25,4

25,64

0,08425

7

26

26,32

26,3

26,8

26,1

26,304

0,09508

8

27,4

27,64

27,85

27,6

27,45

27,588

0,03147

Оценка однородности построчных дисперсий.

Расчетное значение критерия Кохрена.

Критерий Кохрена показывает, какую долю в общей сумме построчных дисперсий занимает максимальная из них, и определяется по формуле:



где smax – наибольшая величина дисперсии;

si дисперсия i-го опыта

NОбщее число опытов в матрице.


Максимальное значение дисперсии результатов опыта:
S2ymax= 0, 11477.
Сумма всех построчных дисперсий:
S2 y = 0,00892+0,05823+0,02503+0,11477+0,03487+0,08425+0,09508+0,03147 = 0,45262.
Расчетное значение критерия Кохрена:
Gp= 0, 11477/0, 45262 = 0, 25.
В случае идеальной однородности построчных дисперсий коэффициент Gp стремился бы к значению 1/N, где N – число опытов (количество строк в матрице планирования).

Табличное значение критерия Кохрена.

Уровень значимости.
 = 0,05.
Степень числителя (f1):
f1= m –1= 4,
где m – количество параллельных опытов в строке матриц
Степень свободы знаменателя (f2):
f2 = N = 8,
где N – общее число опытов в матрице.
Табличное значение критерия Кохрена
Gт = 0,3910.
Вывод: Так как расчетное значение критерия Кохрена меньше табличного (0,3910 <2,01), следовательно, дисперсия экспериментальных значений функции отклика однородны
Вид уравнения регрессии, принятого для построения модели функции отклика.

Рекомендуется полиномиальная модель функции отклика
y = b0 X0 + bX1 + bX2 + bX3 +b12 X1Х2+b13 X1Х3+b23 X2Х3+b123 X1 X2Х3 .
Коэффициенты регрессии.

Значения коэффициентов регрессии определяются по формулам:

;

и так далее для всех коэффициентов.
Таблица - Значения коэффициентов регрессии.

b0

b1

b2

b3

b12

b23

b13

b123

24,00825

0,50975

0,98575

1,97025

-0,03575

-0,01825

0,12575

0,004225


Статистическая значимость коэффициентов регрессии.

Расчетные значения критерия Стьюдента.

Оценка производится по t-критерию Стьюдента. Проверяется отклонение от нуля найденной оценки.

Для каждого коэффициента bk вычисляется расчетное значение критерия Стьюдента:

;

;

;

,

где bk – коэффициент уравнения регрессии;

S{bk} – оценку дисперсию коэффициентов, найденных по экспериментальным данным;

- дисперсия коэффициентов, найденных по экспериментальным данным;

- дисперсия воспроизводимости.
S2b = 0,00892+0,05823+0,02503+0,11477+0,03487+0,08425+0,09508+0,03147/8 = 0,056578 .
S2{bk} = 0,056578/(8*5) = 0,0014.
S{bk} = = 0.0374
Расчетные значения критерия Стьюдента


t0

t1

t2

t3

t12

t23

t13

t123

641,931

13,629

26,3569

52,680

0,9558

0,4879

3,3622

1,1296


Табличные значения критерия Стьюдента.
Уровень статистической значимости.
 = 0,05 .
Степень свободы
f = N (m-1) = 8*(5-1) = 32.
табличное значение коэффициента равно

tт = 2,04
Функция отклика со статистически значимыми коэффициентами.

Функция отклика со статистически значимыми коэффициентами имеет вид:

y = b0 X0 + bX1 + bX2 + bX3 +b12 X1Х2+b13 X1Х3+b23 X2Х3+b123 X1 X2Х3
Значения функции отклика для каждого опыта по новой функции отклика со статистически значимыми коэффициентами.


Номер опыта

Y’

1

20,572

5

24,382

7

26,304

3

22,736

6

25,64

2

21,496

4

23,348

8

27,588

Проверка адекватности новой функции отклика со статистически значимыми коэффициентами.

Расчетное значение критерия Фишера (F- критерия).

Адекватность модели проверяют по критерию Фишера, расчетное значение которого определяется по формуле:

Fp= S2ад/S2в ;
;

,

где L – число значимых коэффициентов.

m – количество параллельных опытов в строке матриц
m/(N-L) = 5/ (8-3) = 1

S2ад = 1*((20,575-20,575)2+ (21,496-24,382)2+ (22.736-26,304)2+ (23.348-22,736)2+ (24.382-25,64)2+ (25.64-21,496)2+ (26.304-23,348)2+ (27.588-27,588)2) = 48,93;
S2в = 0,00892+0,05823+0,02503+0,11477+0,03487+0,08425+0,09508+0,03147/8 = 0,056578;
Fp = 48,93/0.056578 = 864,77.
Уровень значимости  = 0.05.
Степень свободы адекватности:
fад = N – l = 8-1 = 7.
Степень свободы воспроизводимости:
fв = = N(m - 1) = 8*(5-1) = 32.
Табличное значение критерия Фишера.
Fт = 3,2.

Вывод: Сравнив расчетное значение критерия с табличным делаем вывод об адекватности модели, так как Fp> Fт, то полученная математическая модель с принятым уровнем статистической значимости  неадекватна экспериментальным данным. Следовательно, при выбранном уровне статистической значимости полученная в результате эксперимента регрессионная модель вида

y = 24,00825+ 0,50975 X + 0,98575X+ 1,97025X +

(-0,0,3575 X1Х2)+ 0,12575 X1Х3+(-0,01825 X2Х3)+0,04225 X1 X2Х3 неадекватна исследуемому объекту

Функция отклика со статистически значимыми коэффициентами и натуральными факторами.

Функция отклика со статистически значимыми коэффициентами и натуральными факторами имеет вид:
Y = b0 + b1 + b2 + b12

= 24,00825+0,50975*((6-3,05)/2,95)+0,98575*((20-12)/8)+(-0,0357*((6-3,05)/2,95)*((20-12)/8)) = 25,46805.
Заключение В процессе контрольной работы была построена целевая функция, характеризующая зависимость дебита нефтяной скважины от трёх факторов: забойного давления, диаметра штуцера, температуры. Для её построения были проведены стандартные статистические характеристики. За основу целевой функции была принята полиноминальная регрессионная модель. Мною были освоены компетенции по планированию эксперимента и обработке его результатов.


Литература





  1. Сидняев Н.И. Теория планирования эксперимента и анализ статистических данных: учебн. пособ. / Н.И. Сидняев. – М.: Изд-во Юрайт, 2011.- 399 с.

  1. 2.Гмурман В.Е. Теория вероятностей и математическая статистика: учеб.пособ.-12-е изд., перераб. / В.Е. Гмурман.- М.: Изд-во Юрайт, 2010.- 479 с.

  2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике: Учебн. пособ. -12-е изд., перераб. / В.Е. Гмурман. – М.: Высшобраз.,2006. – 476 с.

  3. Боровков, А.А. Математическая статистика: Учебник / А. А. Боровков. – Изд. 4-е, стер. – Санкт-Петербург; М.; Краснодар: Лань, 2010. – 703 с. (электронный ресурс).

  4. Адлер Ю.П., Маркова Е.В., Грановский Ю.В. Планирование эксперимента при поиске оптимальных условий. М.: Наука, 1976.

  5. Асатурян В.И. Теория планирования эксперимента: Учеб. пособие для втузов. М.: Радио и связь, 1983.

  6. Налимов В.В. Теория эксперимента. М.: Наука, 1971.

  7. Планирование и организация измерительного эксперимента / Е.Т. Володаpский, Б.Н. Малиновский, Ю.М. Туз.-К.: В.ш. Головное изд-во, 1987.
1   2


написать администратору сайта