Главная страница

РГР. По модулю Планирование эксперимента Москва, 2021


Скачать 2.66 Mb.
НазваниеПо модулю Планирование эксперимента Москва, 2021
Дата24.04.2023
Размер2.66 Mb.
Формат файлаpptx
Имя файлаРГР.pptx
ТипДокументы
#1085647

по модулю Планирование эксперимента

Москва, 2021

ОСНОВНЫЕ ПОНЯТИЯ

ОСНОВНЫЕ ПОНЯТИЯ


.

Математическая статистикараздел математики, посвящённый математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов.

Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим.

Статистическими данными мы называем сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками

Планирование эксперимента - это постановка опытов по некоторой заранее составленной схеме; средство построения математической модели реального процесса; и способ сокращения средств и времени.

Где мы можем использовать планирование эксперимента и для чего нам это надо?

При осуществлении поиска оптимальных показателей;
    • При поиске эффективных технико‑технологических решений (управляющие воздействия);
    • При осуществлении поиска оптимальных рецептур многокомпонентных систем и параметров режима бурения

При совершенствовании технологии производства
    • При обеспечении перехода на автоматизированное управление процессом;
    • При прогнозировании технологических параметров;

При оценке качества процесса
    • При обеспечении надежности и достоверности результатов исследований
    • Для повышения эффективности труда ИТР, сокращении сроков и затрат на исследования

Первичный статистический анализ

Понятие о генеральной совокупности и выборке


Генеральной совокупностью называется полный набор всех значений, которые принимает или может принять случайная величина

Часть генеральной совокупности из n значений случайных величин, выделенных из этой совокупности, называется выборкой

Выборки объемом до 30 значений случайных величин (СВ) условно принято считать малыми, а свыше 30 – большими

При определении объема выборки следует помнить, что ошибка выводов уменьшается в корень квадратный из n раз

В выборку можно включать только данные, относящиеся к исследуемой генеральной совокупности;

Все значения СВ, принадлежащие к исследуемой генеральной совокупности, должны иметь одинаковую возможность быть включенными в выборку;

Выборка должна быть репрезентативной (представительной), т.е. она должна включать в себя достаточное число значений случайной величины для представления об особенностях генеральной совокупности

1. Составление вариационного ряда (в порядке возрастания)

2. Определение размаха вариационного ряда

3. Выбор числа интервалов разбиения k вариационного ряда

4. Определение длины интервала разбиения (шага)

Нижняя граница первого интервала

Частость - это относительная частота попадания СВ в i‑й интервал (число значений СВ в определенном интервале, отнесенное к общему объему выборки).

Гистограмма – ступенчатая фигура, состоящая из прямоугольников с основанием в виде отрезков, соответствующих длинам интервалов, и высотами, соответствующими частостям.

7. Определяют закон распределения случайной величины

6. Строят в масштабе гистограмму

Закон распределения СВ – это соотношение, устанавливающее связь между возможными значениями СВ и соответствующими им вероятностями.

Таблица 1


Рис.1. Гистограмма

1 2 xi

k

X

Р

Рис. 2. Кривая распределения

Понятие «частость» (i) для генеральной совокупности заменяется на понятие «вероятность» (i). При n   i = i .

С ростом числа интервалов, будет уменьшаться их длина и ломаная линия гистограммы превратится в плавную кривую (рис. 2). При этом, относящееся к выборке понятие частость (ωi) для генеральной совокупности, заменяется на понятие вероятность (ρi): n → ∞ ωi = ρi.

Нормальный закон распределения Гаусса
  • Хорошо изучен, методика проста и отработана;
  • При увеличении объёма выборки, целый ряд других законов стремятся превратиться в НЗ

1). Количество вариантов (значений СВ), превышающих среднее значение, равно количеству вариантов, которые меньше его (примерная симметричность диаграммы).

2). Частота вариантов тем больше, чем ближе к среднему значению они расположены (гистограмма имеет наибольшие ординаты в центре и наименьшие – у краев).

Вывод: если результаты измерений вызывают сомнение в применимости нормального закона, увеличьте объём выборки!

Рис.3. Графическое представление нормального распределения

По своему виду кривые нормального распределения могут быть:

-    нормальновершинными;

-   туповершинными;

-    островершинными (рис. 4);

-    иметь положительную асимметрию (рис.5а);

-    иметь отрицательную асимметрию (рис.5б).

Рис. 4. Кривые нормального распределения

Рис. 5. Кривые нормального распределения с положительной и отрицательной асимметрией

АСИММЕТРИЧНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ

Логарифмически-нормальный закон ЛНЗ (умеренная асимметрия)

Экспоненциальный закон (резко асимметричная кривая распределения)

В крепких и монолитных породах, (выход керна 100%), распределение асимметричное, сдвинуто в сторону больших значений (рис.6,а). В рыхлых нецементированных породах, (выход керна  0, асимметрия распределения правосторонняя (рис.6,b).

Рис.6. Логарифмически-нормальное распределение

ЛНЗ (имеет место, когда значения случайной величины ограничены некоторыми пределами) обладает умеренно асимметричной кривой распределения; экспоненциальный закон (период надёжности и долговечности работы оборудования) имеет резко асимметричную кривую распределения

8) Находят точечные оценки параметров нормального распределения СВ.

Правила определения оценок для параметров нормального распределения по совокупности независимых измерений СВ регламентируются ГОСТ 11.004 ‑ 74.

СТАТИСТИЧЕСКИЕ ВЕЛИЧИНЫ И ПАРАМЕТРЫ

Среднее арифметическое (все варианты имеют одну и ту же частоту, равную единице)

Характерно для малых выборок

Наиболее достоверная оценка измеряемой СВ

Среднее взвешенное

( 5 )

Характерно для больших выборок

МЕДИАНА (m0,5) – это значение случайной величины, которое делит вариационный ряд или площадь, ограниченную кривой распределения, на две равные части.

При нечётном объёме выборки медиана равна:

При чётном:

МОДОЙ (m0) называют варианту, имеющую наибольшую частоту, соответствующую вершине распределения (наиболее вероятное значение СВ)

Для нормального симметричного распределения

не визуальная, а расчётная проверка на нормальность

СТЕПЕНЬ РАЗБРОСА (РАССЕИВАНИЯ) ОТДЕЛЬНЫХ ЧАСТЕЙ СВ ОТНОСИТЕЛЬНО ЕЕ СРЕДНЕГО ЗНАЧЕНИЯ

РАЗМАХОМ (R) называется разность между наибольшим (xmax) и наименьшим (xmin) вариантами

ДИСПЕРСИЕЙ (D) называется среднее арифметическое значение квадратов отклонений отдельных вариант от их средней арифметической

Среднее квадратичное отклонение (δ) это значение корня квадратного из дисперсии

Коэффициент вариации ()

это отношение среднего квадратичного отклонения к среднему значению СВ, выраженное в процентах

Более информативной оценкой среднего взвешенного значения является интервальная оценка, заключающаяся в установлении некоторого интервала, внутри которого с определенной вероятностью и находится истинное значение, т. е. генеральная средняя исследуемой СВ.

Если среднее взвешенное значение , найденное по результатам анализа выборки объемом n, является точечной оценкой математического ожидания а, то чем меньше разность (а  x), тем точнее оценка

Величина Δ, являющаяся пределом, который с определенной вероятностью не превосходит разность, называется предельной ошибкой выборки

Величина Δ в выражении являющаяся пределом, который с определенной вероятностью не превосходит разность, называется предельной ошибкой выборки

Вероятность того, что действительное значение измеряемой величины лежит в пределах

представляет собой доверительную вероятность

где:

Р - доверительная вероятность (статистическая надежность);

  уровень значимости.

В технике, в большинстве случаев надежность P принимается равной 0,9÷0,95 (90  95%). Надежности равной 0,8; 0,9; 0,95, соответствуют уровни значимости α, равные соответственно 0,2 (20%); 0,1 (10%); 0,05 (5%). Для нормального распределения СВ это означает, что вероятность выхода за границу составляет соответственно в 20, 10 и 5% случаев.

Зная предельную ошибку выборки Δ, можно определить доверительный интервал, в котором заключена генеральная средняя

Интервал,

который с заданной доверительной вероятностью или надежностью Р покрывает оцениваемый параметр, называется доверительным интервалом

Предельную ошибку выборки определяют по формуле Стьюдента

Статистический анализ малых выборок (n<30)

I. Проверка принадлежности имеющихся данных нормальному закону распределения с помощью критерия Шапиро‑Уилка (W)

1). Упорядочиваем выборку (составляем вариационный ряд)

3). Определяем вспомогательную величину

L = (n-1)/2

нечётный

L= n/2чётный объём выборки

2). Вычисляем сумму квадратов отклонений - S2 (x):

4). Находим расчетное значение критерия

5)Находим табличное значение критерия Шапиро ‑ Уилка – Wt при заданном (выбранном) уровне значимости α по следующим формулам:

6)Сравниваем расчетное значение критерия Шапиро ‑ Уилка с табличными:

при W > Wt можно считать, что распределение СВ подчиняется нормальному закону;

Если соотношение не выполняется, то необходимо увеличить объём выборки или осторожно отнестись к выводам, особенно к величине доверительного интервала

Например, при n = 10 WТ(0.05) = 0.838; n = 25 WТ(0.1) = 0.935

II. Рассчитаем среднее арифметическое значение СВ:

III. Оценим характеристики степени разброса экспериментальных данных относительно среднего арифметического значения

Дисперсию D

Среднее квадратичное отклонение

Коэффициент вариации

IV. Зададимся величиной уровня значимости α и рассчитаем предельную ошибку выборки – Δ

V. Находим доверительный интервал для математического ожидания (генеральной средней)

Отбраковка резко выделяющихся результатов (промахов)

Значения, которые весьма существенно отличаются от других и появляются, как правило, вследствие грубых ошибок субъективного происхождения, называются ошибками

ОШИБКИ ОБУСЛОВЛЕНЫ

неправильным использованием измерительной техники

ошибками в отчетах по измерительным приборам

ошибками в записях экспериментальных данных

ошибками в вычислениях при обработке результатов измерений

ПРАВИЛА И КРИТЕРИИ ОТБРАКОВКИ

Правило трёх сигм (используется при объёме выборки n > 50)

«Вероятность попадания СВ в интервал от до

равна 0,997 (99,7 %)»

Если такая надежность приемлема, то все значения случайной величины, отклоняющиеся от среднего взвешенного или среднеарифметического больше, чем на 3δ, отбрасываются, как маловероятные

Задача

Вывод: в данной выборке резко выделяющихся замеров нет.

ПРАВИЛА И КРИТЕРИИ ОТБРАКОВКИ

Метод С.В. Башинского ( при объёме выборки n < 50 и для малых выборок n < 30 )

Определяются предельно возможные максимальные (lim xmax) и минимальные (lim xmin) значения случайной величины в выборке по следующим формулам:

КБ- критерий С.В. Башинского, который определяется по формуле

Задача: Проверить наличие грубых промахов методом С.В. Башинского для исходных данных

Формула справедлива для 5 < n < 69

ПРАВИЛА И КРИТЕРИИ ОТБРАКОВКИ

МЕТОД ГРЕББСА - СМИРНОВА

исключение резко выделяющихся замеров производится с помощью безразмерных статистических критериев ξmax и ξmin

Например, при n = 30 0(ф.31) = 2.96, 0(ф.32) = 2.79

Если расчетные значения статистического критерия ξmax (ξmin) > ξ0, то xmax > (xmin) отбрасываются, как содержащие грубую ошибку

4 < n < 150

Определение минимально необходимого числа замеров (объема выборки)

Объем выборки должен быть минимально необходимым и вполне достаточным для получения результатов с желаемой точностью и надежностью. Точность и надежность, в значительной мере определяются изменчивостью изучаемого свойства или показателя, которая оценивается среднеквадратичным отклонением  или коэффициентом вариации ν (для разнородных величин)

Значения  или ν могут быть рассчитаны только по результатам уже проведённых измерений. Однако, необходимое количество измерений нужно знать до начала экспериментов.

До проведения основной серии экспериментов проводится ОЦЕНОЧНАЯ серия, в ходе которой определяют точечные оценки (среднее квадратичное отклонение, коэффициент вариации и т.д.). Окончательное число замеров определяется по специальным методикам.

Определяем значение коэффициента вариации ν

По приведенной формуле с надежностью Р = 0,95 (95%) определяем необходимое число замеров, округлив полученный результат в большую сторону

Определяем значение допустимой погрешности (Кдоп) в процентах от среднего арифметического (например, Кдоп ≤ 10%)

Рассчитываем величину отношения (Кдоп / ν)

Методика приближенного расчёта объема выборки

Методика В.И. Романовского (применима, когда случайная величина подчиняется нормальному закону)

НЕОБХОДИМЫЙ ОБЪЁМ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ:
      • среднеквадратическое отклонение ;
      • среднее арифметическое ;
      • допустимая погрешность (Кдоп) в процентах от среднего арифметического;
      • заданная статистическая надежность Р.

По известным значениям ,  и Кдоп по формуле (34) рассчитывают параметр q (критерий В.И. Романовского)

По формулам (35)-(36), задавшись уровнем значимости , для найденного значения числа q рассчитывают соответствующее ему минимально необходимое число замеров (опытов)

(35) справедлива для 0.2

(36) справедлива для 0.24

ГРАФИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ

Графическое изображение позволяет:
    • дать наиболее наглядное представление о результатах эксперимента;
    • лучше понять физическую сущность исследуемого объекта (процесса);
    • выявить общий характер зависимости между изучаемыми факторами и параметрами;
    • установить наличие максимума или минимума функции и т.д.

Графики бывают первичные и чистовые

Особенности построения первичных графиков

1). Наносят ВСЕ экспериментальные точки;

2). Точки никогда не обозначают точками;

3). Координаты графиков начинаются с нуля

ГРАФИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ

Назначение первичных графиков

1) Предназначены для обнаружения скачков или закономерных колебаний условий измерения, которые из табличных данных не улавливаются;

2). Оценка состояния (стоит ли этот экспериментальный материал обрабатывать или рассеяние, и выбросы лишают его всякого смысла)

Рис.7.

Если вместо четкого графика получается “облако точек”, это не значит, что он бесполезный. По форме облака можно обнаружить косвенные связи и скрытые закономерности
  • Башкатов Д.Н. Планирование экспериментов в разведочном бурении.- М.: Недра, 1985 .- 181 с.
  • Ганджумян Р.А. Математическая статистика в разведочном бурении. Справочное пособие.- М.: Недра, 1990.- 218 с.


написать администратору сайта