В. М. Деревяшкин и. Б. Елистратова основы научных исследований
Скачать 3.1 Mb.
|
6.3 Применение регрессионного анализа для обработки экспериментальных данныхРегрессионным анализом называют раздел математической статистика, посвященный практическим методам исследования, или, как часто говорят, восстановления регрессионной зависимости (регресс) между случайными величинами по статистическим (экспериментальным) данным. Предмет регрессионного анализа составляет обнаружение функциональной связи между независимыми переменными Xi, которые можно менять по воле экспериментаторов, и зависимой переменной, или откликом Y. (6.3.1) Y=F(X1,X2,…, Xn, где Y– зависимая переменная величина; X1,X2,…, Xn– значения независимых переменных величин. (6.3.2) Пусть в результате серии независимых измерений при каждом значении X= Xi (i=1,2,…,n) проведено mi повторных наблюдений, результаты которых Yik (k=1,2,…,mi) использованы для вычислений средних значений (6.3.3) И выборочных оценок дисперсии . Закон изменения математического ожидания одной случайной величины в зависимости от значений другой называют регрессией. Кривая Y= (X) носит название криволинейной регрессии. Различают теоретическую линию регрессии (подразумевая под такой истинную функциональную зависимость, существующую в природе) и эмпирическую линию регрессии (имея в виду соотношение, устанавливаемое с помощью конкретного экспериментального материала). Проведение кривой через экспериментальные точки и их уравновешивание относят к задачам регрессионного анализа. Такой анализ развивается из принципа максимального правдоподобия. Уравнение кривой обычно представляет собой многочлен. Выбор степени многочлена осуществляется, как правило, исходя из теоретических соображений или из упрощенного предоставления экспериментальных данных. Примером линейной модели, как по независимым переменным, так и по параметрам служит выражение (6.3.4) Y=θ0+ θ1x1+ θ2x2+……+ θnxn. (6.3.5) Модель с нелинейно входящим независимыми переменными, но линейная по параметрам, может иметь, например, полиномиальный вид Y=θ0+ θ1x1+ θ2(x2)2+……+ θn(xn)n. (6.3.6) Модель, линейная по независимым переменным, но нелинейная по параметрам, имеет вид Y=θ0+ θ1θ2x1+ θ1x2+ θ3x3. (6.3.7) Возможна модель, нелинейная как по параметрам, так и по независимым переменным: Y=exp(θ1x1)+exp(θ2x2). (6.3.8) В дальнейшем будут рассмотрены в основном линейные модели вида Y=θ0f0(X1,X2,…)+θ1f1(X1,X2,…), где fi – известные функции. Примером простой линейной модели (физической) является закон Ома, согласно которому ток I, протекающий через сопротивление R, связан с падением напряжения U соотношением I=U/R. Эта прямая линия, проходящая через начало прямоугольных координат. Величину θ определяют из графика по наклону эмпирической линии. Кроме разумной интерпретации полученных результатов регрессионный анализ позволяет предсказывать значение Y для будущих значений Х. Для надежности предсказаний, необходима уверенность в справедливости принятой модели. Статистическими задачами регрессионного анализа являются: -получение наилучших точечных и интервальных оценок неизвестных параметров регрессии; -проверка гипотезы относительно этих параметров; -проверка адекватности предлагаемой модели. Для решения поставленных выше статистических задач необходимо соблюдение следующих условий: -погрешность в определении аргумента Х должна быть значительно меньше, чем погрешность Y; -результаты наблюдений должны представлять собой независимые нормально распределенные случайные величины; -выборочные дисперсии должны быть однородны. (6.3.9) Наиболее часто в качестве модели используется степенной полином вида Y=a1+a2x+…+amxm-1, где a1+a2x+…+am– параметры модели. Такая модель при правильном выборе порядка полинома позволяет с любой необходимой точностью аппроксимировать истинную регрессионную зависимость. Достоинством модели является также то, что функция линейна относительно неизвестных параметров а1,а2,…аm, что упрощает обработку наблюдений. В данном случае вопрос выбора модели сводится к выбору порядка m-1 полинома. После выбора вида регрессионной модели вычисляют ее параметры. Для модели (6.3.9) необходимо получить оценки параметров а1,а2,…аm. Для аналитического определения параметров предположим, что Yi (i=1,2,…,n)- это значения выходного параметра объекта, определяемые регрессионной зависимостью отX1, а Yi– соответствующие результаты измерений выходного параметра. Составим разности между i и Yiдля каждого экспериментального значения i. ε1= 1-Y1= 1-a1-a2x2-a3(x1)2-....-am(x1)m-1; ε2= 2-Y2= 2-a1-a2x2-a3(x2)2-....-am(x2)m-1; εn= n-Yn= n-a1-a2xn-a3(xn)2-....-am(xn)m-1. Для нахождения неизвестных констант потребуем минимума квадратичной формы вида . Дифференцируя последнее выражение по параметрам аi и приравнивая полученные соотношения нулю, получим систему нормальных уравнений . . . Преобразовав ее к стандартному виду, получим: (6.3.10) В соответствии с формулами (6.3.10) задача поиска коэффициентов aiсведена к решению системы линейных уравнений. Методы решения их достаточно хорошо разработаны, и имеются соответствующие программы на ЭВМ. Вычислительные значения ai обеспечивают многочлену минимальное квадратичное отклонение от заданных точек. В случае линейной зависимости типа y=a+bx решают систему нормальных уравнений (6.3.11) . При этом получают следующие выражения для коэффициентов (6.3.12) (6.6.13) ; . Не следует сужать область использования этой модели только линейными зависимостями. Имеются и существенно нелинейные соотношения, к которым можно при определенных условиях применять аппарат линейной регрессии [18]. Для этого используется некоторое преобразование, позволяющее наблюдаемую нелинейную зависимость путем преобразований представить в линейном виде. Если преобразование такого вида произведено и получена прямая линия, то параметры нелинейной модели можно найти из модифицированной линейной модели. 6.4 Применение дисперсионного анализа для проверки статистической однородности ряда экспериментов Дисперсионный анализ – статистический метод анализа результатов наблюдений, зависящих от различных одновременно действующих факторов, выбор наиболее важных факторов и оценки их влияния. Наблюдения могут проводиться как в экспериментальных науках (например, в электросвязи), так и в не экспериментальных науках (например, в экономике). Теория анализа результатов наблюдений подсказывает, как планировать проведение наблюдения, то есть приводит к планированию эксперимента. Влияние изучаемых факторов может быть двояким: они могут изменять как дисперсию наблюдений , так и истинный результат (среднее) наблюдений. При сравнении между собой результатов наблюдений необходимо установить, можно ли считать различие между этими результатами достаточным, чтобы иметь уверенность в его неслучайном происхождении. С этой целью необходимо: 1. Проверить гипотезу о равенстве генеральных дисперсий с сравниваемых сериях наблюдений по критерию Фишера или Кохрена. 2. Сравнить между собой среднее значение результатов наблюдений по критерию Стьюдента. Рассмотренные ниже методы справедливы при нормальном законе распределения результатов наблюдений. Статическая обработка ряда наблюдений дает достоверные результаты, если результаты выборки статистически устойчивы (однородны), то есть принадлежат одной генеральной совокупности. Проверка однородности ряда наблюдений осуществляется путем разбиения ряда наблюдений на группы и сравнения их статистических характеристик. Если результаты наблюдений этих групп принадлежат одной генеральной совокупности, то вычисленные групповые оценки дисперсий )2 есть суть оценки дисперсии этой генеральной совокупности, поэтому их различие должно быть не слишком большим и удовлетворять определенным статистическим закономерностям. Проверка этой нулевой гипотезы может осуществлена с помощью ряда статистических критериев Аббе, Бартлета, Кохрена, Фишера). Пусть из нормально распределенной совокупности, имеющей дисперсию , взяты две независимые случайные выборки объемов n1 и n6. Обозначим дисперсии выборок через ( )2 и ( )2 : Отношение оценок дисперсий выборок, так называемый показательно достоверности =( )2/( )2 . (6.4.14) Как установил Р.Фишер, является случайной величиной, подчиняющейся определенному закону, и зависит только от числа степеней свободы = и = [22] F=(P, , ) = ( )2 / (( )2 ), (6.4.15) где ( )2 и ( )2 – распределение К.Пирсона(хи-квадрат); F=(P, , ) – критическое значение распределения Фишера (таблица приложения Х), зависящее от доверительной вероятности Р и чисел степеней свободы и , причем соответствует большей дисперсии. Проверку нулевой гипотезы о принадлежности выборок n1 и n2 к одной генеральной совокупности осуществляется путем сравнения фактического (экспериментального) отношения оценок дисперсий =( )2/( )2 ( в числитель ставят большую оценку) с теоретическим значением Fт , определенным согласно распределению Р.Фишера для заданной вероятности Ркр, из соотношения: Р( )2/( )2 Величину q=1- Ркрназывают уровнем значимости, значение которого обычно выбирается в пределах 0.001-0.05. Это соответствует классификации явлений на: редкие (q=0.05), очень редкие (q=0.01) и чрезвычайно редкие (q=0.001). Уровень значимости q характеризует вероятность того, что справедливая гипотеза будет отвергнута. При выборе значения уровня значимости q следует учитывать, что с его уменьшением возрастает вероятность принятия несправедливой гипотезы (в измерительной технике чаще всего выбирают q=0.05). Если значение Fэ Если выборка содержит большое число наблюдений n (n>40), то ее целесообразно разбить на группы равных объёмов. В этом случае однородность дисперсий и пригодность результатов анализа для совместной обработки удобно проверить с помощью критерия Кохрена. Для этого вычисляют все выборочные дисперсии ( )2 и составляют отношение наибольшей из дисперсий к общей сумме всех выборочных дисперсий . (6.4.17) Дисперсия считаются однородными, если рассчитанное значение критерия Кохрена меньше табличного . Распределение случайной величины зависит только от суммируемых дисперсий k и числа степеней свободы ν, с которым определена каждая дисперсия. В таблице ХI приведены критические точки распределения Кохрена для уровня значимости 0.05 (k- число сравниваемых дисперсий). Всю совокупность экспериментальных данных называют генеральной совокупностью, а количество данных N- объемом генеральной совокупности. Если N велико, то часто удобно полагать, что N бесконечно. Случайной выборкой называют наугад выбранную часть генеральной совокупности, а количество данных в выборке- nобъемом выборки. Можно представить выборку [6] {Xi. i=1,2,..,n} (6.4.18) Как результат изменения величины Х в n экспериментах, выполненных в одинаковых условиях. Поскольку выборок может быть много и в каждой выборке могут быть свои значения Хi, то все Хi в выборке можно рассматривать как случайные величины. Пусть А- некоторый статистический параметр, характеризующий случайную величину Х. приближенное значение этого параметра, полученное с помощью выборки, называют выборочной оценкой и обозначают А*, или в отличие от точной, статистической величины А. Следовательно, выборочная оценка- одна из статистик [6]: [(Xi; i=1,2,…,n)]. (6.4.19) Статистиками могут быть оценки моментов, квантилей, моды распределений, параметров в функциональных выражениях для плотностей распределения и др. различают точечные и интервальные оценки. Точечные оценки дают одно значение оцениваемой величины, интервальные - некоторый интервал значений. Поскольку оценки -функции случайных выборок, они тоже являются случайными величинами и при их анализе следует пользоваться методами теории вероятностей. Пусть была измерена величина Х. Систематические погрешности устранены, проводятся повторные наблюдения в одинаковых условиях. Разумно предположить, что наилучшей оценкой Х для данной выборки будет так называемое математическое ожидание случайной величины. Приближенной оценки математического ожидания, в свою очередь, будет среднее данного ряда (выборки) чисел (иногда его называют «средним арифметическим»): , (6.4.20) где и - выборочные оценки математического ожидания; – среднее арифметическое из наблюдений; – случайные величины в выборке; – число случайных величин в выборке. Но Х дает только точечную оценку измеряемой величины, поэтому необходим еще один параметр, учитывающий степень разброса результатов вокруг среднего. Для этой цели вводят понятие среднего квадратического отклонения выборки. Необходимость ввода такого понятия обусловлена непригодностью показателя усредненного отклонения для оценки степени разброса случайных величин от арифметического среднего, так как отклонения разных знаков при суммировании компенсируют друг друга. Следовательно, необходимо усреднять не сами отклонения, а их квадраты, а для того, чтобы получить отклонение такой же размерности, что и измеряемая величина, надо извлечь из этого среднего квадратный корень. Тогда выражение для отклонения примет вид , (6.4.21) где *xi- смещенная оценка среднего квадратического отклонения. Этот показатель называют стандартным отклонением данный выборки значений случайной величины. Существуют теоретические аргументы, согласно которым для устранения смещения оценки число n в знаменателе формулы (6.1.4) следует заменить на n-1, поэтому окончательно определим как . (6.4.22) При больших значениях n оценки по формулам (6.4.21) и (6.4.22) практически не различаются. В области измерений этот показатель имеет смысл среднего квадратического отклонения результата наблюдения. Если же имеется необходимость определения относительной погрешности через x, то вводят так называемый коэффициент вариации: V = . (6.4.23) Другим распространённым статистическим параметром выборки является дисперсия (ƃхi)2 которая является квадратом стандартного отклонения и вычисляется по формуле . (6.4.24) Среднеквадратическое отклонение среднего результата измерения определяется как i = (6.4.25) Преимущество этого показателя в том, что в него введена зависимость от числа наблюдений n. Это соответствует нашему интуитивному представлению о том, что с увеличением числа измерений точность предсказания Х должна повышаться. Следует заметить, что эта зависимость не строго обратно пропорциональная, а в степени (-1/2). Вместо стандартного отклонения xi или величины применяют иногда вероятную ошибку (ВО), то есть такое отклонение, когда результат с вероятностью 50% попадает в интервал +-ВО: ВО=0.67 xi-для результата наблюдения ВО=0.67 – для результата измерения Расчет статистических параметром выброски целесообразно проводить на программируемом микрокалькуляторе или ЭВМ. Необходимые программы даны в литературе (7-13). Перечень некоторых из них в табл. 6.1 [2]. Другим характерным интервалом является так называемый ”трехсигмовый диапазон” : [ . (6.4.26) Если погрешности распределены по нормальному закону, выход измеряемой величины за такой широкий интервал очень маловероятен (вероятность такого события равно 0.0027). Если в выборе небольшого объема все же встречаются выходящие за трехсигмовый предел результаты, их можно расценивать как грубые ошибки. Это может также означать, что закон распределения данной выброски отличается от нормального и тогда необходимо использовать другую статистическую модель. 6.5 Проверка выборки на ее соответствие нормальному закону Все приведенные выше оценки как средних, так среднеквадратических значений основанные на гипотезе нормальности закона распределения случайных величин в выборке и поэтому могут применяться лишь до тех пор, пока результаты эксперимента не противоречат этой гипотезе. Действующая нормативно-техническая документация [17] устанавливает правила проверки согласия распределения величины, полученной по результатам наблюдений, с предполагаемым теоретическим распределением. В соответствии с этим документом наблюдения необходимо производить в практически одинаковых условиях, исследуемая совокупность результатов должна быть однородной. При числе наблюдений n>100 рекомендуется применять критерий Колмогорова и х2 (критерий Пирсона); если n>50, то критерий ω2 (Мизеса-Смирнова). Данные критерии позволяют проверять соответствие полученных данных не только нормальному распределению. При числе наблюдений n<50 нормальность их распределения проверяют при помощи составного критерия, состоящего из двух критериев. Проверка гипотезы по составному критерию. В соответствии с гипотезой согласия по составному критерию распределения признается нормальным, если оно с заданными уровнями значимости удовлетворяет одновременно двум критериям. Критерий 1. Вычисляют отношение , (6.5.1) где *xi– смещенная оценка среднего квадратического отклонения, вычисляемая по формуле (6.1.4). Результаты наблюдений можно считать распределенными нормально, если справедливо неравенство , (6.5.2) где и – квантили распределения, получаемые из таблицы (Приложение 1) для числа наблюдений n, q1/2и 1-q1/2, причем q1 – заранее выбранный уровень значимости критерия. Критерий 6. Можно считать, что результаты наблюдений принадлежат нормальному распределению, если не более m разностей |Xi- превзошло значение Zp/2 xi, где xi- оценка среднего квадратичного отклонения, вычисляемая по формуле (6.1.5), а Zp/2- верхняя квантиль распределения нормированной функции Лапласа, отвечающая вероятности Р/2 ( напомним, что точка Zp, в которой интегральная функция распределения F переходит от значений, меньших Р, к значениям, большим Р, называется квантилью порядка Р: F(Zp)≤P, F(Zp+0)≥P. Значений Р определяются из таблицы (приложение 11) по выбранному уровню значимости и числу результатов наблюдений n. При уровне значимости, отличном от предусмотренных в таблице приложения 11, значение Р находят путем линейной интерполяции. В случае, если при проверке нормальности распределения результатов наблюдений группы для критерия 1 выбран уровень значимости , а для критерия 2-q2, то результирующий уровень значимости составного критерия . (6.5.3) В случае, если хотя бы один из критериев не соблюдается, то считают, что распределение результатов наблюдений группы не соответствует нормальному. Проверка гипотезы по критерию ω2 (критерию Мизеса-Смирнова).Как было отмечено выше, критерий ω2 считается более мощным критерием, особенно при числе наблюдений 50≤ n≤ 100. Он основан на не сгруппированных экспериментальных данных наблюдений случайной величины [18]. Если обозначить F(Х) экспериментальное распределение, а F0(Х) – известное теоретическое распределение, то в качестве меры отклонения F0(Х) от F(Х) определяют средний квадрат отклонений по всем возможным значения аргумента. , (6.5.4) где (X) – гипотетическая функция плотности вероятностей. Если экспериментальные данные представить в виде вариационного ряда X1 В точке разрыва Х=Xi функция переходит скачком от значения к (для Xi-1 ≤X < Xi). Вся область интегрирования в определении ω2 разбивается на интервалы (-∞, Х1) ( , ) ( , ),…( , ) ( ,∞ ) И теперь все определения ω2можно переписать в виде [18] (6.5.5) Выражение (6.6.5) используется для вычисленияω2 по данным выборки, которые предварительно записывают в форме вариационного варианта. Ниже приведены некоторые критические значения величины Пω2 для различных уровней значимости.50> |