ГФ11-1. Общие методы анализа редакционная коллегия государственной фармакопеи ссср
Скачать 1.83 Mb.
|
i i значений х и у); _ _ х +/-"ДЕЛЬТА"х - граничные значения доверительного интервала среднего результата; х +/-"ДЕЛЬТА"х - граничные значения доверительного интервала i результата отдельного определения; "ДЕЛЬТА" - разность некоторых величин; "альфа" - уровень значимости, степень надежности; "ДЕЛЬТА"х - полуширина доверительного интервала величины; "дельта" - относительная величина систематической ошибки; "эпсилон", - относительные ошибки соответственно результата _______ отдельного определения и среднего результата; "эпсилон" "ми" - истинное значение измеряемой величины; SUM - знак суммирования (сумма); 2 "хи" - критерий хи - квадрат. I. СТАТИСТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ХИМИЧЕСКОГО ЭКСПЕРИМЕНТА Метрологические характеристики методов и результатов, получаемых при статистической обработке данных эксперимента, позволяют проводить оценку и сравнение как экспериментальных методик, так и изучаемых объектов и на этой основе решать ряд прикладных задач, связанных с определением статистической достоверности результатов исследования. I.1. ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ОДНОРОДНОЙ ВЫБОРКИ И ИХ ВЫЧИСЛЕНИЕ Проверка однородности выборки. Исключение выпадающих значений вариант. Термином "выборка" обозначают совокупность статистически эквивалентных результатов (вариант). В качестве такой совокупности можно, например, рассматривать ряд результатов, полученных при параллельных определениях содержания какого-либо вещества в однородной по составу пробе. Допустим, что отдельные значения вариант выборки объема n обозначены через х (1 <= i <= n) и расположены в порядке возрастания: i х ; х ; ... х ; ... х ; х , (I.1.1) 1 2 i n - 1 n Результаты, полученные при статистической обработке выборки, будут достоверны лишь в том случае, если эта выборка однородна, т.е. если варианты, входящие в нее, не отягощены грубыми ошибками, допущенными при измерении или расчете. Такие варианты должны быть исключены из выборки перед окончательным вычислением ее статистических характеристик. Для выборки небольшого объема (n < 10) идентификация вариант, отягощенных грубыми ошибками, может быть выполнена, исходя из величины размаха варьирования R (см. уравнения I.1.12, I.1.13 а, б). Для идентификации таких вариант в выборке большого объема (n >= 10) целесообразно проводить предварительную статистическую обработку всей выборки, полагая ее однородной, и уже затем на основании найденных статистических характеристик решать вопрос о справедливости сделанного предположения об однородности (см. выражение I.1.14). _ В большинстве случаев среднее выборки х является наилучшей оценкой истинного значения измеряемой величины "ми", если его вычисляют как среднее арифметическое всех вариант: n SUM х _ 1 i х = --------- (I.1.2) n _ При этом разброс вариант х , вокруг среднего х характеризуется i величиной стандартного отклонения s. В количественном химическом анализе величина s часто рассматривается как оценка случайной ошибки, свойственной данному методу анализа. Квадрат этой величины 2 s называют дисперсией. Величина дисперсии может рассматриваться как мера воспроизводимости результатов, представленных в данной 2 выборке. Вычисление величин s и s проводят по уравнениям I.1.5 и I.1.6. Иногда для этого предварительно определяют значения отклонений d и число степеней свободы (число независимых i вариант) f: _ d = х - х ; (I.1.3.) i i f = n - l; (I.1.4.) n 2 n 2 - 2 SUM d SUM х - nх 2 1 i 1 i s = --------- = ---------------; (I.1.5.) f f ---- / 2 s = \/ s . (I.1.6.) Стандартное отклонение среднего результата S_ рассчитывают по по уравнению: х s s_ = -------. (I.1.9.) х --- \/ n Примечание I.1.1. При наличии ряда из g выборок с порядковыми 2 номерами k (l <= k <= g) расчет дисперсии s целесообразно проводить по формуле: i=n ┌ i=n ┐ k=g k 2 k=g 2 k=g │ k 2 _2 │ SUM SUM d SUM [(n - 1) s ] SUM │ SUM х - n х │ 2 k=1 i=1 ik k=1 k k k=1 └ i=1 ik k k ┘ s = ------------- х ----------------- = ------------------------ f f f (I.1.7.) При этом число степеней свободы равно: k=g f = SUM (n - 1). (I.1.8.) k=1 k где х - среднее k - той выборки; n - число вариант в k-той k k 2 выборке; х - i-тая варианта k-той выборки; s - дисперсия k-той ik k выборки; d - отклонение i-той варианты k-той выборки. ik Необходимым условием применения уравнений I.1.7 и I.1.8 является отсутствие статистически достоверной разницы между 2 отдельными значениями s . В простейшем случае сравнение крайних k 2 значений s проводят, исходя из величины критерия F, которую k вычисляют по уравнению I.3.4 и интерпретируют, как указано в разделе I.3. Примечание I.1.2. Если при измерениях получают логарифмы искомых вариант, среднее выборки вычисляют как среднее геометрическое, используя логарифм вариант: n SUM lg х _ 1 i lg х = ------------ , (I.1.10) g n откуда _ ------------ _ х = n / х1х2... х = antilg (lg х ). (I.1.11) g \/ n g 2 Значения s , s и s_ в этом случае также рассчитывают, х исходя из логарифмов вариант, и обозначают соответственно через 2 _ s , s и s х . lg lg lg g Пример I.1.1. При определении содержания стрептоцида в образце линимента были получены следующие данные.
n = 5; f = n - 1 = 5 - 1 = 4 n SUM х 9,52 + 9,55 + 9,83 + 10,12 + 10,33 1 i х = ------- = ---------------------------------- = 9,87. n 5 _ d = │x - x│ = │x - 9,87│, т.е. d1 = │9,52 - 9,87│ = 0,35 и т.д. i i i n n 2 _2 SUM d SUM х - nх 2 1 i 1 i s = ------- = ------------- = f f 2 2 2 2 2 2 (9,52 + 9,55 + 9,83 + 10,12 + 10,33 ) - 5 х 9,87 = ----------------------------------------------------- = 0,1252; 4 --- / 2 ------- s = \/ s = \/ 0,1252 = 0,3538; s 0,3538 s_ = ------- = ------- = 0,1582. х ---- ---- \/ n \/ 5 2 Как было указано выше, значения х, s , s и s_ могут быть х признаны достоверными, если ни одна из вариант выборки не отягощена грубой ошибкой, т. е. если выборка однородна. Проверка однородности выборок малого объема (n < 10) осуществляется без предварительного вычисления статистических характеристик, с этой целью после представления выборки в виде I.1.1 для крайних вариант х1 и x рассчитывают значения контрольного критерия Q, исходя из n величины размаха варьирования R: R = [х1 - х ]; (I.1.12) n [х1 - х2] Q1 = ----------; (I.1.13a) R [х - х ] n n - 1 Qn = -------------; (I.1.13б) R Выборка признается неоднородной, если хотя бы одно из _ вычисленных значений Q превышает табличное значение Q (Р, n), _ найденное для доверительной вероятности Р (см. табл. 1 приложения). Варианты х1 или х , для которых соответствующее n _ значение Q > Q (P, n), отбрасываются, и для полученной выборки уменьшенного объема выполняют новый цикл вычислений по уравнениям I.1.12 и I.1.13 с целью проверки ее однородности. Полученная в конечном счете однородная выборка используется для вычисления х, 2 s , s и s_. х Примечание I.1.3. При │х1 - х2│ < │х2 - х3│ и │х - х │ < │ n n - 1│ │х - х │ уравнения I.1.13 а и I.1.13 б принимают │ n - 1 n - 2│ соответственно вид: │х - х │ │х2 - х3│ │ n - 1 n - 2│ Q1 = ------------; Qn = -----------------. R R Пример I.1.2. При проведении девяти (n = 9) определений содержания общего азота в плазме крови крыс были получены следующие данные (в порядке возрастания):
По уравнениям I.1.12 и I.1.13а находим: R = │х1 - х │ = │0,62 - 0,99│ = 0,37; n │х1 - х2│ │0,62 - 0,81│ Q1 = --------------- = ------------- = 0,51. R 0,37 По таблице 1 приложения находим: Q(9; 95%) = 0,46 < Q1 = 0,51; Q(9; 99%) = 0,55 > Q1 = 0,51. Следовательно, гипотеза о том, что значение х1 = 0,62 должно быть исключено из рассматриваемой совокупности результатов измерений как отягощенное грубой ошибкой, может быть принята с доверительной вероятностью 95%, но должна быть отвергнута, если выбранное значение доверительной вероятности равно 99%. Для выборок большого объема (n >= 10) проверку однородности проводят после предварительного вычисления статистических _ 2 характеристик х, s , s и s_. При этом выборка признается х однородной, если для всех вариант выполняется условие: │di│ <= │3s│. (I.1.14) Если выборка признана неоднородной, то варианты, для которых │di │ > 3s, отбрасываются, как отягощенные грубыми ошибками с доверительной вероятностью Р > 99,0%. В этом случае для полученной выборки сокращенного объема повторяют цикл вычислений статистических характеристик по уравнениям I.1.2, I.1.5, I.1.6, I.1.9 и снова проводят проверку однородности. Вычисление статистических характеристик считают законченным, когда выборка сокращенного объема оказывается однородной. Примечание I.1.4. При решении вопроса об однородности конкретной выборки небольшого объема также можно воспользоваться выражением I.1.14, если известна оценка величины s, ранее найденная для данного метода измерения (расчета) вариант. I.2. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ И ОЦЕНКА ИХ ВЕЛИЧИНЫ Если случайная однородная выборка конечного объема n получена в результате последовательных измерений некоторой величины А, _ имеющей истинное значение "ми", то среднее этой выборки х следует рассматривать лишь как приближенную оценку А. Достоверность этой _ оценки характеризуется величиной доверительного интервала х +/- _ "ЕЛЬТА"х, для которой с заданной доверительной вероятностью Р выполняется условие: _ _ _ _ (х - "ДЕЛЬТА"х) <= "ми" <= (х + "ДЕЛЬТА"х). (I.2.1) Расчет граничных значений доверительного интервала проводят по Стьюденту, предполагая, что варианты, входящие в выборку, распределены нормально: _ _ _ t(P,f)s (х +/- "ДЕЛЬТА"х) = х +/- ----------- (I.2.2) --- \/ n Здесь t(P, f) - табличное значение критерия Стьюдента (см. таблицу II приложения). Если при измерении одним и тем же методом двух близких значений А были получены две случайные однородные выборки с объемами n и m, то при m < n для выборки объема m справедливо выражение: _ _ _ t(P,f(n))S(n) х +/- "ДЕЛЬТА"х = х +/- --------------- (I.2.3) (m) (m) (m) ---- \/ m (индекс указывает принадлежность величин к выборке объема m или n). Выражение I.2.3 позволяет оценить величину доверительного _ интервала среднего х(m), найденного, исходя из выборки объема m. _ Иными словами, доверительный интервал среднего х(m) выборки относительно малого объема m может быть сужен благодаря использованию известных величин s(n) и t(P, f(n)), найденных ранее для выборки большего объема n (в дальнейшем индекс n будет опущен). m + n Примечание I.2.1. Если n <= 15, а ----- > 1,5, величины s и f n целесообразно вычислять, как указано в примечании I.1.1. Подставляя n = 1 в выражение I.2.2 или m = 1 в выражение I.2.3, получаем: х +/- "ДЕЛЬТА"х = х +/- t(P, f)s. (I.2.4) i i Этот интервал является доверительным интервалом результата отдельного определения. Для него с доверительной вероятностью Р выполняются взаимосвязанные условия: х - "ДЕЛЬТА"х <= "ми" <= х + "ДЕЛЬТА"х ; (I.2.5) i i "ми" - "ДЕЛЬТА"х <= х <= "ми" + "ДЕЛЬТА"х ; (I.2.6) i _ Значения "ДЕЛЬТА"x и "ДЕЛЬТА"х из выражений I.2.2 и I.2.4 используют при вычислении относительных погрешностей отдельной _________ варианты ("эпсилон") и среднего результата ("эпсилон"), выражая эти величины в %: "ДЕЛЬТА"х "эпсилон" = --------- 100% (I.2.7) _ х _ _______ "ДЕЛЬТА"х "эпсилон" = -------- 100% (I.2.8) _ х Пример I.2.1. В результате определения содержания хинона в стандартном образце хингидрона были получены следующие данные (n = 10).
Расчеты по формуле I.1.2, I.1.4, I.1.5, I.1.6, I.1.9 дали следующие результаты: _ 2 х = 49,96; f = 9; s = 0,01366; s = 0,1169; s_ = 0,03696. х Доверительные интервалы результата отдельного определения и среднего результата при Р=90% получаем согласно I.2.4 и I.2.2: x +/- "ДЕЛЬТА"x = х +/- t(P,f)s = х +/- t(90%, 9)s = i i i = x +/- 1,83 х 0,1169 = х +/- 0,21; i i _ _ _ t(P,f)s 1,83 х 0,1169 x +/- "ДЕЛЬТА"x = х +/- ---------- = 49,96 +/- ------------- = ---- ---- \/ n \/ 10 = 49,96 +/- 0,07 _______ Тогда относительные погрешности "эпсилон" и "эпсилон", согласно I.2.7 и I.2.8, равны: "ДЕЛЬТА"х 0,21 "эпсилон" = --------- 100% = ------ х 100% = 0,42%; _ 49,96 х _ _______ "ДЕЛЬТА"х 0,07 "эпсилон" = --------- 100% = ------ х 100% = 0,14%. _ 49,96 х Обозначая истинное содержание хинона в хингидроне через "ми", можно считать, что с 90% доверительной вероятностью справедливы неравенства: "ми" - 0,21 <= х <= "ми" + 0,21; i х - 0,21 <= "ми" <= х + 0,21 (при любом i); i i _ _ _ "ми" - 0,07 <= х <= "ми" + 0,07; х - 0,07 <= "ми" <= х + 0,07 (при n = 10). Примечание I.2.2. Вычисление доверительных интервалов для случая, описанного в примечании I.1.2, проводят, исходя из логарифмов вариант. Тогда выражения I.2.2 и I.2.4 принимают вид: t(P,f)s _ _ _ lg lg х +/- "ДЕЛЬТА"lg х = lg х +/- ------------; (I.2.9) |