Главная страница

Биометрия верстка_. Учебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия


Скачать 0.93 Mb.
НазваниеУчебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия
Дата31.05.2019
Размер0.93 Mb.
Формат файлаpdf
Имя файлаБиометрия верстка_.pdf
ТипДокументы
#79721
страница5 из 12
1   2   3   4   5   6   7   8   9   ...   12
=
08
,
0
= 0,29.
Пример 3.4. Произведено взвешивание новорожденных детей. Результаты взвешивания представлены в виде вариационного ряда. Число измерений n = 100.
ΔM (кг) 1,75-2,24 2,25-2,74 2,75-3,24 3,25-3,74 3,75-4,24
М
iср
(кг)
2,0 2,5 3,0 3,5 4,0
ν
i
0,02 0,10 0,24 0,30 0,21 Мкг
М
iср
(кг) 4,5 5,0
ν
i
0,10 0,03 Число измерений n = 100 Так как результаты взвешивания представлены в виде интервального ряда, то для вычисления среднего арифметического удобно воспользоваться формулой

=
=

=
n
i
i
ср
I
M
M
1
υ
= 2*0,02+2,5*0,1+3*0,24+3,5*0,3+4*0,21+4,5*0,1+5*
*0,03 = 3,5. Используя среднее арифметическое, составим строки с разностями и квадратами разностей М ср
2,0 2,5 3,0 3,5 4,0 4,5 5,0
ν
i
0,02 0,10 0,24 0,30 0,21 0,10 0,03
М
iср
- M
1,5 1,00 0,50 0,00 0,50 1,00 1.50

iср
- M )
2 2,25 1,00 0,25 0,00 0,25 1,00 2,25 Статистическую дисперсию вычислим по формуле

=
=




=
n
i
i
cp
I
M
M
n
n
x
D
1 2
)
(
1
)
(
ν
=100/99*(2,25*0,02+1*0,1+0,25*0,24+0,25*0,21+1*0,01
+2,25*0,03)=0,429=0,43. Среднее квадратическое отклонение будет равно
)
(
)
(
x
D
x
=
σ
43
,
0
=
= 0,65. Наряду с простыми числовыми характеристиками для оценки выборочных со- вокупностей существуют, так называемые, структурные характеристики. К ним относятся мода, медиана и квантили. Модой (Мо) называется наиболее часто встречающийся результат измерения наиболее часто встречающаяся варианта совокупности в вариационном ряду моде соответствует результат, имеющий наибольшую частоту. Медианой (Ме) называется результат измерений (опыта, который делит вариационный ряд на две равные части. Квантили - это значения результатов измерений, делящие вариационный ряд на четыре, десять и сто равных частей квантили, соответственно, называются квартили, децили и перцентили (или процентили).
Структурные характеристики редко используются для оценок выборочных со- вокупностей. Более подробно об этих характеристиках можно прочитать в специальной литературе [1].
3.4. Доверительная вероятность и доверительный интервал Числовые характеристики результатов измерений (опытов, как характеристики выборочных совокупностей, зависят от числа измерений и от самих результатов измерений и, таким образом, сами являются случайными величинами. Естественно, возникает вопрос насколько полученные по результатам измерений числовые характеристики отличаются от точных значений, те. от числовых характеристик генеральной совокупности. Для оценки достоверности (надежности) числовых характеристик результатов измерений (опытов) в статистике используются понятия доверительной вероятности и доверительного интервала. Доверительной вероятностью, соответствующей данному доверительному интервалу, называется вероятность того, что величина Х лежит в заданном интервале, те. p = p (| ХМ) где p - вероятность того, что величина Х лежит в интервале
[ ММ. Вероятность попадания отдельных значений (реализаций) случайной величины в некоторый интервал можно определить, зная закон распределения этой случайной величины, по формуле где f(x) - функция плотности вероятности. Если исследуемая величина подчиняется нормальному закону распределения, то вероятность попадания отдельных значений случайной величины в заданный интервал будет равна
)
(
2
/
)
(
2
)
(
2 Обычно этот интеграл выражается через функцию Лапласа, значения которой приводятся в справочниках по статистике (см. Таблицу 1 Приложения. Эта вероятность будет равна
[
]
).
(
(
2 1
)
,
(
)
а
b
t
Ф
t
Ф
b
a
p


=
где Ф (t) - функция Лапласа, Так как математическое ожидание результатов измерений М обычно неизвестно, тона практике решают обратную задачу задаются требуемой доверительной вероятностью и по ней определяют доверительный интервал М ± ε.
Подставляя значения а = Ми М + ε в выражения для t b
и t a
получим t
a
= (a - ММ- М) = - ε/σ(x) t
b
= (b - M)/σ(x) = (M + ε - M)/σ(x) = + ε/σ(x) Учитывая, что функция Лапласа - функция нечетная, те. Ф) = - Ф, окончательно получим p = М ± ε) = Ф. Найдя в таблице значение аргумента t b
= дающее соответствующую вероятность, определим границу доверительного интервала ε: t
p
= ε/σ(x) => ± ε = σ(x) * t p
. (3.9) Используя понятие обратной функции Лапласа, формулу для определения доверительного интервала можно зaписать в следующем виде
ε = σ(x) * Ф,
(3.10) где Ф) - обратная функция Лапласа.
Рассмотрим применение понятий доверительной вероятности и доверительного интервала для оценки среднего арифметического результата измерений. Как показано в теории математической статистики, средние арифметические выборочных совокупно- стей при достаточно большом числе измерений (n > 30) подчиняются нормальному закону распределения причем среднее квадратическое отклонение средних арифметических) оказывается враз меньше, чем среднее квадратическое отклонение самих членов выборочной совокупности х, те
σ(
X
) = σ(х)/
n
Из этого следует, что границы доверительного интервала ε для среднего арифметического результатов измерений можно вычислить по формуле (3.10), если вместо среднего квадратического отклонения самих результатов измерений σ(x) подставить среднее квадратическое отклонение средних арифметических
)
(X
σ
:
± ε =
)
(X
σ
* Ф
-1
(p)
)
(
)
(
1
p
Ф
n
x


= σ
(3.11) Если число измерений недостаточно велико (n < 30), но исследуемая величина подчиняется нормальному закону распределения, то границу доверительного интервала можно вычислить, используя коэффициент Стьюдента по формуле
± ε =
p
k
t
X
,
)
(
+
σ
р
к
t
n
x
,
)
(

=
σ
(3.11') где t k,p
= коэффициент Стьюдента, значения которого зависят от доверительной вероятности и числа степеней свободы k = n-1. Значения коэффициента Стьюдента также приводятся в справочниках по статистике (см. Таблицу 2 Приложения. Величина ε определяет интервал М ± ε , внутри которого лежат возможные значения среднего арифметического результатов измерений с заданной (доверительной) вероятностью. Следовательно стой же вероятностью p можно утверждать, что найденное значение среднего арифметического не более, чем на ±ε отличается от математического ожидания этих результатов измерений.
Доверительная вероятность задается, исходя из важности и критичности тех выводов, которые делаются при решении поставленной задачи обычно доверительная вероятность выбирается равной
0,9; 0,95; 0,97; 0,99; 0,995; 0,999. Наряду с доверительной вероятностью часто используется понятие уровня надежности (или просто надежности, под которым понимается величина равная, разности Уровень надежности задается соответственно равным
0,1; 0,05; 0,03; 0,01; 0,005; 0,001. Рассмотрим на примерах вычисление доверительного интервала для заданной доверительной вероятности. Пример 3.5.
Определим доверительный интервал для среднего арифметического результатов измерений, приведенных в примере 3.3 с доверительной вероятностью p = 0,9. В примере 3.3 было получено, что среднее квадратическое отклонение результатов измерений концентрации азота σ(x) = =0,29. Так как число измерений мало (n =
9), то для вычисления доверительного интервала воспользуемся формулой (3.11'). Из таблицы коэффициентов Стьюдента для p = 0,9 и k = n-1 = 8 находим t k,p
= 1,86 и, подставляя его в формулу, получаем
± ε
p
k
t
n
x
,
)
(

=
σ
=
2
,
0 19
,
0 86
,
1 Вычисленное в примере значение концентрации азота
X
= 20,8 с вероятностью p = 0,9 попадает в интервал М ± 0,2, те. отличается от математического ожидания концентрации не более, чем на 0,2. Напомним, что математическое ожидание концентрации- это то значение, которое было бы получено при очень большом числе измерений точнее при бесконечно большом. Отклонение на 0,2 по сравнению со средним арифметическим достаточно мало, те. по результатам измерений получено достаточно точное значение концентрации азота. Пример 3.6.
Определим доверительный интервал для массы новорожденных, вычисленного в примере с доверительной вероятностью p = 0,95. Так как число измерений велико (n = 100), то для вычислений воспользуемся формулой (3.11). Найдем в таблице функции Лапласа значение аргумента t, соответствующее значению функции равному 0,95; это и будет значение обратной функции Лапласа для заданной вероятности Ф) = t з = 1,96. Тогда границы доверительного интервала будут равны
± ε
13
,
0 96
,
1 100 65
,
0
)
(
)
(
1
=

=

=

р
Ф
n
x
σ
При увеличении доверительной вероятности значения обратной функции Лапласа и значения коэффициента Стьюдента увеличиваются, следовательно увеличивается интервал, в котором могут оказаться значения среднего арифметического с заданной вероятностью. Если необходимо получить тот же доверительный интервал с большей вероятностью, то как следует из приведенных формул, необходимо увеличить число измерений n. Точно также, для того, чтобы получить более точную оценку (получить меньший доверительный интервал) стой же вероятностью, тоже необходимо увеличивать число измерений. Приближенно можно считать, что точность оценки среднего арифметического пропорциональна те для того чтобы уменьшить доверительный интервал в два раза, число измерений необходимо увеличить в четыре раза.
3.5. Статистические критерии значимости Числовые характеристики разных серий измерений, как характеристики выборочных совокупностей, различаются между собой, так как зависят от числа измерений (числа членов совокупности) и от самих членов. Эти различия могут носить случайный характер (выборочные совокупности принадлежат к одной и той же генеральной совокупности, а могут быть принципиальными (выборочные совокупности принадлежат к разным генеральным совокупностям). Задача установления достоверности (принципиальности) различий числовых характеристик решается с помощью критериев значимости, которые позволяют с заданной вероятностью утверждать, носят ли различия случайный или принципиальный характер. Существует несколько критериев значимости различий. Одним из таких критериев является d - критерий Стьюдента. Критерий Стьюдента применяется для установления значимости различия средних арифметических двух выборочных совокупностей (двух серий измерений. d - критерий Стьюдента вычисляется по формуле
/
)
(
/
)
(
2 2
1 1
2 1
n
x
D
n
x
D
X
X
d
+

=
(3.12) Как показал Стьюдент, для того, чтобы с заданной вероятностью утверждать, что различие средних арифметических выборочных совокупностей достоверно, необходимо, чтобы критерий d превышал критическое значение d кр Значения d кр зависят от требуемой вероятности (или уровня значимости) и от числа степеней свободы k. Значения d кр совпадают со значениями t k,p критерия Стьюдента для соответствующих значений вероятности и числа степеней свободы k (см. Таблицу 2 Приложения. Рассмотрим на примере применение d - критерия для оценки различия средних арифметических двух серий измерений. Пример 3.7
. При изучении действия некоторого препарата были использованы две группы животных опытная и контрольная (N=8). После окончания опыта были получены следующие изменения массы животных
Опытн. 53 56 65 57 59 53 63 58 Контр. 50 56 44 58 58 51 49 58 Попробуем определить, оказал ли препарат воздействие на массу опытных животных.
Для решения поставленной задачи вычислим средние арифметические значения изменений массы опытных и контрольных животных Х = (53+56+65+57+59+53+63+58)/8 = 59; Х = (50+56+44+58+58+51+49+58)/8 = 53. Как видно из полученных результатов, средние арифметические изменений массы отличаются на шесть единиц однако это отличие может носить случайный характер, зависящий от подбора животных. Для того, чтобы оценить значимость различия изменения массы, найдем средние квадратические отклонения изменений массы и подставим их в формулу для вычисления d – критерия

=



=
n
i
i
X
X
n
x
D
1 2
)
(
1 1
)
(
;
)
(
)
(
x
D
x
=
σ
[
]
7
,
4 71
,
4 7
/
)
59 58
(
)
59 56
(
)
59 53
(
)
(
2 2
2 1

=

+
⋅⋅

+

+

=
x
σ
[
]
3
,
5 26
,
5 7
/
)
53 58
(
)
53 56
(
)
53 50
(
)
(
2 2
2 2

=

⋅⋅

+

+

=
x
σ
( )
41 2
8
/
3
,
5 8
/
)
7
,
4
(
53 59
/
)
(
/
)
(
2 2
2 2
2 1
2 1
2 Для того, чтобы средние арифметические можно было считать достоверно разными, величина d должна превышать критическое значение d - критерия для заданной вероятности p и заданного числа степеней свободы k. Зададимся вероятностью р =
0,95, а число степеней свободы вычислим по формуле k = n
1
+ n
2
- 2 = 8 + 8 - 2 = 14. Для р = 0,95 ив таблице d - критерия находим, что d кр = 2,14. Вычисленное значение d - критерия оказалось больше, чем критическое значение значит средние арифметические изменений массы действительно различаются. С высокой степенью надежности ( с вероятностью p = 0,95 ) можно утверждать, что данный препарат влияет на массу животных. В рассматриваемом примере число степеней свободы вычислялось по формуле k = n
1
+ n
2
- 2. (3.13) Эта формула справедлива для случая, когда дисперсии выборочных совокупно- стей равны или отличаются незначительно. Если дисперсии совокупностей отличаются значительно, то число степеней свободы надо определять по формуле
2
)
1
(
)
(
)
1
(
)
(
/
)
(
)
(
2 2
2 4
2 1
2 1
4 1
2 2
2 1
2 1







+
+
+






+
=
n
n
x
n
n
x
n
x
n
x
k
σ
σ
σ
σ
(3.14) При оценке различия средних арифметических выборочных совокупностей по формуле (8) предполагается, что генеральная совокупность подчиняется нормальному закону распределения, а выборочные совокупности независимы друг от друга. Однако в биологии и медицине часто приходится иметь дело с зависимыми выборочными со- вокупностями, например, при сравнении действия лекарственных препаратов или лечебных процедур, при оценке действия климатических факторов. В случае зависимых выборочных совокупностей более правильный результат получается при оценке средних арифметических методом парных сравнений, при котором выявляется отличие средних арифметических попарных разностей от нулевого значения. Рассмотрим метод парных сравнений на примере. Пример 3.8. При сравнении действия двух лекарственных препаратов определялось время действия этих препаратов на одну и туже группу больных. Были получены такие значения времени действия
Больн.
1 2 3 4 5 6 7 8 9 Преп 8.0 7.6 7.5 6.4 7.0 6.8 7.2 7.8 8.3 Преп 7.8 7.0 6.0 8.0 6.2 6.8 7.3 6.0 7.0 Определим, различаются ли эти препараты повремени действия. Так как выборочные совокупности зависимы (опыты проводились на одной и той же группе больных, то различие будем оценивать, сравнивая среднее арифметическое попарных разностей с нулевым значением. Составим таблицу попарных разностей времен действия препаратов на каждого больного
Больн. 1 2 3 4 5 6 7 8 9 Т 0,2 0,6 1,5 -1,6 0,8 0,0 -0,1 1,8 1,3 Найдем среднее арифметическое попарных разностей и среднее квадратиче- ское отклонение этих разностей Т = (Т + Т + Т + ..... +ΔT
n
)/n =
=(0,2+0,6+1,5-1,6+0,8+0,0-0,1+1,8+1,3)/9 = 0,5
=

Δ

Δ
=

=
n
i
i
n
T
T
x
1 2
)
1
(
/
)
(
)
(
σ
= [(0,5-0,2)
2
+ (0,5-0,6)
2
+ ....... +(0,5-1,3)
2
] / 8 =1,03. Определим d - критерий по формуле
45
,
1 03
,
1 9
5
,
0
)
(
=

=
Δ
=
n
x
T
d
σ
(3.15) Зададимся требуемой вероятностью, например, p = 0,95. Для того, чтобы с заданной вероятностью можно было утверждать, что препараты действительно различаются повремени действия (первый препарат имеет большее время действия, полученное значение d -критерия должно превышать критическое значение для вероятности p = 0.95 и k = n - 1 = 8. Находим в таблице d - критерия значение d, соответствующее заданной вероятности и заданному числу степеней свободы получаем d кр , равное
2.31. Вычисленное значение d оказалось меньше критического, это значит, что по результатам данного опыта нельзя утверждать, что препараты различаются повремени действия. Вероятно, различие (Т = 0,5), полученное по результатам опыта, носит случайный характер. При оценке различий средних арифметических выборочных совокупностей накладывалось условие, что дисперсии этих совокупностей должны быть одинаковыми. Однако, дисперсии выборочных совокупностей различаются между собой, так как зависят от числа членов совокупности и от самих членов. С другой стороны, различие
между дисперсиями может носить и принципиальный характер (выборочные совокупности относятся к разным генеральным совокупностям). Для оценки достоверности различий дисперсий выборочных совокупностей используется критерий Фишера, который вычисляется по формуле
F = σ
1 2
(x) / σ
2 2
(x) . (3.16) При вычислении F - критерия берется отношение большей дисперсии к меньшей, поэтому критерий всегда больше единицы. Для того, чтобы можно было утверждать, что различие дисперсий выборочных совокупностей носит случайный характер, величина F - критерия не должна превышать некоторое критическое значение, зависящее от требуемой вероятности и числа степеней свободы первой (k
1
= n
1
-1) и второй
(k
2
= n
2
-1) выборочных совокупностей. Применим F -критерий для оценки дисперсий выборочных совокупностей, полученных в примере 3.7 Если вычислить F -критерий для опытной и контрольной групп, то получим
F = σ
1 2
(x) /σ
2 2
(x) = 5,3 2
/4,7 2
= 1,25 По таблице F -критерия (см. Таблицу а Приложения) найдем критическое значение для вероятности p = 0,95 и числа степеней свободы k
1
= 7 и k
2
= 7 ; соответствующее значение критерия равно 3,79. Так как вычисленное значение критерия значительно меньше критического, то следует предположить, что различия дисперсий носят случайный характер.
1   2   3   4   5   6   7   8   9   ...   12


написать администратору сайта