Биометрия верстка_. Учебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия
Скачать 0.93 Mb.
|
“ Острый живот Заболевания Инфаркт миокарда Перитонит Крупозная пневмония D 4 Тромбоэмбол. лёгочн. артер. S 1 . Боли в груди 0,9 0,5 0,9 0,5 S 2 . Боли в животе 0,3 0,95 0,4 0,01 S 3 . Учащ. дыхание 0,03 0,07 0,91 0,95 S 4 . Угнетение рефлексов 0,01 0,02 0,1 0,83 S 5 . Вздут живот 0,2 0,95 0,13 0,15 S 6 . Шум трения в перикарде 0,86 0,07 0,05 0,01 S 7 . Шум трения плевры 0,1 0,01 0,95 0,1 S 8 . Понижение АД 0,1 0,95 0,78 0,85 S 9 . Лейкоцитоз 0,95 0,83 0,92 0,04 S 10 . Изменения в ЭКГ 0,98 0,17 0,15 0,6 19 II. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Виды случайных величин Величина, которая в зависимости от тех или иных, неподдающихся учету обстоятельств, может принимать различные значения, называется случайной величиной. Причем, каждое значение случайной величины имеет свою вероятность (то есть одни значения встречаются чаще, другие - реже. Пример Врач при анализе лечебной работы за два года подсчитал, какое число первичных больных катарактой приходило на прием каждый месяц. Получился набор чисел 17, 12, 19, 10, 20, 16, 24, 19, 16, 6, 16, 12, 13, 15, 14, 15, 16, 18, 21, 17, 7, 23, 12, 14. Количество больных за определенный промежуток времени является примером случайной величины. Ее значение зависит от многих факторов времени года, погоды и пр. Различают дискретные и непрерывные случайные величины. Случайная величина называется дискретной, если ее значения есть дискретный (то есть прерывный набор чисел - см. приведенный выше пример, в котором случайная величина принимает только целые значения. К непрерывным относятся такие случайные величины, которые могут принимать на определенном интервале любые значения. К непрерывным случайным величинам можно отнести массу и рост человека, температуру тела и т.п.. При большом числе измерений значения дискретной случайной величины в определенном интервале чисел могут повторяться, а непрерывная случайная величина, несмотря на большой набор чисел, может не иметь повторяющихся значений. 2.2. Числовые характеристики дискретных величин случайных величин Допустим, что при совершении опыта n раз получены некоторые числовые характеристики этого опыта X 1 , X 2 ,.... X n . Сточки зрения теории вероятностей каждый отдельный результат является событием. Средним арифметическим совокупности случайных величин ( X ) называется выражение X =(X 1 + X 2 + ....+ X i +..X n )/n = = n i i n X 1 / . (2.1) Когда получено достаточно большое число случайных дискретных величин, то может оказаться много повторных значений. Допустим, что в n измерениях величина X 1 встречается m 1 - раз, X 2 –m 2 раз, ........, X k – m k - раз (причем, m 1 + m 2 +....+m k = n). Тогда среднее арифметическое можно представить следующим образом X =(m 1* X 1 +m 2 *X 2 +.....+m k *X n )/n = = m 1 *X 1 /n + m 2 *X 2 /n+...+ m k *X k /n. = Если n достаточно велико, то отношения m 1 /n, m 2 /n,...., m k /n есть вероятности появления соответствующих значений X –p 1 , p 2 ,...., p k и среднее арифметическое стремится к постоянной величине, называемой математическим ожиданиeм. С учетом этого математическое ожидание можно записать как = = ∗ = ∗ = n i n i i i i i X p X x M 1 1 lim ) ( ν . (2.2) Среднее арифметическое есть величина случайная, а математическое ожидание - неслучайная (детерминированная. Относительно математического ожидания группируются все значения рассматриваемой совокупности случайных величин. Оно представляет собой наиболее вероятное значение этих величин. Для того, чтобы оценить степень отклонения случайных величин от математического ожидания (или среднего арифметического, надо найти разности (X i - Мили. Совокупность этих отклонений также представит набор случайных чисел. Если теперь вычислить среднее отклонение, то оно может оказаться малым или даже равным нулю, так как значения разностей могут быть как положительными, таки отрицательными. Поэтому находят квадраты отклонений (X i Мили. Совокупность квадратов отклонений также представит набор случайных положительных чисел. Дисперсией называется математическое ожидание квадрата отклонения случайной величины относительного своего математического ожидания. Относительно этой величины группируются значения квадратов отклонений. В соответствии с определением дисперсию вычисляют следующим образом = = − ∗ = − ∗ = n i n i i i i i x M X p X X x D 1 1 2 Так как число случайных величин в совокупности является ограниченным, то за дисперсию принимают среднее значение квадратов отклонений всех случайных величин от их среднего арифметического (X i - X ) 2 : [ ] n X Xi n X X X X X X x D n i n / ) ( / ) ( ) ( ) ( ) ( 1 2 2 2 2 2 1 − = − + ⋅⋅ ⋅ + − + − = = ∗ (2.3) Если в совокупности случайных величин много повторяющихся значений, то удобнее рассчитать следующим образом [ ] = − ∗ + ⋅⋅ ⋅ + − ∗ + − ∗ = ∗ n X X m X X m X X m x D n n / ) ( ) ( ) ( ) ( 2 2 2 2 2 1 1 = − ∗ = n i i i X X 1 2 ) ( υ (2.4) Следует помнить что применение формул (2.3-2.4) позволяет найти лишь оценочное значение дисперсии, которое является случайной величиной и может не совпадать с истинным значением дисперсии. Дисперсия имеет размерность квадрата размерности исследуемой случайной величины. Поэтому для оценки ее рассеяния около математического ожидания вводят понятие среднего квадратического отклонениях. Средним квадратическим отклонением называют корень квадратный из дисперсии 5 , 4 0756 , 0 ) 2 20 ( 388 , 40 ) 564 , 0 1 ( 2 / = ∗ − ∗ − = Y X S (2.5) Пример В травматологический пункт в течение месяца ежедневно обращалось следующее число больных 8, 10, 7, 15, 12, 18, 20, 16, 25, 20, 18, 19, 22, 21, 18, 24, 19, 16, 18, , 22, 12, 17, 16 18, 14, 15, 17, 19, 11, 14. Найдите среднее число ежедневных обращений в травмпункт. Так как в наборе чисел есть повторяющиеся значения, то приведенную выше совокупность чисел можно оформить в виде таблицы. При ее оформлении удобно придерживаться следующего порядка 1) в первую строку таблицы занести различные значения величин (х i ) в порядке возрастания повторяющиеся значения надо записать один раз 2) во второй строке надо записать, сколько раз – m i встречается то или иное значение X i ; 3) рассчитать среднее арифметическое по формулам (2.1) или (2.2); 4) вычислить отклонения (X i - X ); 5) найти квадраты отклонений (X i - X ) 2 ; 6) вычислить дисперсию по формулам (2.3) или (2.4); 7) найти среднее квадратичное отклонение по формуле (2.5). В соответствии с изложенным планом можно оформить результаты расчета в таблицу следующим образом (таблица 1): Таблица 1 Xi 7 8 10 11 12 14 15 16 17 m i 1 1 1 1 2 2 2 3 2 X X i − -10 -9 -7 -6 -5 -3 -2 -1 0 2 ) ( X X i − 100 82 49 36 25 9 4 1 0 Таблица 1 (Продолжение) X i 18 19 20 21 22 24 25 m i 5 3 2 1 1 1 1 X X i − 1 2 3 4 5 7 8 2 ) ( X X i − 1 4 9 16 25 49 64 X = 16,7≈17; ; 5 , 18 ) ( = ∗ x D 4 Статистическая обработка показала, что наиболее вероятным будет (17±4) обращений больных в травмпункт в течение дня. 22 2.3. Законы распределения дискретных случайных величин Как уже отмечалось выше, каждому значению дискретной случайной величины соответствует определенная вероятность. Законом распределения дискретной случайной величины называется всякое соотношение, устанавливающее связь между значениями случайной величины и соответствующими вероятностями (p их появления. Закон распределения случайной величины может быть задан в виде графика, формулы или таблицы. Закон распределения в виде таблицы можно получить поданным рассмотренного выше примера и соответствующей ему таблицы 1 (напомним, что n=30). В пределах от X (min) =7 до X (max) =25 запишем всевозможные значения X без пропусков для отсутствующих значений m =0 и p =0 (см. таблицу 2) Данные этой таблицы можно изобразить графически следующим образом(рис По оси абсцисс надо отложить значения приведенной совокупности чисел, по оси ординат - значения вероятностей того, что в 30 испытаниях исследуемое событие произойдет раз. Таблица 2 X i 7 8 9 10 11 12 13 14 15 16 m i 1 1 0 1 1 2 0 2 2 3 p i 0,033 0,033 0 0,033 0,033 0,066 0 0,066 0,066 0,099 Таблица 2 (продолжение) X i 17 18 19 20 21 22 23 24 25 m i 2 5 3 2 1 2 0 1 1 p i 0,066 0,165 0,099 0,066 0,033 0,066 0 0,033 0,033 p(x) 0.16 0.12 0.08 0.04 0 6 10 14 18 22 26 X Рис. 2.1 Получили совокупность ординат, соответствующих данным таблицы, - это закон распределения дискретной случайной величины, заданный графически. По вершинам ординат можно провести огибающую. Из рис. 2.2 видно, что огибающая представляет собой ломаную линию. Очевидно, что при увеличении числа наблюдений n появятся все целые значения X в заданном интервале и огибающая станет более плавной. Вершиной любой теории является создание математических формул для описания рассматриваемого явления. Поэтому расcмотрим несколько случаев математического описания законов распределения случайных величин. 2.3.1. Биномиальное распределение Наиболее распространенным в медицинской практике примером дискретных величин является число больных или обследуемых, которое может принимать, естественно, только целые значения. Дискретной случайной величиной является также число m, показывающее, сколько разв испытаниях произошло ожидаемое событие. Например раза изв одной серии испытаний, 7 раз изв другой серии и т.д. Очевидно, что в любом случае m - целое число, причем 0≤ m i ≤ n. Рассмотрим в общем виде задачу нахождения вероятности того, что при проведении опытов событие А произойдет m раз. Пусть вероятность события А известна, одинакова в каждом опыте и равна p. Вероятность того, что событие Ане произойдет (то есть вероятность противоположного события ), равна (1-p). Допустим, что водной серии из n опытов событие А произошло первые m разине произошло оставшиеся (n-m) раз. Вероятность такой последовательности событий определится по теореме умножения вероятностей и будет равна А, (а) или p n * (m) = p m * (б) Возможен другой порядок появления события А, например, попеременно с событием. При этом меняются местами сомножители в выражении (а, а общее их произведение остается тем же, равным p n * (m). Для нас безразличен порядок наступления события А, важно только, чтобы в n испытаниях оно появилось m раз. Всего таких вариантов столько, сколько имеется разных перестановок из n сомножителей в формуле (а. Если среди n элементов a,b,c...... и т.д. имеются одинаковые (a повторяется раз, b- раз, срази т.д.), то число перестановок определится формулой C = n!/(α!*β!*γ!). Напомним, что знак "!" - факториал - обозначает произведение целых сомножителей от 1 до стоящего перед знаком "!". Например, 5!= 1*2*3*4*5. Значение 0! принимается равным 1. В нашей задаче имеется m сомножителей одного вида (р) и (n- m) сомножителей другого вида (р. Поэтому число перестановок сомножителей в формуле (а) равно С = n!/ [m!*(n-m)!]. Полученная формула совпадает с коэффициентами в разложении бинома Ньютона, которые обозначаются Си определяют число сочетаний из n элементов по m. В соответствии с изложенным, для нахождения вероятности наступления m событий в n испытаниях независимо от последовательности наступления событий надо выражение (б) сложить С) раз. Это соответствует теореме сложения вероятностей теореме "или одна последовательность событий Аи, или другая, или третья и т.д. p(m) = p * (m) + p * (m) +.......+p * (m) = С n * (m). Учитывая формулу (б, последнее выражение можно переписать следующим образом p n (m) = С) * p m * (1-p) n-m (2.6) Как уже отмечалось выше, m - число событий А в n опытах может изменяться от 0 до n: 0 ≤ m ≤ n. Для подсчета вероятностей всех этих случаев надо воспользоваться формулой (2.6): p n (0) = C n (0)* p 0 * (1-p) n ; p n (1) = C n (1)* p 1 * (1-p) n-1 ; p n (2) = C n (2)* p 2 * (1-p) n-2 ; p n (n) = C n (n)* p n * (Так как коэффициенты С) совпадают с коэффициентами в разложении бинома Ньютона, распределение вероятностей, вычисленное по формуле (2.6), называется биномиальным распределением (или распределением Бернулли).Оно дает связь между значениями, определяющими число наблюдений некоторого события (А) в n опытах, и их вероятностями. Значение m, которому соответствует наибольшая вероятность, называется математическим ожиданием, которое в случае биномиального распределения может быть найдено по формуле М) = n * p . (2.7) Дисперсия для случайной величины m в этом случае вычисляется по формуле D(m) = n * p * (1 - p). (2.8) Результат расчета по формулам биномиального распределения может быть представлен графически. В качестве примера рассмотрим вероятность рождения m девочек в группе из 20 новорожденных (0 ≤ m ≤ 20 ). Вероятность рождения девочки при каждых родах примем равной 0,5. Результаты расчета приведены на рис. 2.2. р) 0.2 0.1 0 0 5 10 15 20 m Рис. 2.2 Мы видим, что наиболее вероятным является рождение 10 девочек. То есть для данного примера математическое ожидание равно 10. Этот же результат можно получить по формуле (2.7). Пример Появление колонии микроорганизмов определенного вида при неизменных условиях оценивается вероятностью 0,7. Найдите вероятность того, что в 6 пробах колонии появятся 4 раза. Определите математическое ожидание, дисперсию и среднее квадра- тическое отклонение этого события. p=0,7 p 6 (4) = СМ М - ? D(4)-? D(m) = 6*0,7*0,3 = 1,26; σ(m) = ) (m D =1,12 ≈ 1. б Округление значений Ми) связано стем, что m может принимать только целые значения. 2.3.2. Распределения Лапласа-Гаусса и Пуассона При большом числе опытов n и не очень малой вероятности p использование формулы Бернулли связано с трудоемкими вычислениями. Например, чтобы найти вероятность того, что из 50 новорожденных будет ЗО девочек, надо вычислить следующее выражение p 60 (30) =((50!)/(30! * Заметим, что 20! представляет число из 19 цифр. В этом случае можно пользоваться формулой, которая представляет собой предельный случай формулы Бернулли при достаточно большом числе измерений. Эта формула представляет собой, так называемое нормальное распределение (или распределение Лапласа-Гаусса): ) 2 /( ) ( 2 2 1 ) ( D M m n e D m p ∗ − − ∗ = π . (2.9) Математическое ожидание Ми дисперсию D для расчета нормального распределения определяют по формулами) При большом числе измерений n и малой вероятности события (p<<1) биномиальное распределение переходит в распределение Пуассона np m n e m p n m p − ∗ ∗ = ! ) ( ) ( . (2.10) Это распределение называют также законом редких явлений. На рис. 2.3 сопоставляются результаты расчета для двух распределений. Первое имеет параметры n=30, p=0,3; оно близко к нормальному распределению с математическим ожиданием М. Второе имеет параметры n=30, p=0,05, оно близко к распределению Пуассона с М. Как видно из второго графика, вероятность того, что в 30 опытах событие не произойдет, достаточно велика и равна 0,223. 26 1) 2) Рис. 2.3 2.4. Непрерывные случайные величины При рассмотрении непрерывной случайной величины вводят понятие плотности вероятности. Обозначим р - вероятность попадания значений случайной величины в промежуток от а до а + ∆X = b риса Рис. 2.4 Средней плотностью вероятности будет отношение Δp/ΔX. Чтобы найти значение плотности вероятности для любой заданной точки (X), надо перейти к пределу Δp/ΔX, сжимая интервал ΔX около этой точки. Значение плотности вероятности для рассматриваемой совокупности зависит от выбора точки X. Поэтому можно записать значение предела следующим образом ) / ( ) ( x p Lim x f Δ Δ = х Функциях) называется функцией плотности вероятности. Из вида записи функции х) видно, что она является производной от зависимости p(x): Если вид функции х) известен, то вероятность попадания случайной величины в интервал значений X от X 1 = а до X 2 = b найдется интегрированием Для непрерывной случайной величины математическое ожидание и дисперсия определяются по формулам +∞ ∞ − ∗ = dx x f X x M ) ( ) ( . (2.11) ∗ − = dx x f x M X x D ) ( )) ( ( ) ( 2 . (2.12) Среднее квадратическое отклонение также равно График функции х) называется кривой распределения вероятностей данной случайной величины (рис. 2.5). Рис. 2.5 В соответствии с геометрическим смыслом определенного интеграла вероятность попадания случайной величины на отрезок а, b] равна площади, ограниченной графиком х, осью абсцисс и ординатами аи. Очевидно, что вероятность попадания случайной величины на интервал [ ] +∞ ∞ − ; равна 1, то есть Это соотношение называется условием нормировки функции плотности вероятности. Нормальный закон распределения плотности вероятности Наиболее часто встречаются наборы случайных величин, распределенных по нормальному закону распределения (или закону Гаусса. Если случайная величина распределена по нормальному закону, то функция плотности вероятности имеет следующий вид 28 ) 2 /( )) ( ( 2 2 1 ) ( D x M X e D x f − − ∗ = π (2.13) График функции f(x) для двух совокупностей случайных величин представлен на рис 2.6. Обе функции принимают максимальное значение при одном и том же значении X. Это означает, что математические ожидания совокупностей совпадают. Максимальное значение f(x) при X = M(x), как следует из (есть D x M f π 2 Относительно своего максимального значения функции симметрично убывают с разной скоростью, то есть имеют различную "размытость. "Размытость" функции распределения определяется значением дисперсии. На приведенном графике D 1 (X) < D 2 (X). |