Главная страница

Биометрия верстка_. Учебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия


Скачать 0.93 Mb.
НазваниеУчебнометодическое объединение по медицинскому и фармацевтическому образованию вузов России биометрия
Дата31.05.2019
Размер0.93 Mb.
Формат файлаpdf
Имя файлаБиометрия верстка_.pdf
ТипДокументы
#79721
страница2 из 12
1   2   3   4   5   6   7   8   9   ...   12
1.3. Полная вероятность зависимого события Среди зависимых событий могут встречаться события, которые с разной вероятностью могут произойти при наступлении не одного, а нескольких случайных событий. Необходимость прогнозирования, то есть определения вероятности таких событий, часто возникает в медицинской практике. Пусть событие А может произойти только при наступлении одного из нескольких несовместных событий В, В, В
3
,....В
n
, образующих полную группу. Каждое из событий В имеет свою вероятность p(В
1
),p(В
2
),p(В
3
),...p(В
n
), причем В как сумма вероятностей событий, образующих полную группу. Событие А может произойти при наступлении одного из событий В с разной условной вероятностью p(А/В
i
),поэтому мы имеем по числу В) условных вероятностей события А p(А/В
1
),p(А/В
2
),p(А/В
3
).........p(А/В
n
). Полной вероятностью события А в этом случае называется величина А, равная p(А)=p(В
1
)*p(А/В
1
)+p(В
2
)*p(А/В
2
)+....+p(В
n
)*p(А/В
n
), то есть сумме произведений вероятностей событий В на условные вероятности события А - p(А/В
i
). Рассмотрим примерна применение понятия полной вероятности. Пример Спецотделение больницы принимает больных с пятью видами заболеваний, условно В
1

2

3

4

5
. Относительные частоты (вероятности) каждого из них по многолетним данным равны 0,1; 0,2; 0,15; 0,4; 0,15. Для лечения этих заболеваний может потребоваться переливание крови с вероятностями для каждого из этих заболеваний равными (соответственно для В
1

2
,...В
5
). Какое количество крови нужно заготавливать на 100 больных, если на одно переливание требуется 400 мл крови Для решения этой задачи необходимо найти полную вероятность переливания крови (для любого больного. Переливание крови событие А, которое может наступить только при одном из заболеваний, то есть событии В. Тогда в соответствии с этими обозначениями и данными задачи имеем В В В В В p(А/В
1
)=0,5; p(А/В
2
)=0,3; p(А/В
3
)=0,4; p(А/В
4
)=0,1; p(А/В
5
)=0,2 Полная вероятность переливания крови равна p(А)=p(В
i
)*p(А/В
i
)=0,1*0,5+0,2*0,3+0,15*0,4+0,4*0,1+0,15*0,2=0,24 . Тогда из 100 больных переливание крови понадобится в среднем m = 100*0,24 =
24 больным, для которых потребуется V = 0,4*24 = 9,6 литров крови. Формула Байеса Рассмотрим другую задачу при тех же исходных данных : событие А зависимо от каждого из событий В, образующих полную группу. Если известно, что событие А произошло, то можно решить обратную задачу - определить, какова вероятность каждого из событий В
1

2
,...В
n при условии, что событие А произошло. Для более наглядного представления сути задачи воспользуемся приведенным выше примером на переливание крови. Представим его условие в виде таблицы i 1 2
3 4
5 В) 0,1 0,2 0,15 0,4 0,15 p(А/В
i
) 0,5 0,3 0,4 0,1 0,2 p(В
i
)-вероятности всех заболеваний p(А/В
i
)-условные вероятности переливания крови приданном заболевании А) = 0,24 - полная вероятность переливания крови. Теперь мы должны определить вероятность одного из пяти заболеваний, зная, что больному сделано переливание крови. Задача нахождения условной вероятности одного из независимых событий, образующих полную группу, при условии, что произошло зависимое от них событие А, впервые была решена английским математиком Т. Байесом: Формула Байеса показывает, что искомая вероятность равна вероятности события В, умноженной на условную вероятность события А при В и деленной на полную вероятность события А. В соответствии с формулой Байеса и данными таблицы вероятности заболеваний при условии, что переливание крови сделано, равны p(В
1
/А)=
24
,
0 5
,
0
*
1
,
0
=0,208 ; p(В
2
/А)=
24
,
0 2
,
0
=0,25 ; p(В
3
/А)=
24
,
0 4
,
0
*
15
,
0
=0,25 ; p(В
4
/А) =
24
,
0 1
,
0
*
4
,
0
=0,167 ; p(В
5
/А)=
24
,
0 2
,
0
*
150
,
0
=0,125 . Более реальные задачи, использующие формулу Байеса, связаны с построением диагностических алгоритмов и применением ЭВМ в диагностике заболеваний.
1.4. Применение методов теории вероятностей в диагностике заболеваний Методы теории вероятностей нашли применение для создания алгоритмов диагностики заболеваний с помощью ЭВМ. Каждое заболевание диагностируется на основе наличия у больного определенной совокупности симптомов или симптомо - комплексов, характерных для классического течения болезни. Но даже классическое описание болезни допускает, что симптомы могут проявляться в разной степени, некоторые из них могут даже отсутствовать в отдельных случаях. Кроме этого, индивидуальные особенности пациентов также влияют на симптоматику заболеваний. Все это свидетельствует о том, что как сами заболевания, таки их симптомы, носят характер случайных величин, появление которых в каждом конкретном случае характеризуется определенной вероятностью (относительной частотой.
Установление вероятностей заболеваний и их симптомов требует анализа достаточно большого количества историй болезни и их статистической обработки. На основе этого анализа могут быть получены значения вероятностей появления отдельных заболеваний (диагнозов - D
i
) и вероятности появления различных симптомов - к при каждом из заболеваний D
i
. Последние будут представлять собой условные вероятности
- к, так как каждый симптом к, как случайное событие, появляется только при наличии того или иного заболевания D
i
, которое рассматривается как независимое событие. Очевидно, что необходимо учитывать и взаимную зависимость симптомов (например, температуры тела и частоты сердечных сокращений ), однако этим нередко пренебрегают в силу сложности количественного учета этих зависимостей. При разработке методов вычислительной диагностики обычно берется одна группа заболеваний ( органов дыхания, брюшной полости или т.п.), так как единая диагностическая задача будет перегружена информацией и ее использование практически нерационально. Первичное же определение той или иной группы заболеваний может основываться, например, на жалобах больного. Объединение заболеваний в одну группу) предполагает, сточки зрения теории вероятностей, что они образуют полную группу событий, сумма вероятностей которых должна быть равной 1 в соответствии с теоремой сложения вероятностей. Рассмотрим последовательные этапы создания диагностического алгоритма на примере конкретных числовых данных. Первый этап - сбор информации о вероятностях рассматриваемых заболеваний и их симптомов. Предположим, что нас интересует диагностика одного из х заболеваний, имеющих близкую симптоматику. Анализ 100 историй болезни с достоверно подтвержденными диагнозами показал, что заболевание D
1
встретилось 20 разрази раз. Для всех этих заболеваний характерны 5 симптомов (S
1
, S
2
, S
3
, S
4
, S
5
), причем симптом встретился 16 раз при заболевании D
1
, 6 при заболевании D
2
, 5 раз
- при D
3
и 14 раз - при D
4
. Подобные данные можно получить и по другим симптомам. Затем находятся вероятности (относительные частоты) заболеваний) и условные вероятности симптомов к. Все полученные значения вероятностей с учетом необходимости последующего ввода их в ЭВМ удобно представить в виде диагностической таблицы. Поданным этой таблицы можно найти полную вероятность каждого из симптомов кв данной группе заболеваний
405
,
0
)
/
(
*
)
(
)
(
4 1
1 1
=
=

=
i
i
i
D
S
p
D
p
S
p
375
,
0
)
/
(
*
)
(
)
(
4 1
2 2
=
=

=
i
i
i
D
S
p
D
p
S
p
222
,
0
)
/
(
*
)
(
)
(
4 1
3 3
=
=

=
i
i
i
D
S
p
D
p
S
p
365
,
0
)
/
(
*
)
(
)
(
4 1
4 4
=
=

=
i
i
i
D
S
p
D
p
S
p
Полные вероятности симптомов могут потребоваться, например, для прогнозирования потребностей в анализах или иных диагностических процедурах, необходимых для установления данного симптома при известном количестве больных. Однако главное назначение диагностической таблицы
- установление вероятности указанных заболеваний при наличии у больного симптома к. С этой целью воспользуемся формулой Байеса, согласно которой вероятность заболевания D
i при наличии симптома к будет равна Диагностическая таблица.

D
i p(D
i
) p(S
k
/D
i
)
D
1 0,2 0,8 0,2 0,3 0,7 0,1
D
2 0,3 0,2 0,7 0,4 0,5 0,6
D
3 0,15 0,3 0,6 0,05 0,3 0,4
D
4 0,35 0,4 0,1 0,1 0,2 0,3 При наличии, например, симптома S2 имеем
=
)
/
(
2 1
S
D
p
)
(
)
/
(
*
)
(
2 1
2 1
S
p
D
S
p
D
p
=
375
,
0 2
,
0
*
2
,
0
=0,107 ;
=
)
/
(
2 2
S
D
p
)
(
)
/
(
*
)
(
2 2
2 2
S
p
D
S
p
D
p
=
375
,
0 7
,
0
*
3
,
0
=0,56 ;
=
)
/
(
2 3
S
D
p
)
(
)
/
(
*
)
(
2 3
2 3
S
p
D
S
p
D
p
=
375
,
0 6
,
0
*
15
,
0
=0,24 ;
=
)
/
(
2 4
S
D
p
)
(
)
/
(
*
)
(
2 4
2 4
S
p
D
S
p
D
p
=
375
,
0 1
,
0
*
35
,
0
=0,093 ; Аналогично можно определить вероятности заболеваний при наличии другого симптома, что рекомендуем проделать в качестве упражнения на использование приведенных формул. Установление диагноза по одному симптому задача- нереальная, так как для этого необходим набор симптомов. Все сказанное выше остается справедливым, если под S
1
, S
2
, S
3
.... подразумевать не отдельные симптомы, а симптомо-комплексы, то есть

15
определённые сочетания симптомов, которыми сопровождаются (стой или иной вероятностью) данные заболевания. Если же диагностическая таблица содержит вероятности отдельных симптомов, то для независимых друг от друга симптомов полные вероятности заболеваний при наличии всего набора симптомов можно определить по модифицированной формуле
Байеса, которая в нашем случае имеет вид p(D
1
/S
1
,S
2
,S
3
,S
4
,S
5
)=

=
4 1
5 2
1 1
5 1
2 1
1 1
)
/
(
*
*
)
/
(
*
)
/
(
*
)
(
)
/
(
*
)
/
(
*
)
/
(
*
)
(
i
i
i
i
i
D
S
p
D
S
p
D
S
p
D
p
D
S
p
D
S
p
D
S
P
D
p
p(D
2
/S
1
,S
2
,S
3
,S
4
,S
5
) =

=
4 1
5 2
1 2
5 2
2 2
1 2
)
/
(
*
*
)
/
(
*
)
/
(
*
)
(
)
/
(
*
)
/
(
*
)
/
(
*
)
(
i
i
i
i
i
D
S
p
D
S
p
D
S
p
D
p
D
S
p
D
S
p
D
S
P
D
p
p(D
4
/S
1
,S
2
,S
3
,S
4
,S
5
)=

=
4 1
5 2
1 4
5 4
2 4
1 Обратившись к диагностической таблице, можно убедиться, что для вычисления вероятностей по приведенным формулам необходимо перемножить все числа одной строки. При этом получаем числители формул для Знаменатели всех выражений одинаковы и представляют собой общую сумму всех построчных произведений. Подсчитайте вероятности всех заболеваний самостоятельно и сравните с правильными ответами p(D
i
)*p(S
1
/D
i
)*p(S
2
/D
i
)*p(S
3
/D
i
)*p(S
4
/D
i
)*p(S
5
/D
i
) = =0,006; p(D
1
/S
1
÷
S
5
) = 0,112; p(D
2
/S
1
÷
S
5
)=0.846; p(D
3
/S
1
÷
S
5
) = 0,0272; p(D
4
/S
1
÷
S
5
) = 0,0141 . Очевидно, что наиболее вероятно в рассмотренном примере заболевание Следует отметить, что к такому выводу можно придти и не вычисляя знаменателя, общего для всех формул однако деление на него необходимо для получения абсолютных значений вероятностей заболеваний. В рассмотренном примере отсутствуют данные о самом больном, поскольку в диагностической таблице представлены результаты статистической обработки данных по предшествующим больным. Очевидно, что диагностическая таблица должна содержать наиболее полный перечень симптомов для данной группы заболеваний. У конкретного больного некоторые из этих симптомов могут отсутствовать. Это можно учесть путем однозначных ответов по каждому из симптомов (есть - нет. С учетом этой возможности и изложенного выше, алгоритм вычислительной диагностики с помощью ЭВМ должен предусматривать а) хранение (или автоматический ввод) в памяти ЭВМ общей диагностической таблицы в виде двумерного массива б) ввод одномерного массива ответов (да-1,нет-0) о наличии или отсутствии у больного каждого из симптомов, приведенных в диагностической таблице в) формирование массива диагностической таблицы больного путем исключения (умножением на 0) симптомов, отсутствующих у больного г) вычисление вероятностей каждого из заболеваний с помощью модифицированной формулы Байеса поданным диагностической таблицы больного д) определение заболевания с максимальной условной вероятностью в качестве предварительного диагноза. Для самостоятельных упражнений по машинной диагностике приводим диагностическую таблицу для х заболеваний, объединенных клинической картиной "Острый живот. Все особенности подобной таблицы уже обсуждались, в данном случае лишь отсутствуют вероятности самих заболеваний p(D
i
). В этом случае обычно полагают их равновероятными, то есть, p(D
1
) = p(D
2
) = p(D
3
) = p(D
4
)= = 1/4, так как имеем всего 4 заболевания. Задачи для самостоятельного решения.

1. В группе из 12 человек трое больны. Найдите вероятности того, что первый выбранный наугад человек больной, а второй - здоровый. Зависимы ли эти события О если первый болен, то вероятность того, что второй здоров - 0,817; если же первый был здоров, то вероятность того, что и второй будет здоров - 0,726; зависимы)
2. На обследование пришла группа из 10 человек. Трое из них больны. Врач приглашает в кабинет по два человека. Найдите вероятность того, что а) оба больны боба здоровы в) один болен, а другой здоров. (1/15; 7/15;7/15)
3. Статистика показывает, что вероятность рождения мальчика равна 0,515. Какова вероятность того, что а) новорожденный окажется девочкой) б) в семье стремя детьми все сыновья (0,14) в) в семье стремя детьми два мальчика (0,39)
4. Согласно статистическим данным вероятности разных групп крови у европейцев следующие А - 0,369, В - 0,235, АВ - 0,066, 0 - 0,390. Найдите вероятность того, что у произвольно взятого донора группа крови А или В. (0,604).

17 5. При аварии пострадали 30 человек, 12 из них получили ожоги. Скорая помощь доставляет в больницу потри человека. Найдите вероятность того, что впервой машине окажутся а) все пострадавшие с ожогами б) все без ожогов. (0,05; 0,20)
6. На складе клиники имеются 15 кардиографов. У пяти из них имеются мелкие неисправности. Какова вероятность того, что из трех взятых наугад приборов хотя бы один окажется неисправным (0,74)
7. Вовремя эпидемии гриппа из 15 человек, доставленных в больницу с переломом, пятеро оказались больны гриппом. В палату помещают по 4 человека. Найдите вероятность того, что в палате окажутся а) все больны гриппом б) хотя бы один болен гриппом. (0,0038; 0,85)
8. На прием к врачу пришли 10 человеку четырех из них повышенная температура. Какова вероятность того, что у первых четырех, вызванных по очереди больных, нормальная температура Какова вероятность того, что среди них окажется хотя бы один с повышенной температурой (1/14; 13/14)
9. Студент пришел на экзамен, зная лишь 20 вопросов из 24. В билете 3 вопроса. Найдите вероятность того, что ему в билете попадется хотя бы один вопрос, которого он не знает. (0,42)
10. Вероятность отрицательного резус-фактора крови у женщины - 0,2, у мужчины. Каковы вероятности браков супругов с положительными резус-факторами ; б) с отрицательными в) с разными резус-факторами? (0,68; 0,03; 0,29)
11. В спецотделении больницы поступают пациенты с четырьмя заболеваниями, вероятности которых по многолетним наблюдениям равны 0,2, 0,3, 0,4 и 0,1. Вероятность того, что поступившему больному требуется рентгенография при первом заболевании, при втором - 0,3, при третьем - 0,2, при четвертом - 0,7. Сколько листов рентгеновской пленки надо запасти на неделю, если в среднем за неделю в отделение поступает 20 человек (7)
12. Утром на прием в поликлинику пришло 30 пациентов, у которых оказались следующие заболевания органов дыхания, нарушения артериального давления, боли в сердце, травмы. Вероятности этих заболеваний соответственно равны 0,4;0,2;0,3 и 0,1. Вероятность того, что надо выдать больничный лист при заболевании органов дыхания
- 0,6; нарушении давления - 0,4; болях в сердце - 0,7; при травмах - 0,8. Сколько больничных листов надо заготовить к началу приема (18)
13. Медсестра обслуживает три послеоперационных палаты впервой палате - двое больных, во второй - трое, в третьей палате - пять больных. Вероятности того что за дежурство придется сделать обезболивающий укол больным первой палаты -1,0, второй палаты - 0,8, третьей - 0,5. Сколько ампул обезболивающего препарата надо иметь в среднем на дежурство медсестре)

18 14. Используя диагностическую таблицу "острый живот, определите наиболее вероятное заболевание у больного с симптомокомплексом S
1
, S
2
, S
6
, S
9
, S
10
. (р) =
0,96). Диагностическая таблица

1   2   3   4   5   6   7   8   9   ...   12


написать администратору сайта