Главная страница

дб. Четвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д


Скачать 3.73 Mb.
НазваниеЧетвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д
Дата19.05.2022
Размер3.73 Mb.
Формат файлаpdf
Имя файла[Dzharratano Dzhozef, Raili Gar - Nieizviestnyi.pdf
ТипДокументы
#538649
страница32 из 74
1   ...   28   29   30   31   32   33   34   35   ...   74

характеризующимся тем, что, во-первых, нет необходимости проводить эксперименты для определения каждой возможной
комбинации вероятностей, и, во-вторых, не требуется отдельно подсчитывать элементы крупных выборочных пространств 322 Глава 4. Рассуждения в условиях неопределенности
Условная вероятность определяется следующим образом Р(А В) =, для P(B) ф О P(A n B) Вероятность Р(В) — это априорная вероятность, определяемая до того, как станет известной какая- либо дополнительная информация. Априорную вероятность,
применяемую в связи с использованием условной вероятности,
иногда называют безусловной вероятностью, или абсолютной вероятностью. Этому определению условной вероятности можно дать интуитивное объяснение, обратившись к примеру на рис. 4.6, где показано выборочное пространство из восьми событий. Согласно рис. 4.6, вероятности могут быть вычислены как отношения количества событий, n(A) или п(В), к общему количеству событий в выборочном пространстве, следующим образом п(А) 4 n(S) 8 р(В) п(В) 6 n(S) 8 Если станет известно, что произошло событие В, то выборочное пространство сократится и будет включать только элементы,
относящиеся кВ Рис. 4.6. Выборочное пространство для двух пересекающихся событий Поскольку произошло событие В, то должны рассматриваться только те события,
относящиеся к А, которые связаны с В Р(А

В) = п(В) 6 4.8. Условные вероятности 323 Чтобы выразить этот результат в терминах вероятностей, достаточно разделить числитель и знаменатель приведенного выше выражения на n(S): n(A n В В) = =, дляР(В) фО n(S) Р(А A В) n(S) Таким образом,
мультипликативный закон для вероятностей двух событий определяется следующей формулой Р(А fl В) = Р(А В)Р(В) А
эта формула эквивалентна формуле Р(А A В) = РВА) Р(А)
Мультипликативный закон для трех событий выражается следующим образом Р(А tl В fl С) = Р(А В A С)Р(В С)Р(С) С
другой стороны, обобщенный мультипликативный закон можно
представить так Р(А,ПА2П ПАРА А . ПАРА Аз ПАРА Ар)Р(А) Таблица 4.6. Гипотетические вероятности отказа жесткого диска в течение одного года
Относящиеся Не относящиеся Итоговые к модели Х к модели Х
данные по (обозначаются Х) (обозначаются Х) строке Отказ, С
Отсутствие отказа С' 0,6 0,1 0,7 0,2 0,1 0,3 0,2 1,0 0,8 Итоговые данные по столбцу Вероятности 0,6, 0,1, 0,2 и 0,1, приведенные в средней части таблицы, называются внутренними вероятностями и представляют пересечения событий. В
качестве примера применения условных вероятностей рассмотрим приведенные в табл. 4.6 гипотетические вероятности отказа жесткого диска при эксплуатации диска модели Х в течение одного года Глава 4. Рассуждения в условиях неопределенности Суммы вероятностей по строками столбцам обозначаются как "Итоговые данные" и называются маргинальными вероятностями, поскольку лежат на полях (margin) таблицы. В
табл. 4.7 и 4.8 приведены более подробные сведения о комбинациях множеств элементарных событий и вероятностей,
а на рис. 4.7 показана диаграмма Венна пересечения выборочных пространств. Как показано в табл. 4.8, сумма итоговых вероятностей по строками столбцам равна 1. Таблица. Интерпретация условной вероятности с учетом множеств элементарных событий Х' Итоговые данные по строкам С' Г Х' С' С' Г Х С'пХ' Итоговые данные по столбцам Таблица Вероятностная интерпретация двух множеств элементарных событий Х Итоговые данные по строкам Р(С п Х) Р(С' п Х) P(X')
Р(С п Х) Р(С' Г Х) P(X) Р(С) P(G') 1.0 С' Итоговые данные по столбцам С помощью табл. 4.8 могут быть рассчитаны вероятности всех событий. Некоторые из полученных при этом значений вероятности описаны ниже. (1) Вероятность аварийного отказа как для модели Х, таки для модели, отличной от Х (выборочное пространство Р(С) = 0.7 (2) Вероятность отсутствия отказа для данного выборочного пространства Р(С')

= 0.3 Х = (СОХ) о(СлХ) Х' = = (С' n X') u (C' n X') С = (СГ1Х)
u(CnX') С' = (С) U (С' п Х) S (Выборочное пространство 4.8. Условные вероятности 325 Рис. 4.7. Интерпретация условных вероятностей двух множеств элементарных событий в выборочном пространстве (3) Вероятность использования модели Х P(X) = 0.8 (4) Вероятность использования модели,
отличной от X: P(X') = 0.2 (5) Вероятность отказа и использования модели Х Р(С fl X) = 0.6 (6) Вероятность отказа при условии, что используется модель X: р(СХ) =P(CnX) ="=
P(X) 0.8 (7) Вероятность отказа при условии, что не используется модель Х Р ) P(X ) 02 При чтении описаний вероятностей (5) и (6) может сложиться впечатление, что они имеют одинаковый смысл. Но случай (5) соответствует просто пересечению двух событий, а случай (6) определяет условную вероятность. Смысл вероятности пересечения двух событий, (состоит в следующем Если бы выбор жесткого диска осуществлялся случайныы образоы, тов Об случая это был бы жесткий диск ыодели Хи этот жесткий диск был бы отказавшиы
Глава 4. Рассуждения в условиях неопределенности 326 Иными словами, в случае (5) используются выборки из совокупности событий, относящихся к жестким дискам. Одни из этих событий соответствуют тому, что эксплуатировался жесткий диск модели
Х и произошел отказ (0.6), другие — что эксплуатировался жесткий диск, не относящийся к модели Хи произошел отказ, третьи — что эксплуатировался жесткий диск модели Хине произошел отказ (0.2), и четвертые — что эксплуатировался жесткий диск, не относящийся к модели Хине произошел отказ. В отличие от этого, условная вероятность,
рассматриваемая в случае (6), имеет совсем другой смысл:
Если бы был выбран жесткий диск модели Х, тов случая этот жесткий диск был бы отказавшим Обратите внимание на то,
что при вычислении условной вероятности мы выбираем только
интересующие нас элементы (относящиеся к модели Хи рассматриваем множество этих элементов как новое выборочное пространство. Если любое из приведенных ниже уравнений является справедливым, то события Аи В
называются независимыми. P(A Вили РВА Р(В)
или P(A П В) = P(A) P(B) При этом, если справедливо одно из этих уравнений, таковыми являются и другие. Теорема Байеса
Условная вероятность P(A В) определяет вероятность события
А с учетом того, что произошло событие В. Задача,
противоположная задаче вычисления условной вероятности,
состоит в определении обратной вероятности, которая показывает вероятность предыдущего события с учетом того,
что произошло последующее. На практике с вероятностью такого типа приходится встречаться довольно часто, например,
при проведении медицинской диагностики или диагностики оборудования, в которой обнаруживаются симптомы, а задача заключается в том, чтобы найти наиболее вероятную причину.
Для решения этой задачи применяется теорема Байеса, которую иногда называют формулой Байеса, правилом Байеса или законом Байеса в честь британского священнослужителя и математика XVIII века Томаса Байеса. Байесовская теория в наши дни широко используется во многих приложениях. В
действительности байесовская логика применяется в знакомых многим приложениях Ofhce Assistant и Technical Troubleshooter
Help, которые по умолчанию предоставляются в комплекте с программой Microsoft Ofhce и операционной системой эти приложения обеспечивают более. Условные вероятности 327 качественный поиск причин неисправности и лучшую помощь, чем при использовании простых деревьев решений [32]. В качестве примера применения теоремы Байеса рассмотрим, как с ее помощью рассчитать вероятности отказа жестких дисков. Согласно определению условной вероятности, показанному в случае (вероятность того, что отказ жесткого диска модели Х произойдет
в течение одного года, равна Ъ, а согласно данным,
относящимся к случаю (7), вероятность отказав течение одного года жесткого диска, не относящегося к модели Х, равна Противоположная задача состоит в следующем предположим,
что имеется жесткий диски неизвестна его модель. Какова вероятность того, что он относится к модели Х или к модели,
отличной от Х, если он отказал Подобная ситуация, в которой пользователь фактически не знает, какая модель жесткого диска установлена на его компьютере, встречается постоянно,
поскольку изготовители компьютеров очень редко занимаются изготовлением жестких дисков. Вместо этого многие изготовители компьютеров покупают жесткие диски у изготовителей комплектного оборудования (Original Equipment
Manufacturer— OEM), устанавливают эти жесткие диски в корпуса своих компьютеров и продают под собственной маркой.
Один и тот же изготовитель компьютеров может время от времени переходить на другие модели жестких дисков из-за того, что предложение другого изготовителя комплектного оборудования становится более выгодным, но его собственная модель остается неизменной. Если принято предположение, что произошел отказ жесткого диска, вероятность того, что он относится к модели Х, можно вычислить с использованием формулы условной вероятности и результатов, полученных в случаях (1) и (5), следующим образом Р(СПХ) 06 6 P(C) 0 7 Еще один вариант состоит в том, что можно применить мультипликативный закон к числителю и взять данные,
полученные в случаях (1), (3) и (6), как показано ниже. Р(С I Х)
Р(Х) (0.75) (0.8) 0.6 6 P(C) 07 07 7 Вероятность типа Р(Х f С)
называется обратной, или апостериорной вероятностью,
определяющей вероятность того, что отказавший диск относится к модели Х. Дерево решений для задачи определения вероятностей отказов дисков приведено на рис. 4.8. Узлы,
обозначенные прямоугольниками, соответствуют действиям, или решениям, а узлы, отмеченные кружками, показывают события,
или проявления. Априорные вероятности представляют собой вероятности, полученные до проведения экспериментов по определению количества отказов

328 Глава 4. Рассуждения в условиях неопределенности Рис. Дерево решений для задачи с отказами жестких дисков
Общая форма теоремы Байеса может быть записана в терминах событий, Е, и гипотез (предположений, Н, в виде следующих альтернативных вариантов Р(Н, Е) Р(ЕГИН) РЕ Н,)P(H,)
,'),'Р(Е Н )P(H) 3 РЕ Н,)Р(Н,) РЕ) 4.9 Гипотетические рассуждения и обратная индукция Теорема Байеса широко используется для анализа деревьев решений в экономике и общественных науках. Метод байесовского принятия решений применя- С другой стороны, апостериорные (или обратные)
вероятности представляют собой вероятности, определяемые после завершения экспериментов. Апостериорные вероятности позволяют пересматривать значения априорных вероятностей для получения более точных результатов. Гипотетические рассуждения и обратная индукция 329 ется также в экспертной системе PROSPECTOR при определении перспективных площадок для разведки полезных ископаемых.
Система PROSPECTOR приобрела широкую известность как первая экспертная система, с помощью которой было открыто ценное месторождение молибдена, имеющее стоимость миллионов долларов. В качестве примера байесовского принятия решений в условиях неопределенности рассмотрим задачу разведки месторождений нефти. Первоначально геологоразведывательная компания должна решить, каковы шансы успешного обнаружения нефти. Если отсутствуют какие- либо свидетельства за или против наличия нефти, то геологоразведывательная компания может присвоить такие субъективные априорные вероятности наличия и отсутствия нефти (0): Р) = P(0') = 0.5 Принято использовать такое выражение, что присваивание вероятностей, равномерно распределенных между возможными результатами в условиях отсутствия свидетельств, осуществляется в безнадежном
положении (in desperation). Термин в безнадежном положении необязательно означает, что геологоразведывательная компания
(обязательно) находится в положении, из которого нет выхода.
Этопросто технический термин для обозначения непредубежденного априорного присваивания вероятностей.
Безусловно, геологоразведывательная компания может считать,
что шансы обнаружения нефти лучше чем 50 на 50, ив связи с этим руководствоваться следующим предположением РО) =
0.6 P(0') = 0.4 Очень важным средством разведки месторождений нефти и полезных ископаемых являются сейсмические исследования. При использовании этого метода с помощью взрывчатых веществ или механических средств создаются звуковые импульсы, движущиеся в глубины Земли.
Отраженные звуковые волны обнаруживаются микрофонами,
расположенными в разных местах. Регистрация времени прибытия импульсов и наблюдение за искажениями формы звуковой волны позволяют определить наличие перспективных геологических структур и возможность залегания месторождений нефти и полезных ископаемых. Но, к сожалению, сейсмические исследования не обеспечивают
100'Ъ-ную точность. На распространение звуковых волн могут повлиять геологические структуры некоторых типов, поэтому отчеты о проведенных испытаниях будут свидетельствовать о наличии нефти, в то время как фактически месторождение отсутствует (ложно положительный результат. Аналогичным образом, результаты испытания могут указывать на отсутствие нефти, тогда как действительно месторождение нефти имеется Глава 4. Рассуждения в условиях неопределенности 330 P(+ О) = 0.8 РО РО РО (ложно отрицательный результат) (ложно положительный результат) Как показано на рис. 4.9, с применением априорных и условных вероятностей может быть построено дерево начальных вероятностей. Кроме того, показаны совместные вероятности,
вычисленные на основании априорных вероятностей и условных
вероятностей. Рис. 4.9. Дерево начальных вероятностей для задачи поиска нефти После этого для вычисления суммарной вероятности результатов испытаний + и — может использоваться аддитивный закон P(+) = P(+ ПОР+ ПОР ГОП О) = 0.12+ 0.36 =
0.48 (ложно отрицательный результат. Предположим, что последние результаты сейсмических исследований привели к получению показанных ниже условных вероятностей, в которых+ обозначает положительный результата соответствует отрицательному результату. Обратите внимание на то, что в данном случае рассматриваются условные вероятности,
поскольку причина (наличие или отсутствие нефти) должна была возникнуть до того, как был получен результат (имеются ввиду данные испытаний. Апостериорная вероятность соответствует цепи событий от результата (данные испытаний)
обратно к причине (наличие или отсутствие нефти. Вообще говоря, условная вероятность охватывает события,
рассматриваемые во времени в прямом направлении, а апостериорная вероятность — события, происходящие во времени в обратном направлении 4.9. Гипотетические рассуждения и обратная индукция Рис. 4.10. Пересмотренное дерево вероятностей для задачи поиска нефти На рис. 4.11 показан первоначальный вариант байесовского дерева принятия решений, в котором используются данные, приведенные на рис. 4.10. Выигрыш,
показанный в нижней части дерева, является положительным,
если получена прибыль, и отрицательным, если получен убыток.
Предполагаемые денежные суммы показаны в табл. Таблица 4.9. Таблица выигрышей для задачи разведки нефти
Выигрыш Сумма В случае успеха сдача месторождения нефти в аренду Расходы на разведывательное бурение Расходы на сейсмическую разведку 1 миллион долларов — 200 тысяч долларов — 50 тысяч долларов Как показано на рис. 4.10, P(+) и
Р( — ) — это безусловные вероятности, которые теперь могут
использоваться для вычисления апостериорных вероятностей наличия месторождения на рассматриваемой площадке.
Например, как РО) обозначается апостериорная вероятность отсутствия нефти в исследуемом районе,
вычисленная на основании отрицательных результатов исследований. После этого вычисляются значения совместной вероятности. Обратите внимание на то, что значения совместной вероятности, показанные на рис. 4.10, являются такими же, как и на рис. 4.9. Такой пересмотр вероятностей необходим для получения качественных результатов, если вслед за выдвижением первоначальных оценок вероятностей (или предположений) поступает экспериментальная информация,
такая как данные сейсмических исследований 332 Глава 4. Рассуждения в условиях неопределенности
Событие Результат проверки положительный (+) или отрицательный ( — ) Действие Отказ от дальнейших исследований или разведывательное бурение Событие Нефть имеется или нефть отсутствует Нефть имеется ро I+) = 12/13
-$50 000 -$1 000 000 $1 000 000 -$50 000 -$1 000 000 $1 000 Выигрыш Рис. 4.11. Первоначальное байесовское дерево решений для задачи поиска нефти Таким образом, если месторождение нефти будет найдено, то выигрыш в долларах составит 1000000 — 200000 — 50000 = 750000; если будет решено отказаться от поиска после получения результатов сейсмических исследований, то выигрыш составит — долларов если же будут проведены сейсмические исследования и бурение, но месторождение нефти не будет найдено, то выигрыш в долларах составит — 200 000 — 50 000
= — 250 000. Обратите внимание на то, что этот выигрыш в долларах не может составить — 1000000 — 200000 — 50000 = =
— 1250000, если вы не сможете воспользоваться лазейкой в налоговом законодательстве (а это не исключено, поскольку при наличии в Конгрессе хорошего лоббиста можно найти очень много удобных дополнений к законам о налогах. Для того чтобы
геологоразведывательная компания могла принять наилучшее решение, необходимо рассчитать ожидаемый выигрыш в узле события А. Ожидаемый выигрыш представляет собой сумму,
которую может заработать геологоразведывательная компания,
придерживаясь наилучшего способа действий. Для вычисления ожидаемого выигрыша в начальном узле, А, необходимо пройти по дереву решений в обратном направлении, от листовых узлов.
В терминах теории вероятностей такой процесс называется обратной индукцией. Это означает, что для вычисления ожидаемого выигрыша или достижения желаемой цели необходимо проводить рассуждения в обратном направлении для поиска причин, которые приведут нас к цели. Ожидаемый выигрыш в узле события определяется как сумма выигрышей в дочерних узлах, умноженная на вероятности, ведущие к этим выигрышам, как показано ниже 4.9. Гипотетические рассуждения и обратная индукция
Ожидаемый выигрыш в узле С 673077 долларов = (долларов) — (250000 долларов) Ожидаемый выигрыш в узле В 0 долларов = (750000 долларов) —
(250000 долларов) Событие Результат проверки положительный (+) или отрицательный ( — ) Действие Отказ от дальнейших исследований или разведывательное бурение
Событие Нефть имеется или нефть отсутствует 153 Нефть имеется v(o I+) = 12/13 -$50 000 -$1 000 000 $1 000 000 -$50 000
1   ...   28   29   30   31   32   33   34   35   ...   74


написать администратору сайта