Главная страница

дб. Четвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д


Скачать 3.73 Mb.
НазваниеЧетвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д
Дата19.05.2022
Размер3.73 Mb.
Формат файлаpdf
Имя файла[Dzharratano Dzhozef, Raili Gar - Nieizviestnyi.pdf
ТипДокументы
#538649
страница40 из 74
1   ...   36   37   38   39   40   41   42   43   ...   74

'А' in this course) = 0.70 (4) 2. Вы забыли пройти обязательный курс. Обратите внимание на то, что это правдоподобие неравно Ы. Причина, по которой оно не составляет 100'4, заключается в том, что в данный момент происходит окончательное подведение итогов прохождения вами всех курсов, после чего учебным заведением будут выставлены баллы. Успешному получению документа об образовании могут также препятствовать другие проблемы,
обусловленные целым рядом причин, в том числе перечисленных ниже. 1. Учебная программа изменилась так, что
не все пройденные вами курсы рассматриваются как основание для получения документа об образовании 5.3. Коэффициенты достоверности 3. Вы получили отказ признать действительными курсы, пройденные в другом учебном заведении. 4. Вы получили отказ признать действительными некоторые пройденные выборочные курсы. Вы должны были внести плату за обучение и пользование библиотекой, ноне сделали этого, надеясь, что о ваших долгах забудут. 6. Ваш средний аттестационный балл ниже, чем выдумали, поэтому его не удастся поднять даже с помощью отличной оценки. 7. "Они" твердо решили вам напакостить.
Предположим, что вы признали наличие проблемы (4) (или,
возможно, сами переоценили значение правдоподобия),
поэтому, согласно уравнению (1): P(not graduating

'А' in this course) = 0.30 (5) Безусловно, с вероятностной точки зрения уравнение (5) является правильным, но интуитивно кажется, что в нем есть какая-то ошибка. В частности, просто не верится, что даже после упорной работы и получения отличной оценки поданному курсу остаются 30оо-ные шансы на то, что вы не получите документ об образовании. Уравнение (5) создает какое-то ощущение неуверенности, как и у эксперта в области медицины, который признает справедливость формулы Р(Н Е1
П Е Г Ез) = 0.70 ноне уверен в том, что справедливо ее вероятностное следствие Р(Н Е п Е п zç) = Фундаментальная проблема состоит в том, что значение Р(Н Е) подразумевает наличие причинно-следственного отношения между Е и Н, тогда как между Е и Н' может не существовать причинно-следственное отношение. Тем не менее в следующем уравнении подразумевается наличие причинно-следственного отношения между Е и Несли есть причинно-следственное отношение между Е иХ: Р(Н I Е) = 1 — Р(Н' I Е) Эти проблемы,
связанные с теорией вероятностей, подвигли Шортлиффа
(Shortliffe) на исследование других способов представления неопределенности. Он применил в системе MYCIN метод
основанный на использовании коэффициентов достоверности,
разработанных на базе теории подтверждения Карнапа
(Carnap). Карнап различает два типа вероятностей. Одним из типов вероятности является обычная вероятность. Это понятие ассоциируется с частотой воспроизводимых событий.
Вероятность второго типа
Глава 5. Нестрогие рассуждения 404 называется эпистемистической вероятностью, или степенью подтверждения, поскольку она подтверждает гипотезу на основании некоторого свидетельства. Этот второй тип является еще одним примером применения степени правдоподобия того, что некоторая гипотеза заслуживает доверия. Меры,
применяемые для измерения степени доверия и недоверия В
системе MYCIN степень подтверждения была первоначально определена как коэффициент достоверности, который определяется как разница между степенью доверия (belief) и степенью недоверия (disbelief): CF(H, Е) = МВ(Н, Е) — MD(H, Е)
В этой формуле применяются следующие обозначения ° CF коэффициент достоверности гипотезы Н, обусловленный наличием свидетельства Е ° МВ — мера повышения степени доверия к гипотезе Н в силу наличия свидетельства Е МВ(Н,Е) Е) = если P(H) = 1 в противном случае если P(H) = О в противном случае 1 max[P(H Е, P(H)] — P(H) max[1, О — P(H)
1 min[P(H Е, P(H)] — P(H) min[1, 0] — P(H) ° MD — мера повышения степени недоверия к гипотезе Н в силу наличия свидетельства Е. Коэффициент достоверности — это способ объединения двух значений, степени доверия и степени недоверия, в единственное число. Объединение мер доверия и недоверия в единственное число осуществляется в двух целях.
Прежде всего, коэффициент достоверности может использоваться для ранжирования гипотез в порядке их важности. Например, если у пациента есть некоторые симптомы, свидетельствующие о наличии нескольких возможных заболеваний, то необходимо обеспечить, чтобы на
основании медицинских анализов в первую очередь было проведено обследование для диагностирования именно того заболевания, которому соответствует наибольшее значение CF
(Certainty Factor — коэффициент достоверности. Меры доверия и недоверия были определены в терминах вероятностей последующим формулам. Коэффициенты достоверности 405 Теперь отметим, что значение max[1, О всегда равно 1, а значение min[1, 0] всегда равно О. Нов данных формулах значения 1 и О записаны в терминах шахи, поскольку это позволяет показать формальную симметрию между выражениями для МВ (measure of belief — мера доверия) и MD (measure of disbelief — мера недоверия. Уравнения, с помощью которых вычисляются значения MB и MD, отличаются только тем, что в первом случае применяется функция max, а во втором — min. В табл. показаны некоторые характерные случаи применения значений
МВ, MD и CF, которые определены на основании приведенных выше формул. Таблица 5.1. Некоторые характерные случаи применения значений МВ, MD и CF Характеристики Значения
Интервалы значений 0 < МВ < 1 0<МР<1 — 1 Е) = 1 MB— = 1 О CF =1 Некоторая ложная гипотеза P(H' E) = 1 MB =0 MD =1 СЕ = — 1 Отсутствие свидетельства P(H E) = P(H) MB=0 MD =0 О Коэффициент достоверности CF показывает, какова чистая степень доверия к гипотезе, основанная на некотором свидетельстве.
Положительное значение СЕ говорит о том, что свидетельство обосновывает гипотезу, поскольку MB ) MD. Тот случай, в котором СР = 1, означает, что свидетельство определенно доказывает гипотезу. С другой стороны, случай CF = О
соответствует одной из двух возможностей. Во-первых, CF = МВ MD = О может означать, что нулю равны и МВ, и MD, иными словами, что отсутствует какое-либо свидетельство. Вовторых,
возможно, что МВ = MD и оба эти значения отличны от нуля, а это сводится к тому, что доверие к гипотезе опровергается такой
же степенью недоверия. К сожалению, опровержение сильной степени доверия таким же недоверием ведет непросто к незнанию, но к некоторому состоянию путаницы (а это гораздо хуже. Например, что может быть неприятнее для водителя,
который подъехал к перекрестку и не знает, куда повернуть, или услышал от пассажира, указывающего влево, что нужно повернуть направо Глава 5. Нестрогие рассуждения СР = 0.70 = 0.70 — 0 = =
0.80 — 0.10 Коэффициенты достоверности позволяют эксперту выразить степень доверия, не задумываясь над тем, какое значение может иметь степень недоверия. В частности, в задаче показано, что справедлива следующая формула CF(H, ЕЕ Эта формула означает, что если свидетельство подтверждает гипотезу на некоторое значение CF(H Е, то подтверждение отрицания гипотезы неравно Е, как следовало бы ожидать согласно теории вероятностей. Таким образом, верно следующее СР(Н, ЕЕ) ф 1 Тот факт,
что СР(Н i Е) + СР(Н' Е) = О, означает, что свидетельство,
поддерживающее гипотезу, снижает поддержку отрицания гипотезы на равную величину, так что сумма всегда остается нулевой. В примере со студентом, который рассчитывает на получение документа об окончании учебного заведения, если получит отличную оценку заданный курс, имеет место следующее ЕЕ Эти формулы означают I am 70 percent certain that I will graduate if I get an 'А' in this course. I am — 70 percent certain that I will not graduate if I get an 'А' in this course. (7) Отрицательные значения CF показывают,
что свидетельство способствует опровержению гипотезы,
поскольку МВ ( MD. Иными словами эту мысль можно выразить так, что есть больше оснований не доверять гипотезе, чем доверять ей. Например, величина CF = — Ъ означает, что степень недоверия на Ы выше, чем степень доверия. С
другой стороны, значение CF = 70'4 показывает, что степень доверия на 70'4 выше, чем степень недоверия. Обратите
внимание на то, что при использовании коэффициентов достоверности никакие ограничения назначения величин МВ и, отдельно взятых, не налагаются. Важной остается только разница между этими величинами. Например, могут наблюдаться показанные ниже и любые другие значения 5.3. Коэффициенты достоверности Обратите внимание на то, что значение — Ъ получено в связи стем, что коэффициенты достоверности определяются в следующем интервале, где О означает отсутствие свидетельства — 1 Е) <+1 Таким образом, положительные коэффициенты достоверности свидетельствуют в пользу гипотезы, а отрицательные коэффициенты достоверности — в пользу отрицания гипотезы. Утверждения (6) и (7) становятся эквивалентными, если коэффициенты достоверности используются по аналогии стем фактом, что "да = не нет".
Приведенные выше значения CF можно было бы выявить у учащегося, задав ему следующий вопрос, если свидетельство должно подтвердить гипотезу How much do you believe that getting an 'А' will help you graduate? А если нужно опровергнуть гипотезу, то вопрос формулируется таким образом How much do you disbelieve that getting an 'A' will help you graduate? Если учащийся на любой из этих вопросов ответит "Ы, то указанным величинам будут присвоены значения CF(e Е) =
0.70 и СР(Н' E) = — 0.70. А в системе MYCIN эксперты не должны были указывать достоверности в процентах, поскольку им предлагали выразить свое представление о достоверности гипотезы с помощью шкалы от 1 до 10, где значение показывало полную уверенность в справедливости гипотезы.
Кроме того, пользователи могли давать ответ UNK (сокращение от unknown), если свидетельство неизвестно это соответствует значению CF = О. Вычисления, проводимые с использованием коэффициентов достоверности CF = MB — MD Например, при использовании 10 частей свидетельства могло было быть получено значение МВ = 0.999, после чего единственная
опровергающая часть смогла привести к получению такого результата СЕ = 0.999 — 0.799 = 0.200 Как уже было сказано, первоначально применялось приведенное выше определение CF, но при использовании этого определения возникали сложности, поскольку даже единственная часть опровергающего свидетельства могла влиять на подтверждение со стороны многих других частей свидетельства Глава 5. Нестрогие рассуждения MB — MD 1 — min(MB, Это было сделано в целях ослабления влияния единственных частей опровергающих свидетельств на многочисленные подтверждающие части свидетельств. Если при использовании указанного определения применяются такие же значения МВ =
0.999, MD = 0.799, то значение CF принимает вид 0.999 — 0.799 0.200 = 0.995 1 — min(0.999, 0.799) 1 — 0.799 Это значение весьма существенно отличается от значения, полученного согласно предыдущему определению, при котором результат был равен 0.999 — 0.799 = = 0.200, и поэтому не происходила активизация правила, поскольку значение не было больше порогового значения 0.2. С другой стороны, при использовании современного определения полученное значение вызывает активизацию правила. В табл. 5.2 показаны правила,
применяемые в системе MYCIN для комбинирования свидетельств в антецедентах правил. Обратите внимание на то,
что эти правила совпадают с правилами системы, основанными на нечеткой логике. Таблица Правила MYCIN, применяемые для комбинирования свидетельств, заданных элементарными выражениями, в антецедентах правил Свидетельство Я Достоверность антецедента min[CF(H, ЕЕ, Е СР(Н, Е) Eg AND Eg Е10В. ЕЕ В системе значение CF антецедента правила должно быть больше 0.2, для того чтобы антецедент рассматривался как истинный и активизировал правило. Такое значение 0.2 рассматривается как пороговое значение, ноне определено как фундаментальная
аксиома теории коэффициентов достоверности. Вместо этого пороговое значение рассматривается как произвольный способ сведения к минимуму возможности активизации правил, которые лишь в незначительной степени подтверждают гипотезу. Без использования порогового значения могут активизироваться многочисленные правила, которые являются малозначительными или вообще не имеют значения, поэтому эффективность системы существенно уменьшается. В 1977 году приведенное выше определение СР в системе MYCIN было изменено и приняло такой вид. Коэффициенты достоверности 409 Например, если дано следующее логическое выражение, применяемое для комбинирования свидетельств ЕЕ Ез) OR (ЕЕ) то значение свидетельства Е можно вычислить таким образом E — max[min(E Е Ез) min(E4 Е При использовании значений ЕЕ получаем следующий результат ЕЕ Ез = 0.3 Е =
max[min(0.9, 0.8, 0.3), min( — 0.5, — ( — 0.4))] = = max[0.3, — 0.5]
= 0.3 Фундаментальная формула определения коэффициента достоверности СЕ для правила IF Е THEN Н задается следующей формулой CF(H, ее, Ее, Е) В качестве примера применения таких коэффициентов достоверности рассмотрим значение CF для правила определения наличия стрептококковой инфекции,
описанного выше В этой формуле применяются такие обозначения ° CF(E, е) — коэффициент достоверности свидетельства Е, формирующего антецедент правила на основе неопределенного свидетельства е ° СР(Н, Е) — коэффициент достоверности гипотезы, в которой предполагается, что свидетельство известно со всей достоверностью, когда CF (E, ее коэффициент достоверности гипотезы,
основанной на неопределенном свидетельстве е. Таким образом, если все свидетельства в антецеденте известны со всей достоверностью, то формула для коэффициента
достоверности гипотезы принимает следующий вид, поскольку, е) = 1:
410 Глава 5. Нестрогие рассуждения IF 1) The stain of the organism is gram positive, and 2) The morphology of the organism is coccus, and 3) The growth conformation of the organism is chains
THEN There is suggestive evidence (0.7) that the identity of the organism is streptococcus В этом правиле коэффициент достоверности гипотезы при наличии достоверного свидетельства определяется следующей формулой и именуется также коэффициентом ослабления (attenuation factor): CF(H, ЕЕ Г Е Г Ез) = 0.7 Это определение коэффициента ослабления основано на предположении, что все свидетельства
(Е1, Е и Ез) известны с полной достоверностью. Таким образом, справедлива следующая формула, в которой е представляет собой наблюдаемое свидетельство, ведущее к заключению, что каждое из свидетельств Е, известно с полной достоверностью СЕ(Е1, е) = CF(Eg, å) = CF(Eg, å) = 1 Эти значения CF аналогичны условным вероятностям свидетельств в системе PROSPECTOR, P(E е. Коэффициент ослабления выражает степень достоверности, относящуюся к гипотезе, если даны некоторые достоверные свидетельства. Также как ив системе PROSPECTOR, если неизвестны все свидетельства с полной достоверностью, возникают сложности. Поэтому в системе PROSPECTOR при наличии недостоверных свидетельств использовалась интерполяционная формула P(H е. С другой стороны, в системе MYCIN для определения результирующего значения CF должна применяться фундаментальная формула (8), поскольку формула CF(H, E> Е Г E3) = 0.7 для недостоверных свидетельств больше недействительна. Например, примем следующие предположения:
CF(El,е) = 0.5 СЕ(Е2,е) = 0.6 СГ(ЕЗ,е) = 0.3 В этом случае получаем такой результате СР(Е1 ПЕ Г Ез,е) = =
ппп[СГ(Е1, ее, СР(Ез, e)] = ппп[0.5,0.6,0.3] = = 0.3

5.3. Коэффициенты достоверности 411 Таким образом,
коэффициент достоверности антецедента, е) ) 0.2, поэтому антецедент рассматривается как истинный и правило активизируется. Коэффициент достоверности заключения равен следующему CF(H, ее Предположим, что та же гипотеза следует также из другого правила, нос другим коэффициентом достоверности.
Коэффициенты достоверности правил, из которых следует одна и та же гипотеза, вычисляются с помощью комбинирующей функции для коэффициентов достоверности, которая определена таким образом СР1 + СР(1 — CF>) оба ) 0 СЕ +
CFq СЕсомвпЕ(СЕ1, СЕ) = . () () один < 0 СЕ + СХ"2(1+ СГ1)
оба ( 0 (9) В этом выражении выбор формулы для зависит оттого, являются ли отдельные коэффициенты достоверности положительными или отрицательными.
Применение комбинирующей функции к коэффициентам достоверности, количество которых превышает два,
осуществляется инкрементно. Таким образом, величина вычисляется для двух значений CF, а затем величина
СГсомвщЕ комбинируется на основании формулы (9) с третьим значением СГ и т.д. Итоговые результаты вычислений с использованием коэффициентов достоверности для двух правил на основе недостоверного свидетельства и вывода одной и той же гипотезы приведены на рис. 5.5. Обратите внимание на то, что дерево, показанное на этом рисунке, не является деревом AND/OR, поскольку величина СГдмвщ не имеет ничего общего с целями AND и OR. Если по условиям рассматриваемого примера следует заключение о наличии стрептококков с коэффициентом достоверности CFq — — еще из одного правила, то комбинированный коэффициент достоверности, вычисленный с использованием первой формулы (9), выражается следующим образом СР(-омвщЕ(0.21,
0.5) = 0.21 + 0.5(1 — 0.21) = 0.605 0.605 — 0.4 СЕсомвпчЕ(0.605,
— 0.4) = 1 — ппп(0.605l, I — 0.4I) 0.205 = 0.34 1 — Предположим, что такой же вывод следует из третьего правила
нона этот раз CF3 = — 0.4. В таком случае используется вторая формула (9), что приводит к получению следующего значения 412 Глава 5. Нестрогие рассуждения Рис. 5.5. Коэффициенты достоверности двух правил с одной и той же гипотезой, основанных на неопределенном свидетельстве Формула сохраняет свойство коммутативности свидетельств. Это означает, что справедлива приведенная ниже формула, поэтому порядок получения свидетельств не влияет наконечный результат. СсомвпчЕ(Х У) = СРсомвпчЕ(У Х) В системе хранятся не отдельные значения MB и MD для каждой гипотезы,
а вместе с каждой гипотезой хранится текущее значение
СРомвщЕ, которое затем комбинируется с новым свидетельством, как только последнее становится доступным CF2) = СР1 + CF (1 — CFl) оба ) 0 CFl + один ( 0 1 — хп1п(СР1 , )CF2 ]) СЕ + СР(1+ СЕ) оба ( Сложности, связанные с использованием коэффициентов достоверности Безусловно, система MYCIN оказалась очень успешным средством медицинской диагностики, но при разработке теоретического фундамента, лежащего в основе применения коэффициентов достоверности, возникли сложности. Коэффициенты достоверности базируются на некоторых понятиях теории вероятностей и теории подтверждения. Однако сами эти коэффициенты достоверности отчасти применялись на основании произвольно выбранного подхода. Основное преимущество коэффициентов достоверности состояло в том, что вычисления, с помо-
1   ...   36   37   38   39   40   41   42   43   ...   74


написать администратору сайта