дб. Четвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д
Скачать 3.73 Mb.
|
столбце таблицы "Количество правил" показано количество вероятностных правил вывода. Вполне очевидно, что в показанных здесь моделях много неопределенности, поэтому при обосновании гипотез важно учитывать вероятность. Сети логического вывода Каждая модель, предназначенная для использования в системе PROSPECTOR, представлена в виде сети со связями (или отношениями, соединяющими свидетельства и гипотезы. Таким образом, сеть логического вывода является разновидностью семантической сети. Наблюдаемые факты, например, касающиеся типа горных пород, полученные входе геологического поиска, составляют свидетельство, применяемое для обоснования промежуточных гипотез. Затем группы промежуточных гипотез используются для обоснования гипотезы верхнего уровня. Таковой является гипотеза, которую требуется доказать. Если различие между свидетельством и гипотезой неважно, то для обозначения того и другого применяется термин утверждение. На рис. 4.18 показана небольшая часть сети логического вывода для гипотезы верхнего уровня из модели разведки медно- порфировой руды. В системе PROSPECTOR используются показанные на рис. коэффициенты достоверности СНЕ и CHNE, поскольку практика показала, что эксперты сталкиваются с трудностями, когда от них требуют задать значения апостериорных вероятностей или коэффициентов правдоподобия. Аналогичные практические результаты были обнаружены вовремя разработки системы, предназначенной для диагностирования заболеваний крови. Входе этой разработки 366 Глава 4. Рассуждения в условиях неопределенности Е - Априорная Сокращенное -Ф PCD вероятность события наименование Месторождение медно-порфировой руды Описательный текст Гипотеза верхнего уровня Вероятность того, что гипотеза истинна, если свидетельство Е ф имеется (СНЕ) Вероятность того, что гипотеза истинна, если свидетельство Е отсутствует (CHNE) FCPCD 0.1 FCPCD — это свидетельство для, а также гипотеза в пользу свидетельств FRE, FLE и Благоприятное сочетание данных о регионе и местности, из которого следует наличие месторождения медно- порфировой руды 3, -4.5 1,— 4 1.5, -4 FRE FSYSTEM Штриховыми линиями обозначены узлы, которые содержат другие узлы (и определены в другом месте) Рис. 4.18. Гипотеза верхнего уровня из модели разведки медно-порфировой руды системы, выраженная с использованием коэффициентов достоверности врачи не испытывали большого желания задавать значения вероятностей, поэтому использовались коэффициенты достоверности. Что касается системы MYCIN, то коэффициенты достоверности ранжировались по точечной шкале со значениями от — 5 до, где — 5 означало "определенно нет, а +5 — "определенно да. PROSPECTOR не относится к категории чисто вероятностных систем, поскольку в ней для комбинирования свидетельств используются нечеткая логика и коэффициенты достоверности. Более подробное описание коэффициентов достоверности и нечеткой логики приведено в главе 5. На рис более подробно показан узел FRE, приведенный на рис, в развернутом виде 4.15. Сети логического вывода 367 GIR FRE 0.001 300, 0.0001 65, 0.01 SMIR 0.03 STIR 0.1 RCS 0.001 300, 1 100, Штоки 1, 0.0002 RCAD 0.001 75, 1 FMGS&PT 0.01 Дайки 2, 0.000001 AND 0.01 RCIB 0.001 20,1 0.001 Интрузивные брекчии PT 0.01 OR (О, 5) RCVP 0.001 4,1 SMIRA Вулканические пробки Рис. 4.19. Небольшая часть сети логического вывода системы PROSPECTOR, относящаяся к модели разведки медно-порфировой руды Вызывающая интерес морфология вулканических пород Вызывающая интерес текстура вулканических пород Степень зернистости от небольшой до средней Глава 4. Рассуждения в условиях неопределенности На данной диаграмме над каждым узлом показаны два числа, которые представляют собой коэффициент правдоподобия, и коэффициент необходимости, LN, разделенные запятой. Например, значения LS, LN для узла, находящегося внизу слева и обозначенного как RCIB, составляют 20.1. Имя каждого узла представляет собой аббревиатуру его описания, например, RCIB — сокращение отв данном районе имеются интрузивные брекчии. В верхней части каждого узла показано также отдельное число, представляющее собой априорную вероятность например, для узла RCIB показано значение 0.001. Отношения логического вывода ° Взвешенные комбинации, в которых используются коэффициенты правдоподобия LS и коэффициенты необходимости LN. Апостериорные шансы вычисляются с помощью следующей формулы, если известно, что свидетельство Е истинно O(H i Е) = LSO(H) и с помощью следующей формулы, если известно, что свидетельство Е ложно: O(H Е) = LNO(H) Если же точное значение Е неизвестно, то, как описано в предыдущем разделе, с помощью линейной интерполяции может быть вычислено значение Р(Н E). Термин взвешенная комбинация сложился с учетом общего случая, в котором свой вклад в обоснование гипотезы вносят многочисленные части свидетельства. Как показано в предыдущем разделе, имеет место следующее соотношение: O(HЕ1nE n...E)= ПАЗ, Н) i=1 Свидетельства, доказывающие или опровергающие гипотезу, направлены вверх посети логического вывода. Например, все свидетельства RCS, RCAD, RCIB, RCVP и SMIRA доказывают или опровергают промежуточную гипотезу SMIR. Промежуточная гипотеза SMIR, в свою очередь, является свидетельством для своей гипотезы НУРЕ, которая служит свидетельством для FLE, и т.д. Свидетельства могут комбинироваться двумя описанными ниже основными способами для получения отношений, необходимых для геолога, создающего определение модели. ° Логические комбинации, такие как комбинации, создаваемые с помощью узлов AND и OR. Как было указано в предыдущем разделе, для вычисления результата в этих логических узлах может применяться нечеткая логика 4.15. Сети логического вывода 369 Логарифмирование указанного соотношения приводит к получению такой формулы 0(H яг кл, Эту формулу можно интерпретировать так, что каждое значение преобразующееся в значение log LS,, "голосует" в пользу гипотезы. Каждое значение log LS, представляет собой весовой коэффициент, от которого зависит гипотеза. Безусловно, систему PROSPECTOR иногда называют системой, основанной на правилах, поскольку взвешенные комбинации соответствуют правилам, подобным приведенному ниже, но эта система не является столь же гибкой, как настоящая продукционная система, основанная на правилах. IF Ei AND Ег AND .. Еи Н Таблица 4.13. Некоторые термины, используемые при описании свидетельств Термин Свидетельство, относящееся к гипотезе Невозможное Возможное Правдоподобное Вероятное Достоверное Определенно известное как противоречащее гипотезе Не может быть опровергнуто со всей определенностью Существует некоторое свидетельство Некоторое свидетельство обосновывает гипотезу Определенно известное как обосновывающее гипотезу Одним из ее ограничений является отсутствие полноценного механизма связывания переменных — это специализированная система, при разработке которой основной упор был сделан на обеспечение эффективности и контроля над приложениями геологического назначения, а не на обеспечение общности продукционной системы. Рассматриваемые взвешенные комбинации могут также служить примером правдоподобных отношений. Термин правдоподобный означает, что есть некоторое свидетельство в пользу сложившегося доверия. PROSPECTOR — пример системы, в которой используется правдоподобный логический вывод для доказательства или опровержения гипотезы. Этапы правдоподобного логического вывода в системе основаны на использовании байесовских вероятностей, в которых значения LS и LN задают эксперты-люди. На рис. показан нечеткий граф, в котором рассматриваются правдоподобные и другие отношения, основанные на использовании различных степеней доверия. Применяемые здесь термины имеют такой общий смысл, как показано в табл 370 Глава 4. Рассуждения в условиях неопределенности Рис. Относительный смысл некоторых терминов, используемых для описания свидетельств График, приведенный на рис. намеренно изображен как нечеткий, чтобы проще было показать неопределенный характер этих терминов и подчеркнуть некоторую степень неосведомленности, наблюдающейся при переходе от одного понятия к другому. Обратите внимание на то, как на рис. 4.20 возрастает степень доверия к гипотезе от степени "невозможно" до степени "несомненно. В данном случае несомненная степень доверия (certain belief) означает, что доверие полностью оправдано, а невозможная степень доверия (impossible belief) означает, что оно полностью не оправдано. С несомненными и невозможными степенями доверия не связано никакой неопределенности. Эти степени доверия эквивалентны логически истинными логически ложным значениям. С другой стороны, термин определенное свидетельство (certain evidence) иногда используется неоднозначно. Определенное свидетельство является либо логически истинным, либо логически ложным. Это означает, что с определенным свидетельством не ассоциируется какая-либо неопределенность. Таким образом, определенное свидетельство соответствует либо несомненной степени доверия (логически истинному значению, либо невозможной степени доверия (логически ложному значению. Возможная степень доверия belief) означает, что гипотеза, независимо от того, насколько далеко она от истины, не может быть исключена. Например, до того как стал возможным научный анализ состава поверхности Луны, нельзя было исключить возможность, хотя и очень, очень и очень отдаленную, что Луна состоит из белого сыра. Такая возможность существовала потому, что не было доступно определенное доказательство. Термин правдоподобная степень доверия (plausible belief) означает, что существует несколько возможностей. Термин правдоподобный часто используется в судебном разбирательстве как синоним термина обоснованный, но лишь при отсутствии надежных свидетельств, которые оправдывали бы доверие к рассмат- 4.15. Сети логического вывода 371 риваемой гипотезе. Это означает, что даже дополучения первых результатов научных свидетельств такая гипотеза, что Луна сделана из зеленого, а не белого сыра, не была бы правдоподобной. Термин вероятная степень доверия (probable belief) означает, что имеются некоторые свидетельства в пользу гипотезы, но этих свидетельств недостаточно, чтобы доказать гипотезу со всей определенностью. Например, если вы все время побеждали, бросая игральные кости, и вдруг начали терпеть поражение, после того как ваш друг предложил вам испытать его "удачливые игральные кости, вы можете приобрести вероятную степень доверия к гипотезе, что теперь удача перешла к вашему другу. Без свидетельств, полученных в результате геологического поиска, таких как наблюдение RCIB (район содержит интрузивные брекчии, отношения, показанные на рис. 4.19 и относящиеся к конкретному району, являются просто возможными. По мере накопления свидетельств возможные отношения могут стать правдоподобными, затем вероятными и, наконец, несомненными, если некоторая выборка подтвердит выдвинутую гипотезу. А в случае игры с чужими игральными костями, если вы потеряете все свои победные очки, то определенно можете считать правдоподобным предположение, что вы попали в полосу неудач. Если же вы потеряете не только все очки, но и все деньги, с которых начинали игру, то можете определенно быть уверенными в том, что вам не везет. Но независимо оттого, сколько раз выбросили кости (даже если количество таких бросков приближается к миллиону, всегда остается шанс, что наблюдаемое явление диктуется законами статистики, поскольку для достижения й вероятности может потребоваться сделать бесконечное количество бросков. Выражения "0'А-ная вероятность" и "Оная вероятность" фактически являются парадоксальными, те. содержащими в себе внутреннее противоречие. Дело в том, что случаи, в которых наблюдаются вероятности Ъ и Ъ, соответствуют полной достоверности, а достоверность не имеет ничего общего с вероятностью, поскольку в реальном мире достоверность равносильна убежденности. Если кто-то говорит "Я наблюдал те же самые свидетельства, что и другие, но все еще уверен, что гденибудь обязательно можно найти нечерного ворона, то он выражает убеждение, а истинные убеждения не могут измениться под действием фактов. Эти соображения становятся очень важными, если вы создаете экспертную систему и пытаетесь формально выразить знания эксперта в правилах и фактах. На этапе приобретения знаний, когда проводятся собеседования с экспертом, вы можете услышать некоторые утверждения, которые внешне выглядят как знания, но фактически представляют собой просто убеждения (проявления полного доверия к определенным взглядам. Но необходимо соблюдать исключительную осторожность при попытке представить в экспертных системах убеждения, поскольку если убеждения не соответствуют действительности, то могут привести к недействительным заключениям. С другой стороны, если эксперт платит вам Глава 4. Рассуждения в условиях неопределенности именно зато, чтобы вы формально отразили его убеждения, то ему не понравится, если система не будет действовать в соответствии с ожиданиями. Еще один парадокс связан стем, что всегда существует вероятность услышать прогноз погоды, согласно которому "имеются 50'Ъ-ные шансы на то, что" пойдет дождь. Дело в том, что 50'4-ные шансы означают общее незнание (total ignorance). Дождь либо будет, либо нет. Но для предсказания того, что дождь пойдет или не пойдет, ненужны теория вероятностей или бюро погоды. Тот факт, что дождь может идти или не идти, диктуется здравым смыслом. Аналогичным образом, в сводке бюро погоды иногда приходится слышать, что шансы на то, что пойдет сильный дождь, равны 100'4, в то время как за окном действительно бушует гроза. Эта оценка шансов соответствует невероятности, а достоверности. Сети логического вывода должны не только обеспечивать представление отношений между узлами принятия решений и соответствующим им вероятностными действиями, но и обладать еще одной желаемой характеристикой — представлять контексты, которые блокируют распространение информации до тех пор, пока это распространение остается нежелательным. Использование контекстов позволяет разрешать или запрещать функционирование определенных частей сети логического вывода до того времени, как станет известно, что другие определенные части присутствуют, отсутствуют или неизвестны. Одно из назначений контекстов состоит в предотвращении необходимости формировать в системе вопросы к пользователю, касающиеся определенного свидетельства, до тех пор, пока не будет установлено, что это свидетельство действительно требуется. Это очень важно, поскольку люди раздражаются, если им задают вопросы, которые кажутся не относящимися к делу. Целью любой системы должно быть получение минимально необходимого объема информации для достижения действительного или по меньшей мере приемлемого заключения. Например, при посещении врача первым контекстом становится вопрос "У вас есть медицинская страховка" Дополучения ответа на этот вопрос могут не оправдаться затраты времени и денег на получение другой необходимой информации, например, такой "Вы плохо себя чувствуете Что у вас болит' А если у вас нет медицинской страховки, то ваша судьба никого не интересует. Основная идея контекстов состоит в том, что они позволяют управлять тем порядком, в котором система переходит от одного утверждения (напомним, что так именуются в целом гипотезы и свидетельства) к другому. Контексты устанавливают необходимые условия, которые должны быть доказаны прежде, чем появится возможность использовать некоторое утверждение. Контексты обозначаются штриховой линией со стрелкой, под которой указан диапазон коэффициентов достоверности как в случае, касающемся узлов FMGS и РТ показанных на рис. 4.19. Узел РТ блокируется, если нет свидетельства со значениями достоверности в диапазоне от до +5, согласно которому имеются порфировые породы с зернистостью от мелкой до средней. Порфировыми породами называются вулканические породы, текстура которых (определяемая по внешнему виду) состоит. Сети логического вывода 373 Архитектура сети логического вывода Формально сеть логического вывода может быть определена как ориентированный, ациклический граф, узлами которого являются утверждения, а дугами меры неопределенности, такие как LS и LN. Сети, приведенные на риса в, могут рассматриваться как примеры, в которых правильно соблюдаются требования к архитектуре сети логического вывода, поскольку в этих сетях отсутствуют циклы. Обратите внимание на то, что в дереве логического вывода стрелки направлены к гипотезам, тогда как в отличие от этого в дереве структуры данных стрелки направлены от корня. Как было описано в главе 3, в ациклическом графе отсутствует возможность вернуться в начальную точку, следуя по стрелке. А на рис. 4.21, г имеется цикл, охватывающий четыре узла. Причина, по которой введен запрет на формирование циклов, обусловлена необходимостью предотвращения циклических рассуждений при установлении некоторой гипотезы. Нов системах, основанных на правилах, допустимым исключением является установление цикла путем обеспечения того, чтобы два правила активизировали друг друга до тех пор, пока не будет выполнено условие завершения. Еще одной широкой областью применения циклов является логика, которой руководствуются политики. из мелких кристаллов, внедренных в содержащую их породу, так называемую матрицу. Вулканические породы представляют собой породы, сформированные в результате затвердевания расплавленного твердого вещества, называемого магмой и поступающего из глубин земли. Вулканические породы некоторых типов выступающие над поверхностью земли (называемые интрузивными брекчиями, являются свидетельством таких залежей полезных ископаемых, как медно- порфировые руды. Итак, медно-порфировая руда состоит из мелких кристаллов меди, вкрапленных в скальную матрицу, содержащую эти кристаллы. Медно-порфировые руды наиболее часто встречающая разновидность залежей меди. Если отсутствуют по меньшей мере небольшие кристаллы размерами от мелких до средних, тонет смысла задавать вопрос о том, наблюдается ли порфировая текстура, и поэтому экспертная система должна быть достаточно интеллектуальной, чтобы не задавать этот вопрос. Экспертная система, которая формирует ненужные вопросы, является неэффективной и вскоре начинает раздражать пользователя. Диапазон значений достоверности от до +5 для данного контекста означает, что работа с узлом РТ |