дб. Четвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д
Скачать 3.73 Mb.
|
не будет проводиться системой, если пользователь не покажет отсутствие свидетельства, соответствующего коэффициенту достоверности 0 или некоторому положительному значению,импликация, отрицание, дизъюнкция и конъюнкция. Как было указано в главе 2, обычные семантические сети фактически предназначены для представления описательных знаний с помощью отношений. Безусловно, фреймы в большей степени приспособлены для представления причинных знаний, нос другой стороны, фреймы нелегко использовать для представления логических отношений. Основная идея секционированной семантической сети состоит в том, что такая сеть позволяет группировать множества узлов и дуг в абстрактные пространства, которые задают область определения представленных в них отношений. Знакомой аналогией пространства может служить область определения модуля 4.15. Сети логического вывода 375 или пакета в языке структурированного программирования. Например, узел см. рис. 4.18) может рассматриваться как пространство со структурой, показанной на рис. 4.19. Наибольшие возможности семантические сети проявляют при моделировании высказываний. И действительно, Хендрикс в своей докторской диссертации впервые разработал такие сети для представления естественного языка. Высказывания подобны формулировкам свидетельств и гипотез, представляющих собой узлы сетей логического вывода. В качестве простого примера секционированной семантической сети, представляющей высказывание, рассмотрим сеть для высказывания "существует компьютер с цветным экраном. Обратите внимание на то, что данное высказывание — экзистенциальное, поскольку в нем имеется квантор "существует. На рис. 4.22 показано представление этого высказывания с помощью секционированной семантической сети, в которой используются три пространства. Пространство SPACE-1 состоит из некоторых общих взаимосвязанных концепций, касающихся компьютеров. Пространство SPACE-2 включает сведения о том конкретном компьютере, о котором идет речь и которому присвоен идентификатор COMPUTER-1. Пространство SPACE-3 включает конкретное отношение COMPONENTS-OF-1, объектом которого является конкретный цветной экран рассматриваемый в данном высказывании. Каждая дуга с надписью "элемент" показывает, что одно состояние является элементом другого. Дуга с надписью "сущность" показывает, какой конкретный компьютер представляет собой сущность сданным конкретным цветным экраном. Рис. 4.22. Простая секционированная семантическая сеть с информацией о компьютере Глава 4. Рассуждения в условиях неопределенности 376 Рис. Упрощенная часть секционированной семантической сети системы PROSPEC- TOR, относящаяся к правилу STIR, в котором используется свидетельство FMGS Следует отметить, что на рис. 4.23 одна секционированная семантическая сеть составляет антецедент правила, а другая — консеквент. Безусловно, консеквент этого правила является тривиальным, но другие правила могут иметь более сложную структуру. Преимуществом секционированных семантических сетей является то, что сих помощью система может прийти к логическому выводу о наличии Преимущество секционированной семантической сети демонстрируется на примере части правила системы PROSPECTOR, относящегося к узлу STIR, в котором используется свидетельство FMGS (рис. Это правило можно сформулировать следующим образом Если имеется сущность Е, кардинальность которой определяется как ABUNDANT (представленный в изобилии) и которая состоит из интрузивных пород, INTRUSIVE ROCKS, то консеквентом является правило STIR (Suggestive Texture of Igneous Rocks — перспективная текстура вулканических пород)". Обратите внимание на то, что эта диаграмма упрощена, поскольку в нее не включено требование, что антецедент также должен указывать на наличие кристаллов с размерами от мелких до средних 4Лб. Распространение вероятностей отношений между узлами, которые не являются непосредственно связанными. Поэтому данная система располагает более глубокими знаниями, чем просто поверхностные знания. Распространение вероятностей P(E ее Отметим, что, как показано на рис. 4.19, все значения I N для других свидетельств SMIR равны 1. Таким образом, если пользователь не дает никаких комментариев в отношении свидетельств, касающихся куполов (stock), валов (dike) и вулканических пробок (volcanic plug), то указанные свидетельства не вносят Сети логического вывода, подобные применяемым в системе PROSPECTOR, имеют статическую структуру знаний. Это означает, что узлы и связи между узлами остаются постоянными, для того, чтобы в структуре знаний сохранялись отношения между узлами. В этом состоит принципиальное отличие сетей логического вывода от систем, основанных на правилах, поскольку в таких системах правила, шаблоны которых согласуются с фактами, помещаются в рабочий список правил, после чего осуществляется разрешение конфликтов, а затем выполняется правило с наивысшим приоритетом. Таким образом, система, основанная на правилах, обычно имеет динамическую структуру знаний, поскольку в ней отсутствуют такие постоянные соединения между правилами, которые установлены между узлами в сети логического вывода. С другой стороны, хотя структура сети логического вывода остается неизменной, вероятности, связанные с каждым узлом гипотезы, по мере получения свидетельств изменяются. Нов действительности единственным изменением в любой сети логического вывода является изменение вероятностей. Основной характерной особенностью сети логического вывода является то, что в них по мере накопления свидетельств происходит изменение вероятностей, начиная с априорных вероятностей и заканчивая апостериорными вероятностями. Указанное изменение вероятностей происходит в направлении к верхней части сети, что позволяет в конечном итоге обосновать или опровергнуть гипотезу верхнего уровня, например, касающуюся существования залежей медно-порфировой руды. Рассмотрим некоторые этапы распространения вероятностей в пользу гипотезы PCDA на основе некоторого свидетельства. Этот пример должен служить в качестве демонстрации конкретного расчета по многим из формул, представленных в этой главе. Как показано на рис. проследим за распространением вероятностей от узла свидетельства RCIB (the Region Contains Intrusive Breccias— в этом районе имеются интрузивные брекчии. Если пользователь укажет, что интрузивные брекчии определенно присутствуют, то Глава 4. Рассуждения в условиях неопределенности 378 свой вклад в гипотезу SMIR и поэтому могут быть проигнорированы вовремя решения данной задачи, посвященной изучению распространения вероятностей. Причина, по которой все указанные свидетельства могут быть проигнорированы, обусловлена наличием следующей формулы для сложного свидетельства, которая обсуждалась в разделен) Ан) В этой формуле L, = Ls, для всех свидетельств, которые являются заведомо истинными, а для свидетельств, являющихся заведомо ложными, используются значения L, = LN,. А если отсутствуют известные свидетельства, то значение Р(Е, е) сводится к значению априорных шансов свидетельства, Р(Е;), поэтому значение Р(Н Е) сводится к значению априорных шансов Р(Н). Таким образом, становится справедливым следующее соотношение и указанные значения, не вносят никакого вклада в значение O(H Ее) Например, если известно, что истинно только свидетельство RCIB, то шансы, соответствующие становятся следующими O(H I -E) — - ксурЯсАрксяБм1кА-кс1в = =1 1 1 1 ° 20 O(SMIR I RCIB) = 20 Еще одной интересной особенностью свидетельства является наличие узла OR, называемого Заслуживает внимания то, что узел SMIRA связан со всеми теми же свидетельствами, с которыми связан узел SMIR. Если имеется какое-либо свидетельство, вносящее свой вклад в значение SMIR, такое как RCS, RCAD, RCIB или RCVP, то узел типа OR не вносит никакого вклада в значение узла, поскольку коэффициент LS для узла SMIRA равен 1. Но если свидетельства RCS, RCAD, RCIB и RCVP отсутствуют, то благодаря значению LN узла SMIRA, равному 0,0002, значение вероятности SMIR по существу становится равным нулю. Фактически это означает, что отсутствие одного или нескольких свидетельств, касающихся SMIR, не имеет значения (LS = Ц, но отсутствие всех свидетельств является очень важным, поскольку влечет за собой исключение узла SMIR из рассмотрения. Проектировщик модели имеет возможность вводить узлы узлы AND, а также значения LS и LN, тем самым приобретает способность регламентировать способ влияния свидетельства на гипотезу. Нов некоторых сложных случаях. Распространение вероятностей 379 P odds=0= 1 — P Это означает, что априорные шансы SMIR таковы O(SMIR) = = 0.0309 0.03 1 — 0.03 Если свидетельство E является достоверным, то апостериорные шансы являются следующими) = LSO(H) O(SMIR I RCIB) = 20 0.0309 = апостериорная вероятность вычисляется с помощью следующей фундаментальной формулы шансов O 1+0 O(H i ЕЕ Е) = = 0.382 0.618 1+ 0.618 поэтому апостериорная вероятность SMIR при наличии достоверного свидетельства равна P(SMIR RCIB) = 0.382 Априорные шансы являются таковыми O(HYPE) = = 0.0101 0.01 1 — 0.01 На этом этапе вычислений могло бы возникнуть стремление использовать следующие соотношения для вычисления шансов гипотезы НУРЕ, обусловленных введение большого количества узлов OR и AND для выполнения требований к свидетельствам приводит к загромождению структуры сети логического вывода до такой степени, что ее становится трудно понять. Кроме того, введение таких вспомогательных узлов связано с необходимостью предусматривать дополнительную проверку модели. Согласно рис. 4.20, для интрузивных брекчий (значение LS = 20, а значение P(SMIR) = 0.03. Таким образом: Глава 4. Рассуждения в условиях неопределенности значением SMIR, но это было бы неправильным НЕ Если свидетельство Е является достоверным, то становится истинной следующая формула НЕ ЬЯ ОН I RCIB) = 0.382 Это означает, что правдоподобие убеждения в том, что гипотеза SMIR истинна, составляет 38,2'Ъ. В действительности нам требуется рассчитать вероятность гипотезы HYPE на основе недостоверного свидетельства которая имеет значение Р 1 RCIB). Один из способов вычисления этого значения состоит в использовании формулы для Р(Н е, которая рассматривалась в разделе 4.14, имеющей такой вид Р(Н ( ЕРЕ е) РЕ) для 0 < РЕ е) < РЕ) Р(Н(е) = (Н ) — Р(Н)Р(Е),)-p(E)) 1 — РЕ) для РЕ) < РЕ е) «< В этой формуле неопределенность свидетельства выражается следующим образом РЕ е) = Р RCIB) = 0.382 а требуемое значение вероятности — формулой Р(Н е) = P(HYPE SMIR) В данной формуле известно только такое значение O(H ЕЕ Эта формула выражает изменение вероятности гипотезы, после принятия предположения о том, что свидетельство является достоверным Но значение SMIR достоверно неизвестно. В действительности вероятность гипотезы SMIR при наличии достоверного свидетельства об обнаружении интрузивных брекчий является таковой 4.17. Резюме Кроме того, согласно рис. 4.19, априорные шансы равны Р(Н) = P(HYPE) = 0.01 РЕ) = P(SMIR) = Безусловно, РЕ I е) ) РЕ, поэтому для вычисления значения Р(Н Е) можно воспользоваться формулой для выражения РЕ) РЕ l е) < 1 следующим образом (0.75 — 0.01) (0.382 — 0.03) 1 — 0.03 P(HYPE I RCIB) = 0.279 РЕ) = P(HYPE) = 0.01 РЕ е) = P(HYPE RCIB) = 0.279 Р(Н) = P(FLE) = 0.005 O(H I Е) = O(FLE I HYPE) = LSHYPE O(FLE) = 200 0.005 = 1 Р(Н I Е) = P(FLE I HYPE) А поскольку Р = odds/(1+ odds), можно выполнить следующие расчеты Р(Н i Е) = O(FLE i HYPE)/(1+ O(FLE i HYPE)) = = 1/(1+1) = = 0.5 Р(Н I е) = P(FLE I RCIB) = (0.5 — 0.005) (0.279 — 0.01) 1 — 0.01 P(FLE I RCIB) = 0.140 4.17 Резюме В настоящей главе вначале рассматривались основные понятия формирования рассуждений в условиях неопределенности и возможные типы ошибок, вызванные неопределенностью. Приведена краткая сводка элементарных сведений по Это значение представляет собой апостериорную вероятность. Такое распространение вероятностей продолжается вверх посети логического вывода. На данном этапе вероятность I RCIB) рассматривается как недостоверное свидетельство для узла FLE. Апостериорная вероятность P(FLE I RCIB) вычисляется с использованием той же формулы, в которой значения откорректированы для FLE: 382 Глава 4. Рассуждения в условиях неопределенности классической теории вероятностей. Описаны различия между классической и другими теориями вероятностей, такими как теории экспериментальных и субъективных вероятностей. Представлены методы комбинирования вероятностей и теорема Байеса. Показана связь между доверием (убеждениями) и вероятностью, а также раскрыт смысл понятия правдоподобности. Для иллюстрации того, как концепции теории вероятностей используются в реальных системах, была подробно проанализирована классическая экспертная система. Система PROSPECTOR использовалась также для вводного описания сетей логического вывода и секционированных семантических сетей. Материал, представленный в данной главе, позволяет сделать такой основной вывод, что классическая теория вероятностей превосходно подходит для решения задач, касающихся идеальных систем, ноне всегда применима при решении таких практических задач, как разведка полезных ископаемых с помощью методов, применяемых в системе Безусловно, теория вероятностей используется как исходный подход, обеспечивающий решения задач, характеризующихся наличием неопределенности, но для обнаружения конкретных полезных ископаемых требуется так дополнить теорию вероятностей, чтобы она позволяла учитывать доверительные коэффициенты и формулы нечеткой логики, так как лишь после этого экспертная система приобретает возможность правильно предсказывать наличие месторождений минерального сырья с использованием известных моделей. После указанной модификации система PROSPECTOR использовалась для обработки заранее неизвестных ей данных и успешно предсказала наличие месторождения молибдена стоимостью миллионов долларов. Следует отметить, что для обнаружения месторождений полезных ископаемых других типов требуются другие модели геологических характеристик, коэффициенты достоверности и формулы нечеткой логики. В этой ситуации нет ничего обескураживающего, поскольку она просто отражает тот факт, что различные залежи полезных ископаемых формировались на протяжении естественной истории по-разному, поэтому для их обнаружения требуются другие свидетельства и теории. Именно поэтому необходимо иметь возможность привлекать знания экспертов, касающиеся различных предметных областей. Эксперт, который хорошо зарекомендовал себя при поиске залежей молибдена, необязательно должен обладать способностью успешно находить месторождения нефти. Следует учитывать одно важное соображение. Необходимо стремиться к тому, чтобы экспертная система соответствовала реальному миру, а не пытаться подогнать реальный мир к существующей экспертной системе, поскольку такая попытка неизбежно окончится неудачей. В конечном итоге все теории основаны на аксиомах, представляющих собой недоказанные истины, такие как аксиома Евклида, согласно которой параллельные прямые в бесконечности не пересекаются. Безусловно, это утверждение трудно оспаривать, если речь идет об евклидовой плоскости, но указанная аксиома не соблюдается в геометрии сферических тел Задачи Задачи 4.1. Выполните следующие задания. а) Докажите аддитивный закон вероятности, используя только три аксиомы вероятности P(A ИВ Р(А) + P(B) — P(A п В) Подсказка. Любое событие Х U У может быть записано в форме Х U (Х fl Y), где Хи Х П У являются взаимоисключающими. Кроме того, представьте В как объединение двух взаимоисключающих множеств. или тел другой формы, не являющихся плоскими. Теории неопределенности также основаны на аксиомах. Тот факт, что, рассуждая о полезных ископаемых, мы вынуждены вводить дополнительные факты, такие как доверительные коэффициенты и формулы нечеткой логики, просто означает, что мы не знаем правильных аксиом, поскольку не имеем представления о том, как действительно формировались залежи полезных ископаемых миллионы лет тому назад и какой конкретный химический состав имела в этом месте земная твердь. Кроме того, в данной главе обсуждался смысл терминов невозможный, возможный, правдоподобный, вероятный и достоверный. Проводя собеседование с экспертом, важно помнить смысл этих терминов, чтобы суметь отделить вероятность от убежденности, о чем шла речь в примере с лево- и правокрылыми воронами. Особое внимание следует уделять высказываниям, рассматриваемым как достоверные, поскольку за ними могут скрываться обыденные суждения, внешне кажущиеся обоснованными. Например, согласно здравому смыслу, трудно оспаривать утверждение, что условная вероятность прихода к финишу лошади в скачках равна если лошадь жива, P(Finish Live) = 100/o. Обратите внимание на то, что здесь не говорится о том, что лошадь обязательно победита лишь придет к финишу. И тем более здравый смысл говорит о том, что участник соревнований должен быть живым, |