Главная страница

дб. Четвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д


Скачать 3.73 Mb.
НазваниеЧетвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д
Дата19.05.2022
Размер3.73 Mb.
Формат файлаpdf
Имя файла[Dzharratano Dzhozef, Raili Gar - Nieizviestnyi.pdf
ТипДокументы
#538649
страница39 из 74
1   ...   35   36   37   38   39   40   41   42   ...   74

Такая ситуация возникает, если антецеденты не заданы должным образом. В качестве очень простого примера предположим, что в базе знаний заданы следующие два правила 394 Глава 5. Нестрогие рассуждения Рис. Неопределенность, связанная с совместимостью правил () (2) происходит пожар THEN примените для его тушения воду происходит пожар THEN не применяйте для его тушения воду
Правило (1) подходит для тушения обычных пожаров, например,
связанных с возгоранием деревянных конструкций, а правило (относится к тушению пожаров, в которых горит нефть или консистентная смазка. Проблема состоит в том, что не указаны достаточно точно антецеденты, соответствующие категории пожара. Если обнаруживается факт "происходит пожар, то выполняются оба правила с противоречивыми консеквентами, в результате чего неопределенность увеличивается. Вторым источником неопределенности становится обобщение правил.
Одно правило обобщается другим, если часть его антецедента является подмножеством другого правила. Например,
предположим, что в базе знаний представлены следующие два правила и оба эти правила имеют одинаковое заключение (3)
(4) ПЕ Н IF E

AND E2 THEN Н Если обнаруживается только свидетельство Е, то проблема не возникает, поскольку активизируется только правило (3). Если же обнаруживаются оба свидетельства, Е и Е, то активизируются оба правила, (и (4), поэтому возникает необходимость в разрешении конфликтов. Разрешение конфликтов В процессе разрешения конфликтов возникает неопределенность, относящаяся к приоритетам правил. Как показано на рис. 5.4, такая неопределенность зависит от целого ряда факторов. Первым фактором является то, каковы особенности применяемого командного интерпретатора или инструментального средства. В
инструментальных средствах экспертных систем, в которых используется алгоритм, более высокий приоритет приобретает правило с более конкретными шаблонами. Это действительно 395 5.2. Неопределенность и правила Рис. Неопределенность, связанная с разрешением конфликтов (ball ellipsoidal) является более конкретным, чем такой шаблон (необходимо, поскольку при увеличении объема доступной информации возрастает доверие к более конкретному правилу,
когда существует потенциальная возможность активизации для последующего запуска многочисленных правил. Например, если экспертная система применяется для обеспечения комфорта и ее пользователь говорит "Я чувствую жар, то одним из правил может быть "IF пользователь чувствует жар THEN он должен принять аспирин. С другой стороны, рассматривается как более конкретное правило, в котором указано "П. пользователь чувствует жар AND сидит в пальто летом на пляже THEN он должен снять пальто, если доступна дополнительная информация, что данное лицо действительно сидит в пальто на горячем песке. Вообще говоря, мерой доверия к тому, что некоторое правило является более подходящим, может служить количество успешных согласований с шаблонами в левой части правила, те. в большей степени подходит правило с большим, а не меньшим количеством согласующихся шаблонов (например,
меньшим из-за того, что доступен меньший объем информации).
Конкретность правила CLIPS зависит от количества шаблонов и от внутренней сложности каждого шаблона. Например,
следующий шаблон:
Глава 5. Нестрогие рассуждения 396 IF Ез THEN Н Свое влияние оказывает также порядок расположения шаблонов в правиле. В системе OPS5 разрешено использование двух других стратегий управления, называемых лексикографической

(lexicographic — LEX) стратегией и анализом целей и средств analysis — MEA). Эти стратегии определяют способ интерпретации шаблонов правил машиной логического вывода.
Стратегия управления выбирается путем ввода команды strategy в интерпретатор экспертной системы. При использовании стратегии LEX порядок шаблонов не имеет никакого значения
(если не считать того, что, возможно, влияет на эффективность).
Таким образом, следующие два правила, согласно стратегии, по сути рассматриваются как одинаковые IF Ei AND E2
THEN Н IF E2 AND Ei THEN НС другой стороны, стратегия МЕА
используется в программе универсального решателя задач
Ньюэлла и Саймона, которая рассматривалась в главе Основная идея стратегии МЕА состоит в том, что нужно стремиться уменьшить различие между начальным состоянием и состоянием успеха. В той реализации МЕА, которая применяется в системе OPS5, очень важен выбор первого шаблона, поскольку именно он применяется для управления процессом согласования с шаблонами. Назначение стратегии
МЕА состоит в том, что она позволяет системе продолжать выполнение текущего задания, не подвергаясь влиянию того,
что в рабочую память введены еще более свежие факты. В
стратегии MEA приоритет правил определяется с учетом первого шаблона, который непосредственно следует за конструкцией Если одно из правил приобретает более высокий приоритет по В
первом шаблоне речь идет об эллипсоидальном мяче, который,
по-видимому, представляет собой мяч для американского футбола, а во втором шаблоне говорится просто о мяче,
который может представлять собой теннисный мяч, мяч для крикета, баскетбольный, бейсбольный или мяч любого другого типа. Возвращаясь к двум правилам, которые рассматривались выше, отметим, что правило (4) является более конкретным,
поскольку имеет в антецеденте два шаблона, и поэтому с ним неявно связан более высокий приоритет. В системе CLIPS в первую очередь будет выполнено правило (4). Но обнаруживаются и другие осложнения. Дело в том, что приходится учитывать не только конкретность, но и новизну фактов. После ввода факта в рабочую память ему
присваивается уникальная временная отметка, позволяющая узнать, когда он был введен. Таким образом, правило со следующим шаблоном получило бы более высокий приоритет,
чем правило (3), если бы факт Ез был введен после факта Е 5.2. Неопределенность и правила Обобщение и неопределенность Проблема обобщения становится более трудноразрешимой, если с правилами связаны правдоподобия,
как показано ниже. (6) (7) ЦЕНЯ Н жЙЫЯ2 Например, рассмотрим следующие правила IF
the starter motor doesn' t work THEN check the battery with LSq = 5
IF the starter motor doesn' t work AND the lights don' t work THEN
check the battery with LSq = 10 В этих правилах значение LSq больше чем ЬЯ1, поскольку заключение обосновывается большим количеством свидетельств. сравнению с другими с учетом именно первого шаблона, то выбирается как раз такое правило. Для определения наиболее высокоприоритетного правила может применяться либо критерий конкретности, либо критерий новизны. Если же количество наиболее высокоприоритетных правил, классифицируемых по первому шаблону, становится больше единицы, то, согласно стратегии
МЕА, осуществляется переупорядочение правил с учетом остальных шаблонов. В конечном итоге, если не обнаруживается единственное наиболее высокоприоритетное правило, осуществляется произвольный выбор правила.
Важным фактором в разрешении конфликтов может также стать правильный порядок ввода правил в экспертную систему. Если машина логического вывода не имеет возможности выбирать правила с учетом приоритетов, то должен происходить произвольный выбор правила. Но проектировщики машины логического вывода должны соблюдать исключительную осторожность, поскольку в противном случае может оказаться,
что машина осуществляет свой выбор в определенном смысле детерминированно, так как выбор происходит в зависимости от последовательности ввода правил. Такая ситуация может
возникать из-за того, что проектировщики машины логического вывода используют стек или очередь для хранения правил в рабочем списке правил. Но для того чтобы выбор правил с равными приоритетами происходил произвольно, правила должны извлекаться из стека или очереди действительно случайно. Но вместо этого проектировщики могут пойти поболее легкому пути и просто выталкивать очередное правило из стека или извлекать следующее правило из очереди. Такой метод выбора прост, но его применение приводит к внесению в систему известного артефакта (постороннего влияния),
поскольку выбор одного из правил среди правил с равным приоритетом не является произвольным Глава 5. Нестрогие рассуждения 398 Как было указано в главе, если наблюдаются оба свидетельства, Е и Е, то, согласно следующей формуле апостериорных шансов, произведение становится равным 5. 10 = 50: (8) IF E AND E2 THEN Н IF E2
AND E AND Ез THEN Н Эти правила становятся избыточными после удаления свидетельства Ез, поскольку антецеденты после этого соответствуют одному и тому же шаблону. Но задача выбора для удаления одного из избыточных правил не всегда решается просто. Если водном из избыточных правил более редко встречающийся шаблон стоит на первом месте, то эффективность системы увеличивается благодаря тому, что в результате неудачного завершения попытки согласования первого шаблона машиной логического вывода отпадает необходимость проверять второй шаблон. Дополнительные усложнения возникают при использовании таких командных интерпретаторов экспертных систем, как OPS5, поскольку в них порядок активизации зависит от стратегии управления,
выбранной пользователем. Как ив случае обобщения, наличие избыточных правил также приводит к возникновению ошибки,
связанной со слишком высоким значением произведения коэффициентов правдоподобия. Нов действительности формула (8) предназначена для описания правил
свидетельства которых комбинируются независимо друг от друга. Тем не менее антецеденты правили) на самом деле не являются независимыми, поскольку в них имеется общее свидетельство Е. Таким образом, выражение Е AND Е2
обобщает выражение Е, поскольку выражение Е, отдельно взятое, является частным случаем выражения E> AND Иначе говоря, возникает ошибка, которая заключается в том, что произведение отношений LS и Х Я слишком высоко,
поскольку антецеденты правил не являются независимыми.
Решение данной проблемы состоит в замене LSg отношением, для того чтобы при наличии обоих свидетельств, Е и
Е2, вычислялось правильное произведение LSg. Но задача поиска вручную возможных обобщений в крупной базе знаний может оказаться слишком сложной. Третьей причиной неопределенности становится наличие избыточных правил,
которые имеют одинаковые консеквенты и свидетельства.
Обычно появление таких правил вызвано тем, что их непреднамеренно вводит повторно инженер познаниям в некоторых случаях такие дубликаты случайно возникают после модификации правил в результате удаления шаблонов.
Например, рассмотрим следующие правила 5.3. Коэффициенты достоверности Четвертой причиной появления неопределенности в консеквентах правил является наличие недостающих правил. Такая ситуация возникает из-за того, что эксперт-человек забывает о существовании необходимого правила или не знает о его существовании, как в следующем примере IF Е THEN Н 5.3 Коэффициенты достоверности Еще один метод учета неопределенности состоит в использовании коэффициентов достоверности, которые были впервые разработаны для экспертной системы MYCIN. В данном случае игнорируется свидетельство Е, а это означает, что гипотеза Н не подтверждается стой основательностью, которая ей соответствует. Одним из преимуществ сетей логического вывода, подобных PROSPECTOR, является явно выраженный
характер сети, что способствует упрощению поиска таких гипотез, которых невозможно или сложно достичь. Если есть недостающие правила, то необходимость во введении этих правил может быть обнаружена непосредственно из анализа самой сети логического вывода. Пятая причина неопределенности обусловлена возникновением проблем,
связанных со сплавлением данных. Этим термином обозначается неопределенность, возникающая, когда данные берутся из источников, представляющих информацию разных типов. Объединение таких данных и называется сплавлением данных. Например, врач, составляя диагноз, может рассматривать свидетельства, полученные из таких весьма разнообразных источников, как физическое обследование,
результаты медицинских анализов, история болезни пациента,
описание социальноэкономической среды, результаты анализа ментального и эмоционального состояний, наличие проблем в семье и на работе и т.д. Все эти свидетельства несут в себе информацию разных типов, которая должна быть подвергнута сплавлению в целях обоснования окончательной гипотезы.
Задача сплавления свидетельств, полученных из таких многочисленных и разных источников, является гораздо более сложной по сравнению с задачей использования свидетельств,
относящихся к одной предметной области, такой как геология.
Аналогичным образом, деловые решения могут зависеть от наличия рынка для товаров, экономических условий, состояния внешней торговли, проявления попыток поглощения, политики компании, личных проблем, участия в экономических союзах и от многих других факторов. Как ив случае решения задач постановки медицинского диагноза, очень сложно присвоить всем этим факторам коэффициенты правдоподобия и определить приемлемую комбинирующую функцию Глава 5. Нестрогие рассуждения Трудности, связанные с применением байесовского метода Е �ЮР(.) Ж.)РР') РЕ Р )Р(Р ) В этой формуле сумма по распространяется на
все заболевания и применяются такие обозначения ° D, — i-e заболевание ° Е — свидетельство ° P(D,) — априорная вероятность того, что пациент имеет заболевание установленная дополучения каких-либо свидетельств ° РЕ
D,) — условная вероятность того, что в отношении пациента будет обнаружено свидетельство Е, при условии наличия у него заболевания D;. Но при наличии общей совокупности обычно невозможно определить согласованные и полные значения для всех этих вероятностей. На практике обычно происходит последовательное накопление свидетельства, часть за частью.
Такое накопление требует существенных затрат времени и денег, особенно если для этого применяются медицинские анализы. Как правило, количество выполняемых медицинских анализов сводится к минимуму, необходимому для постановки качественного диагноза (и защиты от врачебной ошибки, с учетом таких факторов, как время, стоимость и потенциальный риск для пациента. Поэтому вместо приведенной выше формулы применяется более удобная форма теоремы Байеса,
которая хорошо представляет подобный процесс инкремент-
Неопределенность возникает не только при решении задач поиска полезных ископаемых, для чего применяется система, но и при решении почти любых задач медицинской диагностики. Основное различие между задачами двух указанных типов состоит в том, что в первом случае гипотезы формулируются на основе знаний в области геологии и являются не столь многочисленными, поскольку ограниченно само количество различных минералов, в формировании которых участвуют лишь 92 природных элемента. С другой стороны, количество болезнетворных микроорганизмов намного больше, поэтому значительно увеличивается и количество возможных гипотез, касающихся заболеваний. Безусловно,
теорема Байеса находит в медицине широкое применение, но получение с ее помощью точных результатов возможно, только если известно значительное количество вероятностей.
Например, теорема Байеса может служить для определения вероятности конкретного заболевания, если известны некоторые симптомы, определяемые следующей формулой

401 5.3. Коэффициенты достоверности ного накопления свидетельств (см. задачу 5.1): P(E2 D, A E)P(D, Е) QP(Ep
?3 п ЕР E]) В этой формуле Е обозначает новое свидетельство, добавляемое к существующей совокупности свидетельств Е для получения еще более нового,
дополненного свидетельства Е=ElпЕ2 Степени доверия и недоверия Перед экспертами в области медицины возникает не только проблема, связанная с увеличением количества условных вероятностей, необходимых для использования байесовского метода, но и другая важная проблема, которая касается отношения между доверием и недоверием к определенной гипотезе. На первый взгляд эта проблема может показаться тривиальной, поскольку очевидно, что недоверие просто противоположно доверию. И действительно, в теории вероятностей сформулировано следующее утверждение Р(Н) +
P(H') = 1 и поэтому P(H) = 1 — P(H') Для апостериорной гипотезы, обоснованием для которой служит свидетельство Е,
справедлива следующая формула P(H ЕЕ) Но после того как инженеры познаниям, участвующие в разработке системы MYCIN, приступили к собеседованиям с экспертами в области медицины, было обнаружено, что врачи выражают крайнее нежелание формулировать свои знания, пользуясь уравнением (1). Например, рассмотрим такое правило MYCIN: IF
1) The stain of the organism is gram positive, and 2) The morphology of the organism is coccus, Безусловно, эта формула является точной, но обычно неизвестны все необходимые для нее вероятности. Кроме того, ситуация становится еще более затруднительной по мере накопления все большего и большего количества частей свидетельств, поскольку в связи с этим требуется все больше вероятностей Глава 5. Нестрогие рассуждения and 3) The growth conformation of the organism is chains THEN There is suggestive
evidence (0.7) that the identity of the organism is Попросту говоря, это правило гласит о том, что если бактериальный организм приобретает окраску после окрашивания по Граму и напоминает цепочки сфер, то имеется
70'Ъ-ное правдоподобие, что он относится к типу микроорганизмов, называемых стрептококками. Это утверждение может быть записано в терминах апостериорной вероятности следующим образом P(H Е fl E2 A Ез) = 0.7 (2) В
этой формуле выражения Е, соответствуют трем шаблонам антецедента. Инженеры познаниям системы обнаружили следующее эксперты соглашаются стем, что уравнение (2) справедливо, но чувствуют себя растерянными и отказываются соглашаться с таким вероятностным результатом' Е Г Е П Ез) = 1 — 0.7 = 0.3 Это нежелание экспертов соглашаться стем, что уравнение (3) истинно, еще раз показывает, что такие числа, как 0,7 и 0,3, представляют собой правдоподобия степени доверия, а невероятности. Для того чтобы полностью оценить значимость этой проблемы несогласованности между доверием и недоверием, рассмотрим следующий пример. Предположим, что вам для получения документа об образовании требуется пройти последний курс.
Предположим, что ваш средний аттестационный балл (Grade
Point Average — GPA) не слишком высоки после прохождения данного курса вам необходимо получить отличную оценку, чтобы поднять свой средний аттестационный балл. Вашу степень доверия к правдоподобию получения документа об окончании учебного заведения можно выразить с помощью следующей формулы F(graduating
1   ...   35   36   37   38   39   40   41   42   ...   74


написать администратору сайта