Главная страница

дб. Четвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д


Скачать 3.73 Mb.
НазваниеЧетвертое издание джозеф Джарратано Университет Хьюстон клиэрЛэйк Гари Райли People5oft, Издательский дом "Вильямс" Москва СанктПетербург Киев 2007 ббк 32. 973. 26 018 75 Д
Дата19.05.2022
Размер3.73 Mb.
Формат файлаpdf
Имя файла[Dzharratano Dzhozef, Raili Gar - Nieizviestnyi.pdf
ТипДокументы
#538649
страница35 из 74
1   ...   31   32   33   34   35   36   37   38   ...   74

такой как 14. Комбинация свидетельства) и б) может быть принято следующее значение РЕ I е) = 0.95 Это — простейший случай,
в котором используются правила в следующей форме IF Е Н Априорная вероятность гипотезы Н, определяемая до того, как становятся известными какие-либо свидетельства,
равна Р(Н). А после того как становится известным
свидетельство, вероятность гипотезы Х, согласно теореме
Байеса, изменяется, как показано ниже. Р(Н и Е) Р(Н и Е) Р(Е)
Р(Е п Н) + РЕ и Н) Р(Н

Е)Р(Н) РЕ H)P(H) + РЕ Н')Р(Н')
Здесь РЕ) — вероятность наблюдения свидетельства Е.
Ситуация 2. Заключение об истинности гипотезы Н следует из двух частей известного свидетельства. Эта ситуация соответствует более сложному случаю, чем ситуация 1, и отражается в правилах, имеющих такую форму IF Ej and E2 Н После наблюдения свидетельств Е и Е вероятность гипотезы Н изменяется и вместо априорной вероятности Р(Н)
принимает следующую форму Р(Н Е n Z,) = ПЕ) Р(Н П Е1
Г1 ЕЯ) РЕЕ Г Х) + P(Ei ПЕ П Х) Р(ЕГЕ2Н)Р(Н) РЕПЕРЕ ПЕ Н ) В этой формуле Е свидетельство, согласно которому неисправна коробка передаче — описанные выше симптомы аи б. Теперь рассмотрим более подробно вероятности, связанные с различными ситуациями. Ситуация 1. Заключение об истинности гипотезы Н
можно вывести из одной части известного свидетельства Глава 4. Рассуждения в условиях неопределенности
Дальнейшее сокращение этой формулы становится невозможным, если не будут приняты некоторые упрощающие допущения. В частности, если принято предположение, что свидетельства Е и Е условно независимы друг от друга, то имеет место следующее соотношение P(Ei ПЕ Н) = P(Ei I
Н)Р(Е I Н) P(Ei ГЕН РЕ I Н')Р(Е I Ни поэтому справедливо такое уравнение (см. задачу 4.12, касающуюся определения условной независимости Р(Н Е nE) = (2)
Р(Е,Н)Р(Е,Н) РЕ I Н) РЕ I Н) + 0 (Н) P (Ei I Н) РЕ I Н')
Уравнение (2) представляет собой результат значительного упрощения по сравнению с уравнением (1), поскольку теперь в нем все вероятности выражены в терминах индивидуальных вероятностей, а несовместных вероятностей, таких как РЕ ГЕН. Но, как будет описано ниже, при использовании этого предположения об условной независимости возникают
некоторые проблемы. Очевидно, что уравнение (2) является значительно более упрощенным, но для его использования все равно требуется знать априорные вероятности РЕ) и Обычно для экспертов задача определения априорных вероятностей является сложной, поскольку эксперты не проводят свои рассуждения по такому принципу. Например, если к врачу приходит пациент, то врач не предполагает априорно,
что у этого пациента простуда, лишь на основании того, что простуда — наиболее распространенное заболевание, поэтому ее вероятность высока. Основная проблема при присваивании значений априорным вероятностям заключается в том, что при использовании подхода, основанного на учете правдоподобия,
значения таких вероятностей сложно определить. Если речь идет о вероятностях, касающихся таких воспроизводимых событий, как бросок игральной кости, то задача определения указанных вероятностей на основании эмпирических или теоретических исследований является несложной. С другой стороны, если дело касается таких событий, как поиск крупного месторождения минерального сырья, то действительно невозможно точно определить априорные значения правдоподобия. Например, каково априорное правдоподобие такой гипотезы, что ваш дом стоит на участке, под которым находится крупное месторождение золота Измеряется ли оно значением 1,0, 0,01, 0,00000001 или каким-то другим числом. Комбинация свидетельств 357 Это — уникальные ситуации, в которых невозможно определить априорные вероятности. Ситуация 3. Заключение об истинности гипотезы Н
следует из N частей неопределенного свидетельства. Это общий случай наличия неопределенности в свидетельстве ив правиле, зависящем от свидетельства. С какого-то момента возрастание количества частей свидетельства приводит к тому,
что определение всех значений совместных и априорных вероятностей или правдоподобий становится невозможным.
Поэтому для учета общего случая с N частями свидетельства
используются различные приближенные методы.
Комбинирование свидетельств с использованием нечеткой логики Коньюнкция свидетельств Предположим, что следующее правило IF Е THEN Н включает антецедент Е, представляющий собой конъюнкцию свидетельств, как показано ниже. IF Ei AND
Ег AND ... Еи THEN Н Для того чтобы антецедент принял истинное значение, необходимо, чтобы с определенной вероятностью все термы Е были истинными. В общем случае каждая часть свидетельства основана на частичном свидетельстве е. Вероятность этого свидетельства определяется следующей формулой РЕ I е) = P(E> Г Е П Г1
Е I е) = РЕ п E2 n n Е пе) Ре) РЕ п Ее) РЕ п E2 е)—
Р(е) РЕ l E> Г е) РЕ l е) Ре) Ре) На основании предположения о независимости можно вывести следующую формулу, поскольку свидетельство Е не способствует получению каких-либо Если все свидетельства Е, являются условно независимыми, то их совместная вероятность вычисляется как произведение отдельных вероятностей. Это следует из обобщенного мультипликативного закона. Например,
для двух частей свидетельства справедливо следующее соотношение Глава 4. Рассуждения в условиях неопределенности знаний об истинности свидетельства ЕРЕ е) = РЕЕ е) Таким образом, справедливо следующее соотношение РЕ, «i I е) РЕ, I РЕ, I е) а также, вообще говоря, следующее P(E1 г Е2
г1 ll Еу е) = ПР(Е, е) Безусловно, эта формула является теоретически обоснованной, но при ее применении для решения практических задач возникают сложности. Во-первых, обычно в реальном мире отдельные вероятности РЕ, е) не являются независимыми. Во-вторых, в результате умножения многочисленных факторов, полученных на основании первого предположения, формируется произведение, которое обычно слишком мало для РЕ е. Приближенное решение этой задачи состоит в использовании для вычисления P(E I е) нечеткой
логики, например, в виде следующей формулы, в которой функция min возвращает минимальное значение среди всех значений РЕ, е РЕ I е) = ппп[Р(Е, I <)) Дизъюнкция свидетельств Если правило представляет собой дизъюнкцию свидетельств, те. имеет такой вид IF Е OR Ег ОВ --. Еы Н В системе PROSPECTOR эта формула вполне себя оправдала. После определения РЕ е) это значение может использоваться в формуле кусочно-линейной функции для Р(Н е. Основным недостатком этой формулы, полученной с помощью нечеткой логики, является то, что при ее использовании значение РЕ е) становится нечувствительным ко всем значениям РЕ, е, кроме минимального. Это означает,
что даже если все остальные вероятности будут возрастать, а минимальное значение вероятности останется одинаковым,
подобные изменения не отразятся назначении РЕ I е. Таким образом, минимальное значение РЕ I е) блокирует распространение информации о других изменениях вероятностей по цепи логического вывода. А преимуществом формулы, полученной с помощью нечеткой логики, является то,
что она позволяет проводить несложные вычисления. Комбинация свидетельств 359 то можно показать (см.
задачу 4.13), что в условиях использования предположения о независимости свидетельств может быть получена следующая формула РЕ е РЕ I е) = тпах[Р(Е, I е Логическая комбинация свидетельств Если антецедент представляет собой логическую комбинацию свидетельств, то для комбинирования свидетельств можно использовать нечеткую логику и правила отрицания. Например, допустим, что дано следующее правило Е AND (Ег OR Ез ) THEN Н В таком случае можно применить следующие формулы ЕЕ (Е OR Ез) Ее е, 1 — Р(Ез ! e)]) Безусловно, подобные формулы,
полученные на основе нечеткой логики, успешно использовались во многих системах, но могут быть определены и другие функции, обеспечивающие комбинирование
свидетельств. Например, ниже приведена формула,
альтернативная по отношению к той формуле, в которой для вычисления вероятности дизъюнкции применялась функция max. P(E ПЕ Н) = min[1, P(E Н) + РЕ Эффективные значения правдоподобия В общем случае конкретная гипотеза может стать следствием многочисленных правил с неопределенными свидетельствами и несовместимыми априорными вероятностями. Если принято предположение об условной независимости свидетельств и все значения Е, вносящие свой вклад в подтверждение гипотезы Н,
являются истинными, то справедлива такая формула 0(H ЕЕ Г. Еу) = MLS, O(H) i=1 Недостаток этой формулы состоит в том, что рассчитанные с ее помощью значения вероятности слишком велики. Вместо этой формулы в системе применяется следующая формула, полученная с помощью нечеткой логики, в которой функция шах возвращает максимальное значение среди всех значений Глава 4. Рассуждения в условиях неопределенности 360 В
этой формуле значения LSi определены следующим образом:
Р(Е; Н) РЕ, / Н) N o(H E', n E,'n n E„') = Пьк, o(H) в которой значения LN, определяются таким образом РЕ, ' Н) РЕ. Н')
В общем случае, когда имеют место несовместимые априорные вероятности и неопределенные свидетельства, эффективный коэффициент правдоподобия LE определяется следующим образом Не) В этой формуле е, представляет собой i-e частичное свидетельство, вносящее свой вклад в подтверждение гипотезы Н. Обновление значения Н на основании неопределенного и несовместимого свидетельства осуществляется по аналогии с предыдущим случаем, как показано ниже. O(H e1 Г е 5 5 еу) = ПЯЕ, O(H) Эта формула может использоваться в экспертной системе, основанной на применении неопределенных свидетельств и несовместимых априорных вероятностей, как описано ниже. а) Сохранять априорные шансы для каждого правила и значения LE после
каждого вычисления вклада свидетельства в подтверждение гипотезы правила. б) После каждого обновления значений РЕ, е) вычислять новые значения LE,. и апостериорные шансы. А
если все свидетельства, подтверждающие гипотезу Н, являются ложными, то справедлива аналогичная формула. Комбинация свидетельств 361 Сложности, связанные с использованием условной независимости РЕ Н, P(Eg Н),
Р(Е Н, P(Eg Н, Р(Н) Еще одно значение вероятности,
Р(Н'), необходимое для вычисления Н, не является независимым от других, поскольку справедливо следующее соотношение Р(Н') = 1 — Р(Н) В задаче 4.12, б показана еще одна формула для вычисления Р(Н I Ей Е. В этой формуле предусматривается использование четырех других значений вероятностей Р(Н I Е, Р(Н I Е, Р(Н' I Е, Р(Н' I Е) Таким образом, для вычисления значения Р(Н Е ПЕ) может использоваться общее количество вероятностей, равное девяти,
но фактически требуется задать только пять значений,
поскольку остальные четыре можно вычислить при наличии этих пяти значений. По мере того как экспертная система становится все более зрелой, это ограничение на количество независимых вероятностей превращается в реальную проблему. После того как цепи логического вывода начинают действовать правильно,
инженер познаниям должен заняться обеспечением того, чтобы экспертная система выводила правильные числовые значения.
Но в связи стем, что принято предположение о независимости условных вероятностей, инженер познаниям не обладает полной свободой в настройке всех девяти вероятностей,
пользуясь ко- Разумеется, предположение о независимости условных вероятностей позволяет упростить теорему Байеса, но при использовании этого предположения возникает целый ряд проблем. Предположение о независимости условных вероятностей в основном может оказать помощь на начальных этапах создания экспертной системы, когда гораздо важнее правильно представить общее поведение системы, чем
получить правильные числовые результаты. На первых порах может оказаться, что инженер познаниям более заинтересован в разработке адекватных цепей логического вывода, чем в получении точных числовых результатов. Это означает, что,
допустим, в некоторой системе промежуточная гипотеза должна активизироваться свидетельствами 23 и 34. Затем гипотеза 10 и свидетельство 8 должны активизировать гипотезы и 96. Гипотеза 15 не должна активизироваться свидетельствами 23 и 24, и т.д. Как показывает уравнение (приведенное в этом разделе, если принято предположение о независимости условных вероятностей, то для вычисления значения Р(Н Е Г Е) требуется только пять значений вероятности. Эти значения приведены ниже 362 Глава 4. Рассуждения в условиях неопределенности торой он мог бы легко настраивать значения этих вероятностей для получения желаемых результатов. Применение предположения о независимости условных вероятностей позволяет откорректировать значение совместной вероятности
Р(Е1 Г Е, поскольку справедлива следующая формула Р(Н
Е,)Р(Н Е) Р(Н' Е,)Р(Н' [ Е) Р(Н) Р(Н') 4.15 Сети логического вывода Вплоть до этого момента рассматривались лишь такие примеры формирования цепей прямого и обратного логического вывода, которые были очень малы и состояли всего лишь из нескольких правил. Нов практических задачах количество этапов логического вывода, требуемых для обоснования гипотезы или для достижения заключения, намного больше.
Кроме того, основная часть или даже все эти этапы логического вывода осуществляются с учетом неопределенности свидетельств и самих правил. В подобных практических системах успешно использовались вероятностные рассуждения и теорема Байеса. Это означает, что теперь назначение РЕПЕ) налагают ограничения априорные вероятности РЕ, Р(Е2)
и Р(Н). Такое положение дел противоречит структуре знаний эксперта-человека, который может знать только отдельно взятые
значения РЕ, РЕ) и РЕПЕ. Таким образом, принятие предположения о независимости условных вероятностей препятствует применению всех знаний эксперта-человека.
Безусловно, решение руководствоваться предположением о независимости условных вероятностей на первый взгляд кажется оправданным, но фактически то, будет ли благодаря этому достигнут успех, зависит от реальной ситуации,
моделируемой с помощью экспертной системы, поэтому надежды оправдываются не во всех случаях. Водной теории утверждается, что предположение о независимости условных вероятностей обычно оказывается ложным. А в другой теории говорится о том, что из предположения о независимости условных вероятностей следует наличие строгой независимости, а это служит доказательством того, что данное свидетельство неприменимо для обновления гипотез Но такие утверждения таки остались утверждениями, которые опровергаются другой теорией. (Вывод из всей этой истории состоит в том, что утверждения, основанные на нечеткой логике,
не вполне безупречны) Еще водном методе применения субъективных байесовских вероятностей демонстрируется, как можно ослабить предположение о независимости условных вероятностей для того, чтобы из такого предположения больше не следовал вывод острогой независимости [77].
363 4.15. Сети логического вывода Подходящей архитектурой для экспертных систем, основанных на таксономии знаний,
является сеть логического вывода. Таксономия представляет собой один из способов классификации и широко используется в таких естественных науках, как геология и биология. Простой пример таксономии уже рассматривался в этой книге в виде рисунка, приведенного в главе 3, на котором показана классификация различных видов кустарников малины (рис. Применение таксономии может принести пользу по двум причинам. Во-первых, этот метод позволяет организовать знания, относящиеся к некоторой теме, по принципу
классификации объектов и описания отношений этих объектов с другими объектами. Таксономии позволяют выявлять такие важные особенности, как наследование свойств. Во-вторых,
причина значительной пользы таксономий состоит в том, что они способны направлять поиск доказательства гипотезы, такой как "В этом районе есть залежи медной руды. Подобная помощь при доказательстве или опровержении гипотез очень важна в таких областях, как разведка полезных ископаемых, поскольку прямые свидетельства о наличии ценной руды редко лежат на поверхности. А прежде чем принять решение о вложении времени и денег в бурение разведывательной скважины, геолог пытается собрать свидетельства, обосновывающие эту гипотезу.
Система PROSPECTOR Классической экспертной системой, в которой используются вероятностные рассуждения, является. Эта система была разработана для оказания помощи геологоразведывательным компаниям при определении того, является ли некоторый район перспективным сточки зрения наличия в нем месторождений полезных ископаемых определенных типов. Основная идея системы состоит в том, что в базе знаний экспертной системы закодированы знания опытных геологов,
знакомых с принципами экономики, о различных моделях залегания полезных ископаемых. Геологическая модельэто группа свидетельств и гипотез, на основании которых можно судить о наличии в некотором районе минерального сырья определенного типа. Система PROSPECTOR не только помогает выявлять наличие полезных ископаемых, но и обладает способностью давать рекомендации по выбору наилучшего места для проведения разведывательного бурения в данном районе. По мере создания все большего и большего количества моделей возможности системы PROSPECTOR продолжают расширяться. Данные, применяемые в каждой модели,
организованы в виде сети логического вывода. На рис. приведены итоговые данные о типах сетей, которые рассматривались до сих пор в настоящей книге, а на рис. 4.17, г показана очень простая сеть логического вывода. Узлы сети логического вывода могут представлять свидетельства
предназначенные для обоснования гипотез, например,
касающихся наличия полезных ископаемых определенного типа
(сами гипоте-
364 Глава 4. Рассуждения в условиях неопределенности зы представлены другими узлами сети. В табл. 4.12 приведены общие сведения о некоторых из 22 моделей месторождений полезных ископаемых, представленных в системе. Структура Пример вязь Объект а)
Семантическая сеть 25 центов 25 центов Нажмите Получите товар ействие 50 центов Состояние б) Диаграмма состояний
IFBTHENС, D IF С THEN... IF ействие Правило в) Сеть принятия решений или сеть правил Достат необхо ые шансы i, он) 20 г) Сеть логического вывода Рис. 4.17. Некоторые типы сетей 4.15. Сети логического вывода Таблица 4.12. Некоторые модели из системы PROSPECTOR Количество Количество
1   ...   31   32   33   34   35   36   37   38   ...   74


написать администратору сайта