Системы искусственного интеллекта. Искусственного интеллекта Понятия ии, свойства знаний
Скачать 0.75 Mb.
|
12. Состав знаний для статической и динамической ЭС. В соответствии с общей схемой статической экспертной системы (см. рис. 2.1) для ее функционирования требуются следующие знания [7; 8]: • знания о процессе решения задачи (т. е. управляющие знания), используемые интерпретатором (решателем); • знания о языке общения и способах организации диалога, используемые лингвистическим процессором (диалоговым компонентом); • знания о способах представления и модификации знаний, используемые компонентом приобретения знаний; • поддерживающие структурные и управляющие знания, используемые объяснительным компонентом. Для динамической ЭС, кроме того, необходимы следующие знания (см. рис. 2.2): • знания о методах взаимодействия с внешним окружением; • знания о модели внешнего мира. Зависимость состава знаний от требований пользователя проявляется в следующем [7; 8]: 1) какие задачи (из общего набора задач) и с какими данными хочет решать пользователь; 2) каковы предпочтительные способы и методы решения; 3) при каких ограничениях на количество результатов и способ их получения должна быть решена задача; 4) каковы требования к языку общения и к организации диалога; 5) какова степень общности/конкретности знаний о проблемной области, доступная пользователю; 6) каковы цели пользователей. 13. Интерпретируемые и не интерпретируемые знания. С точки зрения архитектуры ЭС знания могут быть структурированы так, как показано на рис. 2.3. Данная классификация рассматривает знания, учитывая их использование в ходе работы экспертной системы. С учетом архитектуры экспертной системы знания целесообразно делить на интерпретируемые и неинтерпретируемые [7; 8]. К первому типу относятся те знания, которые способен интерпретировать решатель (интерпретатор). Все остальные знания относятся ко второму типу. Решатель не знает их структуры и содержания. Если эти знания используются каким-либо компонентом системы, то он не «осознает» этих знаний. Неинтерпретируемые знания подразделяются на вспомогательные, хранящие информацию о лексике и грамматике языка общения, информацию о структуре диалога, и поддерживающие знания. Вспомогательные знания обрабатываются естественно- языковой компонентой, но ход этой обработки решатель не осознает, так как этот этап обработки входных сообщений является вспомогательным для проведения экспертизы. Поддерживающие знания используются при создании системы и при выполнении объяснений. Поддерживающие знания выполняют роль описаний (обоснований) как интерпретируемых знаний, так и действий системы. Интерпретируемые знания можно разделить на предметные знания, управляющие знания и знания о представлении. Знания о представлении содержат информацию о том, каким образом (в каких структурах) в системе представлены интерпретируемые знания. Предметные знания содержат данные о предметной области и способах преобразования этих данных при решении поставленных задач. 14. Система и модель представления знаний. Для того чтобы манипулировать всевозможными знаниями о реальном мире с помощью компьютера, необходимо сначала представить их в виде, пригодном для использования на компьютере. Типичными моделями представления знаний являются: — логическая модель, основанная на логике предикатов первого порядка и выведении заключений с помощью силлогизма; — продукционная система- это модель, основанная на использовании правил, т. е. утверждений в форме «ЕСЛИ …, ТО …»; продукционные модели бывают двух типов: с прямым и обратным выводами, — фреймовая система (frame (англ.) — рамка, каркас); каждый фрейм описывает один объект какой-либо предметной области (экономики, юриспруденции, химии, медицины и т. д.), а конкретные свойства этого объекта описываются в слотах (компонентах фрейма); у каждого фрейма имеется отдельный слот, содержащий процедуру, реализующую вывод на фреймах; — сематическая сеть — это граф, узлы которого соответствуют понятиям и объектам предметной области, а дуги (ребра) графа соответствуют отношениям (взаимосвязям) между объектами; семантические сети легко представляются в виде фремовой системы. 15. Семантические сети. В основе этих моделей лежит понятие сети, образованной помеченными вершинами и дугами. Вершины сети представляют некоторые сущности (объекты, события, процессы, явления), а дуги — отношения между сущностями, которые они связывают. Пример семантической сети приведен на рис. 4.2 [24]. Характерной особенностью семантических сетей является наличие трех важнейших типов отношений: класс — элемент класса («это»); свойство — значение («цвет — красный»); пример элемента класса («например») [24]. Кроме перечисленных, в семантических сетях используются следующие типы отношений: связи типа «часть — целое» («класс — подкласс», «элемент — множество» и т.п.); функциональные связи («объект — свойство», «свойство — значение»); атрибутивные связи (количественные, временные, пространственные); логические связи (и, или, не); лингвистические связи. Семантические сети можно классифицировать на [24]: • однородные (с единственным типом отношений); неоднородные (с различными типами отношений); • бинарные (в которых отношения связывают два объекта); n-арные (в которых есть специальные отношения, связывающие более двух понятий). 16. Фреймы. Стремление разработать представление, соединяющее в себе достоинства различных моделей, привело к возникновению так называемого фрейм-представления [36] (фрейм — от англ. frame — «рама» или «рамка»). По Минскому, фрейм — это структура данных (т. е. декларативное представление), предназначенная для представления некоторой стандартной ситуации. С каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например, информация о том, как пользоваться данным фреймом, каковы ожидаемые результаты выполнения фрейма, что делать, если ожидания не оправдались, и т.п. Фрейм можно представить в виде сети, состоящей из вершин и отношений (дуг). «Верхние уровни» фрейма фиксированы и представляют сущности, всегда истинные в ситуации, описываемой данным фреймом. «Нижние уровни» заканчиваются слотами (от англ. slot — поле), которые заполняются конкретной информацией при вызове фрейма. Можно провести аналогию между фреймами и описанием процедур в языках программирования. Фрейм соответствует описанию процедуры, а означенный фрейм (фрейм-пример) соответствует вызову процедуры. Отличие фреймов от описаний процедур состоит в том, что фреймы могут вызываться не по имени, а по соответствию текущей ситуации той ситуации, которую описывает данный фрейм. Кроме того, фрейм, слоты и механизм их означивания описывают ситуацию в семантических (а не синтаксических) терминах и в метатерминах. С каждым слотом фрейма связаны описания условий, которые должны быть соблюдены, чтобы могло произойти означивание слота. В простейших случаях эти условия могут сводиться к указанию семантических категорий, которым должно удовлетворять значение слота. В более сложных случаях условия могут касаться отношений между значениями, выбираемыми для нескольких слотов. Итак, фрейм-пример может быть представлен в виде следующей конструкции: f = [< r1 , v1 >,< r2 , v2 >, …,< rn , vn >], где f — имя фрейма; ri — имя слота; vi — значение слота. В качестве значений слотов могут выступать имена других фреймов, что обеспечивает связь между фреймами (так образуются сети фреймов). 17. Продукционные системы. Системы, основанные на правилах, разделяются по видам правил на продукционные системы и трансформационные системы. Продукционные системы образованы из правил, в которых сопоставление и планирование (управление) являются явными функциями системы, зафиксированными в интерпретаторе. Трансформационные системы, в отличие от продукционных, могут не иметь явных функций по сопоставлению правил и управлению правилами. Примерами трансформационных систем являются формальные системы и системы формальных грамматик. Продукционные системы могут быть разделены на продукционные системы, управляемые данными (предусловиями правил), и на продукционные системы, управляемые целями (действиями правил). Традиционно под продукционными системами понимают только системы, использующие вывод, направляемый данными. Обычно предусловие (антецедент) задается в виде логической комбинации утверждений о данных рабочей памяти, а действием (консеквентом) является некоторая операция по модификации рабочей памяти. Сложность действий колеблется в значительных пределах: от простой операции присваивания до функции произвольной степени сложности. Итак, представление знаний в виде УОМ и продукционных правил обладает следующими достоинствами: • модульностью организации знаний; • независимостью правил, выражающих самостоятельные фрагменты знаний; • легкостью и естественностью модификации знаний; • отделением управляющих знаний, что позволяет применять различные управляющие стратегии; • возможностью создания для ряда приложений управляющих механизмов для автоматического решения задач. 18. Введение в исчисление предикатов. Логика предикатов дает возможность более детально рассматривать, а следовательно, более точно формализовать знания и рассуждения о свойствах объектов предметной области. В логике высказываний пропозициональные символы служат для обозначения простых высказываний (утверждений) о предметной области, представляющих собой с точки зрения русского языка простые (с одной грамматической основой) повествовательные предложения. Логические связки логики высказываний обозначают следующие союзы или словосочетания и их синонимы: В силу этого формулы логики высказываний обозначают простые или сложные (с несколькими грамматическими основами) повествовательные предложения, в которых выражены свойства предметной области. Исчисление высказываний не «проникает» внутрь простого высказывания, т. е. не учитывает его внутренней структуры. Логика предикатов позволяет учесть внутреннюю структуру простых высказываний, обеспечивая тем самым более точное представление знаний и рассуждений о свойствах предметной области. Рассмотрим простое высказывание «5 является целым положительным числом». В логике высказываний оно может быть обозначено единственным пропозициональным символом p. В логике предикатов это простое высказывание может быть представлено формулой I (5) ∧P(5), в которой использованы одноместные предикаты: I(x) — означает «x — целое число», P(x) — означает «x — положительное число». 19. Дизъюнктивные формы. Дизъюнктивной нормальной формой (ДНФ) называется формула, представляющая собой дизъюнкцию конечного числа конъюнктов. В общем виде ДНФ можно представить формулой C1 C2… Cp, в которой C1, C2, …, Ck — конъюнкты. Вполне возможно, что ДНФ состоит из единственного конъюнкта; точно также КНФ может состоять из единственного дизъюнкта. Теорема. Любая формула логики высказываний эквивалентна некоторой КНФ и некоторой ДНФ. Справедливость этой теоремы установить несложно. Следующий алгоритм преобразования произвольной формулы в эквивалентную ей КНФ по существу является обоснованием этой теоремы. Тот же алгоритм, как позднее будет показано, можно использовать для преобразования произвольной формулы в эквивалентную ей ДНФ. 20. Нечеткая логика. Классическая логика, расширенная на нечеткие множества, называется нечеткой. Она предназначена для формализации субъективных человеческих суждений, которые более адекватно позволяют описывать ситуации с неопределенностью. В отличие от классической, нечеткая логика позволяет оценить степень истинности того или иного суждения. Исходным понятием нечеткой логики является понятие элементарного нечеткого высказывания. Таким высказыванием является повествовательное предложение, выражающее законченную мысль, относительно истинности которой можно судить только с некоторой степенью уверенности. Главным отличием элементарного нечеткого высказывания от элементарного высказывания является следующий факт. Множество значений истинности элементарных высказываний состоит из двух элементов: {«истина», ложь»} ({0,1}). В нечеткой логике степень истинности элементарного нечеткого высказывания принимает значение из замкнутого интервала [0,1], причем 0 и 1 являются предельными значениями степени истинности со значениями «ложь» и «истина», соответственно. Примерами нечетких высказываний являются следующие: «Остап Бендер имеет довольно высокий рост»; «Возможно, завтра пойдет дождь»; «Х – малое число». Консеквент — (лат. consequent) в буквальном смысле «следствие», «вывод», «результат». Антецедент — (лат. antecedent) в буквальном смысле «предшествующее». 21. Основы теории нечетких множеств. При помощи нечетких множеств можно формально определить неточные и многозначные понятия, такие как «высокая температура», «молодой человек», «средний рост» либо «большой город». Перед формулированием определения нечеткого множества необходимо задать так называемую область рассуждений (universe of discourse). В случае неоднозначного понятия «много денег» большой будет признаваться одна сумма, если мы ограничимся диапазоном [0, 1000 руб.] и совсем другая - в диапазоне [0, 1000000 руб.] 22. Операции с нечеткими множествами. Включение. Пусть A и B – нечеткие множества на универсальном множестве X. Говорят, что A содержится в B , или B включает A , т.е. A ⊂ B , если ∀ x ∈ X μ A x ≤ μ B x. Иногда используют термин «доминирование», т.е. B доминирует A при A ⊂ B . Равенство. Пусть A и B – нечеткие множества на универсальном множестве X. Говорят, что A и B равны, т.е. A = B , если ∀ x ∈ X μ A x = μ B x. В противном случае A ≠ B . Дополнение. Пусть A и B – нечеткие множества с множеством принадлежностей характеристических функций M = 0 ; 1 , заданные на универсальном множестве X . Говорят, что A и B дополняют друг друга, т.е. A = B _ или B = A _ , если ∀ x ∈ X μ A x = 1 − μ B x . Очевидно следствие A _ = A – так называемое свойство инволюции. Пересечение нечетких множеств A и B , заданных на универсальном множестве X , – это наибольшее нечеткое множество A ∩ B , содержащееся одновременно и в A , и в B с функцией принадлежности, заданной следующим образом: ∀ x ∈ X μ A ∩ B x = min μ A x ; μ B x . Объединение нечетких множеств A и B , заданных на универсальном множестве X , – это наименьшее нечеткое множество A ∪ B , включающее как A , так и B с функцией принадлежности, заданной следующим образом: ∀ x ∈ X μ A ∪ B x = max μ A x ; μ B x . Разность нечетких множеств A и B , заданных на универсальном множестве X , – это нечеткое множество A ∖ B = A ∩ B _ с функцией принадлежности, заданной следующим образом: ∀ x ∈ X μ A ∖ B x = μ A ∩ B _ x = min μ A x ; 1 − μ B x . Симметрическая разность нечетких множеств A и B , заданных на универсальном множестве X , – это нечеткое множество A − B с функцией принадлежности, заданной следующим образом: ∀ x ∈ X μ A-B x = μ A x − μ B x . Дизъюнктивная сумма нечетких множеств A и B , заданных на универсальном множестве X , – это нечеткое множество A ⊕ B = A ∖ B ∪ B ∖ A = A ∩ B _ ∪ A _ ∩ B с функцией принадлежности, заданной следующим образом: ∀ x ∈ X μ A ⊕ B x = max min μ A x ; 1 − μ B x ;min 1 − μ A x ; μ B x . 23. Нечеткие отношения. Одним из основных понятий теории нечетких множеств считается понятие нечеткого отношения. Эти отношения позволяют формализовать неточные утверждения типа « x почти равно y » или « x значительно больше чем y ». Нечеткое отношение между двумя непустыми множествами (четкими) и будем называть нечеткое множество , определенное на декартовом произведении , т.е. формализаци я неточного утверждения « примерно равно ». Пусть и . Отношение можно определить следующим образом: . (3.162) , где , , , а , , 24. НЕЧЕТКИЕ ВЫВОДЫ. Используемый в различного рода экспертных и управляющих системах механизм нечетких выводов в своей основе имеет базу знаний, формируемую специалистами предметной области в виде совокупности нечетких предикатных правил вида: П1: если х есть A1, тогда у есть B1, П2: если х есть А2, тогда у есть В2, Пn: если х есть Аn, тогда у есть Вn, где х— входная переменная (имя для известных значений дан-ных), у — переменная вывода (имя для значения данных, которое будет вычислено); А и В — функции принадлежности, определен-ные соответственно на xи у. Пример подобного правила Если х — низко, то у — высоко. 25. Этапы нечеткого вывода. 1. Нечеткость. Функции принадлежности, определенные на входных переменных применяются к их фактическим значениям для определения степени истинности каждой предпосылки каждого правила. 2. Логический вывод. Вычисленное значение истинности для предпосылок каждого правила применяется к заключениям каждого правила. Это приводит к одному нечеткому подмножеству, которое будет назначено каждой переменной вывода для каждого правила. 3. Композиция. Все нечеткие подмножества, назначенные к каждой переменной вывода, объединяются вместе, чтобы формировать одно нечеткое подмножество для каждой переменной вывода. 4. В заключение — приведение к четкости, которое используется, когда полезно преобразовать нечеткий набор выводов в четкое число. 26. Правила нечетких продукций База правил систем нечеткого вывода предназначена для формального представления эмпирических знаний экспертов в той или иной предметной области в форме нечетких продукционных правил. Таким образом, база нечетких продукционных правил системы нечеткого вывода – это система нечетких продукционных правил, отражающая знания экспертов о методах управления объектом в различных ситуациях, характере его функционирования в различных условиях и т.п., т.е. содержащая формализованные человеческие знания. Нечеткое продукционное правило – это выражение вида: (i):Q;P;A═>B;S,F,N, где (i) – имя нечеткой продукции, Q – сфера применения нечеткой продукции, P – условие применимости ядра нечеткой продукции, A═>B – ядро нечеткой продукции, в котором A – условие ядра (или антецедент), B – заключение ядра (или консеквент), ═> – знак логической секвенции или следования, S – метод или способ определения количественного значения степени истинности заключения ядра, F – коэффициент определенности или уверенности нечеткой продукции, |