Лекционный материал по ИИС для самостоятельного изучения. 2 Модели представления знаний 2 Логическая модель представления знаний
Скачать 2.32 Mb.
|
57 2.2. Модели представления знаний 2.2.1. Логическая модель представления знаний Логическая модель представляет собой формальную систему — некоторое логическое исчисление как правило, исчисление предикатов первого порядка, когда предметная область или задача описывается в виде набора аксиом. Все знания о предметной области описываются в виде формул этого исчисления или правил вывода. Описание в виде формул дает возможность представить декларативные знания, а правила вывода — процедурные знания. Предикат висчислении предикатов специальный знак, отражающий определенное отношение между конечным множеством сущностей - аргументов. Предикат первого порядка имеет два состояния - истина и ложь. Рассмотрим в качестве примера знание: "Когда температура в печи достигает 120° и прошло менее 30 минут с момента включения печи, давление не может превосходить критическое. Если с момента включения печи прошло более 30 мин, то необходимо открыть вентиль №2". Логическая модель представления этого знания имеет вид: Р(р = 120) T(t<30) →(D Kp ); Р(р = 120) T(t>30) =>F(№2). В этой записи использованы следующие обозначения: Р(р = 120) — предикат, становящийся истинным, когда температура достигает 120°; T(t<30) — предикат, остающийся истинным в течение 30 мин с начала процесса; 58 T(t>30) — предикат, становящийся истинным по истечении 30 мин с начала процесса; D F(№2) — команда открыть вентиль №2. Кроме того, в этих записях использованы типовые логические связки И ( ), импликации (→ ) и логического следования (=>). Первая строчка в записи представляет декларативные знания, а вторая — процедурные. Языки представления знаний логического типа широко использовались на ранних стадиях развития интеллектуальных систем, но вскоре были вытеснены (или, во всяком случае, сильно потеснены) языками других типов. Объясняется это громоздкостью записей, опирающихся на классические логические исчисления. При формировании таких записей легко допустить ошибки, а поиск их очень сложен. Отсутствие наглядности, удобочитаемости (особенно для тех, чья деятельность не связана с точными науками) затрудняло распространение языков такого типа. Исчисление предикатов 1-го порядка в промышленных экспертных системах практически не используется. Эта логи- ческая модель применима в основном в исследовательских «игрушечных» системах, так как предъявляет очень высокие требования и ограничения к предметной области. 59 2.2.2. Продукционная модель представления знаний. Продукционная модель (модель правил) - это модель, основанная на правилах, в которой знания представлены в виде предложений типа «Если (условие), то (действие)». Под «условием» (антецедентом) понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под «действием» (консеквентом) — действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее как условия и терминальными или целевыми, завершающими работу системы). Основу модели составляют системы продукций. Каждая продукцияв наиболее общем виде записывается как стандартное выражение следующего вида: "Имя продукции": Имя сферы; Предусловие; Условие для ядра; Ядро: «ЕслиА, то В»; Постусловие. В наиболее простом виде продукция может состоять лишь из имени (например, ее порядкового номера в системе продукций) и ядра. Имя продукции может выражаться в виде номера или слова (словасочетания). Служит для определения местоположения в системе продукций. Имя сферы указывает ту предметную область, к которой относятся знания, зафиксированные в данной продукции. В 60 интеллектуальной системе может храниться совокупность знаний (ее называют базой знаний), относящихся к разным областям (например, знания о различных заболеваниях че- ловека или знания из различных разделов математики). Ясно, что если в данный момент решается задача из области физики твердого тела или из геометрии треугольника, то надо использовать знания, относящиеся именно к этой области. Сферы и выделяют такие подобласти знаний. Предусловие определяет необходимые предпосылки применения условия для ядра продукции. Предусловия может и не быть вовсе. Условие для ядра определяет те ситуации, при выполнении которых можно (надо) проверять наличие или истинностьАв ядре продукции. Следующий пример иллюстрирует употребление условия для ядра: а, b, с — стороны треугольника; если с = 2 2 b а , то треугольник является прямоугольным. Ясно, что при другой интерпретации а, bи с неимеет никакого смысла использовать данное ядро продукции. Ядро - основная часть продукции. Ядро имеет вид: "ЕслиА, то В", где А и В могут иметь разные значения. Остальные элементы, образующие продукцию, носят вспомогательный характер. Несколько примеров ядра: "Если сверкает молния, то гремит гром". "Если в доме вспыхнул пожар, то вызывайте по телефону 01 пожарную команду". "Если в путеводителе указано, что в городе есть театр, то надо пойти туда". 61 Первый пример иллюстрирует тот случай, когда ядро продукции описывает причинно-следственную связь явленийАи В. Во втором примере А и В представляют собой некоторые действия. В третьем примереА— это некоторые знания, а В — действие. Возможны и другое варианты ядра продукции. Таким образом, при помощи ядер можно представлять весьма разнообразные знания, как декларативные знания, так и процедурные, хотя сама форма продукций весьма удобна для задания именно процедурных знаний. Постусловие определяет специфику ядра. Используется редко. Обычно содержит пояснения. Пример продукции декларативного знания: «Пусть а, b, с — стороны треугольника и при выполнении равенства с = 2 2 b а треугольник является прямоугольным». Имя продукции: №5 Имя сферы: Геометрия; Предусловие: Фигуры; Условие для ядра: а, b, с — стороны треугольника; Ядро: Если с = 2 2 b а , то треугольник прямоугольный; Постусловие: Теорема Пифагора. Основные достоинства систем продукционных: Простота создания и понимания, отдельных правил. Простота понимания и модифицирования знаний. 62 Простота программной реализации механизма логического вывода. Слабые стороны систем: 1.Неясность взаимоотношений правил. 2.Сложность оценки целостного образа знаний. 3.Весьма низкая эффективность обработки. 4.Существенные отличия от человеческих систем знаний. 5.Отсутствие гибкости в логическом выводе. Данная модель широко применяется в экспертных системах, в том числе промышленного (коммерческого) уровня.. Имеется большое число программных средств, реализующих продукционный подход (язык OPS 5; «оболочки» или «пустые» ЭС — EXSYSProfessional, Kappa, ЭКСПЕРТ; ЭКО и др.). 2.2.3. Семантическая модель представления знаний Термин «семантическая»означает «смысловая», а сама семантика — это наука, устанавливающая отношения между символами и объектами, которые они обозначают, то есть наука, определяющая смысл знаков. Семантическая сеть – это модель, в которой структура знаний предметной области формализуется в виде ориентированного графа вершины которого — понятия, а дуги — отношения между ними В качестве понятий обычно выступают абстрактные или конкретные объекты, события , свойства, операции. Отношения — это связи различного типа. Существуют отношения разных типов: логические (дизъюнкция, конъюнкция, отрицание, импликация); 63 теоретико-множественные (часть – целое, множество – подмножество, класс – элемент класса, пример элемента класса); функциональные (количественные, временные, пространственные и другие характеристики: объект- свойство, свойство-значение); квантификационные (логические кванторы общности и существования, нелогические кванторы, например, много, несколько); Наиболее часто в семантических сетях используются следующие отношения: связи типа «часть— целое» («класс— подкласс», «элемент—множество», и т. п.). Отношения ―является‖ и ―имеет часть‖ определяют иерархическую структуру, в которой свойства "высших" понятий автоматически переносятся на "низшие" понятия. Это позволяет избежать дублирования информации в сети.; функциональные связи (определяемые обычно глаголами «производит», «влияет»...); количественные (больше, меньше, равно...); пространственные (далеко от , близко от, за, под, над...); временные (раньше, позже, в течение...); атрибутивные связи (иметь свойство, иметь значение); Классификация семантических сетей: Можно предложить несколько классификаций семантических сетей, связанных с типами отношений между понятиями. По количеству типов отношений: Однородные (с единственным типом отношений). Неоднородные (с различными типами отношений). 64 По типам отношений: Бинарные.(в которых отношения связывают два объекта). N-арные (в которых есть специальные отношения, связывающие более двух понятий). Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, отражающей поставленный запрос к базе. В качестве примера, рассмотрим текст, который содержит некоторые знания (декларативные): «Иванов имеет личный автомобиль «Волга» красного цвета с мощностью двигателя 75 л.с.» На рис.1.3 изображена семантическая сеть. В качестве вершин тут выступают понятия: «человек», «Иванов», «Волга», «автомобиль», «вид транспорта» и «двигатель». Рис. 1.3. Семантическая сеть. Основным преимуществом семантической модели является то, что она более других соответствует современным 65 представлениям об организации долговременной памяти человека. Недостатком этой модели является сложность организации процедуры поиска вывода на семантической сети. Для реализации семантических сетей существуют специальные сетевые языки, например NET, язык реализации систем SIMER+MIR [и др. Широко известны экспертные системы, использующие семантические сети в качестве языка представления знаний — PROSPECTOR, CASNET, TORUS. 2.2.4. Фреймовая модель представления знаний Понятие и структура фрейма. Теория фреймов - это парадигма для представления знаний с целью использования этих знаний компьютером. Теория фреймов (теория представления знаний фреймами) была разработана Марвином Минским (США) в 70-е г.г. XX в. В ее основе лежит восприятие фактов посредством сопоставления полученной извне информации с конкретными элементами и значениями, а также с рамками, определенными для каждого объекта в памяти человека.Эта модель, как и семантическая сеть, имеет глубокое психологическое обоснование. Минский разработал такую схему, в которой информация содержится в специальных ячейках, называемых фреймами, объединенными в сеть, называемую системой фреймов. Новый фрейм активизируется с наступлением новой ситуации. Отличительной его чертой является то, что 66 он одновременно содержит большой объем знаний и в то же время является достаточно гибким для того, чтобы быть использованным как отдельный элемент БД. Термин «фрейм» был наиболее популярен в середине семидесятых годов, когда существовало много его толкований, отличных от интерпретации Минского. Чтобы лучше понять эту теорию, рассмотрим один из примеров Минского, основанный на связи между ожиданием, ощущением и чувством человека, когда он открывает дверь и входит в комнату. Предположим, что вы собираетесь открыть дверь и зайти в комнату незнакомого вам дома. Находясь в доме, перед тем как открыть дверь, у вас имеются определенные представления о том, что вы увидите, войдя в комнату. Например, если вы увидите какой либо пейзаж или морской берег, поначалу вы с трудом узнаете их. Затем вы будете удивлены, и в конце концов дезориентированы, так как вы не сможете объяснить поступившую информацию и связать ее с теми представлениями, которые у вас имелись до того. Также у вас возникнут затруднения с тем, чтобы предсказать дальнейший ход событий. С аналитической точки зрения это можно объяснить как активизацию фрейма комнаты в момент открывания двери и его ведущую роль в интерпретации поступающей информации. Если бы вы увидели за дверью кровать, то фрейм комнаты приобрел бы более узкую форму и превратился бы во фрейм кровати. Другими словами, вы бы имели доступ к наиболее специфичному фрейму из всех доступных. Термин фрейм (от английского слова frame, что означает «каркас» или «рамка») был предложен М.Минскимдля обозначения структуры знаний для восприятия пространственных сцен. 67 Фрейм – это структура для представления знаний, которая при заполнении ее соответствующими значениями превращается в описание конкретного факта, события или ситуации. Фрейм является минимально возможным описание сущности какого-либо явления, события, ситуации, процесса или объекта. (Минимально возможное означает, что при дальнейшем упрощении описания теряется его полнота, оно перестает определять ту единицу знаний, для которой оно предназначено.) В психологии и философии известно понятие абстрактного образа. Например, произнесение вслух слова «комната» порождает у слушающих образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м 2 ». Из этого описания ничего нельзя убрать (например, убрав окна, мы получим уже чулан, а не комнату), но в нем есть «дырки» или «слоты» — это незаполненные значения некоторых атрибутов — например, количество окон,.цвет стен, высота потолка, покрытие пола и др. В теории фреймов такой образ комнаты называется фреймом комнаты. Фреймом также называется и формализованная модель для отображения образа. Структура фрейма. Фрейм имеет почти однородную структуру и состоит из стандартных единиц, называемых слотами. Каждая такая единица — слот — содержит название и свое значение. Фрейм можно представить: а) в виде цепочки: Фрейм:<слот 1>, <слот 2>, … ,<слот N>. 68 или более подробно, как список свойств: Имя ФРЕЙМА: <имя 1-го слота: значение 1-го слота>, <имя 2-го слота: значение 2-го слота>, <…>, <имя N-гo слота: значение N-гo слота>. б) в виде таблицы: Имя фрейма Имя слота 1 Значение слота 1 Имя слота 2 Значение слота 2 Имя слота N Значение слота N В качестве примера, рассмотрим фрейм для понятия "Лекция". Ситуация "лекция" может быть определена как "чтение лектором учебного материала слушателям". Фрейм "лекция" может содержать слоты "предмет" (предмет, по которому проводится лекция), "лектор" (ФИО лектора), "аудитория" (место проведения лекции), "слушатели" (количество слушателей). Лекция Предмет Физика Лектор Иванов И.И. Аудитория 109 69 Слушатели Пи41 В данном случае "ЛЕКЦИЯ" - название фрейма; "ПРЕДМЕТ", "ЛЕКТОР", "АУДИТОРИЯ", "СЛУШАТЕЛИ - слоты; "Физика", "Иванов И.И.", "109", "ПИ41" - значения слотов. Типы фреймов. Различают фреймы-прототипы, хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения реальных фактических ситуаций на основе поступающих данных. Фрейм-прототип (протофрейм) – это фрейм, содержащий знания о самом понятии. Например, фрейм понятия «Битва» можно изобразить следующим образом: Битва Субъект (кто?) Х1 Объект (с кем?) Х2 Место (где?) Х3 Время (когда?) Х4 Результат Х5 В этом фрейме указаны имена слотов (субъект, объект и т. д.), но вместо их значений стоят переменные (X1, Х2и т. д.). Фрейм-экземпляр (экзофрейм) - это фрейм, содержащий конкретное описание понятия или знания. 70 В примере, наверное, основными для фрейма "Битва" можно считать слоты с именами "субъект" и "объект".Бутву осуществляет субъект Х1 с объектом X2 в месте Х3 во время Х4, при этом получается результат Х5. Подставляя вместо всех переменных конкретные значения, получим конкретный факт-описание: Куликовская битва Субъект (кто?) Князь Дмитрий Объект (с кем?) Хан Мамай Место (где?) Куликово поле Время (когда?) Утром в сентябре 1380 года Результат Победа князя Дмитрия Исключение из фрейма любого слота делает его принципиально не полным, а иногда вообще бессмысленным. Модель фрейма является достаточно универсальной, поскольку в состав фрейма могут входить слоты с именами действий, то фреймы годятся для представления как декларативных, так и процедурных знаний. Фрейм является простым, если он не содержит в себе других фреймов. Сложный (составной) фрейм содержит в себе два и более фрейма, и по существу представляет сеть фреймов. Фрейм позволяет отобразить все многообразие знаний о мире через: фреймы – структуры, использующиеся для обозначения объектов и понятий (заем, залог, вексель); фреймы – роли (менеджер, кассир, клиент); 71 фреймы – сценарии (банкротство, собрание акционеров, празднование именин); фреймы – ситуации (тревога, авария, рабочий режим устройства) и др. Фреймовая модель представления знаний – это модель, в которой структура знаний предметной области формализуется в виде совокупности взаимосвязанных фреймов, описывающих объекты, а свойства этих объектов и факты, относящиеся к ним, описываются в структурных элементах фрейма. Чтобы представить семантическую сеть в виде совокупности фреймов, надо уметь представлять отношения между вершинами сети. Для этого также используются слоты фреймов. Эти слоты могут иметь имена вида "Связь Y", где Y есть имя того отношения (его тип), которое устанавливает данный фрейм-вершина с другим фреймом-вершиной. Заметим также, что в качестве значения слота может выступать новый фрейм, что позволяет на множестве фреймов осуществлять иерархическую классификацию. Это очень удобное свойство фреймов, так как человеческие знания, как правило, упорядочены по общности. Важнейшим свойством теории фреймов является заимствование из теории семантических сетей — так называемое наследование свойств. Во фреймах наследование происходит по АКО-связям (A-Kind-Of= это), которые связывают фреймы с фреймами, находящимися на уровень выше в иерархии, откуда неявно наследуются (переносятся) значения слотов.Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, то есть переносятся, значения аналогичных слотов. 72 ПРИМЕР: Понятие «Лектор». ЧЕЛОВЕК AKO Млекопитающее УМЕЕТ Мыслить ЛЕКТОР AKO Человек ОБРАЗОВАНИЕ Высшее ВОЗРАСТ 23-60 В данном случае представлено одно звено иерархии (ЧЕЛОВЕК-ЛЕКТОР). Здесь фрейм "ЧЕЛОВЕК" является обощающим для фрейма "ЛЕКТОР". Таким образом, фрейм "ЛЕКТОР" наследует от фрейма "ЧЕЛОВЕК" значение слота "УМЕЕТ" (а также других слотов, не показанных в примере). Цепочка наследования может быть продолжена вплоть до, например, фрейма "ЖИВОЕ СУЩЕСТВО". Кроме того связь фреймов осуществляется по значению слота. Фрагмент сети фреймов представлен на рис.1.4. Такая структура позволяет систематизировать большой объем информации, оставляя ее при этом максимально удобной для использования. Кроме того, система (сеть) фреймов способна отражать концептуальную основу организации памяти человека. 73 Рис.1.4 Фрагмент сети фреймов. 74 |