Безфамильный Д.С.. Лекциям дисциплина Представление знаний в информационных системах
Скачать 164.28 Kb.
|
Вопросы по лекциям дисциплина «Представление знаний в информационных системах» 1. Понятие архитектуры информационной системы. Современные ИС и информационные технологии (ИТ) достигли такого уровня развития, когда на первый план выходит бизнес-оценка проектов, а не личные при- страстия разработчиков или заказчиков. В связи с этим большое внимание в настоя- щее время уделяется архитектуре информационных систем. Термин «архитектура» в применении к ИС уже давно стал привычным, так как грамотное построение информационной системы, эффективно и надежно функцио- нирующей, является не менее сложной задачей, чем проектирование и возведение современного многофункционального здания. Архитектура (лат. architectura) – искусство проектировать и строить здания и другие сооружения (комплексы), создающие материально организованную среду, не- обходимую людям для их жизни и деятельности, в соответствии с современными техническими возможностями и эстетическими воззрениями общества. Постепенно классическое определение архитектуры трансформировалось в применении к техни- ческим системам как принципиальное устройство чего-либо сложного, общий вид, вид без указания конкретных инженерных расчетов. 2. Характеристика информационной системы как объекта архитектуры (уровни архитектуры ИС). бизнес-архитектура (Business Architecture); • ИТ-архитектура (Information Technology Architecture); • архитектура данных и знаний (Data Architecture, Knowledge Architecture); • архитектура приложений или архитектура программных средств (Application Architecture, Software Architecture), • архитектура аппаратных средств (Hardware Architecture). Под архитектурой ИС понимается объединение архитектур всех рассмотренных уровней Бизнес-архитектура (архитектура уровня бизнес-процессов) определяет бизнес-стра- тегии, основные бизнес-процессы, потоки управления и организацию предприятия. Не обязательно все бизнес - процессы реализуются средствами ИТ-технологий. ИТ-архитектура обеспечивает достижение бизнес-целей, для чего предоставляет со- вокупность программно-аппаратных средств, на которых базируется 2 информационная система организации (в том числе, серверы, сетевое оборудование, базы данных, промежуточное программное обеспечение и т.д.). Архитектура данных и знаний определяет логические и физические средства хране- ния данных, знаний, а также средства управления ими. Архитектура данных и зна- ний поддерживается ИТ- архитектурой. Архитектура программных средств определяется совокупностью прикладных про- грамм, т.е. программ, используемых для решения задач конечного пользователя. Ар- хитектура прикладной программы (приложения) представляет собой описание дан- ного приложения, в том числе его программных интерфейсов. Приложения, в свою очередь, используют предоставляемые ИТ- архитектурой сервисы. Архитектура аппаратных средств описывает организацию аппаратного обеспечения ИС, в частности, таких компонентов, как процессоры, память, накопители информа- ции, периферийные устройства, сетевые средства. Отдельные уровни архитектуры информационной системы могут совмещаться, например, архитектура данных может стать частью архитектуры приложения. Неко- торые функции, общие для некоторого множества приложений, могут быть перене- сены на уровень ИТ-архитектуры. Средства ИТ-архитектуры как правило использу- ются для интеграции приложений в единую систему. 3. Укажите определения «данных», баз данных, систем управления базами дан- ных. Банк данных – это система специальным образом организованных данных – баз дан- ных, а также технических, программных, языковых и организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллек- тивного многоцелевого использования данных. База данных (БД) является ядром банка данных и представляет совокупность взаимо- связанных и вместе хранящихся данных из определенной предметной области, орга- низованных специальным образом и хранимых во внешней памяти (файлах базы данных). Система управления базой данных (СУБД) – это совокупность языковых и про- граммных средств, предназначенных для создания, ведения и совместного использо- вания БД многими пользователями. 3 4. Укажите определение «знания»; приведите классификацию знаний по катего- риям: по степени обобщенности описания, по степени теоретической обосно- ванности, способу представления и использования в ИИС, степени детермини- рованности, с точки зрения фиксации. По природе Знания могут быть: декларативные процедурные Декларативные знания содержат в себе лишь представление о структуре определен- ных понятий. Эти знания приближены к данным, фактов. Например вуз является со- вокупностью факультетов, а каждый факультет в свою очередь является совокупно- стью кафедр. Процедурные знания имеют активную природу. Они определяют представления о средствах и путях получения новых знаний, проверки знаний. Это алгоритмы раз- ного рода.Например метод мозгового штурма для поиска новых идей. По степени научности Знания могут быть научными и ненаучными. Научные знания могут быть: эмпирическими, полученными на основе опыта или наблюдения теоретическими, полученными на основе анализа абстрактных моделей. Теоретические знания - абстракции, аналогии, схемы, отражающие структуру и при- роду процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов. Ненаучные знания могут быть: паранаучные - знание несовместимы с имеющимся гносеологическим стандартом. Широкий класс паранаукового (пара от греч. - Возле, при) знания включает учения 4 или размышления о феноменах, объяснение которых не является убедительным с точки зрения критериев научности; псевдонаучными - сознательно эксплуатирующие домыслы и предрассудки. Лжена- учных знание часто представляет науку как дело аутсайдеров. Как симптомы лжена- уки выделяют малограмотный пафос, принципиальную нетерпимость к опровергаю- щих доводов, а также претенциозность. Псевдонаучное знание очень чувствительно к злобе дня, сенсации. Его особенностью является то, что оно не может быть объеди- нено парадигмой, не может обладать систематичностью, универсальностью. Лжена- укой знания сосуществуют с научными знаниями. Считается, что псевдонаучное зна- ние обнаруживает себя и развивается через квазинаучная; квазинаучными - они ищут себе сторонников, опираясь на методы насилия и при- нуждения. Квазинаучные знания, как правило, расцветает в условиях строгой иерар- хированной науки, где невозможна критика власть имущих, где жестко проявлен идеологический режим; антинаучными - как утопические и сознательно искажающие представления о дей- ствительности. Приставка «анти» обращает внимание на то, что предмет и способы исследования противоположны науке. С ним связывают извечную потребность в вы- явлении общего легко доступных "лекарств от всех болезней». Особый интерес и тяга к антинауки возникает в периоды социальной нестабильности. Но хотя данный феномен достаточно опасен, принципиального избавления от антинауки произойти не может; псевдонаучными - является интеллектуальной активностью, спекулирует на совокуп- ности популярных теорий, например, истории о древних астронавтов; повседневно-практическими - доставлявшие элементарные сведения о природе и окружающей действительности. Люди, как правило, располагают большой объем обыденного знания, которое проводится повседневно и является исходным пластом всякого познания. Иногда аксиомы здравомыслия противоречат научным положе- ниям, препятствуют развитию науки. Иногда, наоборот, наука длинным и трудным путем доказательств и опровержений приходит к формулировке тех положений, ко- торые давно утвердили себя в среде обыденного знания. Обыденное знание вклю- чает и здравый смысл, и приметы, и поучения, и рецепты, и личный опыт, и тради- ции. Оно хоть и фиксирует истину, но делает это не систематично и бездоказательно. Его особенностью является то, что оно используется человеком практически неосо- знанно и в своем применении не требует предварительных систем доказательст. Дру- гая его особенность - принципиально неграмотный характер. собственные - зависящие от способностей того или иного субъекта и от особенно- стей его интеллектуальной познавательной деятельности. 5 «Народной наукой» - особой формой вненаучного и иррационального знания, кото- рая в настоящее время стала делом отдельных групп или отдельных субъектов: зна- харей, целителей, экстрасенсов, а ранее шаманов, жрецов, старейшин рода. При своем возникновении народная наука обнаруживала себя как феномен коллектив- ного сознания и выступала как этнонаука. В эпоху доминирования классической науки она потеряла статус интерсубъективности расположилась на периферии, вдали от центра официальных экспериментальных и теоретических исследований. Как пра- вило, народная наука существует и транслируется в бесписьменная форме от настав- ника к ученику. Она также иногда проявляется в виде заветов, наставлений, ритуалов и др.. 5. Укажите определения базы знаний и системы баз знаний. 6. Укажите определение искусственного интеллекта. Искусственный интеллект — это область информатики, которая занимается разра- боткой интеллектуальных компьютерных систем, то есть систем, обладающих воз- можностями, которые мы традиционно связываем с человеческим разумом, — пони- мание языка, обучение, способность рассуждать, решать проблемы и т. д. 7. Укажите определение инженерии знаний; опишите, что включает в себя про- цесс представления знаний. Инженерия знаний представляет собой совокупность моделей, методов и техниче- ских приемов, нацеленных на создание систем, которые предназначены для решения проблем с использованием знаний. Фактически инженерия знаний – это теория, ме- тодология и технология, которые охватывают методы добычи, анализа, представле- ния и обработки знаний экспертов. Представление знаний, их обработка и использование, рассматриваемые примени- тельно к конкретной прикладной области, являются предметом инженерии знаний. На высоком уровне, процесс инженерии знаний состоит из двух: 1. Извлечение знаний – преобразование «сырых знаний» в организованные. 2. Внедрение знаний – преобразование организованных знаний в реализованные. 8. Приведите классификацию методов извлечения знаний. Методы извлечения знаний: –коммуникативные: · пассивные наблюдение; протокол "мыслей вслух"; 6 лекции; · активные групповые: · мозговой штурм; · круглый стол; · ролевые игры; индивидуальные: · анкетирование; · интервью; · диалог; · экспертные игры; – текстологические: · анализ учебников; · анализ специальной литературы; · анализ документов. 9. Укажите определение системы, основанной на знаниях; приведите классифи- кацию систем, основанных на знаниях. Система , основанная на знаниях ( KBS ) — это компьютерная программа , которая рассуждает и использует базу знаний для решения сложных задач . Термин является широким и относится ко многим различным типам систем. Одна общая тема, объ- единяющая все системы, основанные на знаниях, — это попытка явного представле- ния знаний и система рассуждений , позволяющая получать новые знания. Таким об- разом, система, основанная на знаниях, имеет две отличительные черты: базу знаний и механизм вывода . Первая часть, база знаний, представляет факты о мире, часто в той или иной форме онтологии включения ( а не неявно встроенной в процедурный код, как это делает обычная компьютерная программа). Другие распространенные подходы в дополне- ние к онтологии включения включают фреймы , концептуальные графы и логиче- ские утверждения. [1] Вторая часть, механизм логического вывода, позволяет делать выводы о новых зна- ниях. Чаще всего это может принимать форму правил IF-THEN [2] в сочетании с подходами прямой или обратной цепочки . Другие подходы включают использова- ние автоматических средств доказательства теорем, логическое программирование, системы классной доски и системы перезаписи терминов, такие как CHR (правила 7 обработки ограничений) . Эти более формальные подходы подробно описаны в ста- тье Википедии о представлении знаний и рассуждениях . 10. Дайте описание логической модели представления знаний: основные идеи формализации, синтаксис описание логической модели представления знаний, понятия терма, формулы, предиката, высказывания, квантора. 11. Укажите достоинства и недостатки логических моделей представления знаний. Преимущества: 1. Высокой уровень формализации, обеспечивающий возможность реализации си- стемы формальных точных определений и выводов. 2. Согласованность знаний как единого целого, облегчающее решение проблема ве- рификации базы знаний, оценки независимости и полноты системы аксиом. 3. Единое средство описания как знаний о предметной области, так и способов реше- ния, что позволяет любую задачу свести к поиску логического вывода некоторую формулу. Недостатки: 1. Представление знаний в логической модели не наглядно; 2. Написание знаний в виде логических формул не позволяет появиться преимуще- ствам, которые имеются при автоматизированной обработке структурных данных. 3. Детерминированность логического вывода, т.е. отсутствие возможности опериро- вания с нечеткими знаниями. 4. Невозможность применения в качестве параметров предикатов других предикатов, т.е. невозможность формулирования знаний о знаниях. Логику предикатов первого порядка можно использовать как основу для конструи- рования более сложных логических методов представления знания. В этом качестве она используется в модальных и псевдо-физических логиках. 12. Дайте описание продукционной модели представления знаний: основные идеи формализации, синтаксис описание продукционной модели представления зна- ний, правила обработки продукции, понятие триплета. Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа «Если условие, то действие». Такое предложение называется правилом, или продукцией. Каждое продукционное правило является единицей знаний и состоит из префиксной части и ядра правила 8 13. Укажите достоинства и недостатки продукционных моделей представления знаний. 14. Дайте описание семантических сетей представления знаний: основные идеи се- мантических сетей; понятия графа, пути на графе, события, атрибута, ком- плекса признаков и процедуры; элементы семантической сети. Семантическая сеть - это граф, дуги которого есть отношения между вершинами (значениями). Семантические сети появились как модель СПЗ при решении задач разбора и понимания смысла естественного языка. Достоинства семантических сетей: универсальность, семантическая сеть позволяет представить любую существующую систему в виде схемы; наглядность системы знаний, представленной графически; близость структуры сети, представляющей систему знаний, семантической структуре фраз на естественном языке. Недостатки семантических сетей: формирование и модификация семантической модели затруднительны; поиск решения в семантической сети сводится к задаче поиска фрагмента сети, соот- ветствующего подсети, отражающей поставленный запрос; чем больше отношений между понятий, тем сложнее использовать и модифициро- вать знания. Семантические сети широко используются в экспертных системах в качестве языка представления знаний (например, в экспертной системе PROSPECTOR), в системах распознавания речи и понимания естественного языка. Непосредственное отношение к сетевым моделям имеют исследования по реляционным, сетевым и иерархическим БД. Кроме того, проводятся исследования, которые используют семантическую сеть для создания глобальной базы знаний на основе Интернета. 9 Несмотря на недостатки семантическая сеть, в связи со своей наглядностью и легко- стью создания незаменима в обучении. Также модель необходима на начальных эта- пах создания проектов для рассмотрения его обобщенно. 15. Понятия отношений и их виды в иерархических структурах семантических се- тей. 5. СЕМАНТИЧЕСКИЕ СЕТИ Семантической сетью является структура данных, имеющая определенный смысл как сеть. Стандартного определения семантической сети не существует, но обычно под ней подразумевают следующее: Семантическая сеть — это система знаний, имеющая определенный смысл в виде целостного образа сети, узлы которой соответствуют понятиям и объектам, а дуги — отношениям между понятиями и объектами. Следовательно, всевозможные сети можно рассматривать как сети, входящие в со- став семантической сети. В том числе к ним могут быть отнесены и сетевые струк- туры моделей баз данных. Сама по себе семантическая сеть является моделью памяти и не раскрывает, каким образом осуществляется представления знаний. Поэтому в контексте знакомства с СОЗ семантические сети должны рассматриваться как метод представления знаний с возможностями структурирования этих знаний, процедурами их использования и ме- ханизмом вывода. 5.1. Описание иерархической структуры понятий и диаграмма представления В иерархической структуре понятий существуют отношения, по крайней мере, двух типов: отношение включения или совпадения (IS - A); отношение «целое – часть» (PART - OF). Например, в предложении «ноутбук» (IS - A) «компьютер» 10 основной мыслью является, что устройство ноутбук принадлежит к классу компью- теров. Это означает, что имеет место отношение включения или совпадения. То есть, ноутбук представляет собой один из элементов множества всевозможных устройств, составляющих класс компьютеров. Для этих отношений характерным является то, что экземпляры понятий нижнего уровня содержат все атрибуты понятий верхнего уровня. Это свойство называется наследованием атрибутов между уровнями иерархии (IS - A). Для рассматриваемого примера это означает, что ноутбук, как понятие более низкого уровня, будет обла- дать всеми свойствами (атрибутами), определенными для понятия компьютер. Отношение «целое – часть» можно иллюстрировать предложением, которое характе- ризует то, что экземпляры понятия «процессор» являются частью любого экземпляра понятия «компьютер». «процессор» (PART - OF) «компьютер», Отношения типа (PART - OF) позволяют определить некоторые общие свойства (набор атрибутов) для конкретного класса понятий. В частности, приведенный выше пример отношения описывает тот факт, что общим свойством всех компьютеров яв- ляется наличие в их составе процессоров. И это свойство будет наследоваться всеми экземплярами понятия ноутбук. Наиболее часто используется графическое представление семантических сетей в виде диаграммы. Так предложение «все ласточки – птицы» можно представить графом, содержащим две вершины соответствующие понятиям и дугу, указывающую отношение между этими понятиями (рис. 5.1). 16. Укажите достоинства и недостатки семантических сетей представления зна- ний. Достоинства семантических сетей: – универсальность, достигаемая за счет выбора соответствующего набора отноше- ний. В принципе с помощью семантической сети можно описать сколь угодно слож- ную ситуацию, факт или предметную область; – наглядность системы знаний, представленной графически; – близость структуры сети, представляющей систему знаний, семантической струк- туре фраз на естественном языке; 11 – соответствие современным представлениям об организации долговременной па- мяти человека. Недостатки семантических сетей: – сетевая модель не дает (точнее, не содержит) ясного представления о структуре предметной области, поэтому формирование и модификация такой модели затрудни- тельны; – сетевые модели представляют собой пассивные структуры, для обработки которых необходим специальный аппарат формального вывода; – проблема поиска решения в семантической сети сводится к задаче поиска фраг- мента сети, соответствующего подсети, отражающей поставленный запрос. Это, в свою очередь, обуславливает сложность поиска решения в семантических сетях; – представление, использование и модификация знаний при описании систем реаль- ного уровня сложности оказывается трудоемкой процедурой, особенно при наличии множественных отношений между ее понятиями [4]. 17. Дайте описание фреймовой модели представления знаний: понятия фрейма, слота, виды фреймов, правила заполнения значений фрейма и слота. Фреймовая модель представления знаний – была предложена М.Минским в 1979 г. как структура знаний для восприятия пространственных сцен. Эта модель, как и се- мантическая сеть, имеет глубокое психологическое обоснование. В психологии и философии известно понятие абстрактного образа. Например, слово «комната» вызывает у слушающих образ комнаты: «жи-лое помещение с четырьмя стенами, полом, потолком, окнами и дверью, пло-щадью 6-20 м2». Из этого описа- ния ничего нельзя убрать (например, убрав окна, получим уже чулан, а не комнату), но в нем есть «дырки», или «слоты», — это незаполненные значения некоторых ат-ри-бутов — ко-ли-чество окон, цвет стен, высота потолка, покрытие пола и др. В этой теории та-кой абстрактный образ называется фреймом. Фреймом называется также и формализованная модель для отобра-же-ния образа. В качестве идентификатора фрейму присваивается имя фрей-ма. Это имя должно быть единственным во всей фреймовой системе. Фрейм имеет определенную внутреннюю структуру, состоящую из мно--жества эле- ментов, называемых слотами, которым также присва-и-ва-ют-ся имена. За слотами следуют шпации, в которые помещают данные, представляющие текущие значения слотов. Каждый слот в свою очередь представляется опре-де-ленной струк-турой 12 данных. В значение слота подставляется конкретная инфор-ма-ция, относящаяся к объекту, описываемому этим фреймом. 18. Процедуры, располагающиеся в слотах фреймовой модели. Процедуры, располагающиеся в слотах, называются связанными или присоединен- ными процедурами. Вызов связанной процедуры осуществляется при обращении к слоту, в котором она помещена. Заполнителями слота могут быть также правила продукций, используемые для определения конкретного значения 19. Укажите достоинства и недостатки фреймовых систем. К достоинствам фреймового представления знаний следует отнести то, что оно: 1) обеспечивает эффективную реализацию процедур вывода; 2) имеет возможность логических скачков, т.е. немонотонного вывода; 3) обеспечивает возможность образования СС фреймов, что дает большую экономию памяти при представлении информации за счет наследования свойств фреймов более высоких уровней во фреймах более низких уровней; 4) обеспечивает хорошее соответствие реальной действительности; 5) позволяет комбинировать различные модели представления знаний, объединяя их достоинства и компенсируя их недостатки. К недостаткам отнесем: 1) каждый фрейм представляет собой достаточно сложный фрагмент знаний. По- этому удаление или включение нового фрейма — весьма болезненная процедура, так как должна предусматривать и удаление всех составляющих элементов, которые мо- гут быть составными частями других фреймов; 2) достаточно сложно осуществлять на фреймах представление временных процес- сов; 3) отсутствует формальная теория вывода на фреймах. Поэтому на инженере по зна- ниям целиком лежит ответственность за корректность организации иерархии фрей- мов и их заполнения. 20. Дайте описание методов вывода на знаниях: стратегии управления выводом, прямой и обратный вывод, методы поиска в глубину и ширину. |