лаба. Безфамильный Д.С.. Лекциям дисциплина Представление знаний в информационных системах
Скачать 37.2 Kb.
|
Вопросы по лекциям дисциплина «Представление знаний в информационных системах» Понятие архитектуры информационной системы. Современные ИС и информационные технологии (ИТ) достигли такого уровня развития, когда на первый план выходит бизнес-оценка проектов, а не личные пристрастия разработчиков или заказчиков. В связи с этим большое внимание в настоящее время уделяется архитектуре информационных систем. Термин «архитектура» в применении к ИС уже давно стал привычным, так как грамотное построение информационной системы, эффективно и надежно функционирующей, является не менее сложной задачей, чем проектирование и возведение современного многофункционального здания. Архитектура (лат. architectura) – искусство проектировать и строить здания и другие сооружения (комплексы), создающие материально организованную среду, необходимую людям для их жизни и деятельности, в соответствии с современными техническими возможностями и эстетическими воззрениями общества. Постепенно классическое определение архитектуры трансформировалось в применении к техническим системам как принципиальное устройство чего-либо сложного, общий вид, вид без указания конкретных инженерных расчетов. Характеристика информационной системы как объекта архитектуры (уровни архитектуры ИС). бизнес-архитектура (Business Architecture); • ИТ-архитектура (Information Technology Architecture); • архитектура данных и знаний (Data Architecture, Knowledge Architecture); • архитектура приложений или архитектура программных средств (Application Architecture, Software Architecture), • архитектура аппаратных средств (Hardware Architecture). Под архитектурой ИС понимается объединение архитектур всех рассмотренных уровней Бизнес-архитектура (архитектура уровня бизнес-процессов) определяет бизнес-стратегии, основные бизнес-процессы, потоки управления и организацию предприятия. Не обязательно все бизнес - процессы реализуются средствами ИТ-технологий. ИТ-архитектура обеспечивает достижение бизнес-целей, для чего предоставляет совокупность программно-аппаратных средств, на которых базируется информационная система организации (в том числе, серверы, сетевое оборудование, базы данных, промежуточное программное обеспечение и т.д.). Архитектура данных и знаний определяет логические и физические средства хранения данных, знаний, а также средства управления ими. Архитектура данных и знаний поддерживается ИТ- архитектурой. Архитектура программных средств определяется совокупностью прикладных программ, т.е. программ, используемых для решения задач конечного пользователя. Архитектура прикладной программы (приложения) представляет собой описание данного приложения, в том числе его программных интерфейсов. Приложения, в свою очередь, используют предоставляемые ИТ- архитектурой сервисы. Архитектура аппаратных средств описывает организацию аппаратного обеспечения ИС, в частности, таких компонентов, как процессоры, память, накопители информации, периферийные устройства, сетевые средства. Отдельные уровни архитектуры информационной системы могут совмещаться, например, архитектура данных может стать частью архитектуры приложения. Некоторые функции, общие для некоторого множества приложений, могут быть перенесены на уровень ИТ-архитектуры. Средства ИТ-архитектуры как правило используются для интеграции приложений в единую систему. Укажите определения «данных», баз данных, систем управления базами данных. Банк данных – это система специальным образом организованных данных – баз дан- ных, а также технических, программных, языковых и организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллек- тивного многоцелевого использования данных. База данных (БД) является ядром банка данных и представляет совокупность взаимо- связанных и вместе хранящихся данных из определенной предметной области, организованных специальным образом и хранимых во внешней памяти (файлах базы данных). Система управления базой данных (СУБД) – это совокупность языковых и про- граммных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями. Укажите определение «знания»; приведите классификацию знаний по категориям: по степени обобщенности описания, по степени теоретической обоснованности, способу представления и использования в ИИС, степени детерминированности, с точки зрения фиксации. По природе Знания могут быть: декларативные процедурные Декларативные знания содержат в себе лишь представление о структуре определенных понятий. Эти знания приближены к данным, фактов. Например вуз является совокупностью факультетов, а каждый факультет в свою очередь является совокупностью кафедр. Процедурные знания имеют активную природу. Они определяют представления о средствах и путях получения новых знаний, проверки знаний. Это алгоритмы разного рода.Например метод мозгового штурма для поиска новых идей. По степени научности Знания могут быть научными и ненаучными. Научные знания могут быть: эмпирическими, полученными на основе опыта или наблюдения теоретическими, полученными на основе анализа абстрактных моделей. Теоретические знания - абстракции, аналогии, схемы, отражающие структуру и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов. Ненаучные знания могут быть: паранаучные - знание несовместимы с имеющимся гносеологическим стандартом. Широкий класс паранаукового (пара от греч. - Возле, при) знания включает учения или размышления о феноменах, объяснение которых не является убедительным с точки зрения критериев научности; псевдонаучными - сознательно эксплуатирующие домыслы и предрассудки. Лженаучных знание часто представляет науку как дело аутсайдеров. Как симптомы лженауки выделяют малограмотный пафос, принципиальную нетерпимость к опровергающих доводов, а также претенциозность. Псевдонаучное знание очень чувствительно к злобе дня, сенсации. Его особенностью является то, что оно не может быть объединено парадигмой, не может обладать систематичностью, универсальностью. Лженаукой знания сосуществуют с научными знаниями. Считается, что псевдонаучное знание обнаруживает себя и развивается через квазинаучная; квазинаучными - они ищут себе сторонников, опираясь на методы насилия и принуждения. Квазинаучные знания, как правило, расцветает в условиях строгой иерархированной науки, где невозможна критика власть имущих, где жестко проявлен идеологический режим; антинаучными - как утопические и сознательно искажающие представления о действительности. Приставка «анти» обращает внимание на то, что предмет и способы исследования противоположны науке. С ним связывают извечную потребность в выявлении общего легко доступных "лекарств от всех болезней». Особый интерес и тяга к антинауки возникает в периоды социальной нестабильности. Но хотя данный феномен достаточно опасен, принципиального избавления от антинауки произойти не может; псевдонаучными - является интеллектуальной активностью, спекулирует на совокупности популярных теорий, например, истории о древних астронавтов; повседневно-практическими - доставлявшие элементарные сведения о природе и окружающей действительности. Люди, как правило, располагают большой объем обыденного знания, которое проводится повседневно и является исходным пластом всякого познания. Иногда аксиомы здравомыслия противоречат научным положениям, препятствуют развитию науки. Иногда, наоборот, наука длинным и трудным путем доказательств и опровержений приходит к формулировке тех положений, которые давно утвердили себя в среде обыденного знания. Обыденное знание включает и здравый смысл, и приметы, и поучения, и рецепты, и личный опыт, и традиции. Оно хоть и фиксирует истину, но делает это не систематично и бездоказательно. Его особенностью является то, что оно используется человеком практически неосознанно и в своем применении не требует предварительных систем доказательст. Другая его особенность - принципиально неграмотный характер. собственные - зависящие от способностей того или иного субъекта и от особенностей его интеллектуальной познавательной деятельности. «Народной наукой» - особой формой вненаучного и иррационального знания, которая в настоящее время стала делом отдельных групп или отдельных субъектов: знахарей, целителей, экстрасенсов, а ранее шаманов, жрецов, старейшин рода. При своем возникновении народная наука обнаруживала себя как феномен коллективного сознания и выступала как этнонаука. В эпоху доминирования классической науки она потеряла статус интерсубъективности расположилась на периферии, вдали от центра официальных экспериментальных и теоретических исследований. Как правило, народная наука существует и транслируется в бесписьменная форме от наставника к ученику. Она также иногда проявляется в виде заветов, наставлений, ритуалов и др.. Укажите определения базы знаний и системы баз знаний. Укажите определение искусственного интеллекта. Искусственный интеллект — это область информатики, которая занимается разработкой интеллектуальных компьютерных систем, то есть систем, обладающих возможностями, которые мы традиционно связываем с человеческим разумом, — понимание языка, обучение, способность рассуждать, решать проблемы и т. д. Укажите определение инженерии знаний; опишите, что включает в себя процесс представления знаний. Инженерия знаний представляет собой совокупность моделей, методов и технических приемов, нацеленных на создание систем, которые предназначены для решения проблем с использованием знаний. Фактически инженерия знаний – это теория, методология и технология, которые охватывают методы добычи, анализа, представления и обработки знаний экспертов. Представление знаний, их обработка и использование, рассматриваемые применительно к конкретной прикладной области, являются предметом инженерии знаний. На высоком уровне, процесс инженерии знаний состоит из двух: 1. Извлечение знаний – преобразование «сырых знаний» в организованные. 2. Внедрение знаний – преобразование организованных знаний в реализованные. Приведите классификацию методов извлечения знаний. Методы извлечения знаний: –коммуникативные: · пассивные наблюдение; протокол "мыслей вслух"; лекции; · активные групповые: · мозговой штурм; · круглый стол; · ролевые игры; индивидуальные: · анкетирование; · интервью; · диалог; · экспертные игры; – текстологические: · анализ учебников; · анализ специальной литературы; · анализ документов. Укажите определение системы, основанной на знаниях; приведите классификацию систем, основанных на знаниях. Система , основанная на знаниях ( KBS ) — это компьютерная программа , которая рассуждает и использует базу знаний для решения сложных задач . Термин является широким и относится ко многим различным типам систем. Одна общая тема, объединяющая все системы, основанные на знаниях, — это попытка явного представления знаний и система рассуждений , позволяющая получать новые знания. Таким образом, система, основанная на знаниях, имеет две отличительные черты: базу знаний и механизм вывода . Первая часть, база знаний, представляет факты о мире, часто в той или иной форме онтологии включения ( а не неявно встроенной в процедурный код, как это делает обычная компьютерная программа). Другие распространенные подходы в дополнение к онтологии включения включают фреймы , концептуальные графы и логические утверждения. [1] Вторая часть, механизм логического вывода, позволяет делать выводы о новых знаниях. Чаще всего это может принимать форму правил IF-THEN [2] в сочетании с подходами прямой или обратной цепочки . Другие подходы включают использование автоматических средств доказательства теорем, логическое программирование, системы классной доски и системы перезаписи терминов, такие как CHR (правила обработки ограничений) . Эти более формальные подходы подробно описаны в статье Википедии о представлении знаний и рассуждениях . Дайте описание логической модели представления знаний: основные идеи формализации, синтаксис описание логической модели представления знаний, понятия терма, формулы, предиката, высказывания, квантора. Укажите достоинства и недостатки логических моделей представления знаний. Преимущества: 1. Высокой уровень формализации, обеспечивающий возможность реализации системы формальных точных определений и выводов. 2. Согласованность знаний как единого целого, облегчающее решение проблема верификации базы знаний, оценки независимости и полноты системы аксиом. 3. Единое средство описания как знаний о предметной области, так и способов решения, что позволяет любую задачу свести к поиску логического вывода некоторую формулу. Недостатки: 1. Представление знаний в логической модели не наглядно; 2. Написание знаний в виде логических формул не позволяет появиться преимуществам, которые имеются при автоматизированной обработке структурных данных. 3. Детерминированность логического вывода, т.е. отсутствие возможности оперирования с нечеткими знаниями. 4. Невозможность применения в качестве параметров предикатов других предикатов, т.е. невозможность формулирования знаний о знаниях. Логику предикатов первого порядка можно использовать как основу для конструирования более сложных логических методов представления знания. В этом качестве она используется в модальных и псевдо-физических логиках. Дайте описание продукционной модели представления знаний: основные идеи формализации, синтаксис описание продукционной модели представления знаний, правила обработки продукции, понятие триплета. Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа «Если условие, то действие». Такое предложение называется правилом, или продукцией. Каждое продукционное правило является единицей знаний и состоит из префиксной части и ядра правила Укажите достоинства и недостатки продукционных моделей представления знаний. Дайте описание семантических сетей представления знаний: основные идеи семантических сетей; понятия графа, пути на графе, события, атрибута, комплекса признаков и процедуры; элементы семантической сети. Семантическая сеть - это граф, дуги которого есть отношения между вершинами (значениями). Семантические сети появились как модель СПЗ при решении задач разбора и понимания смысла естественного языка. Достоинства семантических сетей: универсальность, семантическая сеть позволяет представить любую существующую систему в виде схемы; наглядность системы знаний, представленной графически; близость структуры сети, представляющей систему знаний, семантической структуре фраз на естественном языке. Недостатки семантических сетей: формирование и модификация семантической модели затруднительны; поиск решения в семантической сети сводится к задаче поиска фрагмента сети, соответствующего подсети, отражающей поставленный запрос; чем больше отношений между понятий, тем сложнее использовать и модифицировать знания. Семантические сети широко используются в экспертных системах в качестве языка представления знаний (например, в экспертной системе PROSPECTOR), в системах распознавания речи и понимания естественного языка. Непосредственное отношение к сетевым моделям имеют исследования по реляционным, сетевым и иерархическим БД. Кроме того, проводятся исследования, которые используют семантическую сеть для создания глобальной базы знаний на основе Интернета. Несмотря на недостатки семантическая сеть, в связи со своей наглядностью и легкостью создания незаменима в обучении. Также модель необходима на начальных этапах создания проектов для рассмотрения его обобщенно. Понятия отношений и их виды в иерархических структурах семантических сетей. 5. СЕМАНТИЧЕСКИЕ СЕТИ Семантической сетью является структура данных, имеющая определенный смысл как сеть. Стандартного определения семантической сети не существует, но обычно под ней подразумевают следующее: Семантическая сеть — это система знаний, имеющая определенный смысл в виде целостного образа сети, узлы которой соответствуют понятиям и объектам, а дуги — отношениям между понятиями и объектами. Следовательно, всевозможные сети можно рассматривать как сети, входящие в состав семантической сети. В том числе к ним могут быть отнесены и сетевые структуры моделей баз данных. Сама по себе семантическая сеть является моделью памяти и не раскрывает, каким образом осуществляется представления знаний. Поэтому в контексте знакомства с СОЗ семантические сети должны рассматриваться как метод представления знаний с возможностями структурирования этих знаний, процедурами их использования и механизмом вывода. 5.1. Описание иерархической структуры понятий и диаграмма представления В иерархической структуре понятий существуют отношения, по крайней мере, двух типов: отношение включения или совпадения (IS - A); отношение «целое – часть» (PART - OF). Например, в предложении «ноутбук» (IS - A) «компьютер» основной мыслью является, что устройство ноутбук принадлежит к классу компьютеров. Это означает, что имеет место отношение включения или совпадения. То есть, ноутбук представляет собой один из элементов множества всевозможных устройств, составляющих класс компьютеров. Для этих отношений характерным является то, что экземпляры понятий нижнего уровня содержат все атрибуты понятий верхнего уровня. Это свойство называется наследованием атрибутов между уровнями иерархии (IS - A). Для рассматриваемого примера это означает, что ноутбук, как понятие более низкого уровня, будет обладать всеми свойствами (атрибутами), определенными для понятия компьютер. Отношение «целое – часть» можно иллюстрировать предложением, которое характеризует то, что экземпляры понятия «процессор» являются частью любого экземпляра понятия «компьютер». «процессор» (PART - OF) «компьютер», Отношения типа (PART - OF) позволяют определить некоторые общие свойства (набор атрибутов) для конкретного класса понятий. В частности, приведенный выше пример отношения описывает тот факт, что общим свойством всех компьютеров является наличие в их составе процессоров. И это свойство будет наследоваться всеми экземплярами понятия ноутбук. Наиболее часто используется графическое представление семантических сетей в виде диаграммы. Так предложение «все ласточки – птицы» можно представить графом, содержащим две вершины соответствующие понятиям и дугу, указывающую отношение между этими понятиями (рис. 5.1). Укажите достоинства и недостатки семантических сетей представления знаний. Достоинства семантических сетей: – универсальность, достигаемая за счет выбора соответствующего набора отношений. В принципе с помощью семантической сети можно описать сколь угодно сложную ситуацию, факт или предметную область; – наглядность системы знаний, представленной графически; – близость структуры сети, представляющей систему знаний, семантической структуре фраз на естественном языке; – соответствие современным представлениям об организации долговременной памяти человека. Недостатки семантических сетей: – сетевая модель не дает (точнее, не содержит) ясного представления о структуре предметной области, поэтому формирование и модификация такой модели затруднительны; – сетевые модели представляют собой пассивные структуры, для обработки которых необходим специальный аппарат формального вывода; – проблема поиска решения в семантической сети сводится к задаче поиска фрагмента сети, соответствующего подсети, отражающей поставленный запрос. Это, в свою очередь, обуславливает сложность поиска решения в семантических сетях; – представление, использование и модификация знаний при описании систем реального уровня сложности оказывается трудоемкой процедурой, особенно при наличии множественных отношений между ее понятиями [4]. Дайте описание фреймовой модели представления знаний: понятия фрейма, слота, виды фреймов, правила заполнения значений фрейма и слота. Фреймовая модель представления знаний – была предложена М.Минским в 1979 г. как структура знаний для восприятия пространственных сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обоснование. В психологии и философии известно понятие абстрактного образа. Например, слово «комната» вызывает у слушающих образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м2». Из этого описания ничего нельзя убрать (например, убрав окна, получим уже чулан, а не комнату), но в нем есть «дырки», или «слоты», — это незаполненные значения некоторых атрибутов — количество окон, цвет стен, высота потолка, покрытие пола и др. В этой теории такой абстрактный образ называется фреймом. Фреймом называется также и формализованная модель для отображения образа. В качестве идентификатора фрейму присваивается имя фрейма. Это имя должно быть единственным во всей фреймовой системе. Фрейм имеет определенную внутреннюю структуру, состоящую из множества элементов, называемых слотами, которым также присваиваются имена. За слотами следуют шпации, в которые помещают данные, представляющие текущие значения слотов. Каждый слот в свою очередь представляется определенной структурой данных. В значение слота подставляется конкретная информация, относящаяся к объекту, описываемому этим фреймом. Процедуры, располагающиеся в слотах фреймовой модели. Процедуры, располагающиеся в слотах, называются связанными или присоединенными процедурами. Вызов связанной процедуры осуществляется при обращении к слоту, в котором она помещена. Заполнителями слота могут быть также правила продукций, используемые для определения конкретного значения Укажите достоинства и недостатки фреймовых систем. К достоинствам фреймового представления знаний следует отнести то, что оно: 1) обеспечивает эффективную реализацию процедур вывода; 2) имеет возможность логических скачков, т.е. немонотонного вывода; 3) обеспечивает возможность образования СС фреймов, что дает большую экономию памяти при представлении информации за счет наследования свойств фреймов более высоких уровней во фреймах более низких уровней; 4) обеспечивает хорошее соответствие реальной действительности; 5) позволяет комбинировать различные модели представления знаний, объединяя их достоинства и компенсируя их недостатки. К недостаткам отнесем: 1) каждый фрейм представляет собой достаточно сложный фрагмент знаний. Поэтому удаление или включение нового фрейма — весьма болезненная процедура, так как должна предусматривать и удаление всех составляющих элементов, которые могут быть составными частями других фреймов; 2) достаточно сложно осуществлять на фреймах представление временных процессов; 3) отсутствует формальная теория вывода на фреймах. Поэтому на инженере по знаниям целиком лежит ответственность за корректность организации иерархии фреймов и их заполнения. Дайте описание методов вывода на знаниях: стратегии управления выводом, прямой и обратный вывод, методы поиска в глубину и ширину. |