реферат по философии науки. Реферат (Матковская). История развития инженерии знаний одного из направлений теории искусственного интеллекта

Название	История развития инженерии знаний одного из направлений теории искусственного интеллекта
Анкор	реферат по философии науки
Дата	23.07.2022
Размер	0.54 Mb.
Формат файла
Имя файла	Реферат (Матковская).docx
Тип	Реферат #635208

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Челябинский государственный университет»

(ФГБОУ ВПО «ЧелГУ»)
Кафедра философии

РЕФЕРАТ

по истории информатики

на тему:

«История развития инженерии знаний — одного из направлений теории искусственного интеллекта»

Выполнил:

Аспирант каф. ИТиЭИ

Шилова(Матковская) О.Ю.

к.т. 8-(951)-240-2384
Проверил:

Научный руководитель

__________ д.т.н., профессор Мельников А.В.

Челябинск, 2016
СОДЕРЖАНИЕ

Введение 3

I.Предыстория: зарождение научного направления «искусственный интеллект» 4

II.История развития направления представления знаний в 70 – 80-е года XX века 6

III.Развитие направления создания экспертных систем 9

IV.Зарождение новой науки «инженерии знаний» (середина 80-х годов XX века) 11

V.Рассмотрение отдельных сторон, понятий и основ «инженерии знаний» в историческом ракурсе (от их возникновения до современности) 13

Заключение 27

Список использованной литературы 30

Введение

Во введении дадим несколько базовых определений, на которые будем опираться в процессе изложения истории развития рассматриваемой в данном реферате науки — инженерии знаний — одного из направлений теории искусственного интеллекта (ИИ).

Инженерия знаний — молодая ветвь теории искусственного интеллекта, изучающая процессы и методы получения, представления и формализации знаний для разработки экспертных систем (ЭС). Специалисты, работающие в этой области, подготовка которых усиленными темпами ведется во многих странах, называются инженерами по знаниям или просто инженерами знаний.

Экспертные системы — это программные комплексы, аккумулирующие опыт специалистов в некоторой предметной области с целью его тиражирования для консультаций менее квалифицированных пользователей.

Один из видных специалистов ИИ Ньюэлл считает, что сейчас мы ступили на принципиально новый уровень общения с ЭВМ — уровень знаний. Исторически сложилась следующая последовательность уровней общения с ЭВМ. В 50-е годы для того чтобы решить задачу на ЭВМ, необходимо было написать программу в цифровых (машинных кодах, т. е. максимально приблизиться к машинному представлению о данных и операциях над ними. Затем, в 60-е годы, появились языки программирования или алгоритмические языки, которые позволяли вводить информацию о задаче и способе ее решения на некотором более «читаемом», т. е. символьном, языке. И наконец, в конце 70-х годов, благодря успехам ИИ и программирования, появилась возможность вводить в машину непосредственно знания о предметной области и исходные условия задачи, а машина стала способна сама находить необходимые решения [2].

Предыстория: зарождение научного направления «искусственный интеллект»

В XVIII веке Лейбниц и Декарт независимо друг от друга продолжили эту идею, предложив универсальные языки классификации всех наук. Эти работы можно считать первыми теоретическими работами в области искусственного интеллекта. Окончательное рождение искусственного интеллекта как научного направления произошло только после создания ЭВМ в 40-х годах XX века. В это же время Норберт Винер создал свои основополагающие работы по новой науке — кибернетике.

Термин «искусственный интеллект» — ИИ (AI — artificial intelligence) был предложен в 1956 г. на семинаре с аналогичным названием в Дартсмутском колледже (США). Семинар был посвящен разработке методов решения логических, а не вычислительных задач. В английском языке данное словосочетание не имеет той слегка фантастической антропоморфной окраски, которую оно приобрело в довольно неудачном русском переводе. Слово intelligence означает «умение рассуждать разумно», а вовсе не «интеллект», для которого есть термин intellect.

Искусственный интеллект — это одно из направлений информатики, целью которого является разработка аппаратно-программных средств, позволяющих пользователю-непрограммисту ставить и решать свои, традиционно считающиеся интеллектуальными задачи, общаясь с ЭВМ на ограниченном подмножестве естественного языка [1].

Одни из первых направлений искусственного интеллекта были ориентированы на поиски алгоритмов решения интеллектуальных задач на существующих моделях компьютеров. Существенный вклад в становление новой науки внесли ее «пионеры»: Маккарти (автор первого языка программирования для задач ИИ — ЛИСПа), Минский (автор идеи фрейма и фреймовой модели представления знаний), Ньюэлл, Саймон, Шоу, Хант и другие.

В 1954 г в МГУ начал свою работу семинар «Автоматы и мышление» под руководством академика Ляпунова А. А. (1911-1973). одного из основателей российской кибернетики. В этом семинаре принимали участие физиологи, лингвисты, психологи, математики. Принято считать, что именно в это время родился искусственный интеллект в России. Как и за рубежом, выделились два основных направления нейрокибернетики и кибернетики «черного ящика».

В 1956-1963 гг. велись интенсивные поиски моделей и алгоритмов человеческого мышления и разработка первых программ на их основе. Представители существующих гуманитарных наук — философы, психологи, лингвисты — ни тогда, ни сейчас не в состоянии были предложить таких алгоритмов. Тогда кибернетики начали создавать собственные модели. Так последовательно были созданы и опробованы различные подходы.

В конце 50-х годов родилась модель лабиринтного поиска. Этот подход представляет задачу как некоторое пространство состояний в форме графа, и в этом графе проводится поиск оптимального пути от входных данных к результирующим. Была проделана большая работа по разработке этой модели, но для решения практических задач эта идея не нашла широкого применения.

Начало 60-х — это эпоха эвристического программирования. Эвристика — правило, теоретически не обоснованное, которое позволяет сократить количество переборов в пространстве поиска. Эвристическое программирование — разработка стратегии действий на основе известных, заранее заданных эвристик [см. работы Александрова, 1975].

В 1963-1970 гг. к решению задач стали подключать методы математической логики. Робинсон разработал метод резолюций, который позволяет автоматически доказывать теоремы при наличии набора исходных аксиом. Примерно в это же время выдающийся отечественный математик Ю.С. Маслов предложил так называемый обратный вывод, впоследствии названный его именем, решающий аналогичную задачу другим способом [см. работы Маслова, 1983]. На основе метода резолюций француз Альбер Кольмероэ в 1973 г. создает язык логического программирования Пролог. Большой резонанс имела программа «Логик-теоретик», созданная Нъюэлом, Саймоном и Шоу, которая доказывала школьные теоремы. Однако большинство реальных задач не сводится к набору аксиом, и человек, решая производственные задачи, не использует классическую логику, поэтому логические модели при всех своих преимуществах имеют существенные ограничения по классам решаемых задач.

В СССР в 1954-1964 гг. создаются отдельные программы и проводятся исследования в области поиска решения логических задач. В Ленинграде (ЛОМИ – Ленинградское отделение математического института им. Стеклова) создается программа АЛПЕВ ЛОМИ, автоматически доказывающая теоремы. Она основана на оригинальном обратном выводе Маслова, аналогичном методе резолюций Робинсона.

История развития направления представления знаний
в 70 – 80-е года XX века

На первом этапе рассмотрим развитие направления представления знаний, из которого впоследствии вышла новая наука инженерия знаний и некоторых общих тенденций и направлений развития искусственного интеллекта в целом.

В течение 70-х годов сложились основные теоретические направления исследований в области интеллектуальных систем. И одним из таких направлений стало представление знаний и разработка систем, основанных на знаниях (knowledge-based systems) [3]. Многие специалисты по интеллектуальным системам считают это направление работ основным [1]. Именно появление знаний в памяти ЭВМ позволило, по их мнению, всерьез говорить о появлении "интеллекта" в программах, реализуемых на ЭВМ. До этого при решении задач на ЭВМ проблема заключалась в написании той процедуры, которую нужно было реализовать на машине, и ее переводе на язык, понятый ЭВМ (т.е. программировании). При появлении в памяти ЭВМ всех необходимых знаний о некоторой фиксированной проблемной области ЭВМ становится способной на основании этих знаний сама синтезировать программы, необходимые для решения поставленных перед ней задач. Другими словами, труд программиста выполняет сама ЭВМ, а человек общается с ней таким же способом, как он это делает, когда общается со своим коллегой по работе.

Представление знаний — это основное направление в области изучения искусственного интеллекта. Оно связано с разработкой моделей представления знаний, созданием баз знаний, образующих ядро экспертных систем. В последнее время включает в себя модели и методы извлечения и структурирования знаний и сливается с инженерией знаний [2].

Преобразования знаний, выполняемые в тех или иных моделях их представления, носят, как правило, логический характер. В связи с этим в теории представления знаний большое внимание уделяется созданию специальных логических систем для работы со знаниями. В СССР, в частности, разрабатывались так называемые псевдофизические логики (Д.А.Поспелов, А.С.Нариньяни и др.), предназначенные для описания закономерностей, отражающих временной, пространственный или каузальный аспект действий, совершаемых в реальном физическом мире.

История искусственного интеллекта полна драматических событий, одним из которых стал в 1973 г. так называемый «доклад Лайтхилла», который был подготовлен в Великобритании по заказу Британского совета научных исследований. Известный математик Д. Лайтхилл, никак с ИИ профессионально несвязанный, подготовил обзор состояния дел в области ИИ. В докладе были признаны определенные достижения в области ИИ, однако уровень их определялся как разочаровывающий, и общая оценка была отрицательная с позиций практической значимости. Этот отчет отбросил европейских исследователей примерно на 5 лет назад, так как финансирование ИИ (и направления инженерии знаний в том числе) существенно сократилось.

Примерно в это же время существенный прорыв в развитии практических приложений искусственного интеллекта произошел в США, когда к середине 1970-х на смену поискам универсального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. В США появились первые коммерческие системы, основанные на знаниях, или экспертные системы (ЭС). Стал применяться новый подход к решению задач искусственного интеллекта — представление знаний. Созданы MYCIN и DENDRAL [Shortliffe, 1976; Buchanan, Feigenbaum, 1978], ставшие уже классическими, две первые экспертные системы для медицины и химии. Существенный финансовый вклад вносит Пентагон, предлагая базировать новую программу министерства обороны США (Strategic Computer Initiative — SCI) на принципах ИИ. Уже вдогонку улущенных возможностей в начале 80-х объявлена глобальная программа развития новых технологий ESPRIT (Европейский Союз), в которую включена проблематика искусственного интеллекта.

В 1974 году при Комитете по системному анализу при президиуме АН СССР был создан Научный совет по проблеме «Искусственный интеллект», его возглавил Г. С. Поспелов, его заместителями были избраны Д. А. Поспелов и Л. И. Микулич. В состав совета входили на разных этапах М. Г. Гаазе-Рапопорт, Ю. И. Журавлев, Л. Т. Кузин, А. С. Нариньяни, Д. Е. Охоцимский, А. И. Половинкин, О. К. Тихомиров, В. В. ЧаВчанидзе.

В 1965-1980 гг. происходит рождение нового направления — ситуационного управления (соответствует представлению знаний, в западной терминологии). Основателем этой научной школы стал проф. Поспелов Д. А. Были разработаны специальные модели представления ситуаций — представления знаний [см. работы Поспелова, 1986].

По инициативе Совета было организовано пять комплексных научных проектов, которые были возглавлены ведущими специалистами в данной области. Проекты объединяли исследования в различных коллективах страны: «Диалог» (работы по пониманию естественного языка, руководители А. П. Ершов, А. С. Нариньяни), «Ситуация» (ситуационное управление, Д. А. Поспелов), «Банк» (банки данных, Л. Т. Кузин), «Конструктор» (поисковое конструирование, А. И. Половинкин), «Интеллект робота» (Д. Е. Охоцимский).

В 1980-1990 гг. проводятся активные исследования в области представления знаний, разрабатываются языки представления знаний, экспертные системы (более 300). В Московском университете создается язык РЕФАЛ.

В 1988 г. создается АИИ — Ассоциация искусственного интеллекта. Ее членами являются более 300 исследователей. Президентом Ассоциации единогласно избирается Д. А. Поспелов, выдающийся ученый, чей вклад в развитие ИИ в России трудно переоценить. Крупнейшие центры — в Москве, Петербурге, Переславле-Залесском, Новосибирске. В научный совет Ассоциации входят ведущие исследователи в области ИИ — В. П. Гладун, В. И. Городецкий, Г. С. Осипов, Э. В. Попов, В. Л. Стефанюк, В. Ф. Хорошевский, В. К. Финн, Г. С. Цейтин, А. С. Эрлих и другие ученые.

Уровень теоретических исследований по искусственному интеллекту в России на тот момент был ничуть не ниже мирового. К сожалению, начиная с 80-х гг. на прикладных работах начинает сказываться постепенное отставание в технологии.

Развитие направления создания экспертных систем

Более подробно рассмотрим состояние направления разработки экспертных систем, с которыми тесно связана инженерия знаний и которым она обязана своим появлением как наука.

Экспертные системы (ЭС) – наиболее известный тип современных промышленных интеллектуальных систем [3,4]. Принципиальное отличие ЭС от других систем ИИ – это наличие системы обоснования. Задачей системы обоснования является формирование пользователю, если он этого требует, совокупности объяснений о том, как система получила то решение, которое она выдала пользователю.

Исторически сложилось так, что проблемой извлечение и структурирование знаний для экспертных систем, занимались в основном специалисты, которые практически создают экспертные системы (ЭС) и знакомы с историей вопроса и терминологией [2]. В последнее время важное прикладное значение ЭС осознается и неспециалистами.

Разработка ЭС — это активно развивающаяся ветвь информатики, направленная на использование ЭВМ для обработки информации в тех областях науки и техники, где традиционные математические методы моделирования малопригодны, где важны смысловая и логическая обработка информации, опыт экспертов.

Экспертные системы достаточно молоды — первые системы такого рода, которые уже были упомянуты выше, MYCIN [Shortlife, 1976] и DENDRAL [Buchanan, Feigenbaum. 1978], появились в США в середине 70-х годов. А уже к началу 90-х годов в мире насчитывалось несколько тысяч промышленных ЭС, которые дают советы при управлении сложными диспетчерскими пультами, постановке медицинских диагнозов, поиске неисправностей в электронных приборах, по проектированию интегральных микросхем, управлению перевозками, прогнозу военных действий, финансированию и т. д. Сейчас легче назвать области, где еще нет ЭС, чем те, где они уже применяются.

Главное отличие ЭС от других программных средств — это наличие базы знаний, в которой знания хранятся в виде совокупности записей на некотором языке представления знаний (ЯПЗ), который позволяет легко изменять и дополнять базу знаний в форме, понятной специалистам–разработчикам экспертной системы. В обычных же программах знания «зашиты» в алгоритм и только программист (автор программы) может их корректировать (если он вспомнит, как построена и по какому принципу работает его программа).

До последнего времени именно различные ЯПЗ были центральной проблемой при разработке ЭС [2]. В 90-е годы существовали уже десятки языков или моделей представления знаний. Ниже более подробно будут рассмотрены популярные модели и языки представления знаний и их эволюция.

Современные ЭС — это сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и распространяющие этот эмпирический опыт для консультирования менее квалифицированных пользователей. Разработка экспертных систем, как активно развивающаяся ветвь информатики, направлена на использование ЭВМ для обработки информации в тех областях науки и техники, где традиционные математические методы моделирования малопригодны. В этих областях важна смысловая и логическая обработка информации, важен опыт экспертов.

Состояние разработок в области ЭС в России в 90-е годы XX века и к началу 2000-х годов можно охарактеризовать как стадию все возрастающего интереса среди широких слоев специалистов — финансистов, топ-менеджеров, преподавателей, инженеров, медиков, психологов, программистов, лингвистов [1].

Наибольшие трудности в разработке ЭС вызывает и по сей день не процесс машинной реализации систем, а домашинный этап анализа знаний и проектирования базы знаний. Как раз этим в первую очередь и занимается инженерия знаний [1, 2].

Зарождение новой науки «инженерии знаний»
(середина 80-х годов XX века)

Необходимость разработки теоретических основ науки о методах разработки систем, основанных на знаниях — инженерии знаний, — обосновывается в работах Поспелова Д. А., Попова Э. В., Стефанюка В. Л., Шенка Р., Минского М. — ведущих специалистов в области ИИ в России и зарубежом. Первые шаги в создании методологии (работы Осипова Г. С., Хорошевского В. Ф., Яшина А. М., Wielinga, Slagle, etc.) фактически являются пионерскими и чаще всего ориентированы на определенный класс задач, моделируемых в рамках конкретного программного инструментария.

Инженерия знаний (ИЗ) была определена Фейгенбаумом и МакКордаком в 1983 году как: «ИЗ — раздел (дисциплина) инженерии, направленный на внедрение знаний в компьютерные системы для решения сложных задач, обычно требующих богатого человеческого опыта.»

Можно дать еще одно определение инженерии знаний [2]:

Инженерия знаний (англ. knowledge engineering) – достаточно молодое направление искусственного интеллекта, появившееся тогда, когда практические разработчики столкнулись с весьма нетривиальными проблемами трудности «добычи» и формализации знаний.

В первых книгах по ИИ эти факты обычно только постулировались, в дальнейшем начались серьезные исследования по выявлению оптимальных стратегий выявления знаний. Более подробно см. работы: [Boose, 1990; Chorafas, 1990; Wielinga, Schreiber, Breuker, 1992; Tuthill, 1994;Adeli, 1994; Debenham, 1998; Kelly, 1999; Cuena, 2000; Davenport, 2000; Chang, 2002 и др.].

Так и появилась наука, посвященная теоретическим и практическим проблемам проектирования баз знаний — получению и структурированию знаний специалистов для последующей разработки интеллектуальных систем [6].

Инженерия знаний — это ветвь информатики, изучающая модели и методы извлечения, структурирования и формализации (представления) знаний для их обработки в интеллектуальных и информационных системах.

Традиционно при разработке систем, основанных на знаниях (knowledge based systems), отчетливо выделяют три фазы до-машинной обработки (рис. 3.3):

Добыча (получение) знаний из источника (эксперты, Интернет, специальная литература). Трудоемкость этой фазы недооценена. Результат ее — огромное количество гетерогенных (разнохарактерных) противоречивых фрагментов знаний.
Концептуализация (структурирование) разрозненных фрагментов в единую модель. Результат — часто слабо формализованное представление, называемое полем знаний.
Формализация поля знаний при помощи специализированных языков представления знаний (ЯПЗ). Результат — база знаний, описанная на ЯПЗ.

Рис. 1. Основные фазы обработки знаний [6]

Рис. 1 иллюстрирует основные фазы обработки знаний — начиная с получения знаний от источника через структурирование к формализации.

Рассмотрение отдельных сторон, понятий и основ «инженерии знаний» в историческом ракурсе
(от их возникновения до современности)

Центральным понятием на стадиях получения и структурирования является так называемое поле знаний [Гаврилова, 1984].

Поле знаний — это условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста [2]. Очевидно, что поле знаний — это один из способов «компрессии» знаний и их наглядного представления [6].

Теперь можно проиллюстрировать структуру молодого научного направления, ветви искусственного интеллекта — инженерии знаний (рис. 2).

Рис. 2. Структура инженерии знаний [6]

Подробнее основные теоретические компоненты раскрывает следующий рисунок (рис. 3):

Рис. 3. Структура теоретических компонент инженерии знаний [6]

Поиск языка описания поля знаний (в историческом аспекте)

Поле знаний, как первый шаг к формализации, представляет модель знаний о предметной области, в том виде, в каком ее сумел выразить аналитик на некотором «своем» языке. Что это за язык? Известно, что словарь языка конкретной науки формируется путем пополнения общеупотребительного языка специальными терминами и знаками, которые либо заимствуются из повседневного языка, либо изобретаются [Кузичева, 1987].

Был предложен целый ряд языков, достаточно универсальных, чтобы претендовать на роль языка инженерии знаний, — это структурно-логический язык SLL, включающий аппарат лямбда-конверсии [Вольфенгаген и др., 1979], язык К-систем [Кузнецов, 1989], УСК [Мартынов, 1977], нотация KADS [Wielinga, 1989]. И-ИЛИ графы и др. Однако, не все эти модели нашли широкое применение. В последние 10-15 лет роль этого языка все чаще выполняют онтологии (см. ниже более подробно) или иерархические понятийные словари [6].

В некотором смысле создание такого языка очень близко к идеям разработки универсальных языков науки [Кузичева, 1987]. К XVII веку сложились два подхода в разработке универсальных языков: создание языков-классификаций логико-конструктивных языков. К первому примыкают проекты, восходящие к идее Ф. Бэкона, — это языки Вилкинса и Далгарно. Второй подход связан с исследованиями в рамках поиска универсального метода познания, наиболее четко высказанного Р. Декартом, а затем в проекте универсальной характеристики Г. Лейбница. Именно Лейбниц наметил основные контуры учения о символах, которые в соответствии с его замыслами в XVIII веке развивал Г. Ламберт, который дал имя науке «семиотика». Семиотика в основном нашла своих адептов в сфере гуманитарных наук. В последнее время сложилась также новая ветвь семиотики — прикладная семиотика [Pospelov, 1995].

Некоторые ментальные модели инженерии знаний

Для отображения поля знаний удобно применять наглядные представления — различные изображения, схемы, рисунки, наброски. Визуализация всегда считалась мощным инструментом познания (mind tool), т. е. средством, предназначенным для организации и облегчения процесса познания.

Кратко рассмотрим два распространенных вида ментальных моделей.

Интеллект-карты (mind maps). Хотя автором идеи интеллект-карт (и-карт) считается Тони Бюзен [Buzan, 2005; Бьюзен, 2002], в России такой метод успешно использовался в педагогике уже в 1926 г. [Глаголева, 1926]. Бьюзен сформулировал идею еще в 1970-е гг. в качестве компактного средства организации конспектов. Позднее он понял, что метод гораздо шире и может использоваться как мощное орудие мышления применительно к научной работе, инновациям, бизнес-идеям, политическим дискуссиям, мозговому штурму, педагогике и пр.

Идея и-карт сильна еще и тем, что имеет серьезный нейрофизиологический базис. Бьюзен использовал также некоторые идеи из теории межполушарной асимметрии [Sperry, 1980] и гештальт-психологии [Вертгеймер, 1987].

Идея и-карт заключается в использовании и совмещении функции левого и правого полушарий для достижения целостного и наглядного представления идеи. Фактически это переход от последовательного (текстового) изложения к сетевому (образному). И-карта — графическое выражение процесса радиантного мышления.

За последние несколько лет на рынке программного обеспечения
появились десятки средств для быстрого и красивого мгновен-
ного формирования и-карт (майнд-мэппинга).

Концептуальные карты. Если и-карты показывают связи и древовидную структуру произвольных фрагментов знаний, то концептуальные карты или графы (concept maps) позволяют глубже рассмотреть предметную область и включают отношения между понятиями или концептами. Такие концептуальные графы (к-карты) состоят из узлов и направленных поименованных отношений, или связей, соединяющих эти узлы. Связи могут быть различ-ного типа, например, «является», «имеет свойство» и т. п.

Впервые к-карты были предложены Новаком в начале 70-х гг. [Novak, 1990] при изучении детского мышления и формирования первых научных понятий. Это исследование использовало идеи Дэвида Асубеля [Asubel, 1968] о формировании понятийного мышления. К-карты оказались эффективным инструментом отображения понятийной системы человека.

Визуальные спецификации в форме к-карт могут использоваться не только при разработке баз знаний. Они широко используются в обучающих системах (E-learning) и в традиционном обучении в классе.

Практические методы инженерии знаний: стратегии получения знаний

При формировании поля знаний ключевым вопросом является сам процесс получения знаний, когда происходит перенос компетентности экспертов на инженеров по знаниям.

Можно выделить три основные стратегии проведения стадии получения знаний при разработке ЭС (рис. 4.1):

1. Приобретение знаний — с использованием ЭВМ при наличии подходящего программного инструментария.

2. Формирование знаний — с использованием программ обучения при наличии репрезентативной (то есть достаточно представительной) выборки примеров принятия решений в предметной области и соответствующих пакетов прикладных программ.

3. Извлечение знаний — без использования вычислительной техники путем непосредственного контакта инженера по знаниям и источника знаний (будь то эксперт,специальная литература или другие источники).

Рассмотрим автоматизированный подход к проблеме извлечения и структурирования знаний, традиционно называемый приобретением знаний (knowledge acquisition).

Поскольку основную трудность в создании интеллектуальных систем представляет домашинный этап проектирования, выполняемый инженером по знаниям (или аналитиком), — анализ предметной области, получение знаний и их структурирование, — эти процедуры традиционно считаются «узким местом» (bottle-neck) проектирования экспертных систем [Gaines, 1987; Boose, 1990]. С момента оформления инженерии знаний, как научного направления, усилия разработчиков направлены на создание инструментальной программной поддержки деятельности инженера по знаниям и эксперта именно на этих этапах.

Эволюция систем приобретения знаний

Первое поколение таких систем появилось в середине 80-х — это так называемые системы приобретения знаний (СПЗ) (TEIRESIAS [Davis, 1982], SIMER+MIR [Осипов, 1988], АРИАДНА [Моргоев, 1988]). Это средства наполнения так называемых «пустых» ЭС, то есть систем, из БЗ которых изъяты знания (например, EMYCIN — EMPTY MYCIN, опустошенная медицинская ЭС MyCIN со специальной диалоговой системой заполнения базы знаний TEIRESIAS). Их авторы считали, что прямой диалог эксперта с компьютером через СПЗ поможет сократить жизненный цикл разработки. Однако опыт создания и внедрения СПЗ продемонстрировал несовершенство такого подхода.

Второе поколение СПЗ появилось в конце 80-х и было ориентировано на более широкий модельный подход [Gaines, 1989; Борисов, Федоров, Архипов, 1991] с акцентом на предварительном детальном анализе предметной области. Так, в Европе широкое применение получила методология KADS (Knowledge Acquisition and Documentation Structuring) [Wielinga et al., 1989], в основе которой лежит понятие интерпретационной модели, позволяющей процессы извлечения, структурирования и формализации знаний рассматривать как «интерпретацию» лингвистических знаний в другие представления и структуры.

На разработку СПЗ II поколения большое влияние оказали методы смежных наук, в частности психосемантики, одного из молодых направлений прикладной психологии [Петренко, 1988; Шмелев, 1983]. Уже первые приложения психосемантики в ИИ в середине 80-х годов позволили получить достаточно наглядные результаты [Кук, Макдональд, 1986]. В дальнейшем развитие этих методов шло по линии разработки удобных пакетов прикладных программ, основанных на методах многомерного шкалирования, факторного анализа, а также специализированных методов обработки репертуарных решеток [Франселла, Баннистер, 1987]. Специфика конкретных приложений требовала развития также «нечисленных» методов, использующих парадигму логического вывода.

Третье поколение СПЗ - KEATS [Eisenstadt et al., 1990], MACAO [Aussenac-Gilles, Natta, 1992], NEXPERT-OBJECT [NEXPERT-OBJECT, 1990] - перенесло акцент в проектировании с эксперта на инженера по знаниям [Гаврилова,1988; Gruber, 1989]. Новые СПЗ — это программные средства для аналитика, более сложные, гибкие, а главное использующие графические возможности современных рабочих станций и достижения CASE-технологии (Computer-Aided Software Engineering). Эти системы позволяют не задавать заранее интерпретационную модель, а формировать структуру БЗ динамически.

Учитывая новейшие тенденции в инженерии знаний, можно предложить следующую схему таксономии СПЗ, представленную на рис 4.

Рис. 4. Классификация систем приобретения знаний [6]

Однако и современные СПЗ не полностью лишены серьезных недостатков СПЗ I и II поколений, большая часть которых обусловлена отсутствием теоретической концепции проектирования БЗ. В результате эта область до настоящего времени справедливо считается скорее «искусством», чем наукой и основана на «ad hoc» технологии (то есть применительно к случаю).

Машинные модели представления знания

Модель представления знаний позволяет описывать объекты, свойства и закономерности предметной области. Эта модель должна отражать взаимосвязи между имеющимися данными. Существуют десятки моделей, или языков представления знаний (ЯПЗ), как универсальных, так и специализированных, для различных предметных областей [Джарратано, 2006; Waterman,2004]. Многие ЯПЗ появились уже в начале 1970-х гг. при разработке первых интеллектуальных систем. В 1980-х гг. получили развитие формальные компьютерные языки и системы представления и обработки обобщенных знаний, записанных на естественном языке, например, проект Сус (сокр. от Encyclopedia). Наконец, с развитием электронного документооборота, появились языки, также явно содержащие и структуру документа (HTML, SGML, XML и пр.)

Упрощенная классификация классических ЯПЗ была представлена на рис. 5.

Рис. 5. Языки представления знаний [6]

Эволюция некоторых сетевых моделей данных

Фреймы. Впервые термин «фрейм» был предложен в 1970-е гг. американским ученым Марвином Минским, который определил его следующим образом:

«Фрейм — это структура данных, представляющая стереотипную ситуацию. каждому фрейму присоединяется несколько видов информации. Часть этой информации — о том, как использовать фрейм. Часть о том, чего можно ожидать далее. Часть о том, что следует делать, если эти ожидания не подтвердятся».

Впервые теория была опубликована в 1974 г. Из определения Минского следует, что фрейм подобен записи (record), в которой сохранена информация, описывающая стереотипную ситуацию, и которая может быть адаптирована под реальное состояние среды. Подобные структуры можно представить и с помощью семантических сетей. Но для представления каждой стереотипной ситуации понадобится отдельная сеть.

Теория представления знаний с помощью фреймов, развиваемая М.Минским, претендует на объяснение ряда характерных особенностей человеческого мышления. По мнению автора, она позволяет охватить единой концепцией такие, казалось бы, разные теории, как понимание естественного языка, машинного "восприятия" зрительных образов, поиска решений, планирования, в том числе применительно к задачам управления роботами. Она объединяет многие классические и более современные идеи психологии, лингвистики, а также искусственного интеллекта. В частности, эта теория обобщает идеи, высказанные в ряде известных работ по искусственному интеллекту, например в работах А.Ньюэлла, Г.Саймона(1972), в которых знания о мире представляются с помощью пространств подзадач, в работах Р.Шенка(1973), Р.Абельсона(1973), где модель мира представляется пространством "сценариев", наконец, в работах С.Пейперта(1972) и самого М.Минского(1972), в которых предлагается подразделить знания на "микромиры".

Естественным развитием теории фреймов в ходе исследований, проведенных в 1970-х гг. в Массачусетском технологическом институте и исследовательском центре Xerox Palo Alto Research Center, стала разработка парадигмы объектно-ориентированного представления, о которой речь пойдет ниже.

«Чистая» объектно-ориентированная модель. Объектно-ориентированная технология (object-oriented approach) программирования (ООП) сформировалась в начале 1980-х гг. [Буч, 1992; Буч, Рамбо, Якобсон, 1993]. Сегодня она по праву получила широкое распространение для решения самых различных задач: традиционные и интеллектуальные задачи программирования, хранение данных, интерактивная графика и многое другое. В каком-то смысле объектный подход можно считать развитием фреймового представления. Однако если фреймы изначально предназначены для представления знаний и подразумевают решение интеллектуальных задач, то объектно-ориентированная технология является универсальным средством программирования и может применяться для решения любых задач.

Семантические сети: история и примеры применения (семантическая паутина)

Идея систематизации на основе каких-либо семантических отношений предлагалась ещё учёными ранней науки. Примером этого может служить биологическая классификация Карла Линнея 1735 г. Если рассматривать её как семантическую сеть, то в данной классификации используется отношение подмножества, современное AKO.

Прародителями современных семантических сетей можно считать экзистенциальные графы, предложенные Чарльзом Пирсом в 1909 г. Они использовались для представления логических высказываний в виде особых диаграмм. Пирс назвал этот способ «логикой будущего».

Важным направлением в исследовании сетей стали работы немецкого психолога Отто Зельца 1913 и 1922 гг. В них для организации структур понятий и ассоциаций, а также изучения методов наследования свойств он использовал графы и семантические отношения. Исследователи Дж. Андерсон (1973), Д. Норман (1975) и другие использовали эти работы для моделирования человеческой памяти и интеллектуальных свойств.

Компьютерные семантические сети были детально разработаны Ричардом Риченсом в 1956 году в рамках проекта Кембриджского центра изучения языка по машинному переводу. Процесс машинного перевода подразделяется на 2 части: перевод исходного текста в промежуточную форму представления, а затем эта промежуточная форма транслируется на нужный язык. Такой промежуточной формой как раз и были семантические сети. В 1961 г. появилась работа Мастермана, в которой он, в частности, определял базовый словарь для 15000 понятий. Эти исследования были продолжены Робертом Симмонсом (1966), Уилксом (1972) и другими учёными [7].

Большой интерес представляет работа Куиллиана (1967 г.). В ранних работах Квиллиана были сформулированы идеи использования формализма теории графов (graph theory) для построения семантических сетей.

Для построения графа используются два основных вида примитивов: узлы и связи, которые могут быть дополнительно промаркированы. Связи могут быть направленными или ненаправленными. Узлы являются начальными и конечными точками связей и их принято называть вершинами (vertex), а связи — ребрами, или дугами (arc).

В современных разработках семантические сети используются во многих областях. Интересной сферой применения этого способа представления знаний является семантическая паутина.

Семантическая паутина (англ. Semantic Web) — это направление развития Всемирной паутины, целью которого является представление информации в виде, пригодном для машинной обработки.

В обычной Паутине, основанной на HTML-страницах, информация заложена в тексте страниц и извлекается человеком с помощью браузера. Семантическая же паутина предполагает запись информации в виде семантической сети с помощью онтологий.

Термин «семантическая паутина» был впервые введён сэром Тимом Бернерсом-Ли (изобретателем Всемирной паутины) в мае 2001 года в журнале «Scientific American», и называется им «следующим шагом в развитии Всемирной паутины». Эта концепция была принята и продвигается Консорциумом Всемирной паутины. Техническую часть семантической паутины составляет семейство стандартов на языки описания, включающее XML, XML Schema, RDF, RDF Schema, OWL, а также некоторые другие.

Онтологии

Онтология (от др.-греч. онтос — сущее, логос — учение, понятие) — термин, определяющий учение о бытии, о сущем, в отличие от гносеологии — учения о познании. Уже у X. Вольфа (1679-1754), автора самого термина «онтология», учение о бытии было отделено от учения о познании. Введен же термин в философскую литературу немецким философом Р. Гоклениусом (1547-1628). При этом онтология являлась частью метафизики, наукой самостоятельной, независимой и не связанной с логикой, с «практической философией», с науками о природе. Ее предмет составляет изучение абстрактных и общих философских категорий, таких как бытие, субстанция, причина, действие, явление и т. д., а сама онтология как наука претендовала на полное объяснение причин всех явлений [Розенталь и др.,1951].

В философском смысле можно ссылаться на онтологию как на определенную систему категорий, являющихся следствием определенного взгляда на мир. При этом сама система категорий не зависит от конкретного языка: онтология Аристотеля всегда одна и та же, независимо от языка, использованого для ее описания.

Такое определение дает отправную точку для дальнейшей конкретизации и обсуждения с точки зрения целей искусственного интеллекта и инженерии знаний в частности. С точки зрения, более близкой к понятиям, связанным с ИИ, онтология — это формально представленные на базе концептуализации знания. Концептуализация предполагает описание множества объектов и понятий, знаний о них и связей между ними. Таким образом, Онтологией [Gruber, 1993] называется эксплицитная спецификация концептуализации.

Формально онтология состоит из терминов, организованных в таксономию, их определений и атрибутов, а также связанных с ними аксиом и правил вывода. Можно дать еще одно определение онтологии с практической точки зрения в инженерии знаний:

Онтологии — это БЗ специального типа, которые могут «читаться» и пониматься, отчуждаться от разработчика и/или физически разделяться их пользователями.

При этом онтологический инжиниринг — ветвь инженерии знаний, использующий Онтологию (с большой буквы) для построения онтологий (с маленькой буквы). Понятно, что любая онтология имеет под собой концептуализацию, но одна концептуализация может быть основой разных онтологий, и две разные БЗ могут отражать одну онтологию.

Онтология состоит из классов сущностей предметной области, свойств этих классов, связей между этими классами и утверждений, построенных из этих классов, их свойств и связей между ними.

Онтология — это точная спецификация некоторой предметной области, или формальное и декларативное представление, которое включает словарь (или имена) указателей на термины предметной области и логические выражения, которые описывают, что эти термины означают, как они соотносятся друг с другом и как они могут или не могут быть связаны друг с другом.

В рамках [10] было проведено детальное исследование понятия «онтология» и особенно областей применения онтологий. В результате систематизация знаний в области онтологий, предложенная в [11], была расширена (см. рис. 6).

Рис. 6. Систематизация знаний в области онтологий

Взгляды исследователей на онтологии постоянно эволюционируют, и период «бума» онтологий, начавшийся в середине 2000-х годов продолжается до сих пор.

Перспективные направления инженерии знаний: онтологический инжиниринг

Онтологический инжиниринг (ОИ) — раздел инженерии знаний, связанный с процессом проектирования и разработки онтологий. При отсутствии общепринятой методологии и технологии эта разработка не является тривиальной задачей. Она требует от разработчиков профессионального владения технологиями инженерии знаний — от методов извлечения знаний до структурирования и формализации.

Онтологический инжиниринг подразумевает глубокий структурный анализ предметной области. Именно эту работу для интеллектуальных систем обычно выполняют инженеры по знаниям. Онтологический инжиниринг как теория и технологии разработки онтологий активно развивается [Mizogushi & Bourdeau, 2000; Gomez-Perez, Fernandez-Lopez, Corcho, 2004].

Следует констатировать, что основные успехи лежат в области технологии, в то время как методология находится в зачаточном состоянии. В последнее время стало очевидным, что для промышленной разработки систем управления знаниями (СУЗ) уже недостаточно наличия формализованных языков (RDF, RDFS, OWL и др.) и систем (PROTEGE, APPOLLO, и др.), отвечающих на вопрос «КАК представить онтологию в сети?».

Современные исследования в ОИ в основном ориентированы на разработку направлений «Языки» и «Системы». При этом акцент делается на формализованных языках. Сейчас имеются несколько десятков языков, таких как ОКВС, KIF, SHOE, OML, XOL, RDF(S), DAML+OIL, OIL, для описания онтологий. Однако для практического организационного моделирования недостаточно наличия формализованных языков описания онтологий (RDF, RDFS, OWL и др.) и систем (PROTEGE, APPOLLO, и др.). Необходимы практические рекомендации и технологии.

На начальной стадии разработки онтологий хорошо себя показали и системы класса «mind mapping» (см. выше ментальные модели). Однако самые изощренные редакторы и инструменты не могут выполнить содержательный анализ предметной области и синтез онтологических структур. Сегодня необходимы практические рекомендации и технологии в областях извлечения и структурирования знаний, для получения ответа на вопросы: «ЧТО отражают знания, представленные в онтологии?» и «КАК их наглядно отобразить?».

Общие принципы создания онтологий можно рассмотреть
на примере системы Protege — одной из наиболее популярных
систем работы с онтологиями, созданной в Стэнфордском университете (США) (2-я версия системы, ставшей популярной, появилась в 2004 году).

По версии разработчиков системы Protege все понятия предметной области делятся на классы, подклассы, экземпляры. Экземпляры могут быть как у класса, так и подкласса и описываются они фреймом (см. выше машинные модели представления знаний). Разработчики этой системы считают, что нет правильного способа создания онтологии, так как онтология — это взгляд аналитика, т.е. всегда субъективна.

Заключение

В заключении можно отметить, что разработка теории, методов и технологий представления и использования знаний остается актуальной задачей для дальнейшего развития интеллектуальных систем. Особую актуальность, по нашему мнению, приобретают, на современном этапе развития науки и общества в целом Интернет-ориентированные технологии и распределенный искусственный интеллект. Уже сейчас ясно, что применение систем, основанных на знаниях, компонентом которых являются, например, онтологии, а реализация базируется на мультиагентных технологиях, должно привести к рассмотрению и использованию Всемирной паутины как организованного и структурированного пространства знаний.

С точки зрения исторического аспекта рассмотрения, можно отметить, что хотя инженерия знаний является довольно молодой наукой, и ее можно рассматривать как одно из основных и активно развивающихся направлений искусственного интеллекта, но своими корнями она уходит в историю других наук, таких как философия, гносеология, информатика, лингвистика, психология, системный анализ, семиотика, программная инженерия. И сама инженерия знаний в свою очередь порождает новые ветви и направления в науке, одним из которых можно считать онтологический инжиниринг, рассмотренный выше.

В заключение следует отметить, что сегодня одной из ведущих парадигм структурирования информационного контента в инженерии знаний остаются онтологии или иерархические концептуальные структуры, которые формируются аналитиком на основе изучения и структурирования протоколов извлеченных знаний и документации [6].

Свое применение онтологии находят в бизнесе. Последние публикации по информационному менеджменту организаций все больше тяготеют к онтологическому подходу [Gupta, 2003; Mezgar, 2006].

Онтологический подход позволяет создать принципиально единую модель организации как сумму онтологий [Гаврилова, 2003]. В настоящее время существует более десятка теоретических подходов к формированию корпоративных онтологий и более сотни инструментов моделирования. С одной стороны, это признак все возрастающего интереса к данному направлению, с другой стороны — признак молодости и незрелости. В ближайшее время, безусловно, выкристаллизуется пара — тройка наиболее эффективных технологий онтологического моделирования [6]. Последние публикации по информационному менеджменту организаций все больше тяготеют к онтологическому подходу [Gupta, 2003; Mezgar, 2006].

Список использованной литературы

Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский — СПб: Питер, 2000. — 384 с.: ил.
Гаврилова Т.А., Червинская К.Р. Извлечение и структурирование знаний для экспертных систем — М.: Радио и связь., 1992. — 200 с.: ил.
Д.А. Поспелов Из истории искусственного интеллекта: история искусственного интеллекта до середины 80-х годов // Новости искусственного интеллекта. – 1994. – №4. – с.70-90
Представление знаний в человеко-машинных и робототехнических системах. Том С. Прикладные человеко-машинные системы, ориентированные на знания. – М.: Издание ВЦ АН СССР, ВИНИТИ, 1984.
А.В. Гаврилов Системы искусственного интеллекта / Методические указания для студентов — Новосибирск: Новосибирский государственный технический университет, 2004.
Гаврилова Т. А., Муромцев Д. И. Интеллектуальные технологии в менеджменте: инструменты и системы: Учеб. пособие. 2-е изд. / Т. А. Гаврилова, Д. И. Муромцев; Высшая школа менеджмента СПбГУ. —СПб.: Изд-во «Высшая школа менеджмента»; Издат. дом С.-Петерб. гос. ун-та, 2008. — 488 с.
Википедия [Электронный ресурс]: свободная энциклопедия, режим доступа: http://ru.wikipedia.org/wiki/Семантическая_сеть
Википедия [Электронный ресурс]: свободная энциклопедия, режим доступа: http://ru.wikipedia.org/wiki/Семантическая_паутина
Гаврилова Т.А. От инженерии знаний к онтологическому инжинирингу / доклад на конференции «Поспеловские чтения», 2005. http://posp.raai.org/data/posp2005/gavrilova/gavrilova.html
Отчет по НИР «Эталонные модели организации деятельности в государственном секторе», ГУ-ВШЭ, 2006. Фрагмент отчета: Кудрявцев Д. «Технологии применения онтологий»
Гаврилова Т.А. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем. // Ж. "Новости искусственного интеллекта", N2, 2003. — с. 24-30.