Главная страница
Навигация по странице:

  • ТЕМА 1.3 ДАННЫЕ И ЗНАНИЯ. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ

  • 1.3.1 Данные и знания. Основные определения

  • 1.3.2 Модели представления знаний

  • Системы искусственного интеллекта. Тематический план


    Скачать 1.4 Mb.
    НазваниеТематический план
    Дата09.04.2023
    Размер1.4 Mb.
    Формат файлаpdf
    Имя файлаСистемы искусственного интеллекта.pdf
    ТипТематический план
    #1048753
    страница2 из 9
    1   2   3   4   5   6   7   8   9
    ТЕМА 1.2 НАПРАВЛЕНИЯ РАЗВИТИЯ
    ИСКУССТВЕННОГО
    ИНТЕЛЛЕКТА
    Основное направление развития ИИ — это представление знаний и разработка систем, основанных на знаниях. Оно связано с разработкой моделей представления знаний, созданием баз знаний, образующих ядро экспертных систем (ЭС). В последнее время это направление также включает в себя модели и методы извлечения и структурирования знаний и сливается с инженерией знаний.
    Традиционно искусственный интеллект включает в себя игровые интеллектуальные задачи — шахматы, шашки и т. п. В их основе лежит один из ранних подходов — лабиринтная модель (плюс эвристики). Сейчас это скорее коммерческое направление, так как в научном плане указанные идеи считаются тупиковыми.
    Следующее направление — разработка естественно-языковых интерфейсов и машинный перевод. В 1950-х гг. одной из популярных тем исследований искусственного интеллекта являлась область машинного перевода. Первой компьютерной программой в этой области стал переводчик с английского языка на русский. Однако использованная в нем идея пословного перевода оказалась неплодотворной.
    В настоящее время для решения подобных задач используется более сложная модель, включающая в себя анализ и синтез естественно-языковых сообщений и состоящая из нескольких блоков.
    Традиционное направление искусственного интеллекта, берущее начало у самых его истоков, — это распознавание образов. Здесь каждому объекту ставится в соответствие матрица признаков, по которой происходит распознавание этого объекта. Данное направление близко к машинному обучению и тесно связано с нейрокибернетикой.

    Такое направление как новые архитектуры компьютеров занимается разработкой новых аппаратных решений и архитектур, ориентированных на обработку символьных и логических данных. Последние разработки в этой области посвящены компьютерам баз данных, параллельным компьютерам и нейрокомпьютерам.
    Еще одно направление — интеллектуальные роботы. Робот — это электромеханическое устройство, предназначенное для автоматизации человеческого труда. Сама идея создания роботов — исключительно древняя
    (к ней можно, например, отнести еще средневековые легенды о «големах»).
    Само же это слово появилось в 1920-х гг. и было придумано чешским писателем Карелом Чапеком в его повести «RUR». В настоящее время в мире изготавливается более 60 тыс. роботов в год.
    Роботы с жесткой схемой управления. Практически все современные промышленные роботы принадлежат к этой группе и фактически представляют собой программируемые манипуляторы.
    Адаптивные роботы с сенсорными устройствами. Существуют отдельные образцы таких роботов, но в промышленности они пока не используются.
    Самоорганизующиеся, или интеллектуальные роботы. Это — идеал, конечная цель развития робототехники. Основная проблема при создании интеллектуальных роботов — проблема машинного зрения.
    В рамках такого направления как специальное программное обеспечение разрабатываются специальные языки для решения задач невычислительного плана. Эти языки ориентированы на символьную обработку информации — Lisp, Prolog, SmallTalk, Рефал и др. Кроме них создаются пакеты прикладных программ, ориентированные на промышленную разработку интеллектуальных систем, — программные инструментарии искусственного интеллекта. Достаточно популярно и создание так называемых «пустых экспертных систем» — «оболочек»,
    которые можно наполнять базами знаний, создавая различные экспертные системы.
    Еще одна активно развивающаяся область искусственного интеллекта
    — обучение и самообучение. Это направление включает в себя модели, методы и алгоритмы, ориентированные на автоматическое накопление знаний на основе анализа и обобщения данных, обучение на примерах (или индуктивное), а также традиционные подходы распознавания образов.
    Появление сети Интернет оказало существенное влияние на развитие научного направления «искусственный интеллект» и наоборот. Можно отметить следующие существующие и перспективные применения технологий ИИ в Интернете:
    - управление порталами, крупными интернет-магазинами и другими сложными web-системами;
    - маршрутизация пакетов информации при их передаче по сети;
    - прогнозирование и оптимизация загрузки каналов передачи информации;
    - управление сетевыми роботами
    1 и др.
    1
    Сетевые роботы (спайдеры) — интеллектуальные агенты, которые, начиная с некоторого заданного множества ссылок (URL) на web страницы, рекурсивно обходят ресурсы сети Интернет, извлекая ссылки на новые ресурсы из уже полученных документов до тех пор, пока не будет выполнено некоторое условие остановки. Кроме того, сетевыми роботами называют специальные программные модули, которые посещают заданные web-ресурсы и автоматически скачивают размещенную на них информацию.

    ТЕМА 1.3 ДАННЫЕ И ЗНАНИЯ. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ
    В
    ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ
    План лекции:
    1.3.1 Данные и знания. Основные определения
    1.3.2 Модели представления знаний
    1.3.1 Данные и знания. Основные определения
    В рамках направления «Представление знаний» решаются задачи, связанные с формализацией и представлением знаний в памяти интеллектуальной системы (ИС). Для этого разрабатываются специальные модели представления знаний и языки для описания знаний, выделяются различные типы знаний. Изучаются также источники, из которых ИС может черпать знания, и создаются процедуры и приемы, с помощью которых возможно приобретение знаний для ИС. Проблема представления знаний для
    ИС чрезвычайно актуальна, так как ИС — это система, функционирование которой опирается на знания о проблемной области, которые хранятся в ее памяти.
    Однако, чтобы моделировать знания, нужно вначале ответить на целый ряд вопросов: Что такое знания? Чем они отличаются от данных? Чем отличаются базы знаний от баз данных?
    Информация, с которой имеют дело компьютеры, разделяется на процедурную и декларативную. При этом процедурная информация реализуется в форме программ, которые выполняются в процессе решения задач, а декларативная информация — в форме данных, с которыми работают эти программы.
    Данные — это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства.
    Одновременно с развитием структуры ЭВМ происходило развитие информационных структур для представления данных. Появились способы
    их описания в виде векторов и матриц, возникли списочные и иерархические структуры. В настоящее время в языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) ознаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных
    (СУБД), позволяют эффективно манипулировать данными, при необходимости извлекать их из БД или записывать в БД в нужном порядке, вести поиск данных в БД и пр.
    По мере развития исследований в области ИС возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации.
    В компьютере знания, так же, как и данные, отображаются в знаковой форме — в виде формул, текста, файлов, информационных массивов и т. д.
    Поэтому можно сказать, что знания — это особым образом организованные данные, но это слишком узкое понимание. Знания связаны с данными, основываются на них, но, в отличие от данных, представляют результат мыслительной деятельности человека, обобщают его опыт, полученный в ходе выполнения какой-либо практической деятельности. Знания добываются эмпирическим путем.
    Знания — это выявленные закономерности предметной области
    (принципы, связи, законы), позволяющие решать задачи в этой области.
    В системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний (БЗ) — это необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, также называют машинами, основанными на знаниях.

    Любая база знаний содержит в себе базу данных в качестве составляющей, но вовсе не сводится к ней. Главное отличие базы знаний от базы данных состоит в следующем: из базы данных можно извлечь лишь ту фактическую информацию, которая в нее заложена, тогда как благодаря закономерностям и связям из базы знаний можно выводить новые факты, которые непосредственно в нее заложены не были.
    При построении баз знаний традиционные средства, основанные на числовом представлении данных, являются неэффективными. Для этого используются специальные языки представления знаний, основанные на символьном представлении данных.
    1.3.2 Модели представления знаний
    Существуют десятки моделей (языков) представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам:
    - семантические сети;
    - фреймы;
    - формальные логические модели; продукционные.
    Семантические сети
    Термин «семантическая» означает «смысловая», а сама семантика — это наука, устанавливающая отношения между символами и объектами, которые они обозначают, т. е. наука, определяющая смысл знаков.
    Семантическая сеть — это ориентированный граф, вершины которого представляют собой понятия, а дуги — отношения между ними.
    В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения — это связи типа: «это», «имеет частью»,
    «принадлежит», «любит» и т. д.

    Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:
    1) класс — элемент класса;
    2) свойство — значение;
    3) пример элемента класса.
    Проблема поиска решения в базе знаний типа семантической сети сводится к поиску путей на графе, позволяющих от вершин с исходными данными добраться до вершин с искомыми величинами. Такой поиск можно автоматизировать.
    Вывод (продуцирование) новых знаний в семантической сети может проводиться «в двух направлениях»: от известных данных к цели
    (результатам) или, наоборот, от цели к известным данным. Первый способ называется прямой волной, прямым поиском, прямой стратегией вывода, а второй — обратной волной, обратным поиском, обратной стратегией вывода.
    Пример: на рисунке 1.2 изображена семантическая сеть, где вершинами являются понятия: «Человек», «Иванов», «Волга», «Автомобиль», «Вид транспорта», «Двигатель».
    Основной недостаток подобной модели — сложность поиска вывода на семантической сети.

    Фреймы
    Автором теории фреймов является М. Минский. В основе этой теории лежат психологические представления о том, как мы видим, слышим и концентрируем внимание на воспринимаемом. Сам Минский считал теорию фреймов скорее «теорией постановки задач», чем продуктивной теорией, и суть ее излагал следующим образом. Каждый раз, попадая в некую ситуацию, человек вызывает в своей памяти соответствующую этой ситуации структуру, именуемую фреймом («frame» — «рамка»). Таким образом, фрейм
    — это единица представления знания, заполненная в прошлом, детали которой по необходимости изменяются и уточняются применительно к ситуации. Каждый такой фрейм может быть дополнен различной информацией, касающейся способов применения этого фрейма, последствий такого применения и т. п. Образ жизни каждого человека — это большей частью череда типовых ситуаций, различающихся каждый раз в деталях, но в целом повторяющихся.
    В психологии и философии известно понятие абстрактного образа.
    Например, слово «комната» вызывает у слышащих его примерно следующий образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, средней площади». В таком описании ничего нельзя пропустить по существу (например, убрав из него окна, мы получим уже чулан, а не комнату), но в нем есть «лакуны», или «слоты», — незаполненные значения некоторых атрибутов — конкретное количество окон, цвет стен, высота потолка, покрытие пола и др.
    В теории фреймов такой образ и называется фреймом, равно как и формализованная модель для отображения такого образа.
    С точки зрения пользователя различают три уровня общности фреймов:
    1) скелетный, пустой фрейм (шаблон), превращаемый после его заполнения в общее или конкретное понятие;

    2) фрейм общего понятия (прототип) — шаблон, заполненный не конкретными значениями (константами), а переменными;
    3) фрейм конкретного понятия (экземпляр) — прототип, заполненный конкретными значениями (константами).
    Каждому фрейму присваивается имя, которое должно быть уникальным во всей фреймовой системе. Описание фрейма состоит из ряда описаний, именуемых слотами, которым также присвоены имена (они должны быть уникальны в пределах фрейма). Каждый слот предназначен для заполнения определенной структурой данных. Значением слота может быть практически все, что угодно (числа, математические соотношения, тексты на естественном языке, программы, правила вывода, ссылки на другие слоты данного фрейма или других фреймов). При конкретизации фрейма ему и его слотам присваиваются конкретные имена и происходит заполнение слотов их значениями. Переход от исходного фрейма-прототипа к фрейму-экземпляру может быть многошаговым (за счет постепенного уточнения значений слотов).
    Внутреннее (машинное) представление фрейма имеет более сложную организацию и содержит средства для создания иерархии фреймов, их взаимодействия, обмена информацией, порождения конкретных фреймов из общих и общих — из скелетных.
    Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям («A-Kind-Of»
    — «это»). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются (переносятся) значения аналогичных слотов.
    Например, в сети фреймов, показанной на рисунке 1.3, понятие
    «ученик» наследует свойства фреймов «ребенок» и «человек», которые находятся на более высоком уровне иерархии. Соответственно, на вопрос:
    «Любят ли ученики сладкое?» следует ответ: «Да», так как этим свойством
    обладают все дети, что указано во фрейме «ребенок». Наследование свойств может быть частичным, например, возраст для учеников не наследуется из фрейма «ребенок», поскольку он указан явно в своем собственном фрейме.
    Некоторые специалисты по искусственному интеллекту полагают, что нет необходимости специально выделять фреймовые модели в представлении знаний, так как в них объединены все основные особенности моделей остальных типов. Поэтому фреймовые модели часто рассматривают в общем контексте с сетевыми моделями. В частности, сеть фреймов можно рассматривать как семантическую сеть с блочной структурой, позволяющую реализовать альтернативные интерпретации предметных областей. Фрейм в такой сети содержит информационный и процедурный элементы, которые обеспечивают преобразование информации внутри фрейма и его связь с другими фреймами, а слоты фрейма заполняются конкретной информацией в процессе его функционирования. В сети фреймов могут быть также реализованы логические связки, кванторы общности и существования.
    Общий вывод из сказанного выше заключается в том, что на некотором глубинном уровне все формы представления знания равносильны (в том смысле, что они универсальны, а знания, представленные в одной форме,
    могут быть преобразованы в другую), но не равноценны (в том смысле, что для различных предметных областей и различных задач более удобными и эффективными в вычислительном отношении оказываются различные формы представления знания). Основным же преимуществом фреймов как модели представления знаний является способность отражать концептуальную основу организации памяти человека, а также ее гибкость и наглядность.
    Формальные логические модели
    В основе моделей такого типа лежит формальная система, задаваемая четверкой множеств вида: M = .
    Здесь множество T — это множество базовых элементов различной природы (например, слов из некоторого ограниченного словаря, деталей детского конструктора, входящих в состав некоторого набора, и т. д.). Важно, что для множества T существует некоторый способ определения принадлежности или непринадлежности произвольного элемента к этому множеству. Процедура такой проверки может быть любой, но за конечное число шагов она должна давать положительный или отрицательный ответ на вопрос: является ли x элементом множества T? Обозначим эту процедуру как
    П(T).
    Множество P есть множество синтаксических правил. С их помощью из элементов T образуют синтаксически правильные совокупности.
    Например, из слов ограниченного словаря строятся синтаксически правильные фразы, из деталей детского конструктора с помощью гаек и болтов собираются новые конструкции и т. д. Декларируется также существование процедуры П(P), с помощью которой за конечное число шагов можно получить ответ на вопрос: является ли совокупность X синтаксически правильной?

    В множестве синтаксически правильных совокупностей выделяется некоторое подмножество A, элементы которого называются аксиомами. Как и для других составляющих формальной системы, должна также существовать процедура П(A), с помощью которой для любой синтаксически правильной совокупности можно получить ответ на вопрос о принадлежности ее к множеству A.
    Наконец, множество B — это множество правил вывода. Применяя их к элементам A, можно получать новые синтаксически правильные совокупности, к которым снова можно применять правила из B, и т. д. Так формируется множество выводимых в данной формальной системе совокупностей. Если имеется процедура П(B), с помощью которой можно определить для любой синтаксически правильной совокупности, является ли она выводимой, то соответствующая формальная система называется разрешимой. Это показывает, что именно правило вывода является наиболее сложной составляющей формальной системы.
    Для знаний, входящих в базу знаний, можно считать, что множество A образуют все информационные единицы, которые введены в базу знаний извне, а с помощью правил вывода из них выводятся новые производные знания. Другими словами, формальная система представляет собой генератор порождения новых знаний, образующих множество выводимых в данной системе знаний. Это свойство логических моделей делает их привлекательными для использования в базах знаний, оно позволяет хранить в базе лишь знания, которые образуют множество A, а все остальные знания получать из них по правилам вывода.
    Продукционные модели
    Продукционная модель, или модель, основанная на правилах, позволяет представить знания в виде предложений типа: «Если (условие), то
    (действие)». Здесь под условием понимается некоторое предложение —
    образец, по которому осуществляется поиск в базе знаний, а под действием
    — действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее тоже как условия, либо терминальными, или целевыми, завершающими работу системы).
    При использовании продукционной модели база знаний состоит из набора правил. Программа же, управляющая перебором этих правил, называется машиной вывода. Чаще всего вывод бывает прямым (от данных
    — к поиску цели) или обратным (от цели, для ее подтверждения, — к данным).
    Машина вывода выполняет две функции:
    1) просмотр существующих фактов (из рабочей памяти) и правил
    (из базы знаний) и добавление в рабочую память новых фактов;
    2) определение порядка просмотра и применения правил.
    Действие машины вывода основано на применении следующего правила: если известно, что истинно утверждение А, и существует правило вида «если А, то В», тогда утверждение В также истинно.
    Правила срабатывают, если найдены факты, удовлетворяющие их левой части: если истинна посылка, то должно быть истинно и заключение.
    Управляющий компонент машины вывода определяет порядок применения правил и выполняет четыре следующих функции:
    1) сопоставление — образец правила сопоставляется с имеющимися фактами;
    2) выбор — если может быть применено несколько правил, то выбирается только одно из них по какому-либо критерию;
    3) срабатывание — если образец правила совпал с каким-либо фактом, то данное правило срабатывает;
    4) действия — в рабочую память добавляются заключения сработавшего правила.

    Эти действия циклически повторяются, пока мы не дойдем до терминального правила или у нас больше не окажется сопоставлений. Цикл работы машины вывода изображен на рисунке 1.4.
    Рисунок 1.4 - Цикл работы машины вывода
    Пример. Пусть имеется фрагмент базы знаний, состоящий из двух правил.
    П1: Если «отдых — летом» и «человек — активный», то «ехать в горы».
    П2: Если «любит солнце», то «отдых летом».
    Предположим, что в систему поступили данные: «человек активный» и
    «любит солнце».
    Прямой вывод — требуется, исходя из этих данных, получить ответ.
    1-й проход.
    Шаг 1. Пробуем П1 — не работает (не хватает данных «отдых — летом»).
    Шаг 2. Пробуем П2 — работает; в базу поступает факт «отдых — летом».
    2-й проход.
    Шаг 3. Пробуем П1 — работает, активируется цель «ехать в горы», которая и выступает как совет, который будет предложен.

    Обратный вывод — требуется подтвердить выбранную цель при помощи имеющихся правил и данных.
    1-й проход.
    Шаг 1. Цель — «ехать в горы». Пробуем П1 — данных «отдых — летом» нет, они становятся новой целью, и осуществляется поиск правила, где они располагаются в правой части.
    Шаг 2. Цель «отдых — летом». Правило П2 подтверждает цель и активирует ее.
    2-й проход.
    Шаг 3. Пробуем П1 — подтверждается искомая цель.
    Продукционная модель чаще всего применяется в промышленных экспертных системах. Она привлекает разработчиков своей наглядностью, высокой модульностью, легкостью внесения дополнений и изменений и простотой механизма логического вывода.

    1   2   3   4   5   6   7   8   9


    написать администратору сайта