Главная страница
Навигация по странице:

  • 4.1. Извлечение информации

  • Атрибуты

  • Полиморфизм

  • Прагматическое обогащение

  • 4.2. Обработка информации

  • Архитектуры с одиночным потоком команд и данных (SISD).

  • Архитектуры с множественным потоком команд и одиночным потоком данных (MISD).

  • Архитектуры с множественным потоком команд и множественным потоком данных (MIMD).

  • Принятие решений в условиях определенности

  • Принятие решений в условиях риска

  • Принятие решений в условиях неопределенности

  • Принятие решений в условиях многокритериальности

  • OLAP (On-Line Analitycal Processing)

  • EIS (Execution Information System)

  • DSS (Desicion Support System)

  • PS (Presentation Services)

  • BL (Business or Application Logic)

  • лекция. Лекция по ТОИ. Модели процессов извлечения, обработки данных, хранения, представления и использования в информационных системах


    Скачать 22.37 Kb.
    НазваниеМодели процессов извлечения, обработки данных, хранения, представления и использования в информационных системах
    Анкорлекция
    Дата29.04.2022
    Размер22.37 Kb.
    Формат файлаdocx
    Имя файлаЛекция по ТОИ.docx
    ТипДокументы
    #504439

    Модели процессов извлечения, обработки данных, хранения, представления и использования в информационных системах

    План

    4.1. Извлечение информации.

    4.2. Обработка информации.

    4.3. Хранение информации.

    4.4. Представление и использование информации.

    4.1. Извлечение информации

    Объекты и их свойства, процессы и функции, выполняемые этими объектами или для них являются источниками данных в любой предметной области. Любая предметная область рассматривается в виде трех представлений:

    • реальное представление предметной области;

    • формальное представление предметной области; • информационное представление предметной области.

    При извлечении информации важное место занимают различные формы и методы исследования данных:

    • поиск ассоциаций, связанных с привязкой к какому-либо событию;

    • обнаружение последовательностей событий во времени;

    • выявление скрытых закономерностей по наборам данных, путем определения причинно-следственных связей между значениями определенных косвенных параметров исследуемого объекта (ситуации, процесса);

    • оценка важности (влияния) параметров на развитие ситуации;

    • классифицирование (распознавание), осуществляемое путем поиска критериев, по которым можно было бы относить объект (события, ситуации, процессы) к той или иной категории;

    • кластеризация, основанная на группировании объектов по каким-либо признакам;

    • прогнозирование событий и ситуаций.

    Декомпозиция – научный метод, использующий структуру задачи и позволяющий заменить решение одной большой задачи решением серии меньших задач.

    Декомпозиция на основе объектно-ориентированного подхода основана на выделении следующих основных понятий: объект, класс, экземпляр.

    Объект – это абстракция множества предметов реального мира, обладающих одинаковыми характеристиками и законами поведения. Объект характеризует собой типичный неопределенный элемент такого множества. Основной характеристикой объекта является состав его атрибутов (свойств).

    Атрибуты – это специальные объекты, посредством которых можно задать правила описания свойств других объектов.

    Экземпляр объекта – это конкретный элемент множества. Например, объектом может являться государственный номер автомобиля, а экземпляром этого объекта – конкретный номер.

    Класс – это множество предметов реального мира, связанных общностью структуры и поведением. Элемент класса – это конкретный элемент данного множества.

    Понятия полиморфизма и наследования определяют эволюцию объектно-ориентированной системы, что подразумевает определение новых классов объектов на основе базовых.

    Полиморфизм – способность объекта принадлежать более чем одному типу.

    Наследование выражает возможность определения новых классов на основе существующих с возможностью добавления или переопределения данных и методов.

    Инкапсуляция – это процесс отделения друг от друга элементов объекта, определяющих его устройство и поведение; инкапсуляция служит для того, чтобы изолировать контрактные обязательства абстракции от их реализации.

    Среди методов обогащения информации различают структурное, статистическое, семантическое и прагматическое обогащения.

    Структурное обогащение предполагает изменение параметров сообщения, отображающего информацию в зависимости от частотного спектра исследуемого процесса, скорости обслуживания источников информации и требуемой точности.

    При статистическом обогащении осуществляют накопление статистических данных и обработку выборок из генеральных совокупностей накопленных данных.

    Семантическое обогащение означает минимизацию логической формы, исчислений и высказываний, выделение и классификацию понятий, содержания информации, переход от частных понятий к более общим. В итоге семантического обогащения удается обобщенно представить обрабатываемую либо передаваемую информацию и устранить логическую противоречивость в ней.

    Прагматическое обогащение является важной ступенью при использовании информации для принятия решения, при котором из полученной информации отбирается наиболее ценная, отвечающая целям и задачам пользователя.

    Таким образом, процесс извлечения информации связан с переходом от реального представления предметной области к его описанию в формальном виде и в виде данных, которые отражают это представление.

    4.2. Обработка информации

    Обработка информации состоит в получении одних «информационных объектов» из других «информационных объектов» путем выполнения некоторых алгоритмов и является одной из основных операций, осуществляемых над информацией, и главным средством увеличения ее объема и разнообразия.

    На самом верхнем уровне можно выделить числовую и нечисловую обработку. При числовой обработке используются такие объекты, как переменные, векторы, матрицы, многомерные массивы, константы и т.д. При нечисловой обработке объектами могут быть файлы, записи, поля, иерархии, сети, отношения и т.д.

    С точки зрения реализации на основе современных достижений вычислительной техники выделяют следующие виды обработки информации:

    • последовательная обработка, применяемая в традиционной фоннеймановской архитектуре ЭВМ, располагающей одним процессором;

    • параллельная обработка, применяемая при наличии нескольких процессоров в ЭВМ;

    • конвейерная обработка, связанная с использованием в архитектуре ЭВМ одних и тех же ресурсов для решения разных задач, причем если эти задачи тождественны, то это последовательный конвейер, если задачи одинаковые – векторный конвейер.

    Принято относить существующие архитектуры ЭВМ с точки зрения обработки информации к одному из следующих классов (Классификация параллельных архитектур по Флинну).

    Архитектуры с одиночным потоком команд и данных (SISD).

    Традиционная архитектура фон Неймана + КЭШ + память + конвейеризация Архитектуры с одиночными потоками команд и данных (SIMD). Особенностью данного класса является наличие одного (центрального) контроллера, управляющего рядом одинаковых процессоров.

    Архитектуры с множественным потоком команд и одиночным потоком данных (MISD). Один из немногих – систолический массив процессоров, в котором процессоры находятся в узлах регулярной решетки, роль ребер которой играют межпроцессорные соединения. К классу MISD ряд исследователей относит конвейерные ЭВМ, однако это не нашло окончательного признания, поэтому можно считать, что реальных систем – представителей данного класса не существует.

    Архитектуры с множественным потоком команд и множественным потоком данных (MIMD). К этому классу могут быть отнесены следующие конфигурации: мультипроцессорные системы, системы с мультобработкой, вычислительные системы из многих машин, вычислительные сети.

    Создание данных, как процесс обработки, предусматривает их образование в результате выполнения некоторого алгоритма и дальнейшее использование для преобразований на более высоком уровне.

    Модификация данных связана с отображением изменений в реальной предметной области, осуществляемых путем включения новых данных и удаления ненужных.

    Контроль, безопасность и целостность направлены на адекватное отображение реального состояния предметной области в информационной модели и обеспечивают защиту информации от несанкционированного доступа (безопасность) и от сбоев и повреждений технических и программных средств.

    Поддержка принятия решения является наиболее важным действием, выполняемым при обработке информации.

    Создание документов, сводок, отчетов заключается в преобразовании информации в формы, пригодные для чтения как человеком, так и компьютером. С этим действием связаны и такие операции, как обработка, считывание, сканирование и сортировка документов.

    При преобразовании информации осуществляется ее перевод из одной формы представления или существования в другую, что определяется потребностями, возникающими в процессе реализации информационных технологий.

    В зависимости от степени информированности о состоянии управляемого процесса, полноты и точности моделей объекта и системы управления, взаимодействия с окружающей средой, процесс принятия решения протекает в различных условиях:

    1. Принятие решений в условиях определенности. В этой задаче модели объекта и системы управления считаются заданными, а влияние внешней среды – несущественным. Поэтому между выбранной стратегией использования ресурсов и конечным результатом существует однозначная связь, откуда следует, что в условиях определенности достаточно использовать решающее правило для оценки полезности вариантов решений, принимая в качестве оптимального то, которое приводит к наибольшему эффекту.

    2. Принятие решений в условиях риска. В отличие от предыдущего случая для принятия решений в условиях риска необходимо учитывать влияние внешней среды, которое не поддается точному прогнозу, а известно только вероятностное распределение ее состояний. В этих условиях использование одной и той же стратегии может привести к различным исходам, вероятности появления которых считаются заданными или могут быть определены.

    3. Принятие решений в условиях неопределенности. Как и в предыдущей задаче между выбором стратегии и конечным результатом отсутствует однозначная связь. Кроме того, неизвестны также значения вероятностей появления конечных результатов, которые либо не могут быть определены, либо не имеют в контексте содержательного смысла.

    4. Принятие решений в условиях многокритериальности. В любой из перечисленных выше задач многокритериальность возникает в случае наличия нескольких самостоятельных, не сводимых одна к другой целей. Наличие большого числа решений усложняет оценку и выбор оптимальной стратегии. Одним из возможных путей решения является использование методов моделирования.

    Экспертная система пользуется знаниями, которыми она обладает в своей узкой области, чтобы ограничить поиск на пути к решению задачи путем постепенного сужения круга вариантов.

    Для решения задач в экспертных системах используют:

    • метод логического вывода, основанный на технике доказательств, называемой резолюцией и использующей опровержение отрицания

    (доказательство «от противного»);

    • метод структурной индукции, основанный на построении дерева принятия решений для определения объектов из большого числа данных на входе;

    • метод эвристических правил, основанных на использовании опыта экспертов, а не на абстрактных правилах формальной логики;

    • метод машинной аналогии, основанный на представлении информации о сравниваемых объектах в удобном виде, например, в виде структур данных, называемых фреймами.

    Источники «интеллекта», проявляющегося при решении задачи, могут оказаться бесполезными либо полезными или экономичными в зависимости от определенных свойств области, в которой поставлена задача. Исходя из этого, может быть осуществлен выбор метода построения экспертной системы или использования готового программного продукта.

    Процесс выработки решения на основе первичных данных, можно разбить на два этапа: выработка допустимых вариантов решений путем математической формализации с использованием разнообразных моделей и выбор оптимального решения на основе субъективных факторов.

    Информационные потребности лиц, принимающих решение, во многих случаях ориентированы на интегральные технико-экономические показатели, которые могут быть получены в результате обработки первичных данных, отражающих текущую деятельность предприятия.

    Для поддержки принятия решений обязательным является наличие следующих компонент:

    • обобщающего анализа;

    • прогнозирования;

    • ситуационного моделирования.

    Аналитические системы поддержки принятия решений (СППР) позволяют решать три основных задачи: ведение отчётности, анализ информации в реальном времени (OLAP) и интеллектуальный анализ данных.

    OLAP (On-Line Analitycal Processing) – сервис представляет собой инструмент для анализа больших объемов данных в режиме реального времени. Взаимодействуя с OLAP-системой, пользователь сможет осуществлять гибкий просмотр информации, получать произвольные срезы данных, и выполнять аналитические операции детализации, свертки, сквозного распределения, сравнения во времени.

    В зависимости от функционального наполнения интерфейса системы выделяют два основных типа систем поддержки принятия решений : EIS и DSS.

    EIS (Execution Information System) – информационные системы руководства предприятия. Эти системы ориентированы на неподготовленных пользователей, имеют упрощенный интерфейс, базовый набор предлагаемых возможностей, фиксированные формы представления информации.

    DSS (Desicion Support System) – полнофункциональные системы анализа и исследования данных, рассчитанные на подготовленных пользователей, имеющих знания как в части предметной области исследования, так и в части компьютерной грамотности.

    PS (Presentation Services) – средства представления. Обеспечиваются устройствами, принимающими ввод от пользователя и отображающими то, что сообщает ему компонент логики представления PL, плюс соответствующая программная поддержка.

    PL (Presentation Logic) – логика представления. Управляет взаимодействием между пользователем и ЭВМ. Обрабатывает действия пользователя по выбору альтернативы меню, по нажатию кнопки или выбору элемента из списка.

    BL (Business or Application Logic) – прикладная логика. Набор правил для принятия решений, вычислений и операций, которые должно выполнить приложение.

    DL (Data Logic) – логика управления данными. Операции с базой данных (SQL-операторы SELECT, UPDATE и INSERT), которые нужно выполнить для реализации прикладной логики управления данными.

    DS (Data Services) – операции с базой данных. Действия СУБД, вызываемые для выполнения логики управления данными, такие как манипулирование данными, определения данных, фиксация или откат транзакций и т.п. СУБД обычно компилирует SQL-приложения.

    FS (File Services) – файловые операции. Дисковые операции чтения и записи данных для СУБД и других компонент. Обычно являются функциями ОС.


    написать администратору сайта