Главная страница
Навигация по странице:

  • 2.6 Система индексирования

  • Тема 3. ИНФОРМАЦИОННО-ПРАВОВЫЕ СИСТЕМЫ, ИХ СОСТАВ И СТРУКТУРА

  • Информационно-правовая система

  • Компоненты информационной системы

  • 3.4 Информационно-правовая система «Гарант»

  • Основное меню (меню Информация

  • Меню Поиск.

  • лекция по информатике. Информация и информационные системы. Основные понятия и классификации


    Скачать 114.79 Kb.
    НазваниеИнформация и информационные системы. Основные понятия и классификации
    Анкорbyjcnhfyysq
    Дата24.04.2023
    Размер114.79 Kb.
    Формат файлаdocx
    Имя файлалекция по информатике.docx
    ТипДокументы
    #1085802
    страница4 из 7
    1   2   3   4   5   6   7

                2.5 Виды и классификация ИПЯ


     

    1. Иерархические классификации, которые обеспечивают возможность расширения «вниз», т.е. уточнения описания документа, но они отличаются жесткостью, их трудно изменять.

    2. Язык предметных заголовков – как и иерархическая классификация использует фиксированное число предметных классов (часто располагаемых по алфавиту), но для его терминов  обычно не используется определенный код. Язык позволяет любому документу приписывать более чем один термин, почти не имеет структуры и средств для выражения взаимоотношений между терминами.  Этот язык можно считать языком иерархической классификации, но с ослабленной структурой, что облегчает его разработку, но затрудняет изучение и применение (например, в журналах – рубрики, классификаторы специальностей в высшем образовании и т.д.).

    Эти языки иногда называют предкоординированными системами, т.к. семантические комбинации терминов не определены в словарном запасе ИПЯ, а составляются его разработчиками.  Такие языки неизбежно имеют пробелы, в них трудно отражать новые предметные области. Поэтому для более совершенного описания содержания документа стало применяться координатное индексирование или индексирование ключевыми словами:

    1. система ключевых слов с фиксированным словарем (для узкоспециализированных

    ИПС с унифицированной терминологией);

    1. система ключевых слов со свободным словарем (позволяет выбрать для описания документа любые слова, за исключением  союзов и предлогов,  руководствуясь их ролью в отображении содержания документа);

    2. языки с синтаксисом (грамматикой);

    3. языки фасетного индексирования (пример: уточненное описание товара, включая фасон, цвет, цену и др. характеристики товара). Различные роли, которые играют дескрипторы, называются фасетами. Дескриптор – ключевое слово.

    4. язык фраз использует индексирующие фразы, но нет возможности расширения ПОД.

    5. язык пермутационного индексирования. Пермутационный указатель включает контекст каждого слова во фразе и называется указателем ключевых слов. Язык является трудоемким.

    6. естественный язык. Наиболее точно отражает семантику текста, но возникают проблемы с синонимами, омонимами и т.д. Трудоемок, часто неэффективен.

    Т.о. существуют ИПЯ, использующие ключевые слова, дескрипторные ИПЯ без грамматики и с грамматикой, ИПЯ с тезаурусом и т.д.

    При выборе ИПЯ оценивается их эффективность: семантическая сила, многозначность, компактность и стоимость. Оценка ИПЯ – это составная часть проблемы оценки  эффективности ИС, которые мы будем изучать позже. 

     

                2.6 Система индексирования


     

    Процедуру перевода с естественного языка на ИПЯ называют индексированием. 

    Результатом  такого перевода является ПОД (при вводе документов в ИПС)  или ПОЗ (при индексировании запросов пользователя).

    Процедура индексирования связана с большими затратами труда и при неалгоритмическом характере весьма трудоемка и ограничивает семантические возможности ИПЯ. Поэтому большое внимание уделяется возможности автоматизации этого процесса. 

    Проблема индексирования связана с семантическим анализом текстов документов. Сложность ее связана с тем, что индексирование документов, вводимых в поисковые массивы, и запросов пользователя разнесены во времени. 

    Для алгоритмизации и автоматизации индексирования необходимо решить проблему выбора для включения в ПОД или Поз наиболее значимых ключевых слов, дескрипторов, фраз.

    Типы систем индексирования:

    1. системы свободного индексирования. Из индексируемого документа выписываются в ПОД слова или словосочетания, которые отражают содержание индексируемого документа.  Элементами ПОД могут быть слова, отсутствующие в этих элементах, но отражающие более точно смысл его текста с точки зрения целей создания ИПС.  Выписанные элементы упорядочиваются в алфавитном порядке.  Такой упорядоченный набор слов (словосочетаний) представляет собой ПОД при этом типе индексирования.  Аналогично из текста запроса формируется ПОЗ.  ((Такой процесс индексирования является неалгоритмичным, т.е. неавтоматизируемым)).

    2. Метод полусвободного индексирования. Из документа выписывают слова и словосочетания вначале так же, как и при свободном индексировании. Но выписанные элементы сравнивают затем с фиксированным словарем, не найденные в нем – устраняют, а оставшиеся, упорядочиваемые в алфавитном порядке, представляют собой ПОД или ПОЗ. 

    3. Метод, основанный на статистическом подходе. Выбор слов (выражений) исходного текста, подлежащих включению в ПОД, производится на основе статистического анализа текста, при котором его слова рассматриваются как знаки, не имеющих семантических значений. При этом предлагаются различные статистические критерии, основанные на сопоставлении относительной частоты употребления слова в документе и относительной частоты употребления слова в представительском  массиве документов (т.е. в статистической выборке).  Этот способ индексирования может быть алгоритмизирован и автоматизирован. 

    4. Системы индексирования, контролируемые заданным словарем (тезаурусом). Каждое слово текста сравнивается с точностью до основы со словарем, совпавшие слова записываются в ПОД.

    Тема 3.  ИНФОРМАЦИОННО-ПРАВОВЫЕ СИСТЕМЫ, ИХ СОСТАВ И СТРУКТУРА

    3.3 Понятие информационно-правовой системы

    Информационно-правовая система представляет собой систему, функционирование которой во времени заключается в сборе, хранении, обработке и распространении правовой информации о деятельности какого-то объекта реального мира.

    Информационно-правовая  система включает следующие элементы:

    1. структура – множество элементов системы и взаимосвязей между ними; 

    2. входы и выходы – материальные потоки или потоки сообщений, поступающие в систему или выводимые ею. Каждый входной поток характеризуется набором параметров; 

    3. закон проведения системы – функция, связывающая изменения входа и выхода системы;

    4. цель и ограничения. Процесс функционирования системы описывается рядом переменных.Часть этих переменных (или одна переменная) должна поддерживаться в экстремальном значении (цель).

    При решении любых задач с использованием ЭВМ требуется наличие ряда компонентов: 

    • исходной и нормативно-справочной информации; 

    • метода (алгоритма) решения задачи, записанного в виде программы, которая может быть выполнена на ЭВМ;

    • самой ЭВМ как исполнителя алгоритмов; 

    • пользователей, т. е. лиц, которые используют результаты решения задачи в своей профессиональной деятельности.

    Для функционирования ИПС необходимы компоненты, аналогичные названным выше, но с более сложной организацией, вызванной многообразием действий, которые должна производить ИПС. 

    Компоненты информационной системы – это база данных, концептуальная схема и информационный процессор, образующие вместе систему хранения и манипулирования данными. 

    Среди известных свойств информационных систем рассмотрим следующие – относительность, делимость и целостность. 

    Свойство относительности устанавливает, что состав элементов, взаимосвязей, входов, выходов, целей и ограничений зависит от целей исследователя. Реальный мир богаче системы. Поэтому от исследователя и его целей зависит, какие стороны реального мира и с какой полнотой будет охватывать система. При выделении системы некоторые элементы, взаимосвязи, входы и выходы не включаются в нее из-за слабого влияния на остающиеся элементы, из-за наличия самостоятельных целей, плохо согласующихся с целью всей системы, и т. д. Они образуют внешнюю среду для рассматриваемой системы. 

    Делимость означает, что систему можно представить состоящей из относительно самостоятельных частей – подсистем, каждая из которых может рассматриваться как система. Возможность выделения подсистем (декомпозиция системы) упрощает ее анализ, так как число взаимосвязей между подсистемами и внутри подсистем обычно меньше, чем число связей непосредственно между всеми элементами системы. Выделение подсистем проводит исследователь, и оно условно. 

    Свойство целостности указывает на согласованность цели функционирования всей системы с целями функционирования ее подсистем и элементов. 

    Надо также иметь в виду, что система, как правило, имеет больше свойств, чем составляющие ее элементы. Так, предприятие обладает юридической самостоятельностью, а его подразделения – нет. 

    Информационная система создается для конкретного объекта действительности и должна в определенной мере копировать взаимосвязи элементов объекта. Например, задачи обработки данных обеспечивают обычно рутинную обработку и хранение экономической информации с целью выдачи (регулярной или по запросам) сводной информации, которая может потребоваться для управления объектом; автоматизация конторских работ предполагает наличие в ИПС системы ведения картотек, системы обработки текстовой информации, системы машинной графики, системы электронной почты и связи. Поисковые задачи имеют свою специфику, и информационный поиск представляет собой интегральную задачу, которая рассматривается независимо от экономики или иных сфер использования найденной информации. 

    Существуют следующие принципы построения и функционирования ИПС: 

    1)     соответствие. ИПС должна обеспечивать функционирование объекта с заданной эффективностью. Критерий эффективности должен быть количественным; 

    2)     экономичность. Затраты на обработку информации в ИПС должны быть меньше экономического выигрыша на объекте при использовании этой информации; 

    3)     регламентность. Большая часть информации в ИПС поступает и обрабатывается по расписанию, со строгой периодичностью

    4)     самоконтроль. Непрерывная работа ИПС по обнаружению и исправлению ошибок в данных и процессах их обработки; 

    5)     интегральность. Однократный ввод информации в ИПС и ее многократное, многоцелевое использование; 

    6)     адаптивность. Способность ИПС изменять свою структуру и закон поведения для достижения оптимального результата при изменяющихся внешних условиях. 

    Среди других ососбенностей ИПС следует назвать обработку больших объемов информации по сравнительно простым алгоритмам,  высокий удельный вес логической обработки данных (сортировка, группировка, поиск, корректировка) и представление подавляющей части информации в виде документов. 

    3.4 Информационно-правовая  система «Гарант»

    Квалификационный уровень современного специалиста в значительной степени определяется эффективностью его работы с клиентскими и юридическими документами. В понятие эффективности, кроме всего прочего, входят такие компоненты, как полнота, логическая обоснованность и оперативность предлагаемых клиенту юридических решений. Подобные решения в современных условиях высокой деловой активности могут быть приняты только на основе солидной информационной поддержки, которая обеспечивается широким использованием в юридической практике специализированных информационно-поисковых систем (ИПС).

    Знание подобных систем и умение работать с ними составляют необходимые (но, естественно, недостаточные) условия качественной подготовки специалистов юридического профиля. В свою очередь, успешное освоение ИПС связано с необходимостью изучения некоторого базового учебного материала, относящегося к дисциплине «Информатика»:

    1. Персональный компьютер: аппаратное, информационное и программное обеспечение.

    2. Работа с файлами, каталогами и дисками в операционной системе Windows.

    3. Работа с приложениями MS Office, в частности с текстовым редактором Word.

    В настоящее время в сфере информационного обеспечения юридической деятельности в России официально признаны и получили наибольшее распространение ИПС «Гарант» и «КонсультантПлюс». Обе системы имеют близкие технические показатели по мощности установленных баз данных (порядка 800 000 документов), времени доступа, режимам работы, периоду обновления баз данных (не реже двух раз в месяц). Основное отличие этих систем состоит в организации пользовательского интерфейса, что, однако, не мешает быстрому усвоению алгоритмов работы с той или иной системой, например, для поиска документов и подготовки их к печати. 

    Информационно-правовая система «Гарант» предоставляет пользователю множество возможностей:

    –       открытие информационной базы;

    –       запись текущего документа в файл;

    –       печать текущего документа или списка на принтере;

    –       переключение в режим предварительного просмотра печати;

    –       копирование выделенного фрагмента в буфер обмена;

    –       копирование в Microsoft Word;

    –       возврат к предыдущему документу или списку;

    –       вызов списка просмотренных документов (истории);

    –       вызов справки к текущему документу;

    –       просмотр списка респондентов текущего документа;

    –       просмотр списка корреспондентов текущего документа;

    –       поиск словосочетания в текущем документе или списке;

    –       поиск документов по реквизитам;

    –       просмотр списка документов, найденных при поиске по реквизитам;

    –       поиск по ситуации (с использованием словаря ключевых слов);

    –       просмотр списка документов, найденных при поиске по ситуации;

    –       поиск по источнику опубликования;

    –       сохранение текущего списка в папке;

    –       открытие списка, сохраненного в папке;

    –       установка закладки;

    –       просмотр списка закладок;

    –       показ комментариев (автоматически включается при входе в документ);

    –       увеличение размеров всех шрифтов;

    –       уменьшение размеров всех шрифтов;

    –       остановка текущей операции, например сортировки длинного списка;

    –       вызов диалогового окна установки фильтров;

    –       отмена действия предыдущего фильтра;

    –       повторное применение фильтра;

    –       сворачивание или разворачивание списка ссылок на документы;

    –       список сохраненных ранее фильтров.

    Чтобы обратиться к справочному руководству, достаточно выбрать команду Содержание в пункте меню ?. Появится оглавление справочного руководства. Чтобы получить подсказку в диалоговом окне (например, в диалогах поиска документов, печати текста на принтере и др.), применяются пункты меню Справка или Помощь. 

    Командное меню – это строка в верхней части окна системы. Рассмотрим Меню Информация. Команда 

    Основное меню (меню Информация) представляет основные возможности системы. Из него можно перейти к классификаторам правовой и экономической информации, произвести поиск документов, обновить информационный банк.

    Команда Документы (меню Информация) осуществляет переход к общему классификатору всех содержащихся в информационном банке документов.

    Команда Судебная и арбитражная практика (меню Информация) осуществляет переход к классификатору документов по судебной и арбитражной практике.

    Команда Международные договоры (меню Информация) осуществляет переход к классификатору международных договоров.

    Команда Разъяснения и комментарии (меню Информация) применяется для перехода к рубрикатору, состоящему из двух разделов. Первый из них включает собственно комментарии к законодательству, а второй содержит такие подразделы, как «Налоговое законодательство», «Бухгалтерский учет», «Статистическая отчетность» и т. д.

    Команда Проекты законов (меню Информация) – переход к рубрикатору проектов законов.

    Команда Формы документов (меню Информация) осуществляет переход к рубрикатору форм документов: бланков бухгалтерской и статистической отчетности, расчетов по налогам.

    Команда Бизнес-справки (меню Информация) используется, чтобы перейти к рубрикатору бизнес-справок.

    Команда Налоговый календарь (меню Информация) используется, чтобы перейти к налоговому календарю.

    Команда Новые документы (меню Информация) применяется для просмотра списков новых и измененных документов.

    Команда Информация для пользователя (меню Информация) применяется для просмотра информации о системе «Гарант», информационных услугах и льготах для пользователей системы.

    Меню Поиск.

    Команда Поиск по реквизитам... (меню Поиск) – кнопка панели инструментов для поиска документов по реквизитам.

    Команда Результаты поиска по реквизитам (меню Поиск).– кнопка панели инструментов для просмотра списка документов, найденных при поиске по реквизитам.

    Команда Поиск по ситуации... (меню Поиск) -– кнопка панели инструментов для поиска по ситуации (с использованием словаря ключевых слов).

    Команда Результаты поиска по ситуации (меню Поиск) -– кнопка панели инструментов для просмотра списка документов, найденных при поиске по ситуации.

    Команда Поиск по источнику опубликования (меню Поиск) позволяет быстро получить требуемый документ, если известны его источник и дата публикации.

    Чтобы найти документы по источнику опубликования, перейти к классификатору печатных изданий, выбрав команду Поиск по источнику опубликования в меню Поиск. С помощью мыши или стрелками выберите интересующее вас издание, год и месяц публикации, а затем номер или выпуск издания. В текущем окне появится список документов системы «Гарант», которые были опубликованы в данном номере.

    Команда Поиск контекста... (меню Поиск) – кнопка панели инструментов для поиска слова или словосочетания в тексте текущего документа.

    Команда Поиск следующего контекста (меню Поиск) осуществляет поиск следующего вхождения словосочетания в тексте текущего документа или списка.

    Команда Фильтры поиска (меню Поиск) выбирает один из сохраненных фильтров для фильтрации документов текущего списка или задает параметры нового фильтра.

    –  кнопка панели инструментов для вызова окна установки фильтров.

    –  список сохраненных ранее фильтров.
    1   2   3   4   5   6   7


    написать администратору сайта