информатика для экономистов. 1. Информатика для экономистов. Учебное пособие Нижний Новгород Издательство Нижегородского госуниверситета 2012
Скачать 0.95 Mb.
|
4.11. Информационно-поисковые системыИнформационно-поисковая система (ИПС) - система, предназначенная для поиска и представления пользователю сведений из специальным образом организованных информационных массивов. В отличие от универсальных СУБД, предназначенных для создания и ведения баз данных универсальной структуры, ИПС обычно рассчитаны на обслуживание специализированных баз данных. Они могут использовать или не использовать конкретные СУБД. Следует различать оболочки ИПС - программы доступа к специально структурированным информационным массивам, которые могут хранить информацию произвольной предметной области, и специализированные ИПС, включающие, помимо программной оболочки, наборы информационных массивов, содержащие подборки документов конкретной предметной области. Оболочку ИПС следует относить к универсальному ППО, а специализированную ИПС - к специализированному ППО (см. ПО поддержки решения задач в конкретной предметной области). Например, программные оболочки правовых баз данных "Гарант" и "Консультант-Плюс" - универсальное ППО, которое, в принципе, позволяет вести информационные массивы любой предметной области. Однако в наибольшей степени они приспособлены именно для организации доступа к правовой информации. Массовыми информационно-поисковыми системами являются универсальные и специализированные мультимедиа-энциклопедии. Мультимедиа-энциклопедии - это специальные программные оболочки и информационные подборки, обеспечивающие хранение и доступ к большим объемам сведений по разным темам. Универсальные мультимедиа-энциклопедии часто основываются на том или ином энциклопедическом словаре или полной энциклопедии, но дополняют тексты системой гипертекстовых ссылок, изображениями, музыкальными и видеофрагментами. Часто ИПС делят на документальные и фактографические. Документальные ИПС выдают только перечни документов, по заданным пользователем формальным критериям поиска. Фактографические ИПС решают задачу поиска в информационных массивах интересующих пользователя сведений (фактов). Здесь используются различные механизмы интеллектуального анализа текстовых данных, которые позволяют автоматически анализировать массивы текстовых данных с целью отбора сведений, наиболее соответствующих пользовательскому запросу. Анализ смысловой близости текстов в простейшем случае производится по статистике наличия в них определенных слов и словесных комбинаций в произвольных словоформах. Наиболее распространенными программами такого рода являются поисковые системы Интернет. Некоторые программы позволяют проводить еще и анализ смысловой близости текстов по статистике появления близких к заданным словам и фразам понятий (Galaktika-ZOOM). Есть программы, которые позволяют составлять аннотации к тексту - краткое описание содержания объемного текста. Системы управления документооборотом предназначены для систематизации, поиска и управления доступом к массивам разнородных слабоструктурированных документов (Lotus Notes, FileNet, Documentum, Евфрат). Позволяют систематизировать и осуществлять поиск документов и их совокупностей по нескольким различным признакам. Документы могут храниться на разных компьютерах локальной или глобальной сети, использующих разные операционные и файловые системы. Системы автоматизированного проектирования предназначены для решения задач проектирования изделий или архитектурных сооружений. Имеют средства создания, редактирования и печати чертежей, моделирования сложных двух- и трехмерных объектов, позволяют выполнять сложные инженерные расчеты. Наиболее популярными программами данного класса являются разработки фирмы Autodesk. ПО решения задач прикладной математики и статистики реализуют методы прикладной математики (MatLab, Matematica и др.) и математической статистики (SPSS, Statistica и др.). Некоторые математические пакеты позволяют выполнять не только численное решение задач, но и символьные операции над формулами (дифференцирование, интегрирование, алгебраические преобразования). ПО обработки графических, аудио- и видеоданных программы данного класса позволяют просматривать/прослушивать, создавать, редактировать и осуществлять конвертацию форматов графических, аудио- и видеоданных. Существует множество программ для просмотра мультимедиа-данных. Наиболее распространенными и известными программами просмотра мультимедиа-файлов являются Windows Media Player (воспроизведение файлов любого типа), WinAmp (воспроизведение музыкальных файлов), Irfan View (просмотр графических файлов). Создание мультимедиа-файлов возможно как в ручном режиме, так и автоматически, путем ввода в компьютер аналоговых данных и их оцифровки. Ручной ввод мультимедиа-данных осуществляется графическими и музыкальными редакторами, а автоматический - считыванием их со сканера и цифровых фотокамер (рисунки, фотографии), звуковоспроизводящей аппаратуры (аудиоданные), видеомагнитофона или видеокамеры (видеоданные) под управлением специальных программ, обеспечивающих ввод и оцифровку (если нужно) входящего сигнала. Для обработки мультимедиа-данных также существует множество программ. Для работы с растровой графикой наиболее мощными пакетами являются Adobe Photoshop, Corel Photopaint, Gimp; для редактирования музыкальных файлов - Cool Edit и Sound Forge; для редактирования видео - Adobe Premiere и Pinnacle Studio. Еще одной важной разновидностью ПО обработки мультимедиа-данных являются разнообразные программы конвертирования форматов. Конвертирование форматов графических данных обычно производится непосредственно графическими редакторами. Существует множество программ для конвертирования форматов музыкальных файлов. Одной из наиболее популярных программ конвертирования форматов видеоданных является свободно распространяемая программа VirtualDub. ПО управления знаниями - это широкий класс программных средств, реализующих функции искусственного интеллекта. Наиболее востребованными на текущий момент являются: системы аналитической обработки данных (OLAP-системы); системы “раскопки данных” (Data Mining); OLAP-системы (OnLine Analitical Processing) предназначены для организации произвольных выборок из специально организованных массивов данных, группирования и визуализации выбранных данных в соответствии с указанными пользователем критериями и правилами. В отличие от СУБД, при их использовании пользователю не надо составлять запросы, поскольку здесь реализуются специальные интерфейсы манипулирования данными и настройки способов их представления. Простейшим примером OLAP-системы является средство “сводные таблицы” Excel. Однако существуют и более мощные инструменты организации выборок и визуализации данных. Они бывают необходимы для организации доступа к очень большим массивам данных, хранящимся в БД. Для ускорения доступа к очень большим БД, необходимые данные могут быть предварительно выбраны из БД и сгруппированы в так называемый “многомерный куб” - структуру, специально оптимизированную для выполнения анализа. Data mining - это процесс автоматического выделения ранее неизвестной информации из больших баз данных. Системы Data mining позволяют автоматически формулировать гипотезы о наличии определенных взаимосвязей между данными. В основе систем Data Mining лежит математический аппарат, базирующийся на алгоритмах систем искусственного интеллекта (статистические методы, генетические алгоритмы, нейронные сети, алгоритмы распознавания образов и др.). |