Информатика. Инфор-ные системы_УП. Учебное пособие для студентов специальности 080801 Прикладная информатика (в экономике)
Скачать 1.67 Mb.
|
WWW —распределенная гипертекстовая информационная система World Wide Web (Всемирная паутина) предоставляет удобный доступ к большинству информационных архивов Ин- тернета. Особенностью системы является механизм гипертек- стовых ссылок, благодаря которым пользователь может про- сматривать материалы в порядке выбора этих ссылок. Многие 103 интерфейсы данной технологии позволяют выбирать интере- сующий материал простым нажатием кнопки мыши на нужном слове или поле графической картинки. Система универсальных адресов дает возможность проадресовать практически все ин- формационные ресурсы сети Internet. Многие издательства взя- ли WWW на вооружение для создания электронных версий сво- их журналов. В системе WWW существует большое количество различного рода каталогов, которые позволяют ориентироваться в сети Internet. Кроме того, пользователи могут выполнять даже удаленные программы или смотреть фильмы по сети. Такой сервис не обеспечивается другими информационными система- ми сети Internet. Gopher —распределенная информационная система сети Internet. В основу ее интерфейсов положена идея иерархических каталогов. Внешне Gopher выглядит как огромная файловая система, которая расположена на компьютерах сети Internet. Первоначально Gopher задумывался как информационная сис- тема университета с информационными ресурсами факультетов, кафедр, общежитий и т.п. До сих пор основные информацион- ные ресурсы системы сосредоточены в университетах. Gopher считается простой системой, легкой в установке и администри- ровании, достаточно надежной и защищенной. Количество сер- веров Gopher на 1994 г. превышало число серверов WWW в 1,5 раза, и до 1995 г. темпы роста установок серверов Gopher опережали остальные ресурсы сети. В России Gopher-серверы не так распространены, как во всем мире; профессионалам больше нравится World Wide Web. WAIS —распределенная информационно-поисковая сис- тема сети Internet. WAIS разработана четырьмя ведущими аме- риканскими компаниями, и первое время она была коммерче- ским продуктом, пока не появилась свободно распространяемая версия — free WAIS. В основу системы положен принцип поис- ка информации с использованием логических запросов, осно- ванных на применении ключевых слов. Клиент ищет по всем серверам WAIS на предмет наличия на них документов, удовле- творяющих запросу. Система широко применяется как поиско- вая машина в других информационных сервисах сети Internet, 104 например в WWW и Gopher. Наиболее известным проектом, где была применена WAIS, является электронная версия энцикло- педии «Британика». LISTSER V —система почтовых списков BITNET. LISTSER V специально ориентирован на применение в качестве транспорта электронной почты. Доступ к нему в интерактивном режиме затруднен. В мире насчитывается много сотен списков LISTSER V, которые организованы по группам интересов, на- пример существуют группы разработчиков программ ядерно- физических расчетов EGS-4 и любителей научной фантастики. Х.500. Европейский стандарт для компьютерных справоч- ных служб. Базы данных Х.500 содержат информацию о пользо- вателях сети, их электронные и обычные адреса, идентификато- ры и реальные имена, должности и места службы. Кроме того, хранится информация не только о физических лицах, но и об организациях. В последнем случае дается краткое описание ос- новных направлений их деятельности. WHOIS — распределенная система, поэтому запросы от- правляются по всему множеству серверов WHOIS в сети Internet, если только не указан адрес конкретного сервера. TRICKLE. Доступ по почте к архивам RTF, который орга- низован через специальный шлюз, который имеет навигаци- онные средства для поиска нужной информации в сети. Пользо- ватель может вести с ним своеобразный диалог по почте, выби- рая нужную информацию путем ввода специальных команд TRICKLE. Telnet — информационная технология сети Internet, кото- рая входит в число стандартов, насчитывающих три десятка на полторы тысячи рекомендуемых официальных материалов сети, называемых RFC (Request For Comments). Под telnet понимают триаду, состоящую из telnet-интерфейса пользователя, telnet- процесса и telnet-протокола. Эта триада обеспечивает описание и реализацию сетевого терминала для доступа к ресурсам уда- ленного компьютера. В настоящее время существует достаточно большое коли- чество программ — от Kermit до различного рода BBS (Bulletin Board System), которые позволяют работать в режиме удаленно- 105 го терминала, но ни одна из них не может сравниться с telnet по степени проработанности деталей и концепции реализации. Контрольные вопросы 1. Какая служба является распределенной гипертекстовой информационной системой сети Internet? 2. По какому принципу построена система информацион- ного обмена в сети Internet? 3. Какой информационный ресурс обеспечивает система почтовых списков BITNET? 4. Какую триаду понимают под telnet? 5. Какой службой Internet обеспечивается Европейский стандарт для компьютерных справок? 6. Какая служба является распределенной системой, по от- правке запросов по всему множеству серверов в сети Internet? 7. Какая служба является распределенной информационно- поисковой системой сети Internet? 8. Для чего служит система файловых архивов FTP? 106 5 ЕДИНИЦЫ ИНФОРМАЦИИ В ЭИС 5.1 Единицы измерения экономической информации Экономическая информация, являясь сложным по своей структуре образованием, имеет свою форму представления и особенности. Отличительной чертой экономической информа- ции является её объемность, высокая степень структуризованно- сти, т.е. упорядоченности. Экономическая информация отража- ется в материальных носителях: в первичных и сводных доку- ментах, на машинных носителях, передается по каналам связи [1]. В различных представлениях экономической информации выделяют несколько уровней единиц измерения (в порядке воз- растания синтаксической сложности): атрибут, экономический показатель, составная единица информации и база данных [2, 5]. Каждая единица экономической информации характеризу- ется именем, структурой, значением, методами организации значений и допустимыми операциями над ними. Далее будут более подробно рассмотрены вышеуказанные единицы измере- ния экономической информации, кроме базы данных. 5.2 Атрибуты — элементарные единицы информации Каждая представляемая информацией сущность (объект, явление) имеет ряд характерных для неё свойств (признаков, параметров, характеристик) [5]. Например, свойствами материа- ла являются его вес, габариты, сорт, цена и т.д. Свойства физической сущности объекта отображаются с помощью информационных совокупностей, не делимых далее на более мелкие смысловые единицы, являющихся элементар- ными единицами информации — атрибутами. Атрибут (А) — это логически неделимый элемент любой сложной информационной совокупности свойств объекта. Си- нонимами термина «атрибут» являются реквизит, слово, эле- мент, признак, переменная. 107 Из атрибутов компонуются более сложные информацион- ные конструкции. Информация отражает реальный мир с харак- терной для него взаимосвязью. Любой объект имеет общие и индивидуальные свойства. Одно и то же свойство объекта может встречаться у не- скольких сущностей. Например, признак «Склад №» может по- являться в сообщениях о поступлении товара на склад, ремонте помещения склада, выдаче зарплаты работникам склада и т.д. Некоторые из свойств (признаков) присущи единичным экземп- лярам и называются индивидуальными, например станки одной модели, товары одного наименования. Таким образом, атрибут задает только одно свойство объек- та. Атрибут характеризуется именем и значением. Именем атрибута называется его условное обозначение в процессах обработки данных. Оно служит для обращения к не- му, обычно представляется словом или группой слов (например, табельный номер рабочего, наименование изделия, фамилия студента) и описывается идентификатором. Значением атрибута называется величина, характеризую- щая некоторое свойство объекта, явления, процесса в конкрет- ных обстоятельствах. Каждому атрибуту присуще множество его значений, называемое доменом этого атрибута, его областью определения или классом допустимых значений атрибута. На- пример, для признака «пол рабочего» доменом являются два значения: «женский» и «мужской». Формально атрибут с именем X представляет собой пару (X, z), где z — элемент Z. Множество Z называется доменом значений атрибута X (областью определения), величина z явля- ется значением атрибута X в заданный момент времени. Определение домена предполагает указание его имени и списка значений. Если число значений в домене невелико, то их список можно указать при объявлении данных в программе. Например, в языке программирования Паскаль это выгля- дит как: tуре dау = 1..31; month = 1..12; уеаr = 2000..2099. 108 В описании типа перечисляются допустимые значения ат- рибутов ДЕНЬ, МЕСЯЦ и ГОД соответственно. Зачастую невозможно перечислить все элементы домена, поэтому для него указываются тип и длина значения. Наиболее употребительны текстовые (символьные), числовые, логические значения, а также значения дат и другие специальные типы зна- чений. Рассмотрим, например, домен фамилий — FАМILY. Пере- числить все фамилии невозможно, поэтому ограничим FАМILY значениями текстового типа длиной до 20 символов. Для языка Паскаль получим vаr FАМILY: string [20]. В домене, определенном таким образом, могут оказаться элементы, заведомо не являющиеся фамилией, например «МММ», но такие случаи при определении домена не учитыва- ются. Для ряда доменов множество входящих в них значений за- дается с помощью перечисления допустимых значений. Если в домене необходимо перечислить обозначения объектов из неко- торого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены. Атрибут обладает некоторой самостоятельностью и своими особыми, характерными для него чертами, которые находят свое отображение в его форме. Форма атрибута включает его наименование, структуру и конкретное значение. Структурой атрибута называется способ представления его значений. В структуре атрибута различают длину, тип и формат атрибута. Длина атрибута — это число символов, которые образуют его значение. Длина атрибута может быть переменной или по- стоянной. Значение атрибута «код цеха» (от 01 до 99) имеет две позиции, значение атрибута «наименование материала» может занимать до 120 позиций. Типы атрибутов зависят от видов значений и бывают чи- словые, текстовые и логические. 109 Атрибуты числового типа характеризуют количественные свойства сущностей, полученные в результате подсчета нату- ральных единиц путём измерения, взвешивания (вес, масса, длина). Значениями таких атрибутов являются числа (вещест- венные и целые, в зависимости от заданного формата), которые могут быть представлены в различных системах счисления. Атрибуты текстового типа выражают качественные свой- ства сущностей, характеризующие обстоятельства, при которых были получены числовые значения. Тексты представляют собой типичные единицы данных последовательного типа. В значени- ях атрибутов текстового типа возможное применение тех или иных символов ограничено алфавитом, используемым для дан- ной реализации на заданной стадии обработки [2]. Возможное преобразование значений текстовых единиц информации сво- дится к манипулированию символами. Часто значениями при- знаков может быть текст, выраженный цифрами. Например, «номер цеха» на заводе имеет код «50». Применение кодов су- щественно облегчает компьютерную обработку данных. Коди- рование информации упрощает поиск данных, облегчает груп- пировку информации по сводкам, разрезам, выборкам данных. Атрибуты даты и (или) времени — частный случай тек- стового типа. Задавая атрибут этим типом, система получает возможность вести жесткий контроль, например, значение ме- сяца может быть только дискретным в диапазоне 01 ÷12, время суток находится в диапазоне 00 ÷24 часов, строгие ограничения имеют и другие атрибуты даты и времени. С ними значительно проще выполняются вычисления. Атрибуты логического типа принимают одно из двух взаимоисключающих значений — «истина» или «ложь» и ис- пользуются в логических выражениях. Переменные логического типа применяются для отображения таких свойств объектов и процессов, которые по их характеристике можно разделить на две противоположные (взаимоисключающие) группы, например наличие водительских прав (да/нет), исправность ручного тор- моза (да/нет), присутствует какой-то признак или отсутствует, выдержано определенное условие или нет, положительная вели- чина или отрицательная. Примерами переменных логического 110 типа могут быть знак величины (плюс или минус), признак из- быточности, переполнения, завершения, годности и т.п. Над ло- гическими величинами осуществляются операции математиче- ской логики (отрицания, конъюнкции, дизъюнкции, импликации и др.); они участвуют в логических выражениях, вычисляемые значения которых (истинность или ложность), в свою очередь, присваиваются атрибутам логического типа. Атрибут логического типа может принимать только одно из двух значений: истинность или ложность. В текстовой интер- претации значению истинности могут соответствовать символы: «1», «+», «да», «истина», значению ложности — «0», « −», «нет», «ложь». Особенности атрибутов текстового и числового типа при обработке экономической информации привели к образованию двух видов атрибутов: атрибутов-признаков и атрибутов- оснований. Атрибут-признак представляет собой информационное отображение качественного свойства некоторого объекта, пред- мета, процесса. Значение атрибута определяет некоторое об- стоятельство действия (место действия, предметы труда, время, адрес, наименование, дата и т.п.). Атрибуты-признаки характе- ризуют качественные свойства отражаемых сущностей-объектов и служат ключевыми признаками для логической обработки экономической информации (сортировки, выборки, поиска, группировки и т.д.) в ЭИС. Атрибут-основание определяет меру действия (количество и стоимость предметов, норму выработки или времени и др.). Обычно атрибут-основание является атрибутом числового типа (иногда его называют количественным). Атрибуты-основания отражают количественные характеристики описываемых объек- тов, выраженные в определенных единицах измерения (сумма вклада в рублях, ставка налога в процентах и т.д.), и являются основой для математической обработки экономической инфор- мации в ЭИС. Отдельно взятые атрибуты-признаки и атрибуты-основания экономического смысла не имеют, поэтому применяются только в сочетании друг с другом. 111 Если цифровые коды (обычно целые значения), являющиеся атрибутами-признаками, предполагается подвергнуть математи- ческой обработке, они должны быть преобразованы в числа. Рассмотрим простейшие системы классификации и кодиро- вания, применяемые для обозначения объектов в базе данных вместо их полных названий. В первую очередь, если классифи- кация объектов вообще не требуется, производится их нумера- ция, и кодом каждого объекта служит его порядковый номер. Такая система кодирования называется порядковой. Если все множество объектов классифицируется по одному признаку, то коды объектов целесообразно разделить на несколь- ко частей (серий) по количеству значений этого признака и в пре- делах каждой серии использовать последовательные номера. Когда используется несколько классификационных призна- ков и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д., удобно применять разрядную систему кодирования. В качестве примера рассмотрим различные системы коди- рования значений атрибута «код студента». Порядковый код студента — это его номер в списке всех студентов. Предполо- жим, что необходимо различать студентов дневного, вечернего и заочного отделений с использованием серийной системы ко- дирования. Для этого последовательные номера от 1 до 5999 используют при кодировании студентов дневного отделения, номера от 6000 до 7999 — при кодировании студентов вечерне- го отделения, от 8000 до 9999 — при кодировании студентов заочного отделения. Если в этих же условиях применить раз- рядный код, то первый знак кода будет принимать три значения (1 — дневное отделение, 2 — вечернее, 3 — заочное), а сле- дующие 4 знака отводятся для нумерации студентов каждого отделения. В разрядном коде можно учесть больше признаков, например первый знак — код отделения, второй — код факуль- тета, третий — код курса, четвертый — код группы, пятый и шестой — порядковый номер студента в группе. Необходимо обратить внимание, что, увеличивая число различимых призна- ков в коде, мы вынуждены увеличивать и длину значения атри- бута «код студента». 112 Контрольные вопросы 1. Что такое атрибут? 2. Что называется именем, значением и структурой атрибута? 3. Что такое длина и домен атрибута? 4. Что характеризуют атрибуты числового типа? 5. Что определяют атрибут-признак и атрибут-основание и для чего используются в ЭИС? 5.3 Составные единицы информации ( СЕИ ) Каждый из наблюдаемых объектов, процессов характеризу- ется рядом присущих ему свойств. Так как атрибут характеризу- ет своим значением только одно из свойств объекта, то он не может представлять законченного сообщения об объекте (про- цессе). Требуется некоторая взаимосвязанная совокупность ат- рибутов, чтобы воспроизвести более полную картину свойств об одном объекте. Каждое j свойство в сообщении С i представлено значением определенного, приписанного этому свойству, атрибута А j : Сi = (А 1 , А 2 , …, А j , …, А m ), где атрибуты А j могут быть и признаками, и основаниями. Каждый атрибут в сообщении отражает только одно свой- ство объекта, а сообщение — какой-либо один хозяйственный факт на предприятии. В связи с меняющимися значениями свойств сущностей все сообщения будут отличаться друг от друга. Все множество этих сообщений объединяется в один вид благодаря одинаковому составу свойств, отображаемых атрибу- тами, структурой сообщения [3]. C структурой сообщения объе- диняется некоторая совокупность разных атрибутов, состоящая из элементарных единиц информации — атрибутов. Некоторая совокупность разных атрибутов об одном объек- те, связанных между собой отношениями, называется составной единицей информации или просто составной. Для каждой СЕИ будем различать её наименование, струк- туру, значение и некоторые специальные свойства, присущие только составной единице информации. |