Базовые информационные технологии и процессы. И процессы
Скачать 2.47 Mb.
|
♀ применяется в астрономии как символ планеты Венера, а в биологии – как символ женской особи. К несчастью, часто бывает и так, что раз- ные знаки имеют одинаковый смысл, например, знаки • и ×, а в последнее время и * употребляют как символы умножения. Обычно всякое сообщение имеет смысл, т. е. уже является символом. Оче- видно, что этот символ получается в результате присоединения к сообщению той информации, которая им передается. 21 1.4 Обработка сообщений и обработка информации Всякое правило обработки сообщений можно понимать как отображение (функцию) ν ν , которое сообщениям N из некоторого множества сообщений ставит в соответ- ствие новые сообщения N' из множества сообщений . Каждое из сообщений N и N' – это последовательность знаков. Большая свобода в понимании сообщения как последовательности знаков, просматриваемая в приведенных выше примерах, позволяет констатировать, что всякую обработку сообщений можно рассматривать как кодирование. Ко- нечно, это соображение является важным и для изучения процессов обработки сообщений у живых существ, но прежде всего оно лежит в основе всякой машин- ной обработки дискретных сообщений, являющейся основой многих информа- ционных технологий. Сообщения N вместе с сопоставленной им информацией J будем называть данными. Примером могут служить сообщения, записываемые арабскими циф- рами в позиционной системе счисления, и связанная с ними информация, кото- рую называют «натуральными числами», а также символы. Итак, данные есть пары типа (N, J) с α N J , при этом информацию J называют значением данных, а сообщение N – обозначением данных. Говорят, что обозначение N обладает значением J при интерпретации α Например, обозначение 4 обладает значением «четыре», обозначение 004 – значением «четыре», обозначение 3.14 – значением «три целых и четырнадцать сотых». При этом обозначение определяет значение, которым оно обладает, од- нозначно. Поэтому для краткости говорят просто «данные x» вместо «данные с обозначением x». Различные обозначения могут обладать одним и тем же значением – отоб- ражение α обычно не является обратимым [2]. · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · Контрольные вопросы по главе 1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 1. Каким образом связаны понятия «сообщение» и «информация»? 2. Что определяет информацию, которая предается конкретным сообще- нием? 22 3. Дайте характеристику роли органов чувств в восприятии сообщений человеком. 4. Чем отличается знак от символа? 5. Что называется кодом? 6. Приведите примеры наборов знаков, которые не являются алфавитом. 7. Как мы будем понимать обработку сообщений? 23 2 Информационные технологии 2.1 Определение и задачи информационной технологии Термин технология имеет множество толкований. В широком смысле под технологией понимают науку о законах производства материальных благ, вкла- дывая в нее три основные части: идеологию (принципы производства); орудия труда (станки, машины, агрегаты); кадры, владеющие профессиональными навы- ками. Эти составляющие называют соответственно информационной, инстру- ментальной и социальной. Для конкретного производства технологию понимают в узком смысле как совокупность приемов и методов, определяющих последова- тельность действий для реализации производственного процесса. Уровень тех- нологий связан с научно-техническим прогрессом общества и влияет на его со- циальную структуру, культуру и идеологию [3]. Для любой технологии могут быть выделены цель, предмет и средства. Це- лью технологии в промышленном производстве является повышение качества продукции, сокращение сроков ее изготовления и снижение себестоимости. Методология любой технологии включает в себя: декомпозицию произ- водственного процесса на отдельные взаимосвязанные и подчиненные составля- ющие (стадии, этапы, фазы, операции); реализацию определенной последова- тельности выполнения операций, фаз, этапов и стадий производственного про- цесса в соответствии с целью технологии; технологическую документацию, фор- мализующую выполнение всех составляющих. Производство информации направлено на целесообразное использование информационных ресурсов и снабжение ими всех элементов организационной структуры и реализуется путем создания информационной системы. Информа- ционные ресурсы являются исходным «сырьем» для системы управления любой организационной структурой, конечным продуктом является принятое решение. Принятие решения в большинстве случаев осуществляется в условиях не- достатка информации, поэтому степень использования информационных ресур- сов во многом определяет эффективность работы организации. В своем становлении любая отрасль, в том числе и информационная, про- ходила стадии от кустарного ремесленного производства к производству, осно- ванному на высоких технологиях. 24 Информационные технологии обеспечивают переход к промышленным методам и средствам работы с информацией в различных сферах человеческой деятельности, обеспечивая ее рациональное и эффективное использование. В развитии технологии выделяют два принципиально разных этапа: один характеризуется непрерывным совершенствованием установившейся базисной технологии и достижением верхнего предельного уровня, когда дальнейшее улучшение является неоправданным из-за больших экономических вложений; другой отличается отказом от существующей технологии и переходом к принци- пиально иной, развивающейся по законам первого этапа. · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · Информационная технология – совокупность методов и спо- собов получения, обработки, представления информации, направ- ленных на изменение ее состояния, свойств, формы, содержания и осуществляемых в интересах пользователей. · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · Выделяют три уровня рассмотрения информационных технологий: Первый уровень – теоретический. Основная задача – создание комплекса взаимосвязанных моделей информационных процессов, совместимых парамет- рически и критериально. Второй уровень – исследовательский. Основная задача – разработка мето- дов, позволяющих автоматизировано конструировать оптимальные конкретные информационные технологии. Третий уровень – прикладной, который целесообразно разделить на две страты: инструментальную и предметную. Инструментальная страта (аналог – оборудование, станки, инструмент) определяет пути и средства реализации информационных технологий, которые можно разделить на методические, информационные, математические, алгорит- мические, технические и программные. Предметная страта связана со спецификой конкретной предметной об- ласти и находит отражение в специализированных информационных техноло- гиях, например, организационное управление, управление технологическими процессами, автоматизированное проектирование, обучение и другие. Успешное внедрение информационных технологий связано с возможно- стью их типизации. Конкретная информационная технология обладает ком- плексным составом компонентов, поэтому целесообразно определить ее струк- туру и состав. 25 Конкретная информационная технология определяется в результате ком- пиляции и синтеза базовых технологических операций, специализированных технологий и средств реализации. Технологический процесс – часть информационного процесса, содержа- щая действия (физические, механические и др.) по изменению состояния инфор- мации. Информационная технология базируется на реализации информационных процессов, разнообразие которых требует выделения базовых, характерных для любой информационной технологии. Базовый технологический процесс основан на использовании стандартных моделей и инструментальных средств и может быть использован в качестве со- ставной части информационной технологии. Среди базовых технологических процессов выделим: извлечение информации; транспортирование информации; обработку информации; хранение информации; представление и использование информации. Процесс извлечения информации связан с переходом от реального пред- ставления предметной области к его описанию в формальном виде и в виде дан- ных, которые отражают это представление. В процессе транспортирования осуществляют передачу информации на расстояние для ускоренного обмена и организации преобразования. Процесс обработки информации состоит в получении одних «информаци- онных объектов» из других «информационных объектов» путем выполнения не- которых алгоритмов; он является одной из основных операций, выполняемых над информацией и главным средством увеличения ее объема и разнообразия. Процесс хранения связан с необходимостью накопления и долговремен- ного хранения данных, обеспечением их актуальности, целостности, безопасно- сти, доступности. Процесс представления и использования информации направлен на реше- ние задачи доступа к информации в удобной для пользователя форме. Базовые информационные технологии строятся на основе базовых техно- логических операций и включают ряд специфических моделей и инструменталь- ных средств. Этот вид технологий ориентирован на решение определенного 26 класса задач и используется в конкретных технологиях в виде отдельной компо- ненты. Среди них можно выделить: мультимедиатехнологии; геоинформационные технологии; технологии обработки тестовых сообщений; технологии защиты информации; CASE-технологии; телекоммуникационные технологии; технологии искусственного интеллекта. Специфика конкретной предметной области находит отражение в специа- лизированных информационных технологиях, таких как организационное управ- ление, управление технологическими процессами, автоматизированное проекти- рование, обучение и др. Среди них наиболее продвинутыми являются информа- ционные технологии в следующих сферах: организационное управление (корпоративные информационные техно- логии); промышленность и экономика; образование; автоматизированное проектирование. Аналогом инструментальной базы (оборудование, станки, инструмент) яв- ляются средства реализации информационных технологий, которые можно раз- делить на методические, информационные, математические, алгоритмические, технические и программные. CASE-технология (Computer Aided Software Engineering – компьютерное автоматизированное проектирование программного обеспечения) является свое- образной «технологической оснасткой», позволяющей осуществить автоматизи- рованное проектирование информационных технологий. Методические средства определяют требования при разработке, внедре- нии и эксплуатации информационных технологий, обеспечивая информацион- ную, программную и техническую совместимость. Наиболее важными из них яв- ляются требования по стандартизации. Информационные средства обеспечивают эффективное представление предметной области. К их числу относятся информационные модели, системы классификации и кодирования информации (общероссийские, отраслевые) и др. 27 Математические средства включают в себя модели решения функцио- нальных задач и модели организации информационных процессов, обеспечива- ющие эффективное принятие решения. Математические средства автоматически переходят в алгоритмические, которые обеспечивают их реализацию. Технические и программные средства задают уровень реализации инфор- мационных технологий как при их создании, так и при реализации. Таким образом, конкретная информационная технология определяется в результате компиляции и синтеза базовых технологических операций, «отрасле- вых технологий» и средств реализации. Эволюция информационных технологий наиболее ярко прослеживается на процессах хранения, транспортирования и обработки информации. В процессе управления данными, объединяющем задачи их получения, хранения, обработ- ки, анализа и визуализации, выделяют шесть временных фаз (поколений). Вначале данные обрабатывали вручную. На следующем шаге использо- вали оборудование с перфокартами и электромеханические машины для сорти- ровки и табулирования миллионов записей. В третьей фазе данные хранились на магнитных лентах, и сохраняемые программы выполняли пакетную обработку последовательных файлов. Четвертая фаза связана с введением понятия схемы базы данных и оперативного навигационного доступа к ним. В пятой фазе был обеспечен автоматический доступ к реляционным базам данных и была внедрена распределенная и клиент-серверная обработка. Теперь мы находимся в сфере действия шестого поколения систем, кото- рые хранят более разнообразные типы данных (документы, графические, звуко- вые и видеообразы). Эти системы шестого поколения представляют собой базо- вые средства хранения для приложений сетей Интернет и Интранет. 2.2 Базовые информационные процессы Информационные технологии основаны на реализации информационных процессов, разнообразие которых требует выделения базовых. Как уже было ска- зано выше, к ним можно отнести извлечение, транспортирование, обработку, хранение, представление и использование информации. На логическом уровне строятся математические модели, обеспечивающие параметрическую и критери- альную совместимость информационных процессов в системе информационных технологий. В процессе извлечения информации основной акцент сделан на формы и методы исследования данных, позволяющих формализовать и абстрагированно 28 описать предметную область. Процесс транспортирования информации рассмат- ривается в рамках эталонной семиуровневой модели, известной как модель OSI. Большое внимание уделено протоколам различных уровней, обеспечивающих необходимый уровень стандартизации. Процессы обработки информации изла- гаются в аспекте поддержки принятия решений с выделением типовых компо- нентов. Хранение информации представляется, с одной стороны, как совокуп- ность моделей концептуального, логического и физического уровней, с другой – как набор методов и способов практической реализации. Большое внимание уде- лено эргономическим и психологическим факторам при распределении функции между человеком и техническими устройствами в процессе представления и ис- пользования информации. 2.2.1 Извлечение информации Источниками данных в любой предметной области являются объекты и их свойства, процессы и функции, выполняемые этими объектами или для них. Лю- бая предметная область рассматривается в виде трех представлений: реальное; формальное; информационное. По аналогии с добычей полезных ископаемых процесс извлечения инфор- мации направлен на получение ее наибольшей концентрации. В связи с этим про- цесс извлечения можно представить как прохождение информации через много- слойный фильтр, в котором осуществляется оценка синтаксической ценности (правильность представления), семантической (смысловой) ценности, прагмати- ческой (потребительской) ценности. При извлечении информации важное место занимают различные формы и методы исследования данных: поиск ассоциаций, связанных с рассматриваемым событием; обнаружение последовательностей событий во времени; выявление скрытых закономерностей по наборам данных путем опре- деления причинно-следственных связей между значениями определен- ных косвенных параметров исследуемого объекта (ситуации, про- цесса); оценка важности (влияния) параметров на развитие ситуации; 29 классификация, осуществляемая путем поиска критериев, по которым можно было бы относить объект (события, ситуации, процессы) к той или иной категории; кластеризация, основанная на группировании объектов по каким-либо признакам; прогнозирование событий и ситуаций. Обратим внимание на неоднородность (разнородность) информационных ресурсов, характерную для многих предметных областей. Одним из путей реше- ния данной проблемы является объектно-ориентированный подход, наиболее распространенный в настоящее время. Кратко рассмотрим его основные положе- ния. Декомпозиция на основе объектно-ориентированного подхода основана на выделении следующих основных понятий: объект, класс, экземпляр. Объект– это абстракция множества предметов реального мира, обладаю- щих одинаковыми характеристиками и законами поведения. Объект характери- зует собой типичный неопределенный элемент такого множества. Основной ха- рактеристикой объекта является состав его атрибутов (свойств). Атрибуты– это специальные объекты, посредством которых можно за- дать правила описания свойств других объектов. Экземпляр объекта– это конкретный элемент множества. Например, объ- ектом может являться государственный номер автомобиля, а экземпляром этого объекта – конкретный номер В 010 УХ. Класс– это множество предметов реального мира, связанных общностью структуры и поведением. Элемент класса – это конкретный элемент данного множества. Например, класс регистрационных номеров автомобиля. Обобщая эти определения, можно сказать, что объект – это типичный представитель класса, а термины «экземпляр объекта» и «элемент класса» рав- нозначны. Важная особенность объектно-ориентированного подхода связана с поня- тием инкапсуляции, обозначающим сокрытие данных и методов (действий с объ- ектом) в качестве собственных ресурсов объекта. Понятия полиморфизма и наследования определяют эволюцию объектно- ориентированной системы, что подразумевает определение новых классов объ- ектов на основе базовых. Полиморфизминтерпретируется как способность объекта принадлежать более чем одному типу. 30 Наследованиевыражает возможность определения новых классов на ос- нове существующих с возможностью добавления или переопределения данных и методов. Для уменьшения избыточности используется процесс обогащения инфор- мации, например, при хранении в компьютере списка сотрудников организации иногда достаточно использовать первые 3-4 буквы их фамилий. Среди методов обогащения информации различают структурное, статисти- ческое, семантическое и прагматическое обогащение. Структурное обогащениепредполагает изменение параметров сообще- ния, отображающего информацию в зависимости от частотного спектра иссле- дуемого процесса, скорости обслуживания источников информации и требуемой точности. При статистическом обогащенииосуществляют накопление статистиче- ских данных и обработку выборок из генеральных совокупностей накопленных данных. Семантическое обогащениеозначает минимизацию логической формы, исчислений и высказываний, выделение и классификацию понятий, содержания информации, переход от частных понятий к более общим. В итоге семантиче- ского обогащения удается обобщенно представить обрабатываемую либо пере- даваемую информацию и устранить логическую противоречивость в ней. Прагматическое обогащениеявляется важной ступенью при использова- нии информации для принятия решения, при котором из полученной информа- ции отбирается наиболее ценная, отвечающая целям и задачам пользователя [3]. |