А. М. Федотов
Скачать 312.65 Kb.
|
ISSN 1818-7900. ¬ÂÒÚÌËÍ Õ√”. –Âрˡ: »ÌÙÓрχˆËÓÌÌ˚ ÚÂıÌÓÎÓ„ËË. 2008. “ÓÏ 6, ‚˚ÔÛÒÍ 2 © ¿. Ã. ‘‰ÓÚÓ‚, 2008 УДК 004.75 А. М. Федотов »ÌÒÚËÚÛÚ ‚˚˜ËÒÎËÚÂθÌ˚ı ÚÂıÌÓÎÓ„ËÈ –Œ —¿Õ Ôр. ¿Í‡‰. À‡‚рÂÌڸ‚‡, 6, ÕÓ‚ÓÒË·ËрÒÍ, 630090, —ÓÒÒˡ ÕÓ‚ÓÒË·ËрÒÍËÈ „ÓÒÛ‰‡рÒÚ‚ÂÌÌ˚È ÛÌË‚ÂрÒËÚÂÚ ÛÎ. œËрÓ„Ó‚‡, 2, ÕÓ‚ÓÒË·ËрÒÍ, 630090, —ÓÒÒˡ E-mail: fedotov@nsu.ru; fedotov@sbras.ru ПАРАДОКСЫ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ ∗ Статья посвящена современным проблемам развития информационных технологий и эксплуатации информа- ционных ресурсов в условиях сетевой глобализации общества. Ключевые слова: информационные технологии, информационные ресурсы, история, сети, информационные революции, парадигмы программирования, поиск. Введение Проблема доступа к информации является одной из основных проблем, возникающих в современной человеческой деятельности. Любой производственный или научный процесс порождает огромные объемы данных, и работать с ними становится все сложнее по мере то- го, как гигабайты данных превращаются в терабайты. Количество данных когда-нибудь пре- высит способность компьютеров их обрабатывать, поэтому необходимы новые инструмен- тальные средства и алгоритмы для их анализа. Объемы сохраняемых сегодня данных превысили все цифры, о которых говорилось в самых смелых прогнозах, и процесс их накоп- ления будет только ускоряться. Вместе с тем предъявляются серьезные требования к обеспе- чению прозрачного доступа и долговременной сохранности «информации». А в результате вопросы «что хранить?», «как хранить?» и «как найти?» остаются самыми существенными: без ответа на них все остальные теряют актуальность. Может сложиться впечатление, что развитие информационных технологий уже само по себе способно вывести работу с научной информацией на качественно новый уровень, но, к сожалению, это совсем не так. Современные информационные технологии пока не могут предоставить адекватный аппарат для оперирования с «информацией» и информационными ресурсами [1]. Нынешнюю технологическую революцию характеризует не центральная роль знаний и технологий, а применение знаний и информации к генерированию знаний и созданием сис- тем, обрабатывающих информацию и осуществляющих передачу «информации». Парадоксы информационных технологий Появление сетей в человеческом обществе является жизненной потребностью общества обмениваться информацией. Начиная с далекой древности человечество стремилось найти средства для быстрой и надежной передачи сообщений 1 . Поэтому появление сетей является не столько научным достижением, сколько исторической закономерностью. ∗ Работа написана по материалам лекции, прочитанной автором на Международной летней школе молодых ученых государств-участников Содружества независимых государств «Интеграция и инновации в воспроизвод- стве кадров для развития гуманитарного сотрудничества стран СНГ» (20–24 июля 2008 г., Новосибирск). 1 Информация происходит от латинского слова «informatio», что означает сообщение, сведения, разъяснения, изложение. Этот термин получил широкое распространение, однако понятие информации остается одним из са- мых дискуссионных. Несмотря на попытки найти общие свойства и закономерности, присущие многогранному ¿. Ã. ‘‰ÓÚÓ‚ 4 Возникновение сетей.Если не вспоминать сигнальные костры, гонцов или почтовые тройки, то первая надежная крупномасштабная сеть для передачи сообщений со стандарти- зованной системой кодирования появилась во Франции. Французским механиком Клодом Шаппом был изобретен оптический, или семафорный, телеграф. Передача информации про- исходила с помощью вращения перекладины вокруг своей оси, прикрепленной к металличе- скому шесту на крыше башни. Первая его линия была построена между Парижем и Лиллем в 1794 г. Русский механик-самоучка Иван Кулибин изобрел систему семафорного телеграфа, которую он назвал «дальновещающей машиной», с оригинальным сигнальным алфавитом и слоговым кодом. Изобретение Кулибина было забыто царским правительством. В России телеграф Шаппа с некоторыми усовершенствованиями был введен в 1833 г. и соединял Петербург с Варшавой. Эта линия работала довольно успешно. Для передачи небольшой де- пеши на расстояние 1 тыс. км требовался один час. Активно использовался оптический теле- граф и во время Крымской войны. Решающее слово в создании быстродействующего средства связи принадлежит замеча- тельному русскому ученому П. Л. Шиллингу. В 1828 г. им был испытан прообраз будущего электромагнитного телеграфа. Шиллинг был первым, кто практически решил проблему соз- дания кабельных изделий для подземной прокладки, способных передавать электрический ток на расстояние. Дело рано умершего Шиллинга продолжил академик Б. С. Якоби, кото- рый изобрел телеграфный ключ, телеграфный код и печатающее устройство. В истории элек- тротелеграфа самым популярным стал американский живописец Сэмюэл Морзе. Он постро- ил аналоговый 2 телеграфный аппарат и создал азбуку к нему, позволяющие с помощью нажатия на ключ Якоби передавать информацию на дальние расстояния. Благодаря простоте и компактности устройства, удобству работы телеграф Морзе в течение полустолетия был наиболее распространенной системой телеграфа, применявшейся во многих странах. Развитием телеграфа Якоби стал стартстопный аппарат Жана-Мориса Эмиля Бодо (1874 г.) и пятибитный цифровой код телеграфии, который стал прообразом современной системы кодирования информации в компьютерах (код ASCII). Фактически сеть междуна- родного абонентского телеграфа (телетайп) является первой глобальной сетью со своими правилами передачи информации (принцип коммутации каналов, который в начале исполь- зовался и в компьютерных сетях адресации и маршрутизации, и со своими стандартами ко- дирования информации, которые оказали сильное влияние на стандарты кодирования ин- формации в компьютерных сетях). Изобретения телеграфа, телефона и радио произвели первую «информационную» рево- люцию в обществе: телефон оказался первой сугубо личной коммуникационной технологи- ей, радиосвязь кардинально расширила понятия коммуникационной сети, а телеграф явился предшественником глобального информационного пространства. Информационные революции.Появление компьютеров привело к самому большому скач- ку в развитии человеческого познания и, как следствие, к колоссальному увеличению объе- мов перерабатываемой информации. Если в 1800-е гг. сумма человеческих знаний удваива- лась каждые 50 лет, в середине XX в. – каждые 10 лет, то к 1970 г. период удвоения сократился до 2–3 лет. Этот экспоненциальный рост с легкой руки Альберта Эйнштейна называют «информаци- онным взрывом» с тем отличием, что понятие «взрыв» означает самоликвидирующийся про- цесс, а развитие познания бесконечно. Причина его возникновения связана не столько с ги- гантским прогрессом в информационных технологиях, сколько с возросшим во много раз потоком информации, необходимой для жизни современного общества. Развитие вычислительной техники не шло гладко и размеренно. С одной стороны, уже при построении ЭВМ первого поколения возник вопрос: может ли машина мыслить. С дру- понятию «информация», оно во многом остается интуитивным и получает различные смысловые наполнения в различных отраслях человеческой деятельности. Наиболее бесспорным выглядит определение, данное А. Н. Ко- могоровым: «Информация есть характеристика не сообщения, а соотношения между сообщением и его потреби- телем. Без наличия потребителя, хотя бы потенциального, говорить об информации бессмысленно» [2]. 2 Телеграфный аппарат Шиллинга был цифровым. œ‡р‡‰ÓÍÒ˚ ËÌÙÓрχˆËÓÌÌ˚ı ÚÂıÌÓÎÓ„ËÈ 5 гой стороны, внедрение ЭВМ встречало бурное сопротивление со стороны ее потенциальных пользователей. Хронологически средства вычислительной техники возникли прежде всего из практиче- ских проблем, требующих огромных объемов вычислений. К настоящему времени машины позволили решить многие народно-хозяйственные задачи, которые без них были бы в прин- ципе нерешаемы. Следует отметить двойственный характер причинно-следственной связи развития мощности компьютеров и сложности возникаемых задач. Взаимосвязь роста мощ- ностей компьютеров и вычислительной сложности новых актуальных проблем можно сопос- тавить с проблемой «щит и меч», когда появление новых «наступательных средств» сразу порождает соответствующие «оборонительные» и наоборот. В этом отношении существует гипотеза: «мощностей вычислительных средств будет всегда не хватать». B 1960 г. президент Национальной федерации автоматики и кибернетики Франции А. Дюкрок 3 предсказывал проблемы, которые могут возникнуть в связи с повсеместным рас- пространением информационных технологий 4 . Он писал: «Мы лишь весьма приблизительно угадываем перспективы кибернетической революции, ибо в прошлом нельзя найти никаких критериев для сравнения. <…> Мы находимся на пороге перемен в нашем обществе на- столько же фундаментальных, как те изменения, которые были вызваны появлением книго- печатания, конвейерного производства или автомобиля. Эти изменения наступят, когда че- ловек получит власть над информационным процессом» [3. С. 106]. Дюкрок оказался прорицателем, и первый информационный кризис разразился в начале 1970-х гг., проявившись на фоне экономического кризиса 1970-х в снижении эффективности информационного обмена в обществе: • резко возрос объем публикуемых данных; • общение между группами разных специалистов стало затруднено; • возрос объем неопубликованной информации; • выросла проблема межъязыкового обмена в мире. Парадокс социальной коммуникации в условиях информационного кризиса: лавинообраз- ный рост объемов информации, сопровождающийся информационным «голодом» (физиоло- гическими ограничениями человека в восприятии и переработке информации и трудностями в выделении нужной информации из общего потока). Самой актуальной и острой в мире проблемой стала проблема создания, сохранения и эф- фективного использования «информационных ресурсов». Произошло формирование еще од- ного самостоятельного вида общественного ресурса – информационного, позволяющего эко- номить большинство других ресурсов общества. Дальнейший прогресс общества в значительной степени связан сегодня с совершенствованием информационной инфраструк- туры, эффективностью формирования, размещения и использования информационных ре- сурсов и продуктов. Вторую информационную революцию связывают с появлением персонального компьюте- ра(ПК). Создание ПК на время приглушило развивающийся информационный кризис, но не на долго. Если первая революция охватывала средства передачи информации, то создание ПК ре- шительно преобразовало способ формирования, организации и распространения знания. Это изобретение позволило массе людей приобщиться к профессиональным знаниям, общест- венному информационному богатству без помощи посредников и тем самым превратить профессиональные знания в личностно-значимые. Интеллект человека, вооруженный ПК, стал инструментом, ориентированным на самопознание и саморазвитие. Персональная ком- пьютерная вездесущесть широко распахнула ворота в информационный век. Теперь осталось лишь обеспечить легкий и свободный доступ к информации по всему миру. Главное – уже никто не сопротивлялся его применению. Революционное значение сетевых коммуникационных технологийуже осознано: «гло- бальная информационная инфраструктура», «информационная супермагистраль», «инфор- мация на кончиках пальцев» – это различные наименования третьей информационной рево- 3 А. Дюкрок – Albert Ducrocq. 4 В его время еще не было понятия «информатика», поэтому он говорил о кибернетике. ¿. Ã. ‘‰ÓÚÓ‚ 6 люции. Фактически эта революция интегрирует эффекты всех предшествующих, ибо создает технологическую основу объединения интеллектуальных способностей и духовных сил всего человечества. Как никакое предшествующее открытие или изобретение в мире информации и коммуникаций, сетевая информационная революция оказывает мощное воздействие на все сферы жизни общества: политику, экономику, культуру и, разумеется, на жизнь и безопас- ность людей. Вот здесь как раз общество и натолкнулось на неразрешимый пока «второй» кризис ин- формационных технологий. Кризис информационных технологий.Привязывая традиционные циклы производства и потребления к информационной среде и перенося их в «Сеть» почти без изменений, совре- менное общество топит себя в информации. Мутные потоки информации превысили инди- видуальные и социальные возможности их фильтрации для полезного использования. По- давляющая часть циркулирующей в «Сети» информации человеку не нужна: требуются лишь результаты ее обработки. Низкосортное перепроизводство «информационных ресурсов» пре- вратило «Сеть» в аморфную среду коммутатора, нагнетающего чрезмерные потоки инфор- мации. По мнению Питера Друкера 5 , известного специалиста в области управления, в истории человечества прошли три информационные революции, а сейчас происходит четвертая. Дру- кер утверждает: «Неудовлетворенность высшего руководства данными, поставляемыми ин- формационными технологиями, и привела в действие новую, следующую информационную революцию» [4]. «Сеть» необходима для общества как инструмент развития и система хранения «инфор- мации». Однако естественные механизмы самозащиты информационной среды не справля- ются с существующими потоками. Противостоять этой децентрализованной угрозе можно только с помощью создания единой распределенной интегрированной компьютерной среды. С другой стороны, в «Сети» ширится новый феномен – глобальные компьютерные задачи и распределенные вычисления. Требования к интеграции компьютерных решений превысили возможности индустриального программирования. Продвижение в «Сеть» массовых задач экономики и бизнеса, попавших в сферы интере- сов инвесторов, удалось в меньшей степени, чем ожидалось. Колоссальные инвестиции вме- сто дивидендов принесли глубокий спад в сфере информационных технологий. Быстрый от- кат индекса NASDAQ к уровню середины 1990-х гг. говорит об изначальной недооценке сложности глобальной интеграции информационных решений, хотя сами по себе информа- ционные технологии продолжают интенсивно развиваться. Попытки сходу взять глобальные задачи технологии индустриального программирования потерпели фиаско. Причины возникшего кризиса лежат не в экономике или политике, не в отсутствии инвесторов, не только в нехватке высококлассных специалистов, технических средств, передовых технологий, а в фундаментальных подходах к созданию информацион- ных систем и программных продуктов, заложенных в используемую парадигму программи- рования. Во-первых, парадигмы, когда выражают законы природы, не подчиняются настрое- ниям рынка и массового производства. Во-вторых, парадигма не должна давать повода назвать себя догмой. Изначальная классическая модель фон Неймана уже более полувека служит теоретиче- ской основой архитектуры и программ универсального компьютера. Компьютеростроение материализовало ее в многомиллионных тиражах процессоров, программ, закрепило в трил- лионных оборотах информационного рынка. Но «cетевое» программирование потребовало создания качественно иного уровня интеграции глобального информационного пространст- ва. На смену «объектам», захватившим умы программистов, должны прийти «процессы». В том, что в рамках широко используемой парадигмы глобальная интеграция не состоя- лась, нет вины классической аксиоматики. Ее изначальные полномочия распространяются только на изолированный 6 компьютер. Однако об ограничениях сфер действия «классики» благополучно «забыли». Индикатором неадекватности классических постулатов в «Сети» 5 Питер Друкер – Peter Ferdinand Drucker. 6 Может быть, даже очень «большой». œ‡р‡‰ÓÍÒ˚ ËÌÙÓрχˆËÓÌÌ˚ı ÚÂıÌÓÎÓ„ËÈ 7 стал информационный шум «многоязычия», являющийся главным препятствием глобальной интеграции. Деструктивная роль информационного шума «многоязычия» осознана еще в сюжете Вавилонского столпотворения. В отличие от социальной среды, где языки наряду с инфор- мационной несут и социально-психологическую нагрузку, компьютерную среду можно изба- вить от «многоязычия». Полисемия (многозначность представления) – враг информационно- го обмена, фактор внесения искажения и ошибок (семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных на- правлений в разработке формальных подходов представления информации и знаний. Общество уже преодолело первый кризис «многоязычия» информационных технологий в технической сфере: в конце 1980-х гг. был принят целый ряд стандартов 7 Но наиболее серьезной проблемой является кризис в сфере представления информации. Важной деструктивной особенностью «Сети» является отсутствие единых общепринятых определений в сфере информационных технологий, когда речь идет об обработке «информа- ции», прежде всего потому, что со времен Клода Шеннона на инженерном уровне произошло смешение понятий, объединение представлений об информации и данных или сигналах, ко- дирующих эту информацию. С легкой руки первопроходцев «информацией» стали называть, по существу, наборы данных. До последнего времени, пока системы были относительно просты, отсутствие четкого разделения на данные и «информацию» не имело практического значения. Но с появлением сложных информационных систем, где функции распределены между человеком и машиной, где человек является активной составляющей, а также с развитием таких дисциплин, как управление знаниями, требуются более точные определения базисных понятий: «данные», «информация» и «знание». Преодоление этого кризиса возможно только с помощью новой, полной и замкнутой модели единого и математически однородного поля «компьютерной ин- формации», не запрещающей программистам и пользователям строить удобные для себя языки и средства. Интеграция в «Сети» достижима пока только для каждого отдельного случая 8 . Индустри- альное программирование никак не найдет общего языка с интеграцией. То, что надо одно- му, неудобно для другого. Имеющийся инструментарий вынуждает дробить глобальные за- дачи на части, решать их в отдельности (локализовать), а затем по мере необходимости интегрировать воедино. Информационное общество.Основной лозунг своей предвыборной компании Жискар д’Эстен сформулировал так: «Информация является важнейшим стратегическим ресурсом и наибольший экономический и социальный успех сегодня сопутствует тем странам, которые активно используют современные средства компьютерных коммуникаций и сетей, информа- ционных технологий и систем управления информационными ресурсами», – этим определив, что информационные технологии являются критическими технологиями развития общества [6]. Количество информации в современном обществе стремительно возрастает с каждым годом. По всей видимости, в ближайшем будущем информационные ресурсы станут основ- ным национальным богатством. Фундаментальная революция происходит на рубеже веков не в ядерной физике, микро- электронике или химии, а в области «информатики». В экономически развитых странах осознан факт, что информационные технологии перестали выполнять чисто вспомогательные функции и стали важнейшим элементом деятельности государственных учреждений и част- ных компаний. Растущая зависимость промышленно развитых стран от источников инфор- мации (технической, экономической, политической, военной и т. д.), а также от уровня раз- вития и эффективности использования средств передачи и переработки информации и привели к формированию принципиально нового понятия – «национальные информацион- 7 Стандарты взаимодействия открытых систем OSI, которые сейчас восприняты всеми производителями ком- пьютерного и телекоммуникационного оборудования. 8 Наиболее ярким примером глобальной интеграции, но пока единственным, является единый распределенный каталог библиотек и международный стандарт библиографических описаний, созданный на основе протокола Z39.50 под эгидой Библиотеки конгресса США [5]. ¿. Ã. ‘‰ÓÚÓ‚ 8 ные ресурсы». Возникновение в 1980-х гг. этого понятия было обусловлено растущей зави- симостью промышленно развитых стран от источников информации (технической, экономи- ческой, политической, военной), а также от уровня развития и эффективности использования средств передачи и переработки информации. Обобщая сказанное, можно выделить характерные черты и опасные тенденции информа- ционного общества. Характерные черты: • решается, хотя бы частично, проблема первого информационного кризиса – противоре- чие между информационной массой и информационным голодом; • обеспечивается приоритет информационных ресурсов по сравнению с другими ресурсами; • становление информационной экономики как главной формы развития общества; • заложены основные принципы автоматизированной генерации, хранения, обработки и использования знаний; • информационные технологии приобрели глобальный характер, охватив все сферы соци- альной деятельности человека; • формируется глобальное единство человеческой цивилизации. Опасные тенденции информационного общества: • возрастающее влияние на общество средств массовой информации; • все большее нарушение (или даже разрушение) посредством информационных техноло- гий частной жизни людей или организаций; • усложняющаяся проблема отбора качественной и достоверной информации; • увеличение разрыва между разработчиками и потребителями информационных техноло- гий до стратегически опасной величины; • усиление проблемы адаптации части людей к среде информационного общества. Трудно отыскать четкое указание на дату рождения кибернетики и информатики. Их чер- ты как науки вырисовывались из многих смежных дисциплин, а становление связано с воз- никновением промышленности обработки данных. Небывалые темпы развития научных и технических достижений выдвинули в области обработки данных информатику на важней- шие позиции в современном обществе. Считается, что новые информационные технологии обеспечат занятость населения, эффективные результаты экономической деятельности и вы- сокий уровень жизни. Однако в литературе нет четкого формального определения понятия «информация», поэтому если подходить формально, то, что такое информационные техноло- гии, не совсем понятно. Еще хуже дело обстоит в России. Учитывая прошлое негативное отношение к понятиям «кибернетика» и «компьютерная наука», вызванное политическими соображениями, термин «информатика» бесцеремонно отняли у скромной науки, называвшейся информатикой, но при этом ведавшей именно информацией, в основном научно-технической (во всем мире она называется library science) 9 Что такое информатика? Информатика – это исключительно российское понятие, возникшее путем слияния по- нятий кибернетики и компьютерной науки, для определения сферы человеческой деятель- ности, связанной с повсеместным использованием вычислительной техники и телекомму- никаций. Термином «информатика» мы привыкли называть области человеческой деятельности, связанные с разработкой, созданием, использованием, материально-техническим обслужива- нием систем обработки информации, включая компьютеры, сети и программное обеспече- ние, а также организационные, коммерческие, административные и социальные аспекты компьютеризации (информатизации) – массового внедрения компьютерной техники во все области жизни людей. 9 Термин «информатика» (франц. informatique) родился в 1960 г., условно происходит от французских слов «information» (информация) и «automatique» (автоматицация) и дословно означает «информационная автоматиза- ция», в научный обиход вошел в 1978 г. œ‡р‡‰ÓÍÒ˚ ËÌÙÓрχˆËÓÌÌ˚ı ÚÂıÌÓÎÓ„ËÈ 9 Информатика изучает наши модельные представления об окружающей действительно- сти – так называемые информационные модели, в которых на первое место выходит не порт- ретное описания того или иного явления (как в других науках), а описания информационных отношений, которые порож- дает это явление. Так же как и кибернетика, информатика является синтетической наукой, объединяющей целый рад самостоятельных наук: • вычислительные системы, программное обеспечение, методы машинной графики, ани- мации, средства мультимедиа; • теория информации, изучающая процессы, связанные с передачей, приемом, преобразо- ванием и хранением информации; • математическое моделирование, методы вычислительной и прикладной математики и их применение к фундаментальным и прикладным исследованиям в различных областях знаний; • методы искусственного интеллекта, моделирующие методы логического и аналитиче- ского мышления в интеллектуальной деятельности человека (логический вывод, обучение, понимание речи, визуальное восприятие, игры и др.); • системный анализ, изучающий методологические средства, используемые для подготов- ки и обоснования решений по сложным проблемам различного характера; • биоинформатика, изучающая информационные процессы в биологических системах; • социальная информатика, изучающая процессы информатизации общества; • телекоммуникационные системы и сети, в том числе глобальные компьютерные сети, объединяющие все человечество в единое информационное сообщество; • разнообразные приложения, охватывающие производство, науку, образование, медици- ну, торговлю, сельское хозяйство и все другие виды хозяйственной и общественной деятель- ности. Таким образом, информатика – это комплексная наука, занимающаяся разработкой мето- дов и средств преобразования «информации» и организацией технологического процесса се- мантической (смысловой) обработки данных. Это определение позволяет, с одной стороны, подняться над статистической теорией информации К. Шеннона, где определяющая роль принадлежит знаковому представлению, а не смыслу сообщения, а с другой – позволяет не вступить на тернистый, но при этом непродуктивный путь философского анализа понятия «информация». Семантический же подход к информации прагматичен, он позволяет про- вести разделение между данными и информацией. Данные – это представление фактов и понятий в форме, пригодной для их передачи и интерпретации, а информация – это смысл, который ЧЕЛОВЕК приписывает данным на основании известных ему правил их представ- ления. Объектами исследования информатики служат методы и средства, используемые для сбора, переработки, хранения, систематизации, поиска и распространения семантической информации. Незрелость «информационных технологий».Взаимосвязь между «вычислениями» 10 и со- ставляющими информационную индустрию технологиями очень проста: она та же, что и в любой другой индустрии, в авиации, машиностроении, судостроении, – где угодно. Повсюду технологии обеспечивают строительный материал, строительные блоки для создания систем, обладающих конечными потребительскими свойствами – самолетов, станков, кораблей и т. д. Уровень зрелости индустрии определяется тем, насколько глубоко технологии скрыты от потребителя. Пользователи не обязаны понимать устройство бытовых электроприборов или автомобилей, они должны уметь ими ПОЛЬЗОВАТЬСЯ. Сформулированный тезис показывает нам всю незрелость информационных технологий, несмотря на видимые успехи. Пока только некоторыми признаками зрелости обладают пер- сональные компьютеры, но на корпоративном уровне применение этих технологий находит- ся все еще на стадии становления. Современные информационные технологии предоставляют исследователю мощный аппа- рат для «манипулирования данными», а не информацией. Данные, переведенные в электрон- 10 Под вычислениями здесь понимается процесс обработки информации с помощью компьютерных и сетевых устройств (компьютинг). ¿. Ã. ‘‰ÓÚÓ‚ 10 ную форму, приобретают новое качество, обеспечивая им более широкое распространение и эффективное использование. Однако применение информационных технологий должно ос- новываться на использовании различных моделей (феноменологических, информационных, математических и др.). Как неоднократно отмечал А. А. Ляпунов, «нет модели – нет инфор- мации». Для возможности продуктивной работы нужны данные, превращенные в «информа- цию», представленную в виде «знаний» – «адекватного отражения действительности в соз- нании человека в виде представлений, понятии, суждений теорий» [7]. Для эффективного управления необходимо располагать «полноценной информацией»: информация должна быть не только полной, достаточной, но и своевременной, точной и не- противоречивой, а «информация», поступающая через различные по своей физической при- роде каналы, должна быть согласованной. Информационные системы.Очевидно, автоматическая переработка «информации» воз- можна лишь при наличии ее описания с помощью некоторого алгоритма, т. е. при наличии формальной модели данных. Комплексы аппаратно-программных средств, позволяющие ра- ботать с данными, структурированными при помощи той или иной формальной модели, обычно называют информационными системами. Однако и здесь до сих пор присутствует путаница с понятиями «информационная система» (ИС) и «архитектура ИС». Она вовсе не безобидна и часто мешает на практике четко определить, что же является предметом разра- ботки в конкретном проекте: ИС, только ее КСА (комплекс средств автоматизации) или сис- тема (АС) целиком. Для примера приведем два определения из государственных стандартов: «Информационная система (ИС): Комплекс, состоящий из процессов, технических и про- граммных средств, устройств и персонала, обладающий возможностью удовлетворять уста- новленным потребностям или целям» 11 и «Информационная система (ИС): система, предна- значенная для сбора, передачи, обработки, хранения и выдачи информации потребителям и состоящая из следующих основных компонентов: программное обеспечение, информацион- ное обеспечение, технические средства, обслуживающий персонал – Information system: The collection of people, procedures, and equipment designed, built, operated, and maintained to collect, record, process, store, retrieve, and display information» 12 Основная проблема, связанная с построением информационных систем – неразвитость теории об «информации».Невозможно говорить о единой теории, связывающей воедино «данные», «информацию» и «знание», есть только множество подходов к понятию «ин- формация» с философских или кибернетических позиций. Можно обнаружить десятки и сотни порой противоречащих друг другу определений того, что является информацией или знанием. Существует правда «техническая» теория информации, по Шеннону, которую следовало бы называть «теорией передачи и хранения данных». Существующую проблему фильтрации информации уже давно пытаются решить путем создания универсальных или специализированных информационно-поисковых систем. В ре- зультате опережающего развития технологий поиска по сравнению с методиками работы с семантической информацией образовался заметный разрыв между техникой работы с дан- ными (поиском) и способностью работать с содержанием, заложенным в этих данных. Опи- раясь на интуицию, эксперты приходят к выводу о порочности нынешней ситуации, но о ка- ком-либо серьезном переосмыслении проблем извлечения из данных информации пока речь не идет. Стоит напомнить, что в 1950-е и 1960-е гг. в СССР науки об информации занимали весьма достойное место, хотя их развитие и было затруднено спецификой социального устройства общества. Произошедший в последующие годы разворот к работе с данными и узурпация названия «информатика» привели к тому, что многое из накопленного оказалось если не по- терянным, то невостребованным, а культура работы с информацией была утеряна. Сегодня 11 ГОСТ Р ИСО / МЭК 12207-99. Информационная технология. Процессы жизненного цикла программных средств // Госстандарт России. М., 1999. 12 ГОСТ 34.003-90. Информационная технология. Комплекс стандартов и руководящих документов на авто- матизированные системы. Термины и определения. œ‡р‡‰ÓÍÒ˚ ËÌÙÓрχˆËÓÌÌ˚ı ÚÂıÌÓÎÓ„ËÈ 11 для большинства пользователей важнее потребление информационных сервисов, а не обес- печивающие его технологии. Пути преодоления кризиса Дальнейшее развитие работ в области информационно-поисковых систем и интеллектуа- лизации информационных систем и систем поиска, несомненно, даст свои плоды, но очень дорогой ценой. Необходимо переосмысление самого подхода к представлению информации в «Сети». Интеграция разнородных информационных ресурсов в единую среду и организация дос- тупа к ним является одним из важнейших направлений развития современных информаци- онных технологий. При этом наблюдается переход к исключительно распределенной схеме создания, поддержания, хранения ресурсов 13 и в то же время стремление к виртуальному единству посредством предоставления свободного доступа к любым ресурсам сети через ог- раниченное число «точек доступа». Парадигмы программирования.Одна из задач, направленных на преодоление кризиса, за- ключается в смене парадигмы программирования и устранении недостатков классической аксиоматики. В модели фон Неймана произвольные структуры данных формируются после- довательностями (потоками) адресов к памяти (для чтения / записи элементов данных). Зна- чения адресов в потоке задаются алгоритмическими предписаниями. Модель позволяет про- извольным образом кодировать в потоках произвольные структуры данных. Следовательно, при создании алгоритмов имеются две степени свободы: структура данных и способ ее опи- сания; обе они открыты программистам. По своему усмотрению они строят структуры данных и для каждой из них задают свои правила доступа, которые в дальнейшем плохо под- даются интеграции. Здесь и лежит основная причина воспроизводства информационного шума – избыточного и труднопреодолимого при интеграции множества в представлениях структурированной и слабоструктурированной информации. Решение проблемы – запрет на производство плохо совместимых структур данных путем создания однородного поля компьютерной информации посредством математической регламентации используемых структур. Такая регламентация уже предлагалась ранее на основе методов декларативного програм- мирования и исчисления древовидных структур. Деревья (или сети) – это рекурсивно- однородный структурный элемент компьютерной информации, представляющий программы и данные. Исчисление деревьев – это математически полные и замкнутые в множестве деревьев правила универсальной композиции (или декомпозиции). При программировании деревья свободно интерпретируются в терминах предметной области решаемых задач. С ма- тематической точки зрения, это исчисление «слабое», а потому не имеющее обременитель- ных ограничений в отношении классов решаемых в нем задач. На основе этой идеи в конце 1980-х гг. Международным телекоммуникационным сою- зом (ITU) была предпринята попытка построения единой универсальной информационно- справочной системы (RFC1487, X.500 Lightweight Directory Access Protocol. http://rfc.net/rfc1487.html). Проблемы поиска.Идея структуризации информации уже формулировалась создателями WWW сервиса, которые считали, что создаваемая система должна не только поддерживать произвольные гипертекстовые ссылки, но предоставлять сквозной поиск по распределенным в сети базам данных и – что самое главное – быть многопользовательской, платформно- независимой системой. Дальнейшее развитие технологии WWW немного подкорректировало начальные установки, и из системы доступа к разнородным ресурсам она превратилась во всемирную «презентационную» систему. 13 Эффективная эксплуатация информационных ресурсов возможна только в том случае, когда они постоянно поддерживаются авторами, т. е. на основе технологий использования распределенных информационно-вычисли- тельных ресурсов, которые получили название GRID-технологий. ¿. Ã. ‘‰ÓÚÓ‚ 12 Пожалуй, главной проблемой «Сети» считается отсутствие какой-либо упорядоченности в петабайтах данных, раскиданных по его просторам. В полностью децентрализованной сис- теме изначально не предусматривалось встроенных механизмов по каталогизации докумен- тов и обеспечению поисковых сервисов. И, поскольку само по себе существование информа- ции не имеет смысла, если ее нельзя найти, различными компаниями создавались и создаются глобальные поисковые системы, осуществляющие индексацию всех найденных в «Сети» документов. При получении очередного документа такая система осуществляет его разбор, выделяет и сохраняет ключевые слова, по которым в дальнейшем этот документ мо- жет быть найден любым посетителем поискового сервера. Как правило, в роли ключевых слов выступают все слова, найденные в документе, за исключением предлогов, местоимений и прочих малоинформативных слов. Поисковые алгоритмы каждый год совершенствуются, улучшая их качество (повышая релевантность результатов поиска запросу): при поиске учи- тываются морфологические формы и / или синонимы ключевых слов, ограничивается «рас- стояние» между ключевыми словами, для сортировки результатов поиска используется поня- тие «веса» найденных в документе слов... В целом, развитие таких систем, безусловно, оправдано. Однако, как уже отмечалось, это не дает решения проблемы, поскольку пока доминирующей идеей является улучшение средств отображения документов на стороне клиентов, а не их структуризация. Службы каталогов.Спецификации X.500 по организации единой службы каталогов в «Сети», принадлежащие Международному телекоммуникационному союзу, были опублико- ваны в 1988 г. Служба каталогов представляет собой распределенную тиражируемую базу данных, где хранится логическое описание сетевых ресурсов. Конечная цель проекта X.500 была весьма амбициозна: создать распределенную международную систему каталогов, со- держащую в себе все данные обо всех телефонных абонентах по всему миру и других сете- вых ресурсах. После опубликования стандарта стало ясно, что задача построения глобально- го каталога практически неподъемна: технология оказалась слишком сложна, а конкретные ее реализации слишком ненадежны и малосовместимы между собой. Важным результатом этой работы стала очевидная актуальность новой задачи: создания средств хранения данных о реальных объектах в относительно простой, надежной и распределенной системе. Сетевые ресурсы организуются в иерархическую структуру, называемую деревом (в сети может быть несколько деревьев). В 1993 г. группа из Мичиганского университета под руководством Тима Хауса опублико- вала RFC 1487 с описанием LDAP 14 – протокола, работающего непосредственно с TCP/IP и достаточно «легковесного», чтобы хорошо работать на обыкновенных персональных ком- пьютерах. Вначале предполагалось, что LDAP будет использоваться именно как дополнение к существующим продуктам X.500 для относительно маломощных компьютеров; в такой схеме клиент DAP является одновременно сервером LDAP. Производители каталогов X.500 поддержали этот подход и включили LDAP в свои продукты, что привело к резкому росту популярности каталогов масштаба организации. Каталоги LDAP, сохраняя логические стан- дарты X.500 (организация объектов в логическое дерево, хранение данных в виде «атрибут- значение» и т. д.), стали независимы от X.500 на уровне протоколов, полностью перейдя на стандарты Интернета. Еще одним существенным преимуществом технологии LDAP является четкое разделение между системой хранения и системой обмена данными. Каталоги LDAP представляют собой универсальную систему хранения «метаданных» в «Сети» и целый набор профилей (правил) и схем данных для представления «информации». Схемой данных службы каталогов называется набор возможных и необходимых типов объ- ектов и связанных с ними атрибутов с заданными способами взаимодействия между ними. Большое достижение служб каталогов по сравнению со службами доменов состоит в том, что их схемы являются расширяемыми. Иначе говоря, они позволяют регистрировать и вводить новые типы объектов или задавать новые атрибуты для уже имеющихся типов объектов. Служба каталогов позволяет организовать гибкое управление правами доступа к сетевым ресурсам, к объектам, а также к отдельным атрибутам объектов. При рассмотрении службы каталогов важно знать, какие объекты выступают в качестве принципалов безопасности. 14 LDAP – Lightweight Directory Access Protocol (http://rfc.net/rfc1487.html). œ‡р‡‰ÓÍÒ˚ ËÌÙÓрχˆËÓÌÌ˚ı ÚÂıÌÓÎÓ„ËÈ 13 Принципалами безопасности называют объекты, которым могут быть даны права доступа к другим объектам, их свойствам или к сетевым ресурсам. Службы каталогов имеют свойство, называемое наследованием прав доступа к ресурсам. Наследование прав доступа подразумевает следующее: если принципалу безопасности пре- доставлены определенные права на контейнер дерева, то он автоматически получает такие же права на все входящие в контейнер объекты, среди которых могут быть, в свою очередь, вложенные контейнеры и т. д. Ограничение прав доступа на вложенные объекты осуществ- ляется с помощью фильтров наследования. Применение свойства наследования прав доступа совместно с фильтрами наследования позволяет очень гибко распределять обязанности по администрированию сетевой среды. Распределенные вычисления.Второе направление связано с реализаций схем распределен- ных вычислений и доступа к распределенным ресурсам в «Сети». Здесь можно выделить два направления: одно – «снизу вверх» (от практики), другое – «сверху вниз» (от теории). При- мер первого направления – Grid [8], подход к интеграции машинных ресурсов «Сети» для распределенных вычислений и систем. Многочисленные и разнородные версии Grid основа- ны на классической парадигме программирования, потому органично вписываются в арсенал глобального программирования. Это путь постепенного наращивания средств индустриаль- ного программирования в рамках классической парадигмы. Интеграция осуществляется си- ловым преодолением информационного шума, путем формирования общих вычислительных сервисов. Второе направление, фактически заложенное в архитектуру служб каталогов, связано с разработкой новой парадигмы математически однородного поля компьютерной информации. В этой парадигме проблемы программирования, интеграции и масштабирования компьютер- ных решений и распределенных процессов перестают зависеть от технических особенностей компьютеров и сетей. Регулярный инструмент глобального программирования строится сна- чала на теоретическом уровне в виде математически полной и замкнутой модели. Затем ал- горитмы функционирования этой модели программно эмулируются в ресурсах «Сети». В математически однородном поле компьютерной информации интегрируются не ресур- сы машинной среды («объекты»), а решаемые в нем задачи («процессы»). Здесь еще пред- стоит построить математически замкнутую модель представления информации и процессов, необходимую для реализации универсального ядра глобально распределенных вычислений и систем. Новый подход подразумевает и новую стратегию: проблемы переустройства «Сети» вы- ходят за рамки какой-либо корпорации и должны опираться уже не на законы рыночной кон- куренции, а на равно обязательные для всех фундаментальные свойства и законы развития компьютерной информации. В заключение уместно отметить постоянно развивающуюся тенденцию к интеграции уже существующих информационных ресурсов. Одним из необходимых условий для этого явля- ется каталогизация информационных ресурсов и документов на основе существующих от- крытых стандартов. Список литературы 1. Шокин Ю. И., Федотов А. М., Гуськов А. Е., Жижимов О. Л., Столяров С. В. Элек- тронные библиотеки – путь интеграции информационных ресурсов Сибирского отделения РАН // Вестн. Казах. нац. ун-та. 2005. № 2. Спец. вып. С. 115–127. 2. Колмогоров А. Н. Теория информации и теория алгоритмов. М.: Наука, 1987. 3. Дюкрок А. Физика кибернетики // Кибернетика ожидаемая и кибернетика неожиданная. М.: Наука, 1968. 4. Хаас Э. Э. Лучшие идеи Питера Друкера. СПб.: Питер, 2008. 5. Жижимов О. Л., Мазов Н. А., Федотов A. M., Шокин Ю. И. Сервер ZooPARK как сер- вер для построения распределенных информационных систем // Информационные техноло- гии в высшем образовании. 2005. Т. 2, № 1. С. 53–67. 6. Д'Эстен В. Ж. Французы. Размышления о судьбе народа. М.: Ладомир, 2004. 248 с. ¿. Ã. ‘‰ÓÚÓ‚ 14 7. Ляпунов А. А. О соотношении понятий материя, энергия и информация // Ляпунов А. А. Проблемы теоретической и прикладной кибернетики. Новосибирск: Наука, 1980. С. 320–323. 8. The Grid: Blueprint for a New Computing Infrastructure / Eds. I. Foster, C. Kesselman. San Francisco, CA: Morgan Kaufmann Pub., 1999. Материал поступил в редколлегию 13.08.2008 А. M. Fedotov Problems of Information Technologies The paper is devoted to problems and ontology's history of information technologies. Keywords: information technologies, information resource, history, network, information revolution, programming paradigms, search. |