Главная страница
Навигация по странице:

  • Облачные технологии хранения данных

  • Виды баз знаний

  • Разделы международной патентной классификации

  • Лекция 5. 2 Систематизация и хранение информации


    Скачать 38.81 Kb.
    Название2 Систематизация и хранение информации
    Дата22.11.2022
    Размер38.81 Kb.
    Формат файлаdocx
    Имя файлаЛекция 5.docx
    ТипПрограмма
    #805906

    2.2. Систематизация и хранение информации
    Появление электронных компьютеров с хранимыми программами произвело настоящую революцию в области обработки информации. Дальнейшее развитие технологии обработки информации напрямую связано с успехами в области совершенствования программ и собственно компьютеров. В XX веке человечество стало свидетелем информационного взрыва. Количество информации, которую получает человек, удваивается каждые десять лет. Если раньше систематизировались в основном только текстовые и числовые данные, то теперь стало необходимым обрабатывать практически всю информацию, которая доступна органам чувств человека. Последние достижения компьютерных технологий, включая развитие средств коммуникаций, позволяют решить эту задачу.

    Информационная система (ИС) – это программно-аппаратный комплекс, функции которого состоят в надежном хранении информации, предоставлении пользователю удобного интерфейса и, что особенно важно, выполнении специфических операций по преобразованию и поиску необходимой информации.

    Информационная система позволяет облегчить труд человека, повысить качество и достоверность обработки информации. Она может храниться как в «бумажном» варианте, так и в памяти компьютера. Основу информационной системы составляют хранящиеся в ней данные. Хорошая информационная система должна предоставлять достоверную информацию в определенное время конкретному лицу с ограниченными затратами.

    Систематизация документов основывается на ряде принципов, вытекающих из целей и задач классификационных систем.

    Основным принципом является приоритет содержания документа над всеми другими его признаками: конструктивной формой, естественным языком, читательским назначением и т.п. Документ, прежде всего, получает индекс отраслевого отдела основных таблиц, а его второстепенные признаки отражаются с помощью вспомогательных типовых делений. Исключение составляют художественная литература, универсальные энциклопедии, словари, библиографические пособия и другие документы, систематизация которых по содержанию объективно невозможна. Для систематизации таких документов предусмотрены специальные отделы, к которым в библиотечно-библиографической классификации (ББК), например, относятся «84 Художественная литература (произведения)», «9 Литература универсального содержания» и другие, а в универсальной десятичной классификации (УДК), например, относятся «82 Художественная литература. Литературоведение». Необходимость таких отделов диктуется особенностями читательского спроса и ассортиментом печатной продукции.

    Принцип объективности требует выявления основной сути документа, возможно более точного отражения его содержания и других признаков с помощью правильного классификационного решения. Объективный анализ научной, научно-популярной книги невозможен без владения систематизатором знанием той отрасли, которой посвящен документ.

    Реализация этого принципа требует постоянного слежения за последними дополнениями и изменениями в классификационной системе, позволяющими своевременно актуализировать таблицы.

    Принципом последовательности руководствуются при принятии окончательного классификационного решения в процессе редактирования индексов. Выполнение этого принципа означает, что принятое однажды классификационное решение всегда применяется в идентичных случаях систематизации. Реализации данного принципа способствуют указания общей и частной методики систематизации, рабочие таблицы классификации, отражающие особенности структуры и степень детализации фонда и систематического каталога, наличие картотеки методических решений. Следование данному принципу устранит случаи систематизации одной и той же книги разными способами.

    Классификационное решение выражают с помощью следующих индексов:

    • полочного, который определяет место документа на полке;

    Полочный индекс приводят в левом верхнем углу каждой карточки. Сочетание полочного индекса и авторского знака - условного обозначения фамилии автора или первого слова заглавия документа - является шифром хранения документа, т.е. условным обозначением места хранения документа в фонде при систематической расстановке.

    • каталожного, который определяет место библиографической записи в каталоге;

    Каталожный индекс проставляют в нижнем левом углу каждой карточки. Каталожный индекс совпадает с полным, если документ монотематичен и, естественно, отражается в одном отделе систематического каталога.

    • полного, который представляет собой совокупность всех каталожных индексов для данного документа.

    Полный индекс указывает, в каких делениях отражается данный документ при многократном тиражировании и сколько экземпляров карточек (основной и дополнительных) необходимо для включения в систематический каталог.

    Полный индекс размещают в правом нижнем углу карточки систематического каталога. Входящие в него каталожные индексы объединяются знаком +. Первым всегда ставится тот индекс, по которому документ стоит на полке.

    После поиска информации и ее соответствующей обработки возникает проблема хранения данных. Здесь исследователь должен решить несколько вопросов: как долго должна храниться информация (нужна ли она только для промежуточного этапа исследования или к ней будут возвращаться многократно; она может использоваться в первоначальном виде или будет преобразована и сохраняться в новой форме); на каких носителях следует хранить данные; следует ли их хранить с открытым доступом, либо в силу конфиденциальности к ним должен быть санкционированный доступ.

    Элемент информационной системы, информация о котором сохраняется в ней, называется объектом. Объект может быть реальным (человек, населенный пункт, какой-либо предмет) и абстрактным (событие, счет покупателя). Каждый объект обладает набором свойств, которые запоминаются в информационной системе. Свойства, характеризующие объект, называются атрибутами объекта. Каждый атрибут имеет свое имя – идентификатор. Атрибут, записанный на каком-либо носителе информации, называют элементом данных, полем данных или просто полем. При обработке данных часто встречаются однотипные объекты с одинаковыми свойствами. Совокупность объектов, обладающих одинаковым набором свойств, называется классом объектов.

    Сроки хранения определяются:

    - содержанием информации (нормативные документы, сведения фундаментального характера хранятся дольше);

    - скоростью ее старения (быстро стареющие данные, как правило, часто обновляются);

    - видом научного исследования, в интересах которого информация собирается (в исторических, экономических и других науках, где перспектива формируется с учетом ретроспективы, т.е. данных прошлого времени, следует постоянно хранить старые сведения, т.к. они позволяют установить тенденции развития систем, общества от прошлого в будущее).

    В науке не существует строгих правил расчета сроков хранения данных. Здесь весьма сильное влияние оказывают субъективные факторы (опыт и стиль работы исследователя, уровень его информированности и др.).

    Важным вопросом хранения данных является выбор носителей информации. Это могут быть специальные папки для хранения документов (папки-скоросшиватели, папки архивные), картотеки, магнитные и другие современные носители. В качестве носителей используются также рабочие тетради, подшивки газет и журналов и т.п.

    В настоящее время, наряду с магнитными носителями информации (гибкими и жесткими дисками), широко используются оптические (CD/ DVD -диски) и электронные носители информации (flash-устройства).

    Возможность переноса на дискету, оптический диск и флэш-карту содержания книги, быстрого обновления содержащейся информации, редактирования, копирования и выполнения других процедур обусловила огромную популярность оптических и электронных носителей в среде научно-технических специалистов, аспирантов, студентов. Эта популярность особенно возросла с появлением системы интернет.

    В то же время выявились и недостатки цифровых носителей информации:

    • хранение данных на жестких дисках компьютеров нередко приводит к утрате информации из-за выхода из строя ЭВМ, нарушения правил пользования ими. Это требует дублирования данных (например, записав их на жесткий диск компьютера, пользователь должен сделать копию на дискете, оптическом диске, flash-устройстве либо распечатать ее на принтере и поместить в папку документов);

    • к информации, хранящейся на цифровых носителях, в компьютерных информационных системах, возможен несанкционированный доступ, что затрудняет сохранение конфиденциальности информации с точки зрения авторского права, новизны, секретности и т.д.;

    • установление защиты от несанкционированного доступа часто требует значительных затрат.

    В последнее время набирают популярность облачные технологии хранения данных. Информация хранится на многочисленных, распределённых в сети серверах, при этом пользователи не видят структуру серверов, они работают в облаке – одном большом виртуальном сервере. (Табл. 2.1)
    Таблица 2.1

    Облачные технологии хранения данных


    Название хранилища

    Особенности

    Сайт

    Google Drive

    Позволяет хранить 30 типов файлов, предоставляет инструменты для работы с документами в режиме онлайн. Кроме доступа к сервису через веб-интерфейс, есть возможность доступа через клиентов для Windows, Mac OS и Android, iOS

    https://drive.google.com

    Dropbox

    Простота в использовании и высокая скорость работы.Чтобы поместить файлы в облако, нужно открыть доступ к папке и синхронизировать с устройством. Возможность восстановить данные после удаления в течении 30 дней. Для обеспечения конфиденциальности есть инструмент BoxCryptor, который шифрует файлы перед передачей в облако

    http://www.dropbox.com

    Mega

    Забота о конфиденциальности. Данные шифруются в браузере, передаются в облако, ключи дешифрования не публикуются в открытом доступе, а передаются между доверяющими друг другу пользователями

    https://mega.co.nz

    Яндекс.Диск

    Диск интегрирован в офисный пакет Microsoft Office, а так же дает возможность автоматической загрузки фото и видеофайлов с цифровых камер и внешних носителей информации

    http://disk.yandex.ru

    Облако@mail.ru

    Доступ через мобильные приложения для Android и iOS, клиент для Linux. В облако можно автоматически загружать фотографии с телефона через мобильные приложения.

    https://cloud.mail.ru

    Amazon WebServices

    Различные варианты хранения данных (объектное хранилище, блочное хранилище, хранилище файловых систем, архивное хранилище, интегрированное хранилище), различные сетевые решения (виртуальное частное облако, прямое подключение, балансировка нагрузки), инструменты обработки данных и формирования баз данных, корпоративные приложения и мобильные сервисы.

    https://aws.amazon.com

    OneDrive

    Облачное хранилище от компании Microsoft интегрировано с Office365, что позволяет непосредственно из приложения создавать, редактировать, сохранять файлы Excel, OneNote, PowerPoint и Word в облаке

    http://onedrive.com


    Базы знаний в организациях

    Базы знаний представляют собой информационные системы, содержащие замкнутый, не подлежащий дополнению объем информации по данной теме, структурированной таким образом, что каждый ее элемент содержит ссылки и другие логически связанные с ним элементы из их общего набора. Ссылки на элементы, не содержащиеся в данной базе знаний, не допускаются. Такая организация информации в базе знаний позволяет учащемуся изучать ее в той логике, которая ему наиболее предпочтительна в данный момент, т. к. он может по своему желанию легко переструктурировать информацию при знакомстве с ней. Привычным библиографическим аналогом базы знаний являются энциклопедии и словари, где в статьях содержатся ссылки на другие статьи этого же издания. Программные продукты, реализующие базы знаний, относятся к классу HIPERMEDIA сверхсреда), поскольку они позволяют не только осуществлять свободный выбор пользователем логики ознакомления с информацией, но дают возможность сочетать тексто-графическую информацию со звуком, видео- и кинофрагментами, мультипликацией. Компьютерная техника, способная работать в таком режиме, объединяется интегральным термином MULTIMEDIA (многовариантная среда).

    База знаний – это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.

    Под базами знаний понимает совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации.

    Классификация баз знаний в зависимости от уровня сложности систем указаны в табл. 2.2
    Таблица 2.2

    Виды баз знаний

    База знаний

    Пример

    Всемирного масштаба

    Интернет или Википедия

    Национальная

    Википедия

    Отраслевая

    Автомобильная энциклопедия

    Организаций

    Управление знаниями

    Экспертных систем

    Экспертная система


    В основе систем баз знаний лежат принципы работы человеческого интеллекта. Интеллектом называется способность подходить к решению какой-либо задачи с учетом имеющегося опыта.

    Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз – помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.

    Системы, основанные на знаниях, реализуются на базе следующих интеллектуальных алгоритмов: 

    • экспертные системы;

    • нейронные сети;

    • нечёткая логика;

    • генетические алгоритмы.

    Патентные базы

    Базы данных по патентам – необходимый инструмент для проведения патентного поиска. Они содержат сведения по заявкам и выданным патентам, позволяя узнать о разработках конкурентов и получить информацию о прототипах и аналогах. Информация в базах открытая, поэтому теоретически патентный поиск может провести технический специалист, разработавший решение. Но, работая с открытыми и бесплатными источниками, необходимо учитывать, что база патентов и заявка может быть неполной, не все базы поддерживают нормальный поиск по нужным параметрам – система сложная и требует поддержки специалиста, а у большинства баз и вовсе отсутствует поиск на русском языке. Даже если система нашла информацию, не все результаты могут отвечать запросу. Базы данных по патентам представлены в табл. 2.3.
    Таблица 2.3

    Название

    Особенности

    Недостатки

    База ФИПС

    По базе ФИПС можно провести как бесплатный, так и платный поиск. Она содержит сведения о новых зарегистрированных патентах, опубликованных заявках и архивы патентов СССР. Предусмотрена возможность просмотра официальной публикации в формате PDF и поиск по номеру регистрации, дате публикации, индексам МПК и МКПО (для изобретений, полезных моделей, промышленных образцов и товарных знаков)

    Бесплатная версия позволяет получить информацию только по заявкам и патентам за последние 3 месяца. Полный доступ с возможностью полнотекстового поиска – платный

    ЕАПАТИС

    База ЕАПАТИС обеспечивает доступ к мировым, региональным и национальным фондам патентной документации. Русскоязычный фонд представлен патентной документацией России, ЕАПВ и национальных патентных ведомств стран евразийского региона

    Содержит информацию о заявках и патентах ЕАПВ только с 1996 года. Результаты поиска в бесплатной версии представляются в виде реферативно-библиографических описаний патентных документов. Платный поиск позволит просмотреть титульные листы и полные описания евразийских патентов и опубликованных заявок


    Окончание таблицы 2.3

    PATENTSCOPE

    База PATENTSCOPE содержит информацию по международным заявкам, поданным по системе PCT, а также накапливает документы из некоторых региональных и национальных патентных ведомств (всего около 30). По базе можно провести поиск патентов по различным странам – от Японии до США

    Сложный процесс поиска, который подходит для профессионалов в патентовании


    Google Patent

    Бесплатная поисковая система Google Patents поможет провести расширенный поиск и ознакомиться с полным текстом патентов со всего мира (по базе патентов США и ЕПВ). Осуществляет поиск по таким критериям, как автор, название, номер патента, дата. Система использует технологию распознавания текста в фотографиях, позволяя осуществить поиск по тексту в отсканированных патентах

    Можно использовать на начальной стадии поиска, полноту желательно проверять по национальным базам


    Esp@cenet

    База Esp@cenet содержит максимально возможную коллекцию бесплатной патентной информации: можно узнать не только о выданных европейских патентах на изобретения, но и ознакомиться с патентными документами базы ЕАПВ. Есть отдельный русскоязычный сервис

    Неразвитая поисковая система, небольшой набор ключевых слов, которые можно использовать для поиска, отсутствие развитых средств работы с найденными документами


    Провести качественный патентный поиск можно только за деньги, поскольку он требует участия высококвалифицированных технических специалистов и профессионального ПО. Самое надежное решение – обратиться за проведением патентного поиска к специалистам Роспатента. Роспатент является органом государственной исполнительной власти, основные функции которого состоят в следующем:

    • предоставление, регистрация и поддержание на территории России прав на интеллектуальную собственность;

    • контролирование и надзор в правовой сфере охраны интеллектуального капитала;

    • отстаивание и защита интересов граждан России, получивших права на патенты.

    Патентное ведомство проводит прием заявок, выполняет экспертизы, регистрацию и выдачу охранных документов на товарные знаки, объекты промышленной собственности, авторские права, программы ЭВМ. Регламентирующими документами являются Конституция РФ и Федеральные законы, а также ведомственные стандарты – Административные регламенты службы.

    Федеральная патентная служба вносит все официальные изменения в гос. реестры, осуществляет продление, восстановление или прекращение правовой защиты, а также контролирует уплату всех видов пошлин.

    Роспатент регистрирует все сделки о передаче прав собственности по патентам и свидетельствам, лицензионные договоры и соглашения на уступки и отчуждения прав. Сведения о регистрации сделок публикуются в открытом доступе.

    В Роспатенте проводится аттестация с последующей регистрацией патентных поверенных.

    Преимущества очевидны – если выяснится, что аналогичное изобретение уже запатентовано, специалисты Роспатента помогут решить возникшую проблему. Отчет о патентном поиске и рекомендации по доработке входят в любой пакет услуг по патентованию.

    Международная патентная классификация

    Международная классификация изобретений (МКИ) создавалась в соответствии с положениями Европейской конвенции о международной патентной классификации (1954). МКИ периодически пересматривается для совершенствования системы с учетом развития науки и техники. Каждые 5 лет выходит очередная редакция МКИ для индексирования документов текущей регистрации.

    Практическое использование патентной документации невозможно без ее строгой классификации. Классификация изобретений имеет целью распределение описаний изобретений, а также других патентно-информационных документов по тематическим рубрикам с целью обеспечения ориентации в патентной документации и нахождения материалов, соответствующих запросам. На основании принятой классификации изобретений производятся индексирование и расстановка патентной документации в фонде.

    Рост объёма мирового патентного фонда, развитие международного сотрудничества привели к крайне важности создания единой классификации изобретений. Неоднократные попытки сближения различных национальных систем классификации изобретений завершились разработкой Международной патентной классификации (МПК). С 1 января 2009 ᴦ. вступила в силу девятая редакция МПК (МПК-2009).

    МПК охватывает все области знаний, объекты которых могут подлежать защите охранными документами. МПК разделена на 8 разделов, обозначаемых заглавными латинскими буквами, которые указаны в табл.2.4
    Таблица 2.4

    Разделы международной патентной классификации

    Раздел

    Область знаний

    A

    Удовлетворение жизненных потребностей человека

    B

    Различные технологические процессы; транспортирование

    C

    Химия; металлургия

    D

    Текстиль; бумага

    E

    Строительство; горное дело

    F

    Машиностроение; освещение; отопление; оружие и боеприпасы; взрывные работы

    G

    Физика

    H

    Электричество


    Каждый раздел делится на подразделы, которые не обозначаются индексами. Каждый раздел делится на классы. Индекс класса состоит из индекса раздела и двузначного числа. Каждый класс содержит один или более подклассов. Каждый подкласс подразделяется на группы. В свою очередь группы делятся на основные группы и подгруппы. Индекс каждой группы состоит из индекса подкласса, за которым следуют два числа, отделённых наклонной чертой. Индекс основной группы состоит из индекса подкласса, после которого следует одно–, двух– или трехзначное число, наклонная черта и два нуля.

    Подгруппы образуют рубрики, подчинённые основной группе. Индекс подгруппы состоит из индекса подкласса, за которым следует одно–, двух– или трехзначное число его основной группы, наклонная черта и по крайней мере две цифры, кроме 00.

    Текст подгруппы принято понимать всегда в пределах её основной группы и точно определяет предметную область, целесообразную при поиске изобретений. Перед текстом подгруппы ставится одна или несколько точек, которые определяют степень её подчиненности, т.е. указывают, что подгруппа является рубрикой, подчиненной ближайшей вышестоящей рубрике, напечатанной с меньшим сдвигом, ᴛ.ᴇ. имеющей на одну точку меньше.

    Заголовки классов, подклассов или групп могут содержать фразу, заключенную в скобки. Такая фраза, называемая отсылкой, указывает, что тематика, обозначенная отсылкой, охватывается другим подразделением МПК.

    Программное обеспечение для хранения и систематизации знаний:

    1. MS OneNote

    Она находится в офисном пакете Windows, начиная с MS Office 2003. Это программа-блокнот с несколькими уровнями иерархии, позволяющими создавать записные книжки, разделы, страницы и подстраницы.

    Подходит для систематизации и хранения любой информации,

    Возможности программы безграничны. Можно выбрать вид «подложки», всевозможно редактировать текст, делать списки с чек-боксами (для отметки галочками), рисованные пометки. Можно использовать теги – ключевые слова, или просто пользоваться поиском.

    Есть версии для android, iOs и OSX. Для любителей Apple есть ещё и платная программа Outline. Её преимущество в том, что записные книжки можно хранить только на компьютере.

    Достойным конкурентом OneNote является Evernote. Суть программы та же. Несколько в другом формате представлены записки. Изначально ориентирована на синхронизацию с мобильными устройствами через интернет. У нее есть ограничения по использованию бесплатного аккаунта. Зато эта программа может использоваться и на платформах Apple, и на старых версиях android.

    Пользователи Linux могут попробовать Keynote.

    1. Mind maps

    Вторым по важности являются программы по построению карт памяти – mind maps.

    Безусловным лидером таких программ является Mind Manager – это самая удобная программа, но вместе с тем и самая дорогая.

    Менее затратный вариант – Xmind. У нее есть бесплатная версия – вы сможете делать карты для собственного использования, но не сможете экспортировать в pdf, чтобы показать другу, у которого не установлена эта программа.

    Самый доступный вариант Freemind – она бесплатна, интуитивно понятна и подходит для любой платформы.

    1. Wunderlist

    Сейчас существует огромное количество планировщиков разной степени сложности. В ней есть подзадачи и место для дополнительной информации. В платной версии программы можно даже прикреплять файлы и направлять задания другим людям. Wunderlist позволяет выделять важные события, ставить дедлайны и напоминания, в том числе для повторяющихся событий.

    Программа доступна для Windows, всех платформ Apple, android и в качестве web-приложения.


    написать администратору сайта