МСПИСТ. лб1-мспист. Отчет по лабораторной работе 1 Проектирование системы классификации и кодирования
Скачать 118.57 Kb.
|
Санкт-Петербургский государственный университет телекоммуникаций им. проф. М. А. Бонч-Бруевича Факультет информационных систем и технологий Кафедра безопасности информационных систем Дисциплина «Методы и средства проектирования информационных систем и технологий» Отчет по лабораторной работе № 1 «Проектирование системы классификации и кодирования» Группа: ИБ-85з Выполнил: Белов А.П.. Проверил: Цель работы: получить навыки проектирования систем классификации и кодирования различных видов информации, полученной в ходе проведения предпроектного обследования. В ходе данной лабораторной работы для проектирования систем классификаций были выбраны учёт товаров (фильмы). Радикально возросшее число фильмов потребовало систем их классификации. В течение 20-го века видеосалоны были озабочены отслеживанием многочисленных новых книг, число которых увеличивалось ежегодно. В рамках данной лабораторной работы выполнена классификация данной предметной области тремя методами: иерархическим, фасетным, дескрипторным (описательным). Ход работы Была спроектирована иерархическая модель (рис.1) Рис 1. - Иерархическая модель
Была спроектирована фасетная модель (рис.2) Рис.2 – Фасетная модель Задача №1 Какую книгу написал Рэй Брэдбери в 20 веке? Решение: Ф13?Ф21 = «451 градус по Фаренгейту». Задача №2 Найти все книги изданные в 20 веке Стивена Кинга. Решение: Ф14?Ф21 = «Кэрри». Задача №3 Найти книги, выпущенные в 21 веке жанра «классическая проза». Решение: Ф22?Ф33 = «Старик и море», «Праздник, который всегда с тобой». Задача №4 Какие книги жанра «зарубежная мистика» выпущены в 21 веке? Решение: Ф22?Ф25 = «Возрождение». Задача №5 Какое фэнтези произведение написал Джордж Р.Р. Мартин в 20 веке? Решение: Ф15?Ф21?Ф32 = «Игра престолов», «Буря мечей». Была разработана дескрипторная модель Был составлен неполный список наиболее часто используемых слов для поиска информации о литературе и книгах. Классика, классическая литература Джордж Мартин Книга года Фэнтези Древние книги Приключения Книги для подростков Детективы Запись в библиотеку онлайн Фантастика Космическая фантастика Социальная фантастика Школьные книги, книги учебная программа, школьная программа Научные книги Былины Литература 18 века Детские книги Книги по жанрам, жанры книг Издательство “Питер” Слово о полку Игореве Без возрастных ограничений Новинка, новинки 2015 Книги Германии Ужасы Серии книг Интеллектуальный бестселлер Представленный выше список был нормализован, из списка синонимов были выбраны наиболее употребляемые. В ходе нормализации был составлен словарь дескрипторов. Классическая литература Детские книги Книги для подростков Фэнтези Детективы Школьная программа Научные книги Литература 18 века Фантастика Серии книг Синонимическая связь, указывающая некоторую совокупность ключевых слов как синонимы. Пример: литература-книги Родовидовая связь. Указывает на общность некоторых объектов Примеры: книги для подростков-детские книги, классическая литература-литература 18 века Ассоциативная связь. Соединяет дескрипторы, обладающие общими свойствами, позволяющая расширить область поиска информации. Пример: фэнтези-детективы-фантастика Вывод В ходе выполнения лабораторной работы были изучены три метода классификации данных. Были выявлены определенные недостатки и явные преимущества каждой из них. Иерархическая классификация позволяет хранить огромное количество данных, всегда иметь возможность отследить происхождение и исходные данные. Однако явным недостатком такого вида классификации является недостаточная гибкость и трудность в добавлении новых объектов в средние и верхние уровни. Фасетный метод классификации, как и иерархический, позволяет использовать большие объемы данных, но в отличие от предыдущей, является очень гибкой и модульной. Возможность добавления новых данных в систему без глобальных переделок. Недостатками такой классификации является большая ресурсозатратность из-за неполного использования емкости, а также не традиционность и сложность применения. Дескрипторная классификация сильно отличается от двух предыдущих. Этот метод используется в поисковых системах для так называемого интеллектуального поиска, позволяет строить связи между объектами, однако требует длительной подготовки перед запуском системы, подготовки дескрипторных словарей, создание связей, которые создаются вручную без какой-то очевидной системы. Исходя из вышесказанного, можно отметить, что дескрипторный метод чаще используют в поисковых системах интернета или библиотеках, фасетная используется в классификации товаров, определения категорий. А иерархическая позволяет ранжировать данные. Это может быть полезно в тех же магазинах или местах, где легко можно объединить объекты в одну категорию. Санкт-Петербург 2021 |