Главная страница

Тест по ТОД. Тест. Чем данные отличаются от информации Отличие информации


Скачать 24.5 Kb.
НазваниеЧем данные отличаются от информации Отличие информации
АнкорТест по ТОД
Дата01.11.2021
Размер24.5 Kb.
Формат файлаdocx
Имя файлаТест.docx
ТипДокументы
#260815

  1. Чем данные отличаются от информации?

Отличие информации от данных состоит в том, чтоданные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.  Данные - это носители информации, а не сама информация.


  1. Какие бывают меры информации: прагматическая и еще 2 других?


Синтаксическая мера и Семантическая мера.



  1. Какие бывают системы классификации (первые две похожи на дерево и таблицу)?


Иерархическая,Фасентная,Дескриптовая.



  1. Что такое ИС?


Информационная система (ИС) – это программно-аппаратный комплекс, который используется для сбора, хранения, обработки и выдачи информации. Традиционно ИС работают с огромными объемами сложноструктурированных данных.



  1. Перечислите 4 типа обеспечивающих подсистем ИС (из 6).


Информационное обеспечение. Техническое обеспечение. Математическое и программное обеспечение. Организационное обеспечение.



  1. Классификация ИС по степени автоматизации (3 вида):


Ручные. Автоматизированные. Автоматические.



  1. Что такое АИПС?


Автоматизированные информационно-поисковые системы.



  1. Расшифруйте аббревиатуры ИПЯ, ЕЯ, ПОЗ, ПОД, ПП, КСС:


ИПЯ-информационно-поисковой язык.
ЕЯ-естественный язык.

ПОЗ-поисковой образ запроса.
ПОД-поисковой образ документа
ПП-поисковое предписание.
КСС-критерий смыслового соответствия.


  1. На какие категории (3) делятся АИПС по результатам выдачи:


-Документальные

-Фактографические

-Информационно-логические


  1. Назовите другие (3) классификации ИС:


Формализуемые. Не формализуемые. Модельные,экспертные.



  1. Что такое декомпозиция АИПС и какие декомпозиции вы знаете?



Декомпозиция-операция мышления, состоящая в разделении целого на части..

Виды декомпозиций АИПС:

- функциональная декомпозиция;

- покомпонентная декомпозиция;

- декомпозиция на обеспечивающие составляющие;

- организационная декомпозиция;

- методологическая декомпозиция.


  1. Что такое система индексирования и какие СИ вы знаете?


Система индексирования (СИ) – совокупность средств и методов перевода текстов на ИПЯ с естественного языка с помощью заданного набора словарей ЛЕ и правил применения ИПЯ.
К первому типу относят системы свободного индексирования.

При втором методе, который условно называют методом полусвободного индексирования, из документа выписывают- слова и словосочетания вначале так же, как и при свободном индексировании.
Третий способ индексирования основан на статистическом подходе.
К четвертому типу относя т системы индексирования, контролируемые заданным словарем (тезаурусом).


  1. Перечислите основные элементы ИПЯ:


Алфавит, лексика и грамматика.


  1. Перечислите не менее 3-х показателей функциональной эффективности АИПС:


Полнота поиска; точность поиска; оперативность поиска; специфичность поиска; коэффициент корреляции; интегральный энтропийный показатель.



  1. Чем действительная релевантность отличается от формальной?


Найденный по запросу документ может иметь отношение к запросу, т. е. содержать нужную (искомую) информацию, а может и не иметь к запросу никакого отношения. В первом случае документ называется релевантным, во втором – нерелевантным, или шумовым.


  1. Что такое полнота и точность поиска (формулы или определения)?


Точность поиска – это параметр, показывающий, какова доля релевантных документов в общем числе найденных.
Полнота поиска – дополнительный параметр, показывающий, какова доля найденных релевантных документов в общем количестве релевантных документов. Если в области поиска на самом деле имеется 100 документов, содержащих нужную информацию, а по запросу найдено из них всего 30, то полнота поиска равна 30%.


  1. Перечислите виды (3) информационного обслуживания:


Документальное, фактографическое и концептографическое.



  1. Назовите 5 основных подсистем ДИПС:


1. Подсистема ввода и регистрации.

2. Подсистема обработки.

3. Подсистема хранения.

4. Подсистема поиска.

  1. Компоненты поисковых систем в интернете.


Паук (spider): его задача - скачивать WEB страницы; программа, которая подобна WEB браузеру.

Crawler: паук, которого называют «путешествующим»; он автоматически переходит по всем ссылкам, которые были найдены на странице.

Индексатор (indexer): программа, которую называют «слепой»; ее задача анализировать WEB страницы, которые были скачены пауками.

База данных (database): она является хранилищем страниц, которые были сначала скачены, а потом подвергнуты обработке.

Система выдачи результатов (search engine results engine): данная система помогает извлекать результаты поиска из базы данных.


  1. Как устроен процесс индексирования ресурсов Интернета?


Формирование индекса состоит из 4-х основных этапов. Рассмотрим подробнее каждый из них:

  • Извлечение текста. На этом этапе роботы извлекают текст из ресурса или страницы и отделяют его от лишних элементов: фотографии, разметки и других структурных элементов.

  • Формирование списка слов-лексем. На втором этапе робот формирует выборочную совокупность, чтобы дальше выделить лексему. Лексема — это слово или выражение, считающиеся за отдельную единицу. Такие единицы выделяются со всех слов в тексте на сайте.

  • Структурирование и обработка. На третьем этапе сформированные лексемы упорядочиваются в алфавитном порядке и пронумеровываются. Таким образом каждая лексема получает свой номер страницы и номер вхождения.

  • Формирование индексной записи. Подобная запись выглядит так: лексема/ № страницы + № вхождения/ № страницы + № вхождения/ № страницы + № вхождения. Поисковые роботы могут создать более сложную запись, но в ее основе все равно будет этот скелет.



  1. Основные принципы ранжирования.


Ранжирование — сортировка сайтов в поисковой выдаче, применяемая в поисковых системах. Существует множество факторов для ранжирования, среди которых можно отметить рейтинг сайта, количество и качество внешних ссылок, релевантность текста к поисковому запросу, на основании которых поисковая система формирует список сайтов в поисковой выдаче.


  1. Что такое веб-робот?


Поисковый робот — специальная программа, принадлежащая определенной поисковой системе и предназначенная для индексирования (занесения в базу сайтов поисковой системы) веб-сайтов и их страниц, найденных в интернет-пространстве. Также принятые названия: краулер, бот, паук, webcrawler, bot, automaticindexer, ant, webrobots, webspider, webscutter.



  1. Виды веб-роботов.


Робот-сканер изображений

Робот-«зеркальщик»

Сборщик иконок favicon.ico

Проверочный бот


  1. Для чего используют поисковых роботов (перечислить варианты)?


Статистический анализ

Обслуживание гипертекстов

Зазеркаливание

Исследование ресурсов


  1. Что означают параметры ИИПС охват и глубина?


Подохватомпонимается объём базы поисковой машины, измеряемый тремя показателями: общим объёмом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов.
Под глубиной понимается – существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.


  1. Основные функции поисковых машин.


Поиск ссылок.

Индексация документов сайтов.

Нахождение документов, соответствующих поисковому запросу.

Ранжирование документов.

Кластеризация документов.


  1. Классы ИИПС (по месторасположению компонент системы).


1. Распределенные системы, в которых процесс поиска реализуется на всей совокупности распределенных по сети ресурсов, как первичных – текстовых файлов, так и вторичных – реферативная и библиографическая информация.

2. Частично распределенные, в которых вторичная информация располагается на одном поисковом сервере, а первичная распределена по всей совокупности серверов.

3. Локальные системы, которые обеспечивают доступ пользователей к ресурсам сосредоточенном на одном сервере.



  1. Что из себя представляют метапоисковые системы?


Метапоисковые системы –это системы, которые используют для поиска базы данных других поисковых систем. Они посылают запрос одновременно на несколько поисковых систем, каталогов и иногда в так называемую невидимую (скрытую) паутину – хранилище онлайн-информации, не считанной традиционными поисковыми системами.


  1. Что из себя представляют вербальные системы?


Основным инструментом поиска в Интернет следует считать вербальные поисковые системы. Как и у локальных ИПС, это тип систем посткоординатного типа, который "противостоит" предкоординируемым ИПС – классификационным (тематическим каталогам). В английской литературе за ними закрепился термин "search engine". По-русски мы предлагаем называть их "поисковые системы".



  1. Язык запросов вербальных ИПС (способы задания ПП).


Указание положения слова в тексте с точностью до номера предложения и номера этого слова в предложении позволяет построить гибкий язык запросов, позволяющий задавать расстояние между словами и предложениями в документе.


написать администратору сайта