2 Носители данных Данные составная часть информации
Скачать 53.03 Kb.
|
2.1. Носители данных Данные - составная часть информации. Представляют собой зарегистрированные сигналы. физический метод регистрации: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, изменение химического состава и (или) характера химических связей, В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов. Самым распространенным носителем данных является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. Изменение оптических свойств - в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (CD-ROM, DVD-ROM). В качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски. Регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии. Твердотельные накопители, флэш память, SD карты—основаны на технологии записи данных на основе регистрации электрического заряда в изолированной области полупроводниковой структуры. Носители данных интересуют нас не сами по себе. Любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). Операции с данными Обработка данных включает в себя множество различных операций. сбор данных — накопление информации с целью обеспечения достаточной полноты для принятия решений; формализация данных — приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности; фильтрация данных — отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом достоверность и адекватность данных должны возрастать; сортировка данных — упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации; архивация данных — организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом; защита данных — комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных; транспортировка данных — прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя — клиентом; преобразование данных — перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя: например, книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку. 2.2. Основные структуры данных Существует три основных типа структур данных: линейная, иерархическая, табличная. Если собрать все листы книги в правильной последовательности, мы получим простейшую структуру данных — линейную. Такую книгу уже можно читать, хотя для поиска нужных данных ее придется прочитать подряд, начиная с самого начала, что не всегда удобно. Для быстрого поиска данных существует иерархическая структура. Книги разбивают на части, разделы, главы, параграфы и т. п. Элементы структуры более низкого уровня входят в элементы структуры более высокого уровня. 2.2.1. Линейные структуры (списки данных, векторы данных) Линейные структуры — это списки. Список — это простейшая структура данных, отличающаяся тем, что каждый элемент данных однозначно определяется своим номером в массиве. Пример номера на отдельных страницах рассыпанной книги. При создании любой структуры данных надо решить два вопроса: как разделять элементы данных между собой ; как разыскивать нужные элементы. Разделителем может быть и какой-нибудь символ : пробелы или точка. В этом случае для розыска элемента с номером n надо просмотреть список начиная с самого начала и пересчитать встретившиеся разделители. Когда будет отсчитано n–1 разделителей, начнется нужный элемент. Он закончится, когда будет встречен следующий разделитель. Если все элементы списка имеют одну и туже длину, равную а, то разделители в списке не нужны. Для розыска элемента с номером n надо просмотреть список с самого начала и отсчитать а(n–1) символ. Со следующего символа - нужный элемент. Его длина тоже равна a, поэтому его конец определить нетрудно. Такие упрощенные списки, состоящие из элементов равной длины, называют векторами данных. Таким образом, линейные структуры данных (списки) — это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером. 2.2.2. Табличные структуры (таблицы данных, матрицы данных) Для таблицы умножения, например, адрес ячейки определяется номерами строки и столбца. Нужная ячейка находится на их пересечении, а элемент выбирается из ячейки. Если нужно сохранить таблицу в виде длинной символьной строки, используют один символ-разделитель между элементами, принадлежащими одной строке, и другой разделитель для отделения строк, например, так: Меркурий*0,39*0,056*0#Венера*0,67*0,88*0#Земля*1,0*1,0*1#Марс*1,51*0,1*2#… Для розыска элемента, имеющего адрес ячейки (m, n), надо просмотреть набор данных с самого начала и пересчитать внешние разделители. Когда будет отсчитан m – 1 разделитель, надо пересчитывать внутренние разделители. После того как будет найден n–1 разделитель, начнется нужный элемент. Он закончится, когда будет встречен любой очередной разделитель. Еще проще можно действовать, если все элементы таблицы имеют равную длину. Такие таблицы называют матрицами. В данном случае разделители не нужны, поскольку все элементы имеют равную длину и количество их известно. Таким образом, табличные структуры данных (матрицы) — это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент. Многомерные таблицы. Выше мы рассмотрели пример таблицы, имеющей два измерения (строка и столбец), но в жизни нередко приходится иметь дело с таблицами, у которых количество измерений больше. Вот пример таблицы, с помощью которой может быть организован учет учащихся. Номер факультета 3. Номер курса (на факультете) 2. Номер специальности (на курсе) 2. Номер группы в потоке одной специальности 1. Номер учащегося в группе 19 Размерность такой таблицы равна пяти, и для однозначного отыскания данных об учащемся в подобной структуре надо знать все пять параметров (координат). Иерархические структуры данных В иерархической модели связи между объектами графически отображаются в виде дерева. Самая главная вершина — корень — не подчиняется ни одной вершине. Для каждого объекта существует только одна вершина, с которой он связан, расположенная на более высоком уровне. Взаимосвязи между главным и подчиненным объектами устанавливаются по типу «Один — ко-многим». В иерархической структуре адрес каждого элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу. Например, Пуск->Все программы->Стандартные->Калькулятор. 2.3. Упорядочение структур данных Списочные и табличные структуры являются простыми. адрес каждого элемента задается числом (для списка), двумя числами (для двумерной таблицы) или несколькими числами для многомерной таблицы. Они также легко упорядочиваются. Основным методом упорядочения является сортировка. Данные можно сортировать по любому избранному критерию, например, по алфавиту и т.д. Основной недостаток — их трудно обновлять. Если, например, перевести студента из одной группы в другую, изменения надо вносить сразу в два журнала посещаемости; при этом в обоих журналах будет нарушена списочная структура. Если переведенного студента вписать в конец списка группы, нарушится упорядочение по алфавиту, а если его вписать в соответствии с алфавитом, то изменятся порядковые номера всех студентов, которые следуют за ним. Таким образом, при добавлении произвольного элемента в упорядоченную структуру списка может происходить изменение адресных данных у других элементов. В системах, выполняющих автоматическую обработку данных, нужны специальные методы для решения этой проблемы. Иерархические структуры данных по форме сложнее, чем линейные и табличные, но они не создают проблем с обновлением данных. Их легко развивать путем создания новых уровней. Даже если в учебном заведении будет создан новый факультет, это никак не отразится на пути доступа к сведениям об учащихся прочих факультетах. Недостатком иерархических структур является относительная трудоемкость записи адреса элемента данных и сложность упорядочения. Часто методы упорядочения в таких структурах основывают на предварительной индексации, которая заключается в том, что каждому элементу данных присваивается свой уникальный индекс, который можно использовать при поиске, сортировке и т. п. После такой индексации данные легко разыскиваются по двоичному коду связанного с ними индекса. Адресные данные. Если данные хранятся не как попало, а в любой организованной структуре, то каждый элемент данных приобретает новое свойство (параметр), который можно назвать адресом. Конечно, работать с упорядоченными данными удобнее, но за это приходится платить их размножением, поскольку адреса элементов данных — это тоже данные и их тоже надо хранить и обрабатывать. |