Главная страница
Навигация по странице:

  • Введение в технологии машинной обработки данных и основные определения

  • Прикладная программа Операционная система

  • Типы, форматы, структуры данных

  • Типы данных.

  • Реляционная модель данных

  • 4.4 Базовые сведения о компьютерной графике и геометрии Компьютерная графика

  • Учебное пособие по информатике 2014. Основы информатики


    Скачать 4.61 Mb.
    НазваниеОсновы информатики
    АнкорУчебное пособие по информатике 2014.pdf
    Дата28.03.2018
    Размер4.61 Mb.
    Формат файлаpdf
    Имя файлаУчебное пособие по информатике 2014.pdf
    ТипУчебное пособие
    #17317
    страница16 из 28
    1   ...   12   13   14   15   16   17   18   19   ...   28
    OLAP (англ. online analytical processing, аналитическая обработка в реальном времени) — технология обработки данных, заключающаяся в подготовке суммарной
    (агрегированной) информации на основе больших массивов данных, структурированных по многомерному принципу.

    132 и средства — лингвистические переменные одного и того же языка.
    Например, описание весовых свойств может быть представлено несколькими, но имеющими один смысл, вариантами предложений:
    «Чугунная заготовка весом 29 килограммов» или «Чугунная заготовка имеет свойство m = 29, где m — вес в килограммах».
    Автоматическое приведение такого рода представлений к очевидно наилучшей для этого случая табличной форме, потребовало бы применения трудно реализуемых процедур морфологического и семантического анализов. Однако с другой стороны, выделение смысла (и генерация новой информации) обычно производится человеком, сознание которого (как среда преобразования) ориентировано именно на обработку лингвистических переменных.
    Рассматривая процесс автоматизированной генерации новой информации (рисунок 4.3), где в качестве источника исходных данных используются БД, нужно сказать, что отбор и обработка должны быть выделены в отдельные процессы, так как с точки зрения общей (суммарной) эффективности один из них (обычно поиск) должен быть опосредованным — оценка полезности найденной информации производится обычно человеком, так как сознание человека — внешняя по отношению к машине среда, работает со слабоструктурированной информацией эффективнее машин.
    Рисунок 4.3 – Схема процесса автоматизированного решения задач
    Случаи, когда информация представляется в форме, не адекватной архитектуре фон-неймановских машин, могут быть обусловлены разными факторами. Рассмотрим следующие случаи.
    1.Хорошо структурированная информация, представляемая в графическом или специальном формате. Например, структурные химические формулы, конструкторская документация и т. д. В этом случае для автоматической обработки требуются узкоспециализированные средства, что приводит к общей неунифицированности представления семантических элементов (например, графических примитивов) на уровне данных.
    2.Информация, точная по содержанию, но вариантно представляемая по форме. Например, описание в текстовом виде численно задаваемых параметров изделия. Лингвистические переменные в этом случае имеют точное значение, однако построение универсальной процедуры автоматического выделения факта из текста трудоемко и потому
    Контекст
    Решение задачи
    Отбор исходных данных
    Обработка данных
    БД
    Постановка задачи

    133 нецелесообразно.
    3.Слабоструктурированная информация, обычно представляемая в текстовой форме. Например, учебная или научная публикация, где новые понятия строятся на основании ранее определенных. В этом случае лингвистические переменные могут принимать новые, ранее не определенные значения, которые определяются контекстом — ближним
    (словосочетания) или общим (темой сообщения).
    Возвращаясь к процедуре поиска как важнейшей составляющей использования баз данных, еще раз отметим, что критерий отбора должен содержать не только величину (например, слово), но и контекст.
    В реальных системах поиск документальной информации, представленной в текстовой форме, производится по вторичным документам
    — специально создаваемым поисковым образам, точно идентифицирующим сам документ как единицу хранения, и приблизительно, в краткой форме, путем перечисления основных понятий, отражающий смысловое содержание.
    Такой подход позволяет построить процедуры поиска на основе теоретико- множественной модели с точной логикой отбора по критерию наличия заданного сочетания терминов запроса в списке терминов поискового образа.
    Однако контекст использования терминов должен быть доопределен отдельно — либо во время поиска, например, указанием тематической области, либо после отбора из базы — во время ознакомления человека с содержанием найденного.
    Определение контекста предметной области в целом осуществляется с помощью тезаурусов терминологических систем, фиксирующих с помощью родо-видовых и других отношений роль и семантику дескрипторов — выделенных терминов, которые используются для формирования поисковых образов документов.
    Для доопределения смысла термина в составе поискового образа документа в первых поколениях автоматизированных информационных систем применялись специальные указатели роли, однако их использование было трудоемко и требовало специальной подготовки пользователя, поэтому в современных системах не применяется.
    Другой важный фактор, влияющий на эффективность работы человека с информацией — это форма хранения и представления — структура и оформление документа. Это особенно заметно при работе с объемными полнотекстовыми документами, причем иногда определяется на уровне машинного формата (например, DOC, PDF, HTML и т. д.), от выбора которого зависит возможность дальнейшей обработки.
    В том случае когда для хранения информации используются базы данных, структура документов может быть определена двумя путями:

    так же как и для фактографических БД, заданием схемы — последовательности именованных типизированных полей данных;

    контекстным определением — использованием специализированных языков разметки (например, HTML или XML), задающим индивидуальные особенности представления материала каждого документа.

    134
    Использование встраиваемых определений структуры позволяет ввести
    «самоопределяемые» форматы представления документов. Это обеспечивает практически неограниченную гибкость при организации хранения коллекций разнородных документов, однако создает семантические проблемы согласованного использования материала (из-за возможности различной интерпретации определений), что в свою очередь требует создания доступного всем пользователям репозитария метаинформации — описаний природы и способов представления информации.
    Введение в технологии машинной обработки данных и основные
    определения
    Реальные базы данных промышленного масштаба содержат миллионы записей, данные которых описывают состояния и взаимосвязи многих и многих объектов реального мира.
    Требования, предъявляемые пользователями к автоматизированным или автоматическим системам, обрабатывающим эти данные, обусловливают и требования к параметрам подсистем внешней памяти, в первую очередь, предполагают высокую оперативность доступа.
    Важной особенностью здесь является то, что архитектура систем и технологий управления данными непосредственно связана с двумя следующими значительными, хотя и противоположными обстоятельствами:

    непредсказуемой вариантностью представления данных в прикладной программе, зависящей от разнообразных особенностей пользовательских задач;

    жесткостью технических решений устройств внешней памяти, выражающейся в функциональной простоте
    2
    операций и ограниченности форм представления данных.
    Высокая эффективность решений в области обработки данных достигается введением промежуточных слоев специализированных технических и программных средств. Характер проблем и архитектурно- технологические решения такого рода достаточно полно иллюстрируются приведенной на рисунке 4.4 примерной схемой реализации операций ввода- вывода — взаимодействия прикладной программы с компонентами операционной системы и устройствами внешней памяти. Здесь
    специализация компонент выражается в том, что по существу каждый из них реализует различные способы работы с потоком данных (и в частности, его
    2
    Требование операционной простоты определяется производственными и экономическими причинами: устройство должно быть надежным в использовании и дешевым в изготовлении (т. е. содержать минимум механических компонент и сложной логики).
    Функциональная ограниченность управления данными, кроме того, диктуется еще и требованием унифицированности: устройство должно одинаково эффективно и стандартным способом использоваться в составе различных вычислительных и операционных систем, даже если со временем отдельные компоненты систем будут принципиально меняться.

    135 фрагментацию на блоки), что и обеспечивает, с одной стороны, необходимый уровень декомпозиции и идентификации логических/физических записей, а с другой — независимость физического и логического уровней представления данных.
    Здесь термины логический и физический отражают различия аспектов представления данных. Логическое представление указывает на то, как данные используются в прикладной программе, т. е. отражают логику обработки. Физическое представление — это то, как данное хранятся на
    физическом носителе.
    Рисунок 4.4 – Примерная схема организации ввода-вывода
    Будем считать логической записью идентифицируемую (именованную)
    совокупность элементов или агрегатов данных, воспринимаемую прикладной программой как единое целое при обмене информацией с внешней памятью (по крайней мере, для операций ввода-вывода).
    Физической записью будем считать совокупность данных, которая может быть считана или записана как единое целое одной командой ввода-вывода.
    Важно, что для компонент различного уровня в технологической цепи ввода- вывода состав и структура физической записи может быть разной.
    Структура данных и их взаимосвязь в случаях логического и физического представления могут не совпадать. Например, а) одна физическая запись может включать несколько логических; б) порядок следования элементов данных в физической записи может быть изменен для
    Оперативная память
    Рабочая область прикладной программы
    Запись 1
    Системный буфер
    Запись 1 Запись i+1
    Прикладная
    программа
    Операционная
    система
    Файловая система
    Драйвер устройства
    Подсистема ввода- вывода
    Определение данных
    Определение файла
    Логическая структура устройства
    Параметры устройства
    Буфер устройства
    Устройство-носитель
    Запись i
    Запись i
    Поверхность носителя
    Контроллер устройства
    Запись i-1
    Запись i+1
    Сектор 2
    Сектор 1
    Сектор 3
    Кластер К

    136 оптимизации использования пространства памяти. То есть, если логическая структура может варьироваться в широком диапазоне и даже представляться, например, вариантными записями, то физическая — практически всегда представлена жесткой структурой, причем в значительной степени определяемой типом носителя.
    Типы, форматы, структуры данных
    Структура информационных единиц, обрабатываемых на ЭВМ, определяется следующими понятиями:

    тип данных, или совокупность соглашений о программно- аппаратурной форме представления и обработки, а также ввода, контроля и вывода элементарных данных;

    структуры данных — способы композиции простых данных в агрегаты и операции над ними;
    форматы файлов — представление информации им уровне взаимодействия операционной системы с прикладными программами.
    Типы данных. Ранние языки программирования — Фортран, Алгол — были ориентированы исключительно на вычисления и не содержали систем типов и структур данных. Типы числовых данных Алгола: INTEGER (целое число), REAL (действительное) — различаются диапазонами изменения, внутренними представлениями и применяемыми командами процессора
    ЭВМ (соответственно арифметика с фиксированной и плавающей точкой).
    Нечисловые данные представлены типом BOOLEAN — логические, имеющие диапазон значений {TRUE, FALSE}.
    Появившиеся позже языки программирования COBOL, PL/1, Pascal уже предусматривают новые типы данных:

    символьные (цифры, буквы, знаки препинания и пр.);

    числовые символьные для вывода;

    числовые двоичные для вычислений;

    числовые десятичные (цифры 0—9) для вывода и вычислений.
    Структуры данных. В языке программирования Алгол были определены два типа структур: элементарные данные и массивы (векторы, матрицы, тензоры, состоящие из арифметических или логических переменных). Основным нововведением, появившимся первоначально в
    Коболе, (затем в PL/1, Паскале и пр.) являются агрегаты данных (структуры, записи), представляющие собой именованные комплексы переменных разного типа, описывающих некоторый объект или образующих некоторый достаточно сложный документ.
    Термин запись подразумевает наличие множества аналогичных по структуре агрегатов, образующих файл (картотеку), содержащих данные по совокупности однородных объектов. Элементы данных образуют поля, среди которых выделяются элементарные и групповые (агрегатные).
    Появление СУБД и АИПС приводит к появлению новых разновидностей структур:

    множественные поля данных;

    137

    периодические групповые поля;

    текстовые объекты (документы), имеющие иерархическую структуру
    (документ, сегмент, предложение, слово).
    Форматы файлов. В зависимости от типа и назначения файлов и возможностей ОС (методов доступа) файл может передаваться в прикладную программу как целое или блоками (физическими записями) либо логическими записями (строками, словами, символами).
    Например, в системе OS/360 основную роль играли два типа файлов: символьные (исходные программы или данные) и двоичные (программы в машинных кодах). В современных системах активно используется значительно большее разнообразие файлов, например, текстовые файлы —
    обобщенное название для простых и размеченных текстов, ASCII-файлов и других наборов данных символьной информации.
    Реляционная модель данных
    Реляционная
    3
    модель является удобной и наиболее привычной формой представления данных в виде таблицы. В отличие от иерархической и сетевой моделей, такой способ представления: 1) понятен пользователю- непрограммисту; 2) позволяет легко изменять схему — присоединять новые элементы данных и записи без изменения соответствующих подсхем; 3) обеспечивает необходимую гибкость при обработке непредвиденных запросов. К тому же любая сетевая или иерархическая схема может быть представлена двумерными отношениями.
    Рисунок 4.5 – Основные понятия реляционной модели
    3
    В математических дисциплинах понятию «таблица» соответствует понятие «отношение»
    (relation). Отсюда и произошло название модели – реляционная. То есть, применительно к базам данных понятия «реляционная БД» и «табличная БД» по существу являются синонимами.

    1 2
    3 4
    5 6
    ФИО
    Иванов И.И.
    Сидоров С.С.
    Петров П.П.
    Козлов К.К.
    Пупкин В.В.
    Машкина М.М.
    Год.р.
    1962 1973 1971 1972 1973 1978
    Должность
    Зав. кафедрой
    Профессор
    Профессор
    Доцент
    Доцент
    Ст. преподаватель
    Кафедра
    605 605 605 605 605 605
    PK
    FIO
    YEAR
    JOB
    KAF
    Первичный ключ
    Таблица
    Поля, атрибуты
    С
    троки, з апи си

    138
    Одним из основных преимуществ реляционной модели является ее однородность. Все данные рассматриваются как хранимые в таблицах, в которых каждая строка имеет один и тот же формат. Каждая строка в таблице представляет некоторый объект реального мира или соотношение между объектами. Пользователь модели сам должен для себя решить вопрос, обладают ли соответствующие сущности реального мира однородностью.
    Этим самым решается проблема пригодности модели для предполагаемого применения.
    Первичный ключ — это столбец или некоторое подмножество столбцов, которые уникально, т. е. единственным образом определяют строки.
    Первичный ключ, который включает более одного столбца, называется множественным, или комбинированным, или составным. Правило целостности объектов утверждает, что первичный ключ не может быть полностью или частично пустым, т. е. иметь значение null.Остальные ключи, которые можно также использовать в качестве первичных, называются потенциальными или альтернативными ключами.
    Внешний ключ — это столбец или подмножество одной таблицы, который может служить в качестве первичного ключа для другой таблицы.
    Внешний ключ таблицы является ссылкой на первичный ключ другой таблицы. Правило ссылочной целостности гласит, что внешний ключ может быть либо пустым, либо соответствовать значению первичного ключа, на который он ссылается. Внешние ключи являются неотъемлемой частью реляционной модели, поскольку реализуют связи между таблицами базы данных.
    Внешний ключ, как и первичный ключ, тоже может представлять собой комбинацию столбцов. На практике внешний ключ всегда будет составным
    (состоящим из нескольких столбцов), если он ссылается на составной первичный ключ в другой таблице. Очевидно, что количество столбцов и их типы данных в первичном и внешнем ключах совпадают.
    Если таблица связана с несколькими другими таблицами, она может иметь несколько внешних ключей.
    Модель предъявляет к таблицам следующие требования:
    1)данные в ячейках таблицы должны быть структурно неделимыми
    4
    ;
    2)данные в одном столбце должны быть одного типа;
    3)каждый столбец должен быть уникальным
    (недопустимо дублирование столбцов);
    4)столбцы размещаются в произвольном порядке;
    5)строки размещаются и таблице также в произвольном порядке;
    6)столбцы имеют уникальные наименования.
    4
    Недопустимо, чтобы в ячейке таблицы содержались более одной порции информации, что иногда происходит при создании композиционных данных. Примером служит идентификационный номер автомобиля. Если записать его в одну ячейку, то будет нарушен принцип неделимости информации, поскольку в ячейке окажутся разделяемые данные, имеющие разную информационную сущность, такие как наименование модели, номер кузова, двигателя, сведения о предприятии-изготовителе и т. д.

    139
    4.4 Базовые сведения о компьютерной графике и геометрии
    Компьютерная графика – это раздел информатики, в котором изучаются методы и средства для преобразования данных в графическую форму представления и обратно с помощью ЭВМ. В компьютерной графике рассматриваются следующие задачи:

    представление изображения в компьютерной графике;

    подготовка изображения к визуализации;

    создание изображения;

    осуществление действий с изображением.
    Под компьютерной графикой обычно понимают автоматизацию процессов подготовки, преобразования, хранения и воспроизведения графической информации с помощью компьютера. Под графической информацией понимаются модели объектов и их изображения.
    1   ...   12   13   14   15   16   17   18   19   ...   28


    написать администратору сайта