Главная страница
Навигация по странице:

  • OmniPage11 продукт компании ScanSoft

  • 34. База данных, база знаний; программное обеспечение ведения файлов, баз данных, баз знаний.

  • 35. Модели данных: определение модели данных; основные модели данных (иерархическая, сетевая, реляционная), понятие нормализации отношений.

  • Проектирование баз данных. Этапы проектирования БД (прагматический, инфологический, логический, физический). Информационно-логическое моделирование БД (разработка информационно- логической модели).

  • Под даталогической понимается модель

  • Концептуальная(логическая) модель

  • Внутренняя (физическая) модель

  • Шпаргалка по информатике. шпаргалка Инф. 1. История становления информатики, как науки, ее связь с другими науками


    Скачать 0.86 Mb.
    Название1. История становления информатики, как науки, ее связь с другими науками
    АнкорШпаргалка по информатике
    Дата13.05.2023
    Размер0.86 Mb.
    Формат файлаdoc
    Имя файлашпаргалка Инф.doc
    ТипДокументы
    #1126983
    страница11 из 17
    1   ...   7   8   9   10   11   12   13   14   ...   17
    1   ...   7   8   9   10   11   12   13   14   ...   17

    Readiris Pro7 профессиональная программа распознавания текста. отличается от аналогов высочайшей точностью преобразования обычных (каждодневных) печатных документов, таких как письма, факсы, журнальные статьи, газетные вырезки, в объекты, доступные для редактирования (включая файлы PDF). Основными достоинствами программы являются: возможность более или менее точного распознавания картинок, сжатых по максимуму (с максимальной потерей качества) методом JPEG, поддержка цифровых камер и автоопределения ориентации страницы.

    OmniPage11 продукт компании ScanSoft.. Разработчики утверждают, что их программа практически со 100% точностью распознает печатные документы, восстанавливая их форматирование, включая столбцы, таблицы, переносы (в том числе переносы частей слов), заголовки, названия глав, подписи, номера страниц, сноски, параграфы, нумерованные списки, красные строки, графики и картинки. Есть возможность сохранения в форматы Microsoft Office, PDF и в 20 других форматов, распознавания из файлов PDF, редактирование прямо в формате PDF. Система искусственного интеллекта позволяет автоматически обнаруживать и исправлять ошибки после первого исправления вручную. Новый специально разработанный модуль Despeckle позволяет распознавать документы с ухудшенным качеством (факсы, копии, копии копий ит.д.). Преимуществами программы являются возможность распознавания цветного текста и возможность корректировки голосом. Теперь версия OmniPage существует и для компьютеров Macintosh.



    34. База данных, база знаний; программное обеспечение ведения файлов, баз данных, баз знаний.

    База данных — это организованная структура, предназначенная для хранения информащш. Однако сегодня большинство систем управления базами данных (СУБД) позволяют размещать в своих структурах не только данные, но и методы (то есть программный код), с помощью которых происходит взаимодействие с потребителем или с другими программно-аппаратными комплексами. Таким образом, мы можем говорить, что в современных базах данных хранятся отнюдь не только данные, но и информация.

    С понятием базы данных тесно связано понятие системы управления базой данных. Это комплекс программных средств, предназначенных для создания структуры новой базы, наполнения ее содержимым, редактирования содержимого и визуализации информации. Под визуализацией информации базы понимается отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующая выдача на устройство вывода или передача по каналам связи.

    В мире существует множество систем управления базами данных. Несмотря на то что они могут по-разному работать с разными объектами и предоставляют пользователю различные функции и средства, большинство СУБД опираются на единый устоявшийся комплекс основных понятий. СУБД является Microsoft Access, входящая в пакет Microsoft Office наряду с рассмотренными ранее пакетами Microsoft Word и Microsoft Excel. В тех случаях, когда конкретные приемы операций зависят от используемой версии программы, мы будем опираться на последнюю версию Microsoft Access 2000, хотя в основном речь будет идти о таких обобщенных понятиях и методах, для которых различия между конкретными версиями программ второстепенны.


    35. Модели данных: определение модели данных; основные модели данных (иерархическая, сетевая, реляционная), понятие нормализации отношений.
    Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними.

    Модель данных - совокупность структур данных и операций их обработки.

    По способу установления связей между данными СУБД основывается на использовании трёх основных видов модели: иерархической, сетевой или реляционной; на комбинации этих моделей или на некотором их подмножестве.

    Каждая из указанных моделей обладает характеристиками, делающими ее наиболее удобной для конкретных приложений. Одно из основных различий этих моделей состоит в том, что для иерархических и сетевых СУБД их структура часто не может быть изменена после ввода данных, тогда как для реляционных СУБД структура может изменяться в любое время. С другой стороны, для больших БД, структура которых остается длительное время неизменной, и постоянно работающих с ними приложений с интенсивными потоками запросов на БД-обслуживание именно иерархические и сетевые СУБД могут оказаться наиболее эффективными решениями, ибо они могут обеспечивать более быстрый доступ к информации БД, чем реляционные СУБД.

    Иерархическая структура представляет совокупность элементов, связанных между собой по определенным правилам. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевернутое дерево). К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Узел - это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа.

    Следует отметить, что в настоящее время не разрабатываются СУБД,

    поддерживающие на концептуальном уровне только иерархические модели. Как

    правило, использующие иерархический подход системы, допускают связывание

    древовидных структур между собой и/или установление связей внутри них. Это

    приводит к сетевым даталогическим моделям СУБД.

    К основным недостаткам иерархических моделей следует отнести:

    неэффективность реализации отношений типа N:N, медленный доступ к сегментам

    данных нижних уровней иерархии, четкая ориентация на определенные типы

    запросов и др. В связи с этими недостатками ранее созданные иерархические

    СУБД подвергаются существенным модификациям, позволяющим поддерживать более

    сложные типы структур и, в первую очередь, сетевые и их модификации.

    Сетевая модель СУБД во многом подобна иерархической: если в

    иерархической модели для каждого сегмента записи допускается только один

    входной сегмент при N выходных, то в сетевой модели для сегментов

    допускается несколько входных сегментов наряду с возможностью наличия

    сегментов без входов с точки зрения иерархической структуры.

    Графическое изображение структуры связей сегментов такого типа моделей

    представляет собой сеть. Сегменты данных в сетевых БД могут иметь

    множественные связи с сегментами старшего уровня. При этом направление и

    характер связи в сетевых БД не являются столь очевидными, как в случае

    иерархических БД. Поэтому имена и направление связей должны

    идентифицироваться при описании БД.

    В рамках сетевых СУБД легко реализуются и иерархические даталогические

    модели.

    Сетевые СУБД поддерживают сложные соотношения между типами данных, что

    делает их пригодными во многих различных приложениях. Однако пользователи

    таких СУБД ограничены связями, определенными для них разработчиками БД-

    приложений.

    Более того, подобно иерархическим сетевые СУБД предполагают разработку

    БД приложений опытными программистами и системными аналитиками.

    Среди недостатков сетевых СУБД следует особо выделить проблему

    обеспечения сохранности информации в БД, решению которой уделяется

    повышенное внимание при проектировании сетевых БД.

    Реляционная модель ориентирована на организацию данных в виде

    двумерных таблиц. Каждая реляционная таблица представляет собой двумерный

    массив и обладает следующими свойствами:

    - каждый элемент таблицы - один элемент данных; повторяющиеся группы

    отсутствуют;

    - все столбцы в таблице однородные, т.е. все элементы в столбце имеют

    одинаковый тип (числовой, символьный и т.д.) и длину;

    - каждый столбец имеет уникальное имя;

    - одинаковые строки в таблице отсутствуют;

    - порядок следования строк и столбцов может быть произвольным.

    Таблица такого рода называется отношением.

    База данных, построенная с помощью отношений, называется реляционной

    базой данных.

    Отношения представлены в виде таблиц, строки которых соответствуют

    кортежам или записям, а столбцы - атрибутам отношений, доменам, полям.

    Одни и те же данные могут группироваться в таблицы (отношения) различными способами, т.е. возможна организация различных наборов отношений взаимосвязанных информационных объектов.

    Определенный набор отношений обладает лучшими свойствами при включении, модификации, удалении данных, чем все остальные возможные наборы отношений, если он отвечает требованиям нормализации отношений.

    Нормализация отношений – формальный аппарат ограничений на формирование отношений (таблиц), который позволяет устранить дублирование, обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение (ввод, корректировку) базы данных.

    Выделены три нормальные формы отношений и предложен механизм, позволяющий любое отношение преобразовать к третьей (самой совершенной) нормальной форме

    1. Отношение называется нормализованным или приведенным к первой нормальной форме, если все его атрибуты простые (далее неделимы). Преобразование отношения к первой нормальной форме может привести к увеличению количества реквизитов (полей) отношения и изменению ключа.
    2. Чтобы рассмотреть вопрос приведения отношений ко второй нормальной форме, необходимо дать пояснения к таким понятиям, как функциональная зависимость и полная функциональная зависимость.

    Описательные реквизиты информационного объекта логически связаны с общим для них ключом, эта связь носит характер функциональной зависимости реквизитов.

    Функциональная зависимость реквизитов – зависимость, при которой в экземпляре информационного объекта определенному значению ключевого реквизита соответствует только одно значение описательного реквизита.

    Такое определение функциональной зависимости позволяет при анализе всех взаимосвязей реквизитов предметной области выделить самостоятельные информационные объекты.
    3. Понятие третьей нормальной формы основывается на понятии нетранзитивной зависимости.

    Транзитивная зависимость наблюдается в том случае, если один из двух описательных реквизитов зависит от ключа, а другой описательный реквизит зависит от первого описательного реквизита.


    36. Проектирование баз данных. Этапы проектирования БД (прагматический, инфологический, логический, физический). Информационно-логическое моделирование БД (разработка информационно- логической модели).

    В теории проектирования информационных систем предметную область (или, если угодно, весь реальный мир в целом) принято рассматривать в виде трех представлений:

    - представление предметной области в том виде, как она реально существует

    - как ее воспринимает человек (имеется в виду проектировщик базы данных)

    - как она может быть описана с помощью символов.

    Т.е. говорят, что мы имеем дело с реальностью, описанием (представлением) реальности и с данными, которые отражают это представление.

    Данные, используемые для описания предметной области, представляются в виде трехуровневой схемы (так называемая модель ANSI/SPARC):

    Внешнее представление (внешняя схема) данных является совокупностью требований к данным со стороны некоторой конкретной функции, выполняемой пользователем. Концептуальная схема является полной совокупностью всех требований к данным, полученной из пользовательских представлений о реальном мире. Внутренняя схема - это сама база данных.
    Отсюда вытекают основные этапы, на которые разбивается процесс проектирования базы данных информационной системы:

    1. Концептуальное проектирование - сбор, анализ и редактирование требований к данным. Для этого осуществляются следующие мероприятия:

    - обследование предметной области, изучение ее информационной структуры

    - выявление всех фрагментов, каждый из которых харакетризуется пользовательским представлением, информационными объектами и связями между ними, процессами над информационными объектами моделирование и интеграция всех представлений По окончании данного этапа получаем концептуальную модель, инвариантную к структуре базы данных. Часто она представляется в виде модели "сущность-связь".

    2. Логическое проектирование - преобразование требований к данным в структуры данных. На выходе получаем СУБД-ориентированную структуру базы данных и спецификации прикладных программ. На этом этапе часто моделируют базы данных применительно к различным СУБД и проводят сравнительный анализ моделей.

    3. Физическое проектирование - определение особенностей хранения данных, методов доступа и т.д.
    Проектирование базы данных состоит в построении комплекса

    взаимосвязанных моделей данных.

    Важнейшим этапом проектирования базы данных является разработка

    информационно-логической (инфологической) модели предметной области, не

    ориентированной на СУБД. В инфологической модели средствами структур данных

    в интегрированном виде отражают состав и структуру данных, а также

    информационные потребности приложение (задач и запросов).

    Информационно-логическая модель предметной области отражает предметную

    область в виде совокупности информационных объектов и их структурных

    связей.

    Инфологическая модель является исходной для построения даталогической

    модели БД и служит промежуточной моделью для специалистов предметной

    области (для которой создается БнД) и администратора БД в процессе

    проектирования и разработки конкретной БнД.

    Под даталогической понимается модель, отражающая логические

    взаимосвязи между элементами данных безотносительно их содержания и

    физической организации. При этом даталогическая модель разрабатывается с

    учетом конкретной реализации СУБД, также с учетом специфики конкретной

    предметной области на основе ее инфологической модели.

    Инфологическая модель предметной области строится первой.

    Предварительная инфологическая модель строится еще на пред проектной стадии

    и затем уточняется на более поздних стадиях проектирования баз данных.

    Затем на ее основе строятся концептуальная (логическая), внутренняя

    (физическая) и внешняя модели.

    Концептуальный уровень соответствует логическому аспекту представления

    данных предметной области в интегрированном виде. Концептуальная(логическая) модель

    состоит из множества экземпляров различных типов данных, структурированных

    в соответствии с требованиями СУБД к логической структуре базы данных.

    Внутренний уровень отображает требуемую организацию данных в среде

    хранения и соответствует физическому аспекту представления данных.

    Внутренняя (физическая) модель состоит из отдельных экземпляров записей, физически

    хранимых во внешних носителях.

    Внешний уровень поддерживает частные представления данных, требуемые

    конкретным пользователям. Внешняя модель является подмножеством

    концептуальной модели. Возможно пересечение внешних моделей по данным.

    Частная логическая структура данных для отдельного приложения (задачи) или

    пользователя соответствует внешней модели или подсхеме БД. С помощью

    внешних моделей поддерживается санкционированный доступ к данным БД

    приложений (ограничен состав и структура данных концептуальной модели БД

    доступных в приложении, а также заданы допустимые режимы обработки этих

    данных: ввод, редактирование, удаление, поиск).

    Появление новых или изменение информационных потребностей существующих

    приложений требуют определения для них корректных внешних моделей, при этом

    на уровне концептуальной и внутренней модели данных изменений не

    происходит. Изменения в концептуальной модели, вызванные появлением новых

    видов данных или изменением и структур, могут затрагивать не все

    приложения, т.е. обеспечивается определенная независимость программ от

    данных. Изменения в концептуальной модели должны отражаться и внутренней

    модели, и при неизменной концептуальной модели возможна самостоятельна

    модификация внутренней модели БД с целью улучшения ее характеристик (время

    доступа данным, расхода памяти внешних устройств и др.). Таким образом, БД

    реализует принцип относительной независимости логической и физической

    организации данных.


    37. Cоздание БД, разработка форм, ввод данных. Отчеты и запросы к БД.

    С одной стороны, формы позволяют пользователям вводить данные в таблицы базы данных без непосредственного доступа к самим таблицам. С другой стороны, они позволяют выводить результаты работы запросов не в виде скупых результирующих таблиц, а в виде красиво оформленных форм. В связи с таким разделением существует два вида формирования структуры форм: на основе таблицы и на основе запроса, хотя возможен и комбинированный подход, — это вопрос творчества.

    Автоформы. В отличие от таблиц и запросов, которые мы формировали вручную, формы удобнее готовить с помощью средств автоматизации. Полностью автоматическими являются средства, называемые автоформами. Существует три вида автоформ: «в столбец», ленточные и табличные

    Для создания автоформы следует открыть панель Формы в окне База данных и воспользоваться командной кнопкой Создать. В открывшемся диалоговом окне Новая форма выбирают тип автоформы и таблицу (или запрос), на которой она основывается. После щелчка на кнопке ОК автоформа формируется автоматически и немедленно готова к работе, то есть к вводу или отображению данных.

    Обратите внимание на то, что автоформа основывается только на одном объекте. Иные средства создания форм позволяют закладывать в основу структуры формы поля нескольких таблиц или запросов. Если форма основывается только на одном объекте, она называется простой формой. Если форма основывается на полях из нескольких связанных таблиц, то она называется сложной и представляет собой композицию из нескольких форм.


    написать администратору сайта