Главная страница
Навигация по странице:

  • Преобразование документов в электронную форму Сканирование документов

  • Распознавание документов

  • Работа с программой FineReader

  • Распознавание документа.

  • Учебник Информатика. Базовый курс. Симонович С.В.. С. В. Симоновичаинформатикабазовый курс2е издание


    Скачать 17.96 Mb.
    НазваниеС. В. Симоновичаинформатикабазовый курс2е издание
    АнкорУчебник Информатика. Базовый курс. Симонович С.В..pdf
    Дата28.01.2017
    Размер17.96 Mb.
    Формат файлаpdf
    Имя файлаУчебник Информатика. Базовый курс. Симонович С.В..pdf
    ТипКнига
    #56
    КатегорияИнформатика. Вычислительная техника
    страница61 из 76
    1   ...   57   58   59   60   61   62   63   64   ...   76
    Упражнение 16.3. Построение упрощенного чертежа
    разреза зубчатого колеса
    1. Запустите программу CorelDraw (Пуск • Программы • Corel
    Graphics Suite
    • CorelDraw
    2. В открывшемся окне Welcome to CorelDraw (Добро пожа- ловать в CorelDraw) щелкните на кнопке New Graphics
    (Создать).
    3. Чертеж требует высокой точности графики. Поэтому необходимо поменять некоторые установки параметров документа. Щелчком на кнопке Options (Параметры) па- нели свойств откройте диалоговое окно Options (Парамет- ры). Откройте раздел Document (Документ) и перейдите к строке Grid (Сетка). На вкладке Grid (Сетка) установите переключатель Frequency (Число линий), счетчиками вы- ставьте значение по горизонтали и вертикали.
    вите флажки Show Grid (Показывать сетку) и Snap to Grid
    (Привязывать к сетке). Перейдите к разделу Guidelines (Направляющие), уста- новите флажок Snap to Guidelines (Привязать к направляющим). Щелчком на кнопке ОК закройте окно.
    4. Для задания габаритов чертежа следует создать направляющие линии. Устано- вите указатель мыши на вертикальную измерительную линейку и протягива- нием перетащите направляющую линию в область чертежа. На панели свойств счетчиком х выставьте значение 20 мм. Следующие линии выставьте в положе-
    х = 70 мм
    = 100 мм. Вертикальные направляющие выставьте в положения
    у
    у
    у
    мм.
    5. Прежде чем начинать рисование, надо задать толщину контуров, принятую по умолчанию. Щелчком на кнопке Outline (Контур) на Панели инструментов откройте диалоговое окно Outline Pen (Перо контура), установите флажок
    Graphics (Графика), щелчком на кнопке ОК закройте окно, в открывшемся

    Глава 16. Векторный редактор CorelDraw логовом окне Outline Pen (Атрибуты контура) в разделе Width (Толщина) в рас- крывающемся списке единиц измерения выберите пункт millimeters (миллимет- ров), счетчиком Width (Толщина) выставьте значение 0,6. Щелчком на кнопке закройте окно.
    6. Выберите инструмент Rectangle (Прямоугольник), нарисуйте прямоугольник размером 50x90 мм с координатами центра х, у (45;
    Откройте палитру
    Object
    (Диспетчер объектов) командой Window • Dockers • Object
    Manager (Окно • Палитры • Диспетчер объектов), присвойте прямоугольнику имя 01. Щелчком правой кнопки мыши на палитре цветов присвойте контуру цвет Red (Красный).
    7. На панели свойств щелчком на кнопке Rounds Corners Together (Скруглять синхронно) отключите режим взаимосвязанного изменения радиусов закругле- ния углов. Счетчиками Left Rectangle Corner Roundness (Скругление левых углов прямоугольника) и Right Rectangle Corner Roundness (Скругление правых углов прямоугольника) выставьте значение для нижних углов.
    8. Нарисуйте прямоугольник (см. п. 6) размером 50x70 мм с координатами центра
    х, у (45;
    Присвойте ему имя
    9. Нарисуйте прямоугольник размером 20x50 мм с координатами центрах, у (30;
    Присвойте ему имя 03. Выставьте значение скругления его правых углов 20.
    Дав команду Effects • Add Perspective (Эффекты • Добавить перспективу), измени- те перспективу перетаскиванием нижней правой управляющей точки (при на- жатом сочетании клавиш CTRL+SHIFT) по вертикали до появления в строке состо- яния Vanishing Point (Hoz) (Точка схождения по горизонту) значения 461 мм.
    10. Создайте дубликат прямоугольника 03 (CTRL+D), зеркально отразите его по горизонтали, установите координаты центра х, у (60;
    присвойте объекту имя 04.
    Нарисуйте прямоугольник размером мм с координатами
    у (85; 145),
    выставьте значение скругления правого нижнего угла 60, присвойте ему имя
    05. Дав команду Effects • Add Perspective (Эффекты • Добавить перспективу),
    измените перспективу перетаскиванием нижней правой управляющей точки по вертикали до появления в строке состояния значения Vanishing Point (Hoz) (Точка схождения по горизонту) примерно 255 12. Откройте палитру Shaping (Преобразование) командой Window • Dockers •
    Shaping • Weld (Окно • Палитры • Преобразование • Объединение). Выберите прямоугольник 05. Щелкните на кнопке Weld
    (Объединение с) и укажите прямоугольник 02. Назначьте контуру итогового объекта цвет Green (Зеленый),
    оставьте имя 02.
    13. Выберите прямоугольник 04, в стыкуемой палитре Shaping (Преобразование)
    переключитесь в режим Trim (Пересечение), сбросьте все флажки Leave Original
    (Сохранить оригинал), щелкните на кнопке Trim (Пересечение с), укажите объект 02.
    14. Повторите операцию (см, п. 13) с прямоугольником 03.

    Практическое занятие 4 8 7 15. Выделите все объекты, сделайте дубликат, отразите его зеркально по вертикали,
    переместите дубликат в положение х, у (60; 205).
    16. Выберите прямоугольник дайте команду Weld
    (Объединить с) и укажите дубликат прямоугольника
    Присвойте дубликату объекта имя 02а.
    17. Нарисуйте прямоугольник размером 80x20 мм с координатами
    (60; 160),
    присвойте ему имя 06, назначьте цвет контура Cyan (Голубой).
    18. Нарисуйте прямоугольник размером 80x3 мм с координатами
    у (60;
    171,4), присвойте ему имя 07, назначьте цвет контура Cyan (Голубой).
    Последовательно выберите прямоугольники 06 и 07 и скомбинируйте их. При- свойте заполнению цвет White (Белый). Присвойте итоговому объекту имя 08.
    20. Выберите объекты 02 и 02а, продублируйте их, присвойте заполнению цвет
    White (Белый), переместите на задний план командой Arrange • Order
    Back
    (Упорядочить • Порядок • Ниже всех), переместите в
    х, у (60; 160),
    сгруппируйте объекты, присвойте результату имя Group
    Выберите объект переместите его на задний план. Сгруппируйте объекты 02 и присвойте результату имя Group 02. Командами Arrange • Order (Упорядочить • Порядок)
    разместите объекты в следующей последовательности (сверху вниз): 08, Group 02,
    Group
    01.
    21. Выберите объект Group щелчком на кнопке Fill (Заливка) на Панели инстру- ментов откройте вложенную панель и щелчком на кнопке PostScript Fill Dialog
    (Заливка узором PostScript) откройте окно PostScript Texture (Заливка PostScript).
    Выберите строку Hatching, счетчиками установите параметры: Max distance
    (Максимальное расстояние) = 50, Min distance (Минимальное расстояние) = 50,
    Line width (Ширина линии) = 5, Angle (Угол) = 45, Random seed (Случайный от- счет) = 0.
    22. Инструментом Bezier (Кривая Безье) проведите горизонтальную линию длиной
    100 мм с координатами х, у (60, 160). На панели свойств установите ее свой- ства: Width (Толщина) = 0,353
    Outline Style Selector (Выбор стиля контура) —
    штрих-пунктир.
    23. Инструментом Bezier (Кривая Безье) проведите горизонтальную линию длиной
    60 мм с координатами х, у
    На панели свойств ее свойства:
    Width (Толщина) = 0,353
    Outline Style Selector (Выбор стиля контура) — штрих- пунктир. Создайте такую же линию с
    х, у
    75).
    24. Выберите все объекты, присвойте контурам цвет Black (Черный), сгруппируйте объекты. При необходимости сохраните чертеж под именем, указанным инст- руктором.
    Мы изучили ряд приемов использования средств CorelDraw для построения точного чертежа машиностроительной детали.

    Компьютер предназначен для работы с документами, имеющими электронную форму. В то же время, нам часто приходится иметь дело с бумажными изданиями и документами: журналами, книгами, письмами, служебными записками и т. д.
    Чтобы в работе с информацией такого рода тоже можно было использовать компью- тер, необходимы средства преобразования бумажных документов в электронную
    форму.
    Если предполагается, что документ содержит в основном текстовую информацию,
    то можно выделить следующие основные этапы такого преобразования:
    • в ходе сканирования при помощи устройств оцифровки изображения произво- дится создание электронного образа (изображения) документа;
    • процесс распознавания позволяет преобразовать электронное изображение в текстовые данные (с сохранением элементов форматирования оригинала или без них);
    • для документов, исполненных на иностранном языке, применяют дополнитель- ные средства автоматизированного перевода на другой язык.
    Преобразование документов в электронную форму
    Сканирование документов
    Процесс создания электронного изображения бумажного документа напоминает его фотографирование и требует применения соответствующего устройства. Сего- дня в качестве такого устройства выступает сканер. Такие устройства, как цифро-
    вые камеры, пока не могут обеспечить для документов стандартного формата каче- ство изображения, которое гарантировало бы их надежное распознавание.
    Основной рабочий элемент сканера включает источник света, используемый для освещения документа, и светочувствительную головку, воспринимающую отражен- ный свет. Универсальные сканеры, в отношении которых нет специальных требова-

    Преобразование документов в электронную форму
    489
    ний по функциональным возможностям, качеству и скорости сканирования на три основные категории.
    Ручной сканер протягивается над поверхностью документа вручную. Он обеспечивает минимальное качество сканирова- ния, в частности, непригоден для сканирования документов,
    содержащих
    Применяется обычно в условиях,
    когда использование настольных устройств сканирования не- возможно или неудобно.
    Листовой сканер способен сканировать от- дельные страницы, протягивая их мимо све- точувствительного элемента. Его недостатком является невозможность сканирования книг и журналов без разборки на отдельные стра- ницы. В связи со значительным снижением стоимости планшетных сканеров практичес- ки вышел из употребления.
    В планшетном сканере подвижный светочув- ствительный элемент перемещается в ходе сканирования внутри корпуса устройства.
    Сканируемый документ располагается напро- тив прозрачного окна в корпусе прибора. Этот вид сканера лишен недостатков, которые ха- рактерны для типов, рассмотренных выше.
    Сегодня планшетный сканер является наибо- лее распространенным типом сканера.
    Сканер является внешним устройством и подключается к компьютеру через спе- циальный разъем. При высоком разрешении и большой площади сканируемого документа объем передаваемых данных оказывается очень большим и требует про- изводительной линии передачи. Современные сканеры чаще всего используют для подключения порт USB. Сканеры предыдущих поколений использовали порт прин- тера (обеспечивает низкую производительность) или интерфейс SCSI (Small
    Computer System Interface).
    Разные модели сканеров понимают разные управляющие команды. Чтобы избежать разнобоя, был принят универсальный стандарт взаимодействия сканера и прило- жений. Этот стандарт называется TWAIN. Приложение посылает команды драйверу
    TWAIN, который преобразует их в инструкции, распознаваемые конкретным скане- ром. Таким образом, для приложения конкретная модель сканера перестает иметь значение. Операционная система Windows ХР поддерживает интерфейс TWAIN, a все современные сканеры совместимы с ним и предоставляют необходимые драй- веры нижнего уровня.
    Сканирование через посредство
    TWAIN осуществляется следующим образом. Сначала следует включить сканер. Команда сканирования располагается в приложении в меню Файл (например, в программе Paint соответствующий пункт

    490
    Глава
    Автоматизация обработки документов
    Сканировать для предварительного просмотра
    Сканировать документ
    Страница сканируемого документа
    Окно предварительного просмотра
    Рис. 17.1. Диалоговое окно интерфейса TWAIN может выглядеть по-разному его вид
    определяется драйвером сканера
    называется Со сканера или камеры). После выбора этой команды открывается диа- логовое окно драйвера TWAIN, вид которого зависит от модели сканера (рис.
    В этом окне задают параметры сканирования: черно-белый или цветной режим,
    разрешение, коррекция яркости и контрастности. Большинство сканеров позво- ляют также произвести предварительное черновое сканирование с низким разреше- нием и по его результатам точно задать область сканирования — часть страницы документа.
    После настройки всех параметров следует щелкнуть на кнопке Сканировать (над- пись на кнопке может быть иной). Процесс происходит автомати- чески, и изображение передается в приложение. Диалоговое окно драйвера TWAIN
    автоматически не закрывается, так что, например, в многооконных графических редакторах (таких,
    Adobe PhotoShop) можно сразу провести сканирование не- скольких изображений.
    Распознавание документов
    Этап распознавания
    состоит в преобразовании ния (фактически набора цветных или черно-белых точек) в текстовый документ.
    Ранее для описания этого процесса обычно использовался термин OCR (Optical
    Character Recognition), который соответствует одному из используемых методов.
    При таком подходе происходит «сравнение» элемента изображения с эталонными

    Преобразование документов в электронную форму вариантами начертания символов, после чего выбирается наиболее подходящий символ. Этот подход требует использования специального комплекта шрифтов,
    но дает на нем наилучшие результаты. Современные алгоритмы распознавания не привязаны к конкретному начертанию символов: программа, как и человек, спо- собна узнавать буквы при любых начертаниях (а иногда и при значительных иска- жениях).
    В ходе распознавания сначала в изображении выделяются крупные элементы тек- ста: колонки, абзацы, отдельные текстовые блоки (например, подрисуночные под- писи), ячейки таблиц. Этот этап называют сегментацией, он может выполняться автоматически или вручную. После этого автоматический этап распо- знавания: блоки разбиваются на строки, строки — на отдельные символы, каждый из которых распознается независимо и помещается в итоговый текстовый документ.
    Работа с программой FineReader
    Все операции, необходимые в ходе преобразования бумажного документа в элект- ронную форму, могут быть выполнены с помощью программы FineReader
    (рис. 17.2). Эта программа способна выполнять сканирование и распознавание тек- стов на разных языках, в том числе и смешанных двуязычных текстов. С ее помо- щью можно выполнять пакетную обработку многостраничных документов, а так- же настраивать режим распознавания для улучшения соответствия электронного документа бумажному оригиналу при плохом качестве последнего или использо- вании в нем шрифтов, далеких от стандартных.
    Основные операции обработки бумажного документа в программе FineReader
    выполняются с помощью панели инструментов Scan&Read. С точки зрения этой программы, процесс обработки документа состоит из пяти этапов:
    • сканирование документа (кнопка Сканировать);
    • сегментация документа (кнопка Сегментировать);
    • распознавание документа (кнопка Распознать);
    • редактирование и проверка результата (кнопка Проверить);
    • сохранение документа (кнопка Сохранить).
    Сканирование документа. На
    сканирования производится получение ражений при помощи сканера и сохранение их в виде, удобном для последующей обработки. Чтобы начать сканирование, надо включить сканер и щелкнуть на кнопке Сканировать на панели инструментов Scan&Read. В программе FineReader
    сканирование может производиться как через драйвер TWAIN, так и в обход его.
    Первый способ используют, когда требуется точная настройка параметров сканиро- вания, когда документ включает цветные иллюстрации, которые необходимо сохра- нить, а также когда разные страницы многостраничного документа сильно разли- чаются по качеству. Второй вариант обеспечивает максимальную скорость и удобство сканирования. Выбор используемого варианта осуществляется при помощи флажка Показывать
    TWAIN-драйвера сканера (Сервис • Опции Ска- нирование).

    492
    Глава
    Автоматизация обработки документов
    Панель
    Стандартная
    Панель Панель Панель
    Инструменты —Распознавание
    Окно Пакет
    Окно Крупный план
    Окно Изображение
    Рис.
    Рабочее окно программы FineReader в процессе
    распознавания отсканированного документа
    Процесс сканирования осуществляется автоматически и требует от пользователя только вспомогательных операций, таких, как смена сканируемой страницы. Воз- можность вмешательства в работу программы заблокирована размещением на эк- ране специального диалогового окна, уведомляющего о том, что идет сканирова- ние, и позволяющего прервать это процесс.
    По завершении сканирования значки всех обработанных страниц отображаются в окне Пакет. В основной части рабочей области появляется окно Изображение, содер- жащее изображение текущей страницы. Добавлять страницы в пакет можно не только путем сканирования, но и путем открытия файлов с изображениями, имею- щихся на компьютере.

    Преобразование документов в электронную форму
    Распознавание документа.
    распознавания текста документа можно разде- лить на две операции, выполняемые поочередно. Первая операция — сегментация,
    разбиение страницы на блоки текста. Обычная книжная страница представляет собой единый блок текста, который распознается в естественном порядке — по стро- кам, расположенным на странице сверху вниз и идущим от левого края до правого.
    Если страница содержит колонки, иллюстрации, врезки, подрисуночные подписи или таблицы, то порядок распознавания требует коррекции.
    В таком случае содержимое страницы разбивается на блоки. Внутри каждого блока сохраняется естественный порядок распознавания. Блоки нумеруются, исходя из порядка включения их в документ. Программа FineReader
    выполнить сег- ментацию (определить границы блоков) автоматически даже для весьма сложных страниц. При этом учитываются поля документа, просветы между колонками,
    рамки.
    Если структура страницы очень сложна или содержит явные дефекты, которых не всегда удается избежать при сканировании, удобнее
    ручную сегмен-
    тацию или ручное редактирование результатов автоматической сегментации.
    Блоки отображаются в виде цветных прямоугольников с номером в левом верх- нем углу. Новый блок создают протягиванием мыши по диагонали прямоугольника.
    Текущий блок помечается выделенной линией, а его углы — прямоугольными мар- керами. С помощью этих маркеров можно изменить размер или положение блока.
    Команды редактирования блоков выведены на панель Изображение. Они позволяют:
    • объединить два блока в один (Добавить часть к блоку);
    • удалить фрагмент блока (Удалить часть блока);
    • изменить порядок нумерации блоков (Перенумеровать блоки);
    • изменить разбиение таблицы на ячейки (Добавить вертикаль, Добавить гори- зонталь, Удалить линии).
    Разные типы блоков обрабатываются программой по-разному. Чтобы изменить тип блока, надо щелкнуть правой кнопкой мыши в его пределах и назначить новый тип с помощью меню Тип блока в контекстном меню. Программа FineReader под- держивает следующие типы блоков:
    • автоматический (Зона распознавания) — на этапе распознавания анализируется и разбивается на блоки автоматически;
    • текстовый (Текст) — на этапе распознавания преобразуется в текст;
    • табличный (Таблица) — представляет собой набор ячеек, каждая из которых преобразуется в текст по отдельности;
    • изображение (Картинка) — включается в документ без изменений как графи- ческая иллюстрация, если формат сохранения преобразованного документа допускает вставные объекты.
    Процесс распознавания текста после сегментации полностью автоматизирован.
    Кнопка Распознать на панели Scan&Read позволяет автоматически выполнить сег- ментацию и распознавание, хотя в ходе сегментации учитываются ограничения,

    494
    Глава
    Автоматизация обработки документов установленные вручную. В ходе процесса отображается диалоговое окно Распозна- вание, позволяющее прервать процесс. Кроме того, в этом окне отображаются сооб- щения, указывающие на наличие проблем при распознавании. Проблемы обычно вызываются неверными настройками или плохим качеством распознаваемого изоб-
    Если же дело в каких-то шрифтовых особенностях распознаваемого доку- мента,
    распознавание с обучением.
    Распознавание с обучением. Распознавание с обучением состоит в формировании
    эталона, который используется в ходе распознавания в дальнейшем. Эталон настра- ивается так, чтобы соответствовать определенному документу или группе однотип- ных документов. Чтобы создать эталон, используют команду Сервис • Редактор эталонов • Новый. После этого надо указать имя эталона и щелкнуть на кнопке ОК.
    Режим распознавания с обучением включается при настройке параметров работы программы (Сервис • Опции • Распознавание). Создать, выбрать или сменить эта- лон можно, щелкнув на кнопке Эталоны. После этого необходимо установить фла- жок Распознавание с обучением.
    Когда в ходе распознавания с обучением программа FineReader обнаруживает сим- вол, который не может интерпретировать однозначно, на экран выдается диалоговое окно Ручное обучение эталона (рис. 17.3). Программа указывает элемент изобра- жения, вызвавший сомнения, и показывает, как именно он будет интерпретиро- ван. Если допущена ошибка, можно указать нужный символ в поле Введите символ,
    выделенный рамкой или уточнить область распознавания с помощью кнопок Сдви- нуть влево и Сдвинуть вправо. Затем надо щелкнуть на кнопке Обучить. Необходи- мые сведения сохраняются и используются при дальнейшем анализе изображения.
    Если число ошибок невелико, можно продолжить распознавание в обычном режиме щелчком на кнопке Закрыть.
    Распознаваемый элемент
    Корректировка
    1   ...   57   58   59   60   61   62   63   64   ...   76


    написать администратору сайта