Главная страница
Навигация по странице:

  • 4.2. Программное обеспечение сканирования

  • ПО сканирование малых объёмов документов

  • ПО сканирования больших объёмов документов.

  • ПО для специальных задач сканирования

  • 4.3. Сканирование и распознавание текста

  • Литература Михеева Е.В. Информационные технологии в профессиональной деятельности: учеб. пособие. – М.: Проспект, 2014. – С. 142-159. Раздел 2.

  • ТЕХНОЛОГИИ ПОДГОТОВКИ ДОКУМЕНТОВ Лекция 2.4. Редакторы обработки графической информации

  • 4.1. Понятия компьютерной графики

  • 4.2. Векторные графические редакторы

  • лекции по ОП. лекции. Лекции по дисциплине Информационные технологии в профессиональной деятельности


    Скачать 7.53 Mb.
    НазваниеЛекции по дисциплине Информационные технологии в профессиональной деятельности
    Анкорлекции по ОП.10
    Дата15.10.2019
    Размер7.53 Mb.
    Формат файлаdocx
    Имя файлалекции.docx
    ТипЛекции
    #90246
    страница8 из 26
    1   ...   4   5   6   7   8   9   10   11   ...   26

    Ручные сканеры для автомобилей

    Ручные диагностические сканеры предназначены для диагностики, считывания кодов ошибок, просмотра показаний внутренних датчиков автомобилей без использования компьютера или дополнительных вспомогательных средств. Часто имеют встроенный высококонтрастный дисплей для отображения информации.

    Портативные ручные сканеры

    Данные устройства — как монохромные, так и цветные — обеспечивают функционал настольных решений, при этом имея возможность работать независимо от компьютера. Внешне сканер похож на обыкновенную шариковую ручку, но немного толще и длиннее (длина примерно равна ширине листа формата А4). Работают сканеры от перезаряжаемой литий-ионной батареи, количество хранимых отсканированных страниц зависит от объема памяти конкретной модели (при возможности расширения памяти картами Micro-Sd), примерное время сканирования одной страницы – 4…8 секунд. Подзарядка и передача изображений на компьютер осуществляется посредством USB кабеля.
















    Ручные текстовые сканеры

    Этот тип устройств включает в себя сканер и систему распознавания текста, которая позволяет преобразовывать графическое изображение в текстовый файл. Такие сканеры автоматически заносят информацию в любое поле ввода программы или информационной системы на компьютере, где возможен ввод с клавиатуры. Количество распознаваемых языков — до ста пятидесяти, также поддерживаются специальные банковские шрифты и одномерные штрих-коды. Обычно используется при работе с финансовыми документами, персональными данными и в библиотечной сфере. Отличительной особенностью, как уже было сказано, является наличие встроенной OCR.

    Сканеры-записные книжки

    Сканеры-записные книжки сочетают в себе функции двух предыдущих видов устройств: работу независимо от компьютера, а также сканирование, сохранение полученного текста (до 500 страниц), передачу данных на ПК или коммуникатор и возможности затем редактировать их в Windows-приложениях.

    Сканеры-переводчики

    Ручной сканер-переводчик зачастую является функциональным расширением сканера-записной книжки. Главное отличие устройства — возможность сканировать слово (строку слов) и предоставлять пословный перевод (включая перевод идиомам (Идиома (лингвистика) — оборот речи, употребляющийся как единое целое; фразеологическое сращение) и фраз), а также функцию произношения строки или отдельного слова на выбранном языке.

    Ручные сканеры для чтения

    Разработаны с ориентацией на людей, либо изучающих иностранный язык, либо испытывающих трудности в чтении (например, страдающих дислексией). Сканеры этого типа обеспечивают беглость и автономность чтения и улучшают понимание текста за счет возможности в течение нескольких секунд получить определение и корректное произношение слова.
    Планетарный или книжный сканер

    Планетарный сканер - устройство, в котором при сканировании оригинал неподвижен и располагается лицевой стороной вверх на значительном удалении относительно оптической системы и сканирующей линейной ПЗС матрицы сканера.

    Планетарные сканеры могут быть оборудованы специальными книжными колыбелями для удобного размещения фолиантов при сканировании.

    Данный тип сканера предназначен для сканирования скреплённых документов, периодических изданий и книг.



    Особенность планетарных сканеров - бесконтактный метод сканирования, нет необходимости расшивки оригиналов, большая производительность при оцифровке книг и сшитых оригиналов, очень большпя стоимость (цена от 350 до 700 тыс. руб., в зависимости от производителя, модели и комплектации).

    4.1.2. Основные характеристики сканеров

    Разрешение (Resolution) - число точек или растровых ячеек, из которых формируется изображение, на единицу длины или площади. Чем больше разрешение устройства, тем более мелкие детали могут быть воспроизведены. Измеряется в «точках на квадратный дюйм» (DPI (произносится как ди-пи-ай) — сокращение для англ. Dots per inch, количество точек на линейный дюйм.). Типовое разрешение промышленных сканеров - 200-300 dpi.

    Разрядность цвета (глубина цвета) - количество разрядов каждого пикселя в цифровом изображении, в т.ч. выдаваемом сканером. Описывает максимальное количество цветов, воспроизводимое сканером в виде степени числа 2. Одному разряду соответствует черно-белое изображение, 8-ми - серое полутоновое (типовое для рассматриваемых в данной лекции сканеров), 16-ти - цветное, 24-цветное изображение, наиболее близкое к человеческому восприятию, 36-цветное и больше - полноцветное изображение с высокой достоверностью цветопередачи, предназначенное для профессиональной работы, чаще всего в издательском деле.

    Время сканирования. Измеряется в страницах в минуту (иногда - в секундах на изображение). Типовые значения различны для разных типов сканеров и приведены далее в примерах.

    Формат. Формат сканируемого документа. Как правило - A3/A4.

    Интерфейс передачи данных - способ подключения сканера к компьютеру. Способы могут быть различны (к COM или USB порту, к SCSI карте и др.).

    4.2. Программное обеспечение сканирования

    Существует три категории ПО сканирования:

    1. ПО сканирование малых объёмов документов

    2. ПО сканирования больших объёмов документов

    3. ПО для специальных задач сканирования

    ПО сканирование малых объёмов документов

    Применяется при домашнем и офисном сканировании.

    Используется практически любое программное обеспечение, совместимое со стандартом TWAIN и поддерживающее функцию сканирования - система управления документооборотом, программа распознавания графических образов или любой распространенный графический редактор.

    Примеры ПО сканирования малых объемов:

    1. ABBYY FineReader;

    2. Adobe PhotoShop;

    3. Cognitive Cuineiform;

    4. Microsoft Photo Editor;

    5. ACDSEE;

    ПО сканирования больших объёмов документов.

    Применяется при промышленном сканировании. При поточном сканировании один сканер ежедневно может обрабатывать до 50.000 и более документов. При таких нагрузках возможностей универсального стандарта TWAIN становится не достаточно, и для программного управления сканерами используется промышленный стандарт ISIS (ISIS - Image and Scanner Interface Specification - Изображение и интерфейс сканера. Спецификация).

    Примеры применяемого ПО:

    1. Kofax Ascent Capture;

    2. Captiva InputAccel.

    ПО для специальных задач сканирования

    Применяется при планетарном, высококачественном сканировании.

    Программное обеспечение специально разрабатывается с учётом специфики сканирующего устройства, не совместимо с другими стандартами.

    Применяемое ПО:

    1. ПланСкан BSC-2;

    2. RZ ProScan Book (Minolta PS7000 edition);

    3. Zeutschel OmniScan.

    4.3. Сканирование и распознавание текста

    4.3.1. Особенности сканирования


    Одной из наиболее распространенных программ, предназначенных для сканирования и распознавания текста, является программа FineReader. Простейшая из команд этой программы — Сканировать и распознать из меню Процесс. По этой команде будет отсканирована и тут же распознана одна страница текста. После завершения процесса распознавания распознанным текст появится в окне Текст, после чего его можно читать и править, как в обычном редакторе текстов.

    При сканировании целой книги удобно сначала отсканировать все её страницы, а потом их распознать. Для этого нужно воспользоваться командой Сканировать несколько страниц меню Файл, а затем — командой Распознать все меню Процесс. Перед сканированием разворота книги в настройках сканера необходимо установить признак альбомной ориентации изображения, а на вкладке Сканирование диалога Опции — Делить разворот книги. Это приведёт к тому, что после сканирования FineReader разделит два листа разворота на две разных страницы и будет распознавать их отдельно. Такой метод улучшит качество распознавания и уменьшит количество ошибок. При сканировании отдельных страниц эту опцию можно убрать.

    Текст «нормального» размера и хорошего качества печати можно сканировать при Ручном подборе яркости 50 %. В Режиме сканирования картинок нужно установить Черно-белое изображение при Разрешении 200…300 (это самый быстрый режим сканирования). Для мелких шрифтов разрешение можно увеличить до 400, 500 или 600. Если качество печати плохое или книга совсем плохо разворачивается, необходимо перейти к Автоматическому Подбору Яркости и в Режиме Сканирования Картинок установить Серый.

    Это замедлит сканирование, но улучшит качество распознавания. Все описанные параметры устанавливаются в окне диалога Настройки Сканера. Если на листе встречаются серые пятна, или из-за тонкой бумаги и жирного черного текста проступают буквы и рисунки с обратной стороны страницы, увеличьте яркость сканирования, например, до 60 или до 70. Это приведет к исчезновению пятен и проступающих с обратной стороны страницы букв и рисунков.

    Если буквы слишком бледные, то уменьшите яркость сканирования, например, до 40. Это приведет к тому, что буквы станут более четкими и жирными, и их легче будет распознавать. Если текст на листе расположен в несколько колонок, то на вкладке Сканирование диалогового окна Опции переключатель Тип Страницы необходимо установить в положение Авто. А если это обычный книжный текст, то лучше поставить переключатель Тип Текста в значение Одна Колонка, что ускорит процесс распознавания.

    4.3.1. Особенности распознавания текста

    Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения, переданного сканером, и распознавание каждого символа.

    Процессы анализа макета страницы:

    1. определение областей распознавания;

    2. определение таблиц;

    3. определение картинок;

    4. выделение в тексте строк и отдельных символов и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.

    Возникает вопрос? Каким образом строится распознавание символов?

    Для выдвижения гипотез о том, что может представлять собой изображение, применяются так называемые признаковые классификаторы. Они используют ряд признаков, на основе которых программа вычисляет степень близости распознаваемого изображения и известных ей классов изображений, после чего выдает список подходящих классов, т.е. гипотезу о принадлежности объекта к тому или иному классу. Кроме того, признаковые классификаторы применяются также и для повышения точности распознавания изображений с дефектами Полученный набор классов последовательно проверяется структурным классификатором, анализирующим каждый символ. Скажем, если FineReader полагает, что на странице изображена буква Ф, он специально проверяет те признаки, которые должны быть именно у буквы Ф, а не у какой-либо другой, сравнивая этот символ со структурным эталоном. Структурный эталон описывает символ как комбинацию структурных элементов (отрезок, дуга, кольцо, точка), находящихся в определенных отношениях между собой. Процесс распознавания делится на этапы выделения структурных элементов в изображении и сопоставления их с эталоном.

    Если в окончательный список попало более одной гипотезы, они попарно сравниваются с помощью дифференциальных классификаторов. Если структурный классификатор при распознавании символов не может однозначно выбрать одну из двух букв с похожим написанием, между этими конкурирующими гипотезами делается дифференциальный выбор. Например, есть две гипотезы: распознаваемый символ представляет собой строчную букву ъ или ь. Чтобы сделать выбор, FineReader целенаправленно проанализирует левый верхний угол буквы, где имеется единственная отличительная деталь между этими буквами.

    С завершением работы дифференциального классификатора заканчивается распознавание и начинается этап проверки итогового списка гипотез. Окончательная стадия распознавания осуществляется системой контекста - при наличии некоторого количества распознанных букв из слова программа, используя словарь, может «догадаться», что это за слово.

    4.3.2. Точность распознавания

    Ключевым параметром систем распознавания, характеризующим их практическую ценность, является точность распознавания, то есть процент правильно распознанных символов.

    OCR-системы могут достигать наилучшей точности распознавания — свыше 99,9% для чистых изображений, составленных из обычных шрифтов. На первый взгляд такая точность распознавания кажется идеальной, но уровень ошибок все же удручает, потому что, если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. То есть, если какого-то слова нет в словаре системы, то она по специальным правилам пытается найти похожее. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов.

    Точность распознавания падает за счёт ошибок распознавания. Повышению точности распознавания способствует устранение указанных ниже причин ошибок.

    Контрольные вопросы

    1. Для чего используются программы оптического распознавания текста?

    2. Перечислите принципы технологии распознавания.

    3. Чем этап сканирования отличается от распознавания?

    4. Какие параметры настройки сканера (и в каких случаях) позволяют улучшить скорость сканирования и качество распознавания текста?

    5. Как называются встроенные программы проверки правописания?

    6. Как осуществить подбор оптимальной яркости при сканировании?

    7. Какие параметры настройки сканера (и в каких случаях) позволяют улучшить скорость сканирования и качество распознавания текста?

    Литература

    1. Михеева Е.В. Информационные технологии в профессиональной деятельности: учеб. пособие. – М.: Проспект, 2014. – С. 142-159.

    Раздел 2. ТЕХНОЛОГИИ ПОДГОТОВКИ ДОКУМЕНТОВ

    Лекция 2.4. Редакторы обработки графической информации. Классификация и возможности графических редакторов. Векторные графические редакторы. Растровые графические редакторы.

    Представление данных на мониторе компьютера в графическом виде впервые было реализовано в середине 50-х годов для больших ЭВМ, применявшихся в научных и военных исследованиях. С тех пор графический способ отображения данных стал неотъемлемой частью подавляющего числа компьютерных систем, в особенности персональных.

    Компьютерная графика - это специальная область информатики, изучающая методы и средства создания и обработки изображений с помощью программно-аппаратных вычислительных комплексов. Она охватывает все виды и формы представления изображений, доступных для восприятия человеком либо на экране монитора, либо в виде копии на внешнем носителе (бумага, киноплёнка, ткань и прочее).

    Без компьютерной графики невозможно представить себе не только компьютерный, но и обычный, вполне материальный мир. На сегодняшний день компьютеры и компьютерная графика неотъемлемая часть жизни современного общества. Для примера назовём медицину (компьютерная томография), научные исследования (визуализация строения вещества, векторных полей и других данных), моделирование тканей и одежды, опытно-конструкторские разработки, рекламные щиты, цветные журналы, спецэффекты в фильмах – всё это в той или иной мере имеет отношение к компьютерной графике. Поэтому созданы программы для создания и редактирования изображений, то есть графические редакторы.

    4.1. Понятия компьютерной графики

    Графическими называют редакторы, предназначенные для создания и редактирования изображений. Для хранения и обработки графической информации используются графические редакторы двух видов: растровые и векторные.

    Растровая графика. Растровая (пиксельная) графикасостоит в описании каждой отдельной точки (пиксела) изображения. Растровое изображение в целом состоит из множества точек (пикселов) разных цветов. Слово pixelобразовано от словосочетания pictureelement— элемент изображения. Каждая цветовая точка представлена в компьютере несколькими битами (от 8 до 16). При увеличении растровое изображение может стать расплывчатым.

    Простейшим растровым редактором является встроенный в Windows графический редактор Paint, который входит в стандартный набор приложений Windows.

    Adobe Photoshop — самый мощный инструмент для обработки растровых изображений, а начиная с версии 6.0 в нем значительно расширены возможности по обработке векторных изображений.

    Векторная графика. Векторная графикапредставляет изображение как набор большого количества стандартных графических элементов, таких, как отрезок, дуга, окружность, прямоугольник и т. д. Рисунок делится на простейшие геометрические фигуры, и каждый элемент хранится в памяти компьютера в виде математической формулы. Поэтому, к примеру, при масштабировании рисунок в векторном редакторе не теряет в качестве: компьютер высчитывает необходимые параметры, производя определенные математические операции.

    Простейшим векторным редактором является встроенный графический редактор Word. Основные профессиональные графические редакторы для подготовки изображений с векторной графикой, такие, как CorelDraw и Adobe Illustrator, применяются для полиграфии и анимации. Графические редакторы, ориентированные на работу с чертежами и техническими документами, такие, как AutoCAD и ArchiCAD, работают с векторным представлением графической информации.

    Форматы графических файлов.

    Способ организации информации в файле носит название формата. Этот параметр оказывает определенное влияние на качество изображения и размер файла т.к. некоторые форматы позволяют сжимать файлы и могут содержать в себе дополнительную информацию.

    Для сохранения графических файлов используют следующие графические форматы: JPEG (.jpeg, .jpg), TIFF (.tif, .tiff), GIF (.gif), PNG (.png), BMP (.bmp).

    Стандартными для растровых графических изображений являются форматы TIFF, EPS, GIF и JPEG. Для векторных изображений используются форматы EPS (файл описания изображений на языке post-script) и AI (формат редактора Adobe Illustrator).

    Все имеющиеся графические форматы можно разбить на три группы:

    • растровые;

    • векторные;

    • универсальные.

    Лучше сохранить результаты работы в формате, который является «родным» для используемой программы, например PhotoShop – PSD, CorelDraw – CDR.и т.д.

    Универсальные форматы поддерживают не только графические программы, но и другие типы прикладных программ.

    Формат .ВМР - родной формат Windows. Применяется для хранения растровых изображений, предназначенных для использования в WINWOWS (рабочий стол).

    Формат .YPEC - является одним из наиболее распространенных графических форматов, которые используются для сжатия растровых картинок фотографического качества. Недостатком этого формата является частичная потеря хранящейся в файле информации (например, тонкие нюансы цветопередачи).

    Формат .EPSнадежный и универсальный формат, почти все программы, работающие с графикой, могут писать и читать файлы в этом формате. Родная программа AdodeIllustrate.

    Формат .PDF –родной формат программы AdodeAcrobat (основное средство распространения документов). В этом формате хранятся документы, предназначенные только для чтения, но не для редактирования. Формат .PDF может использоваться для представления как векторных, так и растровых изображений.

    Разрешающая способностьэто количество элементов в заданной области. Этот термин применим ко многим понятиям, например, таким как:

    • разрешающая способность графического изображения;

    • разрешающая способность принтера как устройства вывода;

    • разрешающая способность мыши как устройства ввода.

    Например, разрешающая способность лазерного принтера может быть задана 300 dpi (dot per inche — точек на дюйм), что означает способность принтера напечатать на отрезке в один дюйм 300 отдельных точек. В этом случае элементами изображения являются лазерные точки, а размер изображения измеряется в дюймах.

    Разрешающая способность графического изображения измеряется в пикселях на дюйм. Отметим, что пиксель в компьютерном файле не имеет определенного размера, так как хранит лишь информацию о своем цвете. Физический размер пикселя приобретает при отображении на конкретном устройстве вывода, например, на мониторе или принтере.

    Разрешающая способность технических устройств по-разному влияет на вывод векторной и растровой графики.

    Так, при выводе векторного рисунка используется максимальное разрешение устройства вывода. При этом команды, описывающие изображение, сообщают устройству вывода положение и размеры какого-либо объекта, а устройство для его прорисовки использует максимально возможное количество точек. Таким образом, векторный объект, например, окружность, распечатанная на принтерах разного качества, имеет на листе бумаги одинаковые положение и размеры. Однако более гладко окружность выглядит при печати на принтере с большей разрешающей способностью, так как состоит из большего количества точек принтера.

    Значительно большее влияние разрешающая способность устройства вывода оказывает на вывод растрового рисунка. Если в файле растрового изображения не определено, сколько пикселей на дюйм должно создавать устройство вывода, то по умолчанию для каждого пикселя используется минимальный размер. В случае лазерного принтера минимальным элементом служит лазерная точка, в мониторе — видеопиксель. Так как устройства вывода отличаются размерами минимального элемента, который может быть ими создан, то размер растрового изображения при выводе на различных устройствах также будет неодинаков.

    Масштабирование заключается в изменении вертикального и горизонтального размеров изображения. Масштабирование может быть пропорциональным - в этом случае соотношение между высотой и шириной рисунка не изменяется, а меняется общий размер, и непропорциональным — в этом случае оба измерения изменяются по-разному.

    Масштабирование векторныхрисунков выполняется просто и без потери качества. Так как объекты векторной графики создаются по их описаниям, то для изменения масштаба векторного объекта, достаточно изменить его описание. Например, чтобы увеличить в два раза векторный объект, следует удвоить значение, описывающее его размер.

    Масштабирование растровых рисунковявляется намного более сложным процессом, чем для векторной графики, и часто сопровождается потерей качества. При изменении размеров растрового изображения выполняется одно из следующих действий:

    • одновременное изменение размеров всех пикселей (в большую или меньшую сторону);

    • добавление или убавление пикселей из рисунка для отражения производимых в нём изменений, называемое выборкой пикселей в изображении.

    Цветовые модели, системы соответствия цветов и режимы. Для обеспечения одинакового воспроизведения одного и того же цвета видеомониторами, принтерами и сканерами различных фирм-изготовителей необходимо наличие объективных измерительных систем, позволяющих установить однозначное определение цветовых координат.

    Для этих целей разработаны специальные средства, включающие:

    • цветовые модели;

    • система соответствия цветов;

    • цветовые режимы.

    Цветовые модели представляют собой средства для концептуального и количественного описания цвета.

    Режимэто способ реализации определенной цветовой модели в рамках конкретной графической программы.

    Большинство компьютерных цветовых моделей основано на использовании трех основных цветов, что соответствует восприятию человеческим глазом. Каждому основному цвету присваивается определенное значение цифрового кода, после чего все остальные цвета определяются как комбинация основных цветов.

    Цветовое разрешение (глубина цвета) определяет метод кодирования цветовой информации для её воспроизведения на экране монитора.

    Для отображения черно-белого изображения достаточно двух бит (белый и черный цвет). Восьмиразрядное кодирование позволяет отобразить 256 градаций цветового тона (28). Два байта (16 бит) 216 определяют в 65536 оттенков (такой режим называется High Color). При 24 разрядном способе кодирования возможно определить более 16,5 мил. цветов (режим True Color).

    4.2. Векторные графические редакторы

    Векторная графика строится в соответствии с той или иной геометрической формулой, что позволяет сохранять резкость изображения при любом увеличении.

    4.2.1. Встроенный графический редактор MS Word

    Графический векторный редактор, встроенный в Word, обеспечивает возможность создания сложных документов, содержащих не только алфавитно-цифровую информацию, но и рисунки, схемы, графики (рис. 4.1) и т. д.



    1   ...   4   5   6   7   8   9   10   11   ...   26


    написать администратору сайта