Главная страница
Навигация по странице:

  • 5) Высокоуровневая обработка

  • 1.2 Обзор алгоритмов и систем обнаружение текстовых областей

  • Алгоритмы обнаружения текста

  • Использование DCT для обнаружения текста

  • Магистерская диссертация тема работы Разработка мобильного приложения детектирования и распознавания текстов на изображениях для платформы ios


    Скачать 1.55 Mb.
    НазваниеМагистерская диссертация тема работы Разработка мобильного приложения детектирования и распознавания текстов на изображениях для платформы ios
    Дата27.01.2019
    Размер1.55 Mb.
    Формат файлаpdf
    Имя файлаTPU552789.pdf
    ТипДиссертация
    #65474
    страница8 из 23
    1   ...   4   5   6   7   8   9   10   11   ...   23

    4) Детектирование/Сегментация
    На определённом этапе обработки принимается решение о том, какие точки или участки изображения являются важными для дальнейшей обработки.
    Примерами являются:
    • выделение определённого набора интересующих точек;
    • сегментация одного или нескольких участков изображения, которые содержат характерный объект.
    5) Высокоуровневая обработка
    На этом этапе входной набор данных обычно представляется в небольшом количестве. Например: набор точек или небольшой участок изображения, в котором и располагается определенный объект. Примеры:
    • выполнение проверки на удовлетворение тем или иным условиям, которые зависят от метода;
    • выполнение оценки параметров, таких как размер объекта или его положение;
    • выполнение классификации найденного объекта по различным классам.
    1.2 Обзор алгоритмов и систем обнаружение текстовых областей
    Далее рассмотрим основные методы и алгоритмы для решения задач детектирования и распознавания текста. Также следует рассмотреть методы предобработки изображения для улучшения качества распознавания.
    Алгоритмы обнаружения текста
    Известны следующие подходы к обнаружению текстов на изображениях [6]:
    1.
    На основе использования контурной информации (каждый символ обладает четко выраженной контурной структурой); для локализации
    текста тут используют такие приемы как скелетизация (skeletonization), выделение краев (edge detection) и выделение углов (corner detection), методы на основе инвариантных моментов (invariant methods) и пр. В случае изображений со сложным фоном быстрая обработка данных, полученных на этапе предобработки, может представлять нетривиальную задачу.
    2.
    На основе цветовой информации (целевые текстовые области обладают однородными цветами/интенсивностью и удовлетворяют ограничениям по размеру и форме); популярными инструментами являются метод гистограмм (histogram method), анализ главных компонент (connected component analysis) и различные алгоритмы адаптивной бинаризации
    (adaptive binarization)–– в том числе алгоритмы Niblack, Sauvola, Chistian,
    Bernsan, Otsu и пр. Методы позволяют работать с произвольными размерами шрифта и произвольной направленностью текста, однако плохо работают на изображениях со сложным фоном, шумом и нерезкостями, используют большое количество эвристик.
    3.
    На основе анализа текстурной информации (текстовые зоны могут заметно отличаться от фона, что позволяет использовать различные частотные фильтры для «пирамиды» изображений); для выявления нужных зон могут использоваться как классические методы распознавания образов –– метод опорных векторов (support vector machines), искусственные нейронные сети (neural networks), экспертные системы (expert systems) и др., так и специальные, например, метод спектрографических текстур. Подходы позволяют работать с изображениями со сложным фоном, обладают высокой вычислительной сложностью из-за необходимости масштабирования изображений. В основополагающих работах среди прочего рассмотрены вопросы выделения текстурных признаков.
    Использование DCT для обнаружения текста
    ДКП (дискретно-косинусное преобразование) – является одним из ортогональных преобразований.
    Косинусное преобразование,
    использующиеся для вектора действительных чисел. Данный тип сжатия применяется для алгоритмов сжатия информации с потерями, например,
    MPEG и JPEG. Этот тип преобразования связан с дискретным преобразованием Фурье, кроме того он является гомоморфизмом его векторного пространства.
    Данное преобразование осуществляется при помощи умножения вектора на матрицу преобразования. В данном случае матрица обратного преобразования с точностью до множителя равна транспонированной матрице. Матрицы выбирают таким образом, чтобы постоянный множитель равен единице, а преобразование было ортонормированным. Однако в компьютерных программах это не всегда так.
    Тип ДКП зависит от типа периодического продолжения сигнала.
    Это преобразование раскладывает изображение по амплитудам некоторых частот, так, чтобы при преобразовании получить матрицу, в которой многие коэффициенты либо близки, либо равны нулю. Также стоит отметить, что человеческая система восприятия цвета достаточно плохо распознает определенные частоты. Следовательно, можно аппроксимировать некоторые коэффициенты менее точно без сильной потери качества изображения.
    Для этого используется квантование коэффициентов. После этого часть информации теряется, при этом достигаются более высокие коэффициенты сжатия.
    Рисунок 1. – Этапы обработки для использования метода ДКП.
    RGB->YUV
    Дискретизация YUV
    ДКП
    1   ...   4   5   6   7   8   9   10   11   ...   23


    написать администратору сайта