Главная страница
Навигация по странице:

  • Фан Нгок Хоанг АЛГОРИТМЫ ОБРАБОТКИ И АНАЛИЗА СИМВОЛОВ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕМ, МЕТОДОМ ГЛАВНЫХ КОМПОНЕНТ И НЕЙРОННЫМИ СЕТЯМИ

  • Диссертация на соискание ученой степени кандидата технических наук

  • ВВЕДЕНИЕ Актуальность работы.

  • Целью диссертационной работы

  • Апробация работы

  • Методы исследования

  • Основные положения, выносимые на защиту.

  • Степень достоверности результатов проведенных исследований

  • Структура и объем работы

  • Фан_Ногк_Хоанг_Диссертация. Алгоритмы обработки и анализа символов вейвлетпреобразованием, методом главных компонент и нейронными сетями


    Скачать 3.2 Mb.
    НазваниеАлгоритмы обработки и анализа символов вейвлетпреобразованием, методом главных компонент и нейронными сетями
    Дата13.10.2022
    Размер3.2 Mb.
    Формат файлаpdf
    Имя файлаФан_Ногк_Хоанг_Диссертация.pdf
    ТипДиссертация
    #732105
    страница1 из 7
      1   2   3   4   5   6   7

    Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
    «Национальный исследовательский
    Томский политехнический университет»
    На правах рукописи
    Фан Нгок Хоанг
    АЛГОРИТМЫ ОБРАБОТКИ И АНАЛИЗА СИМВОЛОВ
    ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕМ, МЕТОДОМ ГЛАВНЫХ
    КОМПОНЕНТ И НЕЙРОННЫМИ СЕТЯМИ
    05.13.01 – Системный анализ, управление и обработка информации
    (в отраслях информатики, вычислительной техники и автоматизации)
    Диссертация
    на соискание ученой степени
    кандидата технических наук
    Научный руководитель – доктор технических наук, профессор В.Г. Спицын
    Томск 2014

    2
    ОГЛАВЛЕНИЕ
    ВВЕДЕНИЕ .............................................................................................................. 5
    Глава 1.
    Аналитический обзор подходов к распознаванию символов......... 12 1.1
    Основные задачи обработки изображений....................................... 12 1.2
    Подходы и системы распознавания символов и текстов ................ 14 1.2.1
    Системы распознавания текста .............................................. 14 1.2.2
    Подходы к распознаванию символов .................................... 16 1.2.3
    Выделение признаков .............................................................. 19 1.3
    Методы обработки изображений и распознавания образов с использованием вейвлет-преобразования .................................................. 31 1.3.1
    Построение дескриптора фигуры ........................................... 31 1.3.2
    Классификация изображений ................................................. 32 1.3.3
    Распознавание лиц ................................................................... 35 1.4
    Цель и задачи исследования .............................................................. 39 1.5
    Основные результаты и выводы по главе 1 ..................................... 41
    Глава 2.
    Применение вейвлет-преобразования, метода главных компонент и нейронных сетей для распознавания символов и фрагментов печатных текстов ............................................................................................................... 42 2.1
    Предложенный алгоритм распознавания символов ........................ 42 2.1.1
    Выделение признаков изображений символов ..................... 43 2.1.2
    Уменьшение размерности вектора признаков ...................... 48 2.1.3
    Распознавание символов нейронными сетями ..................... 51 2.2
    Предложенный алгоритм распознавания фрагментов печатных текстов ............................................................................................................ 52 2.2.1
    Выделение символов из фрагмента текста............................ 53 2.2.2
    Распознавание фрагмента текста ........................................... 57

    3 2.2.3
    Распознавание похожих по написанию символов ................ 58 2.3
    Основные результаты и выводы по главе 2 ..................................... 61
    Глава 3.
    Разработанное программное обеспечение для распознавания символов и фрагментов печатных текстов ......................................................... 62 3.1
    Выбор средств разработки ................................................................. 62 3.2
    Реализованные классы для распознавания символов и фрагментов текстов ............................................................................................................ 66 3.2.1
    Классы для распознавания символов .................................... 66 3.2.2
    Классы для распознавания фрагментов печатных текстов . 77 3.3
    Разработанные программные средства ............................................. 87 3.3.1
    Приложение для исследователей ........................................... 87 3.3.2
    Приложение для обычных пользователей........................... 100 3.4
    Основные результаты и выводы по главе 3 ................................... 102
    Глава 4.
    Численные эксперименты и анализ результатов распознавания разработанными алгоритмами ........................................................................... 103 4.1
    Тестирование на задаче распознавания рукописных цифр .......... 103 4.1.1
    Обучающая выборка .............................................................. 103 4.1.2
    Описание тестирования ......................................................... 104 4.1.3
    Результаты тестирования ...................................................... 105 4.2
    Тестирование на задаче распознавания печатных символов ....... 108 4.2.1
    Обучающая выборка .............................................................. 108 4.2.2
    Описание тестирования ......................................................... 110 4.2.3
    Результаты тестирования ...................................................... 111 4.3
    Тестирование на задаче распознавания фрагментов печатных текстов .......................................................................................................... 113 4.3.1
    Описание тестирования ......................................................... 113

    4 4.3.2
    Результаты тестирования ...................................................... 115 4.4
    Основные результаты и выводы по главе 4 ................................... 118
    ЗАКЛЮЧЕНИЕ ................................................................................................... 119
    ОБОЗНАЧЕНИЯ .................................................................................................. 120
    СПИСОК СОКРАЩЕНИЙ ................................................................................. 121
    СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ .......... 122
    ПРИЛОЖЕНИЕ ................................................................................................... 138

    5
    ВВЕДЕНИЕ
    Актуальность работы. В области обработки изображений задача распознавания образов является одной из широко исследуемых задач в настоящее время. Решение задачи распознавания образов востребовано в различных сферах деятельности современного общества. Например, распознавание лиц используется в системах паспортного контроля аэропортов и вокзалов, распознавание радужной оболочки глаза – в системах контроля доступа, распознавание речи – для управления приборами, такими как компьютеры, телефоны, распознавание жестов – для взаимодействия с людьми с ограниченными возможностями и т.д.
    Задача распознавания символов является одной из актуальных задач распознавания образов. Эту задачу можно использовать для решения других задач, таких как распознавание текстов, распознавание автомобильных номеров и т.п.
    В настоящее время существует ряд программных средств и систем, использующих алгоритмы распознавания символов для решения задачи распознавания текстов. Широкое распространение получили такие программные средства как ABBY FineReader, Tesseract OCR, CuneiForm,
    OmniPage, Readiris и др. В каждом из перечисленных программных продуктов предложены свои алгоритмы и методы для распознавания символов и текстов. Однако большинство указанных программных средств являются коммерческими, поэтому алгоритмы и методы, применяемые в них для решения задач, известны только разработчикам.
    Хотя перечисленные программы показывают высокую точность распознавания символов и текстов, но они не могут обеспечивать 100% точность распознавания для всех вариантов символов и текстов, а также в присутствии шума на изображениях. Указанные программные средства и системы продолжают развиваться в направлении повышения точности и скорости распознавания. Таким образом, можно сделать вывод, что разработка новых алгоритмов для распознавания символов и текстов

    6 является актуальной задачей.
    Главными преимуществами признакового подхода к распознаванию символов являются хорошая устойчивость к изменениям формы, размера и шрифта символов и высокая скорость распознавания. Кроме того, такой подход имеет другие преимущества, такие как низкое число отказов от распознавания и простота реализации. Благодаря указанным преимуществам признаковый подход выбран для дальнейшей разработки алгоритмов, предназначенных для распознавания символов разных шрифтов с высоким быстродействием.
    Вейвлет-преобразование является эффективным методом для выделения признаков объектов при решении задач распознавания образов.
    При разложении изображения вейвлет-преобразование содержит в себе необходимую информацию об этом изображении. Например, субдиапазоны в пространственных и частотных доменах, в различных разрешениях, в горизонтальном, вертикальном и диагональном направлениях. Вейвлет- преобразование также достаточно быстро вычисляется. В алгоритмах ряда авторов Mehdi L., Weibao Z., Chang T., Daniel M.R.S., Park S.B. и Gonzalez A.C. используются вейвлет-преобразования для решения задачи классификации изображений. В указанных работах показано, что при использовании вейвлет-преобразования для выделения признаков изображения точность классификации изображений составляет 76–99,7%.
    Кроме того, в области распознавания образов вейвлет-преобразования используются в алгоритмах ряда авторов Lai J.H., Kakarwal S., Zhang B.,
    Gumus E., Wadkar P.D., Kumar S.V.PMazloom M. В указанных работах показано, что вейвлет-преобразования эффективно используются при решении задач распознавания образов, в особенности, задачи распознавания лиц. Точность распознавания лиц при этом составляет 90–98,5%.
    Таким образом, применение вейвлет-преобразования является перспективным способом для разработки новых алгоритмов распознавания символов и текстов.

    7
    Целью диссертационной работы является разработка алгоритмов на основе вейвлет-преобразования, метода главных компонент и нейронных сетей, способных распознавать символы разных шрифтов и фрагменты текстов.
    Для достижения поставленной цели необходимо решить следующие
    основные задачи.
    1.
    Разработать алгоритм распознавания символов на основе вейвлет-преобразования, метода главных компонент и нейронных сетей.
    2.
    Разработать способ построения классификатора для распознавания символов на основе нейронных сетей.
    3.
    Создать алгоритм распознавания фрагментов печатных текстов на основе разработанного алгоритма распознавания символов.
    4.
    Осуществить апробацию созданных в диссертационной работе алгоритмов на задачах распознавания символов и фрагментов печатных текстов на изображениях.
    Апробация
    работы.
    Результаты диссертационной работы докладывались и обсуждались на следующих симпозиумах, конференциях и семинарах: VIII, IX Всероссийские научно-практические конференции студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии»
    (Томск,
    2010, 2011);
    XVI,
    XVII
    Международные научно-практические конференции студентов, аспирантов и молодых ученых «Современные техника и технологии» (Томск, 2010, 2011);
    III Всероссийская научно-практическая конференция «Научная инициатива иностранных студентов и аспирантов российских вузов» (Томск, 2010); VI
    Международная научно-практическая конференция «Электронные средства и системы управления» (Томск, 2010); XIX Всероссийский семинар
    «Нейроинформатика, ее приложения и анализ данных» (Красноярск, 2011);
    XIV Всероссийский с международным участием научный симпозиум по теории и приложениям непараметрических и робастных статистических методов «НЕПАРАМЕТРИКА-XIV» (Томск, 2012); The 7
    th
    International Forum

    8 on Strategic Technology IFOST (Томск, 2012).
    Кратно изложим основное содержание работы.
    В первой главе проведен анализ систем распознавания текстов и подходов к распознаванию символов. Приведен аналитический обзор основных методов и алгоритмов для выделения признаков изображения.
    Описывается принцип работы двумерного вейвлет-преобразования и определяются его преимущества при решении задач обработки изображений и распознавания образов. Проведен анализ основных методов и алгоритмов, основанных на вейвлет-преобразовании, предназначенных для решения задач обработки изображений и распознавания образов.
    Во второй главе предложен и описан способ построения классификатора для распознавания символов на основе нейронных сетей.
    Разработан и описан алгоритм распознавания символов, основанный на вейвлет-преобразовании, методе главных компонент и нейронных сетях.
    Создан и описан алгоритм распознавания фрагментов печатных текстов, основанный на разработанном алгоритме распознавания символов и способе выделения символов из фрагмента текста.
    В третьей главе рассматриваются средства для разработки программного обеспечения. Проведен анализ инструментальных библиотек по обработке изображений, по результатам которого сделан выбор объектно- ориентированного языка программирования C#, библиотек Emgu CV и
    OpenCV для дальнейшей разработки. В главе содержится описание библиотеки, предназначенной для реализации предложенного способа построения классификатора для распознавания символов, предложенных алгоритмов распознавания символов и фрагментов печатных текстов.
    Указанная библиотека состоит из двух модулей. Первый модуль предназначен для выделения признаков и распознавания символов, а второй модуль осуществляет выделение символов из фрагмента текста. Подробно описываются классы этих модулей. В главе также описываются программные средства, разработанные для реализации библиотеки, имеющие два варианта

    9 интерфейса для конечных пользователей. Первый вариант предназначен для исследователей, а второй вариант для обычных пользователей.
    В четвертой главе приведены результаты апробации разработанных алгоритмов на задачах распознавания рукописных цифр, печатных символов и фрагментов печатных текстов. Представлены данные для обучения и тестирования алгоритмов, а также таблицы и диаграммы, в которых представлены результаты распознавания. Произведено сопоставление разработанных алгоритмов с другими современными алгоритмами распознавания.
    Научную новизну полученных в диссертации результатов определяют следующие положения.
    1.
    Впервые предложен способ построения классификатора для распознавания символов на основе нейронных сетей, отличающийся от других тем, что каждая нейронная сеть соответствует только одному символу обучающей выборки.
    2.
    Предложен новый алгоритм, основанный на вейвлет- преобразовании, методе главных компонент и нейронных сетях, позволяющий распознавать символы разных шрифтов в присутствии шума на изображениях.
    3.
    Разработан оригинальный алгоритм, основанный на предложенном алгоритме распознавания символов и способе выделения символов из фрагмента текста, позволяющий распознавать фрагменты печатных текстов.
    Практическая ценность. Разработанные в ходе диссертационной работы алгоритмические и программные средства предназначены для использования в системах OCR, системах распознавания номеров автомобилей, при обработке изображений.
    Реализованные в диссертации алгоритмы предназначены для распознавания рукописных цифр, печатных символов и фрагментов печатных текстов.

    10
    Апробация реализованных алгоритмов осуществлялась на задачах распознавания рукописных цифр и печатных символов, при распознавании фрагментов печатных текстов.
    Методы
    исследования.
    Для решения поставленных задач используются вейвлет-преобразования, метод главных компонент, аппарат нейронных сетей, методы цифровой обработки изображений, методы вычислительной математики и численные компьютерные эксперименты для оценки надежности и эффективности разработанных алгоритмов.
    Личный вклад автора. Постановка задач исследования по теме диссертации выполнена автором совместно с научным руководителем, д.т.н., профессором В.Г. Спицыным. Основные теоретические результаты, представленные в диссертации, получены лично автором.
    Основные положения, выносимые на защиту.
    1.
    Способ построения классификатора для распознавания символов на основе нейронных сетей, отличающийся от других тем, что каждая нейронная сеть соответствует только одному символу обучающей выборки.
    2.
    Алгоритм распознавания символов, основанный на вейвлет- преобразовании, методе главных компонент и нейронных сетях.
    3.
    Алгоритм распознавания фрагментов печатных текстов, основанный на предложенном алгоритме распознавания символов и способе выделения символов из фрагмента текста.
    4.
    Разработанное программное обеспечение позволяет успешно распознавать рукописные цифры, печатные символы и фрагменты печатных текстов.
    Автор выражает глубокую благодарность научному руководителю профессору, доктору технических наук В.Г. Спицыну за помощь в написании работы, ценные советы, замечания и доброжелательную критику. Автор также благодарит за ценные замечания и всестороннюю помощь кандидатов технических наук, доцентов Ю.Р. Цоя и Ю.А. Болотову. Автор благодарит заведующего кафедрой Вычислительной техники, профессора Н.Г. Маркова

    11 за ценные замечания и обсуждение работы. Автор также благодарит за обсуждение работы доцентов Томского политехнического университета, кандидата технических наук Е.А. Мирошниченко и кандидата физико- математических наук Ю.Б. Буркатовскую.
    Степень достоверности результатов проведенных исследований подтверждена результатами численных экспериментов на различных тестовых задачах и согласованностью результатов диссертационной работы с результатами, полученными другими авторами.
    Внедрение работы. Результаты работы внедрены в Томском политехническом университете на кафедре вычислительной техники при подготовке специалистов по магистерской программе «Компьютерный анализ и интерпретация данных» по курсу «Методы интеллектуальной обработки и анализа изображений».
    Структура и объем работы. Диссертация содержит введение, четыре главы, заключение, список использованной литературы, содержащий 117 наименований. Общий объем диссертации составляет 138 страниц машинописного текста, включающих 63 рисунка и 26 таблиц.

    12
      1   2   3   4   5   6   7


    написать администратору сайта