Главная страница
Навигация по странице:

  • Применение нейронных сетей для выделения текста

  • Входной слой

  • Слой сверти

  • Магистерская диссертация тема работы Разработка мобильного приложения детектирования и распознавания текстов на изображениях для платформы ios


    Скачать 1.55 Mb.
    НазваниеМагистерская диссертация тема работы Разработка мобильного приложения детектирования и распознавания текстов на изображениях для платформы ios
    Дата27.01.2019
    Размер1.55 Mb.
    Формат файлаpdf
    Имя файлаTPU552789.pdf
    ТипДиссертация
    #65474
    страница9 из 23
    1   ...   5   6   7   8   9   10   11   12   ...   23

    На основании данного метода получаем коэффициенты ДКП. Данные коэффициенты показывают амплитуды частот области 8х8 изображения.
    Данные значения могут говорить о высокочастотной или низкочастотной области изображения. Обычно текстовая информация на изображении дает более высокий уровень частоты, следовательно, таким образом ее можно выделить среди других объектов на изображении.
    Применение нейронных сетей для выделения текста
    Чаще всего в задачах распознавания и идентификации изображений используются классические нейронные сети (многослойный персептрон, сети с радиально-базисной функцией и др.). Однако, проанализировав данные работы, можно сделать вывод, что применение классических нейронных сетей в данном типе задач недостаточно эффективно по следующим причинам [7]:
    1)
    Размер изображения сильно влияет на размер нейронной сети, таким образом, большое изображение приводит к сильно большому размеру нейронной сети;
    2)
    Увеличение вместимости системы требует увеличения тренировочной выборки, времени и вычислительной сложности в процессе обучения;
    3)
    Для того чтобы достигнуть высокой эффективности работы системы лучше применять каскад нейронных сетей (при этом каждая нейронная сеть будет иметь свои начальные коэффициенты). Это приводит к увеличению вычислительной сложности решения задачи, а также возрастает время выполнения;
    4)
    Инвариантность к изменению масштаба изображения, ракурсов и прочих искажений входного сигнала должна отсутствовать.
    Более современным вариантом является использование сверточных нейронных сетей. Данные нейронные сети используются для поиска, выделения и классификации различных объектов на изображениях. [8]

    Рисунок 2. – структура сверточной нейронной сети.
    Сверточная нейросеть — это особый вид нейросетей прямого распространения, и под прямым распространением понимается то, что переменные нейроны в этой сети разбиты на группы, которые называются слоями. При применении данного тип нейронных сетей к данным, значение переменных при активации слоев подсчитывается последовательно: от первого слоя к последующим, по порядку. Значения активации последнего слоя являются выходами нейронной сети.
    Такой тип сетей обладает огромным количеством параметров, причем для каждого слоя, которые определяют зависимость активации следующего слоя от предыдущего. Также важно отметить, что активации внутри одного слоя могут происходить параллельно и одновременно, так как они друг от друга не зависят. Это дает большое преимущество при вычислениях на современных процессорах, особенно на графических сопроцессорах. [9]
    Топология данного типа нейронной сети ориентирована на определенную задачу. В нашем случае это детектирования и распознавание текстовой информации. Кроме того, топология зависит также от определенный ограничений в задаче, таких как: скорость обучения, точность ответа. А также от такого какие используется входные данные и что должно быть получено на выходе. Однако общая топология отображена на рисунке 3.

    Рисунок 3. – Топология сверточной сети.
    Входной слой
    На вход подаются цветные изображения, выбранного формата и размера. Если размер будет слишком большим, то сильно возрастет вычислительная сложность и как следствие скорость сильно снизиться.
    Однако слишком маленький размер нарушит заданную точность. Кроме того, изображения разбивается на 3 цветовых канала.
    Входные данные каждого полученного пикселя должны нормализоваться в диапазоне от 0 до 1. Для этого должна быть использована следующая формула:
    ??????(??????, ??????????????????, ??????????????????) =
    -./01
    /23./01
    , где
    ?????? – функция нормализации,
    ?????? – значение конкретного цвета (величина от 0 до 255),
    ?????????????????? – минимальное значения цвета а конкретном пикселе – 0,
    ?????????????????? – максимальное значения цвета а конкретном пикселе – 0.
    Слой сверти
    Данный слой представляет собой набор карт (карт признаков), каждая такая карта имеет синаптическое ядро.
    Количество таких карт должно определятся соответствующими требованиями к задаче. Большое число улучшит точность, однако это приведет к возрастанию вычислительной мощности. [10]
    1   ...   5   6   7   8   9   10   11   12   ...   23


    написать администратору сайта