Магистерская диссертация тема работы Разработка мобильного приложения детектирования и распознавания текстов на изображениях для платформы ios
Скачать 1.55 Mb.
|
ВВЕДЕНИЕ В современном мире мы не представляем свою жизнь без информационных технологий. Данные технологии прочно проникли в нашу жизнь и значительно ее упростили. Сейчас мы уже не тратим время на многие задачи, так как за нас их решает машина. Однако пока не все задачи решены, а даже если и решены, то практически всегда есть возможность каким-либо образом улучшить предложенное решение. На данный момент одним из перспективных направлений считается разработка алгоритмов распознавания объектов на изображении или видео. Исследования в данной области ведутся уже давно. Данный тип задач уже успешно решается, однако пока компьютер не обладает таким же интеллектом, как и человек. Поэтому некоторые объекты по-прежнему достаточно сложно найти и каким-либо образом идентифицировать с помощью компьютера. Особенно это касается таких объектов как текст. Также задачу может еще сильней усложнить качество исходного изображения и, в особенности, если это не изображение, а видео. Поэтому результат не всегда является точным и корректным. В свою очередь данную проблему возможно решить, используя алгоритмы предобработки, однако данные методы требуют значительных вычислительных ресурсов и увеличивают время работы алгоритма. Задача детектирования и распознавания текстовой информации на изображениях представляет интерес в области компьютерного анализа. На данный момент различные системы используют совершенно разные технологии для решения данной задачи от различных вариаций обработки изображений с целью получения репрезентативных признаков до нейронных сетей. Различные методы дают разную точность и занимают разное время на обработку. Таким образом, разработка такой системы, которая могла бы распознавать текст на различных типах видеозаписей, даже на сильно некачественных, была бы очень актуальна. Кроме того, данная разработка имела бы свое применение в таких практических задачах, как распознавание автомобильных номеров, дорожных знаков, для перевода текста и прочей важной информации, записываемой на фото и видеокамеры. Целью данной работы является разработка алгоритма для детектирования и распознавания текста в приложении для платформы iOS. Чтобы достичь поставленную цель, в работе решаются следующие задачи: 1) проведение аналитического обзора существующих алгоритмов методов детектирования и распознавания текста на изображениях; 2) разработка приложения для детектирования и распознавания текста на изображениях для платформы iOS; 3) тестирование приложения и анализ полученных результатов; Работа состоит из введения, 5 глав, заключения, списка использованных источников из 33 наименований. Работа изложена на 140 страницах машинописного текста, иллюстрируется 35 рисунками и содержит 33 таблиц. В первой главе сделан аналитический обзор методов и алгоритмов, которые применяются для детектирования и распознавания текста. Рассматриваются основные особенности различных подходов. Подробно описываются их преимущества и недостатки. Во второй главе представлена архитектура и алгоритмы разрабатываемого приложения, сделано обоснование выбора средств разработки. В третьей главе проведено тестирование полученного приложения, выполнен анализ полученных результатов. В четвертой главе осуществлен экономический анализ разрабатываемого проекта. Пятая глава посвящена описанию социальной ответственности исполнителя за те последствия, которые могут возникнуть в результате использования данного программного продукта. Рассмотрено воздействие на общество, окружающую среду, а также различные правовые нормы, регулирующие правила использования. 1 АНАЛИТИЧЕСКИЙ ОБЗОР МЕТОДОВ ДЕТЕКТИРОВАНИЯ И РАСПОЗНАВАНИЯ ТЕКСТА НА ИЗОБРАЖЕНИЯХ Задачи детектирования и распознавания текста на изображениях исследуются довольно давно, поэтому на данный момент уже существуют сложившиеся понятия в данной области. Кроме того, на данный момент времени, существует достаточно много разработанных алгоритмов и методов для детектирования и распознавания текста. 1.1 Компьютерное зрение Технология и теория для создания интеллектуальных машин, производящих обнаружение, детектирование и классификацию объектов называется компьютерным зрением.[1] С научной точки зрения, компьютерное зрение можно отнести к технологии по созданию интеллектуальных систем, получающих информацию из изображений и видео. Видеоданные могут представляться как видеопоследовательность, изображения с нескольких камер, а также трехмерными данными. Примеры систем, применяющих технологию компьютерного зрения: 1) Системы для управления процессами; 2) Системы организации информации (например, для индексации баз данных изображений). 3) Системы взаимодействия (например, устройства ввода для системы человеко-машинного взаимодействия). 4) Системы дополненной реальности. 5) Системы видеонаблюдения. 6) Системы моделирования объектов или окружающей среды (анализ медицинских изображений, топографическое моделирование). 7) Вычислительная фотография. |