Главная страница

информ. Программа для распознавания символов, которая сможет выделить в изображении буквы, составить их в слова, а затем объединить слова в предложения, что в дальнейшем позволит работать с содержимым исходного документа


Скачать 16.69 Kb.
НазваниеПрограмма для распознавания символов, которая сможет выделить в изображении буквы, составить их в слова, а затем объединить слова в предложения, что в дальнейшем позволит работать с содержимым исходного документа
Дата19.02.2019
Размер16.69 Kb.
Формат файлаdocx
Имя файлаинформ.docx
ТипПрограмма
#68230

Мы можем сканировать документы и преобразовывать их в текст с помощью программы обработки текста. Технология, позволяющая компьютерам «читать» текст с физических объектов, называется OCR (Optical Character Recognition). Оптическое распознавание символов – это технология, которая позволяет преобразовывать различные типы документов, такие как отсканированные документы, PDF-файлы или фото с цифровой камеры, в редактируемые форматы с возможностью поиска.

Для того чтобы копировать, извлекать и редактировать данные, нам понадобится программа для распознавания символов, которая сможет выделить в изображении буквы, составить их в слова, а затем объединить слова в предложения, что в дальнейшем позволит работать с содержимым исходного документа.

Наиболее совершенные системы распознавания символов, такие как ABBYY FineReader OCR, делают акцент на использовании механизмов, созданных природой. В основе этих механизмов лежат три фундаментальных принципа: целостность, целенаправленность и адаптивность (принципы IPA). Система оптического распознавания символов ABBYY FineReader – единственная в мире система OCR, действующая в соответствии с вышеописанными принципами на всех этапах обработки документа. Эти принципы делают программу максимально гибкой и интеллектуальной, предельно приближая ее работу к тому, как распознает символы человек.

Алгоритм:

  1. Запустить ABBYY FineReader и положить оригинал на планшет сканера. Кнопка сканировать  делаем предварительное сканирование. Уточняем рамки отсканированного листа. Выбираем разрешение, режим сканирования и размер бумаги+включаем автоматическую обработкуитоговое сканирование (так 30 стр)

  2. Редактируем, убираем все лишнее. Выбираем язык (англ)

  3. Распознаем весь текст , проверяем с помощью «проверка», приступаем к редактированию проблемных частей (здесь у меня возникла одна небольшая проблемка, на одной из страниц был так скажем немного испорчен текст и не были видно буквы в самом оригинале. Однако благодаря редактированию я смогла исправить это)

  4. Создание из полученных текстовых и графических объектов машиночитаемого документа.

  5. Сохранение созданного машиночитаемого документа в форматах Word, PDF, html, web-страница.


Преимущества. Высокое качество технологий распознавания текста ABBYY OCR обеспечивает точную конвертацию бумажных документов (сканов, фотографий) и PDF-документов любого типа в редактируемые форматы. Применение современных OCR-технологий позволяет сэкономить много сил и времени при работе с любыми документами. С ABBYY FineReader OCR вы можете сканировать бумажные документы и редактировать их. Вы можете извлекать цитаты из книг и журналов и использовать их без перепечатывания. позволяет анализировать и обрабатывать документ целиком, а не постранично; распознает документы, написанные на одном или нескольких из 189 языков; простота и удобство использования. Весь процесс преобразования из бумажного документа, снимка или PDF занимает меньше минуты, а сам распознанный документ выглядит в точности как оригинал!


написать администратору сайта