ПР№19. ПР №19. Практическая работа 19 Сканирование и распознавание текстов
Скачать 17.2 Kb.
|
Практическая работа №19Сканирование и распознавание текстовПодготовьте бумажную страницу с печатным текстом, которую вы собираетесь сканировать. Выполните сканирование в черно-белом режиме (оттенки серого) с разрешением 300 ppi и глубиной кодирования цвета 8 бит на пиксель (256 оттенков серого), сохраните файл в формате JPG. С помощью программы или онлайн-сервисов (например, http://en.pdf24.org/onlineConverter.html) преобразуйте полученную картинку в формат PDF. Найдите в Интернете информацию о формате DjVu. Используя сервис http://any2djvu.djvuzone.org/, преобразуйте картинку в формат DjVu. Сравните качество и размеры полученных PDF-файла и DjVu-файла.
Выполните распознавание текста с помощью программы (например, CuneiForm) или онлайн-сервисов, например: http://www.newocr.com/ http://www.free-ocr.com/ http://www.ocronline.com/ru/ http://www.onlineocr.net/ru/ http://finereader.abbyyonline.com/ Сохраните результат распознавания в виде документа в формате DOC и исправьте ошибки распознавания, если они были. Затем преобразуйте документ в формат PDF. Преобразуйте полученный PDF-документ в формат DjVu (с помощью сервиса http://any2djvu.djvuzone.org/) и сравните размеры полученных файлов, заполнив таблицу:
Отсканируйте ту же страницу с разрешениями 200 ppi, 150 ppi и 100 ppi, и проверьте, как изменяется качество распознавания. Сделайте выводы. Попробуйте отсканировать и распознать страницу документа, содержащего рисунки, таблицы и формулы. Сделайте выводы. |