Главная страница

Практика. Программное обеспечение Практические работы Инсталляция программ


Скачать 1.74 Mb.
НазваниеПрограммное обеспечение Практические работы Инсталляция программ
АнкорПрактика
Дата16.12.2020
Размер1.74 Mb.
Формат файлаdoc
Имя файлаpractice10-6bu.doc
ТипДокументы
#161108
страница2 из 6
1   2   3   4   5   6


Сканирование и распознавание текстов




  1. Подготовьте бумажную страницу с печатным текстом, которую вы собираетесь сканировать.

  2. Выполните сканирование в черно-белом режиме (оттенки серого) с разрешением 300 ppi и глубиной кодирования цвета 8 бит на пиксель (256 оттенков серого), сохраните файл в формате JPG.

  3. С помощью программы или онлайн-сервисов (например, http://en.pdf24.org/onlineConverter.html) преобразуйте полученную картинку в формат PDF.

  4. Найдите в Интернете информацию о формате DjVu.

  5. Используя сервис http://any2djvu.djvuzone.org/, преобразуйте картинку в формат DjVu. Сравните качество и размеры полученных PDF-файла и DjVu-файла.

    Формат

    JPG

    PDF

    DjVu

    Качество (1-5)










    Размер










  6. Выполните распознавание текста с помощью программы (например, CuneiForm) или онлайн-сервисов, например:

http://www.newocr.com/
http://www.free-ocr.com/
http://www.ocronline.com/ru/
http://www.onlineocr.net/ru/

http://finereader.abbyyonline.com/

  1. Сохраните результат распознавания в виде документа в формате DOC и исправьте ошибки распознавания, если они были. Затем преобразуйте документ в формат PDF.





  1. Преобразуйте полученный PDF-документ в формат DjVu (с помощью сервиса http://any2djvu.djvuzone.org/) и сравните размеры полученных файлов, заполнив таблицу:

    Тип документа

    Размер

    Без распознавания

    Формат JPG




    Формат PDF




    Формат DjVu




    После распознавания

    Формат DOC




    Формат PDF




    Формат DjVu




  2. Отсканируйте ту же страницу с разрешениями 200 ppi, 150 ppi и 100 ppi, и проверьте, как изменяется качество распознавания. Сделайте выводы.





  1. Попробуйте отсканировать и распознать страницу документа, содержащего рисунки, таблицы и формулы. Сделайте выводы.



      1. Возможности текстовых процессоров




  1. Загрузите файл Дейкстра.doc.

  2. Выделите заголовок стилем Заголовок 1.

  3. Создайте стиль Биография со следующими характеристиками:

    • шрифт Times New Roman, 12 пт

    • абзацный отступ (отступ в первой строке) 1 см

    • выравнивание по ширине

    • междустрочный интервал 1,25 строки

    • дополнительные интервалы : до абзаца – 0, после абзаца – 6 пт

Все абзацы текста оформите с помощью стиля Биография.

  1. Включите режим автоматической расстановки переносов.

  2. Включите проверку орфографии для русского языка.

  3. Поместите информацию о книге OperatingSystem в сноску в нижней части страницы.

  4. Сделайте гиперссылками

    • имена ученых: Тони Хоар, Никлаус Вирт (только когда они встречаются в первый раз); гиперссылка должна указывать на статью в Интернете с информацией об этом ученом;

    • выражения «грамматика Ван Вейнгаардена» и «Алгоритм Дейкстры»; ссылки должна указывать на статьи с описанием упомянутой грамматики и алгоритма;

    • выражение «премия Тьюринга»; ссылка должна указывать на статью с информацией об этой премии.

  5. С помощью тезауруса найдите синонимы и антонимы к слову «впоследствии».



  1. Преобразуйте документ в формат PDF. Если на вашем компьютере не установлена программа-конвертер, можно использовать бесплатные онлайн-сервисы, например,

http://www.doc2pdf.net/

http://convertonlinefree.com/

http://docupub.com/pdfconvert/



  1. Используя доступные вам системы машинного перевода (например, встроенные возможности Word или системы онлайн-перевода типа http://translate.ru или http://translate.google.com) переведите текст на какой-нибудь другой язык (например, на немецкий), а затем выполните обратный перевод. Сравните результат с оригиналом и сделайте выводы.



      1. 1   2   3   4   5   6


написать администратору сайта