практическая работа информатика. Переводчики. Программыпереводчики. Возможности систем распознавания текстов
Скачать 21.96 Kb.
|
ИНСТРУКЦИОННО - ТЕХНОЛОГИЧЕСКАЯ КАРТА на выполнение практического занятия Дисциплина ПД.02 «Информатика» Курс: 1 Группа: 1И1 Тема: Программы-переводчики. Возможности систем распознавания текстов. Наименование работы: практическая работа. Цель работы: - выработать практические навыки использования программ перевода текста; - выработать практические навыки использования систем распознавания текстов. Приобретаемые навыки и умения: соблюдать правила техники безопасности и гигиенические рекомендации при использовании средств ИКТ; оценивать достоверность информации, сопоставляя различные источники; распознавать информационные процессы в различных системах Норма времени:1 час Оснащение рабочего места: инструкционные карты. Пакет программ MS Office. Литература: Цветкова М. С., Хлобыстова И. Ю. Информатика и ИКТ: практикум Глава 4, пр. 16 КОНТРОЛЬНЫЕ ВОПРОСЫ ПРИ ДОПУСКЕ К ЗАНЯТИЮ: Каковы возможности MS Word для проверки ошибок различного рода в текстовых документах? Каков порядок проверки орфографии и грамматики в MS Word? Для каких целей нужны функции автозамены и автотекста? МЕТОДИЧЕСКИЕ УКАЗАНИЯ: Изучить теоретический материал. При выполнении практической работы необходимо соблюдать следующие общие требования: работы выполняются на ПК согласно заданию. ПОРЯДОК (АЛГОРИТМ) ВЫПОЛНЕНИЯ ПРАКТИЧЕСКОЙ РАБОТЫ: Теоретический материал. Программы-переводчики. Происходящая в настоящее время глобализация нашего мира приводит к необходимости обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках. В этих условиях использование традиционной технологии перевода «вручную» тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществить немедленно, и нет возможности и времени пригласить переводчика. Системы машинного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду) и, с другой стороны, переводить Web-страницы «на лету», в режиме реального времени. Лучшими среди российских систем машинного перевода считаются PROMT и «Сократ». Системы машинного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка (синтаксиса языка — правил построения предложений, правил словообразования) и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке. Современные системы машинного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они неприменимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека. Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition – OCR). Возможно, самая известная программа для распознавания текстов – это FineReader от компании ABBYY. Именно эту программу чаще всего вспоминают, когда речь заходит о системах распознавания. Возможности систем распознавания текстов. FineReader – омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии "целостного целенаправленного адаптивного распознавания". FineReader имеет массы дополнительных функций, которые простому пользователю, возможно, и без надобности, но зато производят впечатление на определенные группы покупателей. Так, одним из козырей FineReader является поддержка неимоверного количества языков распознавания – 176, в числе которых вы найдете экзотические и древние языки, и даже популярные языки программирования. Но далеко не все возможности включены в самую простую модификацию программы, которую вы можете получить бесплатно вместе со сканером. Пакетное сканирование, грамотная обработка таблиц и изображений – для всего этого стоит приобрести профессиональную версию программы. Все версии FineReader, от самой простой до самой мощной, объединяет удобный интерфейс. Для запуска процесса распознавания вам достаточно просто положить документ в сканер и нажать единственную кнопку (мастер Scan & Read) на панели инструментов программы. Все дальнейшие операции – сканирование, разбивку изображения на “блоки” и, наконец, собственно распознавание программа выполнит автоматически. Пользователю останется только установить нужные параметры сканирования. FineReader работает со сканерами через TWAIN-интерфейс. Это единый международный стандарт, введенный в 1992 году для унификации взаимодействия устройств для ввода изображений в компьютер (например, сканера) с внешними приложениями. Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. Качество изображения регулируется установкой основных параметров сканирования: типа изображения, разрешения и яркости. Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Если Вы хотите, чтобы содержащиеся в документе цветные элементы (картинки, цвет букв и фона) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения. Оптимальным разрешением для обычных текстов является – 300 dpi и 400–600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов). После завершения распознавания страницы FineReader предложит пользователю выбор: сканировать и распознавать дальше (для многостраничного документа) или сохранить полученный текст в одном из множества популярных форматов – от документов Microsoft Office до HTML или PDF. Можно, впрочем, сразу же перебросить документ в Word или Excel, и уже там исправить все огрехи распознавания (без ни обойтись просто невозможно). При этом FineReader полностью сохраняет все особенности форматирования документа и его графическое оформление. Практические задания. Задание 1 В сети «Интернет» найдите и запишите в тетрадь адреса онлайновых словарей и переводчиков (не менее 4) Задание 2 С помощью онлайнового словаря переведите и запишите в тетрадь с русского языка на английский следующие предложения: When the work had been completed the results were published in the magazine When the experiment was being made everybody was watching it with great interest Professor N. was to deliver a lecture on history at the club Before writing our test we learn the necessary grammar material. Задание 3 С помощью онлайнового словаря переведите и запишите в тетрадь с английского языка на русский следующие предложения: Большой объем исследовательской работы был сделан в этом колледже. Я должен переводить текст а у меня нет словаря. Парты за которыми мы сидим, деревянные. Золото не ржавеет Задание 4 Выполните сканирование предложенного Вам документа и сохраните его . Скопируйте папку «…. Группа» в Общую папку на центральном компьютере. По локальной сети откройте эту папку на вашем компьютере. Скопируйте свой документ в свою папку. Запустите программу FineReader (Пуск – Программы ) В окне FineReaderвыполнитекоманду Файл – Открыть изображение, найдите свой документ и откройте его в окне программы FineReader. Выберите язык для распознавания документа. Выполните распознавание графического файла, сегментируйте текстовые блоки, таблицы и рисунки. Выполните проверку отсканированного документа. Ошибки исправляйте в окне Текст или в диалоговом окне Проверка. Сохраните отсканированный документ в формате Word . Задайте параметры страниц документа (вкладка Разметка страницы – группа Параметры страницы): ориентация альбомная, левое поле 1,5 см, правое 1,5 см, верхнее 3см, нижнее 2 см., расстановка переносов Автоматическая. Параметры абзацев: выравнивание по ширине, отступ первой строки 1,5см, интервал перед абзацем 6пт, интервал между строчками 1,15. Для картинки используйте команду Обтекание текстом – по контуру. В верхний колонтитул запишите дату и номер работы. В нижний колонтитул запишите виши фамилию, имя и группу. В готовый документ запишите тему и цель работы. Выведите готовый документ на печать. Контрольные вопросы: Зачем нужны программы - переводчики? По какому принципу построены компьютерные словари? Какие тексты нецелесообразно переводить с помощью компьютерных переводчиков? Перечислите основные элементы окна программы Fine Reader. Дайте понятие сегментации изображения. Как выполняется настройка операций, выполняемых программой Fine Reader? Оценка результатов работы. В критерии оценки уровня подготовленности студента входят: - уровень освоения студентом материала, предусмотренного учебной программой по дисциплине; -умение студента использовать теоретические знания при выполнении практических задач. Уровень подготовки студента оцениваться в баллах: 5 (отлично), 4 (хорошо), 3 (удовлетворительно), 2 (неудовлетворительно). |