Главная страница
Навигация по странице:

  • Состав САТ. Характеристика ресурсов. Системы управления терминологией. Объективность использования.

  • Объективная необходимость использования САТ-инструментария. Преимущества использования. Принципиальное отличие САТ и МП.

  • Объективная необходимость

  • Машинный перевод. История МП. Главная проблема МП. Системы МП. Нейронный машинный перевод.

  • при машинном переводе .

  • Предпосылки возникновения научной теории перевода. Лингвистические и межкультурные параметры теории перевода. Основные методы исследования


    Скачать 0.52 Mb.
    НазваниеПредпосылки возникновения научной теории перевода. Лингвистические и межкультурные параметры теории перевода. Основные методы исследования
    Дата21.02.2022
    Размер0.52 Mb.
    Формат файлаdocx
    Имя файлаEkzamen_TP_5sem-1.docx
    ТипДокументы
    #369250
    страница11 из 16
    1   ...   8   9   10   11   12   13   14   15   16

    Информационная среда и информационное общество и современная переводческая деятельность.


    «информационное общество» - новая фаза развития общества, в которой главными
    продуктами производства являются информация и знания.
    Отличительные черты информационного общества:
    . увеличение роли информации и знаний в жизни общества;
    возрастание доли информационных коммуникаций, продуктов и услуг;
    . создание глобального информационного пространства.
    . насыщенность информационной среды;
    . проблема отбора информации;
    . проблема эффективного использования информации в соответствий со
    способностями и целями конкретного человека (желательно человека разумного);
    « ужесточают требования интернет-технологии.

    По сравнению с индустриальным обществом, где все направлено на производство и потребление товаров, в информационном обществе производятся и потребляются интеллект, знания, что приводит к увеличению доли умственного труда- От человека потребуется способность к творчеству, возрастет спрос на знания. Материальной и технологической базой информационного общества станут различного рода системы на
    базе компьютерной техники и компьютерных сетей, информационной технологии телекоммуникационной связи.
    1. Состав САТ. Характеристика ресурсов. Системы управления терминологией. Объективность использования.


    Системы CAT включают в себя:

    • Проверку качества перевода (правописание, грамматика, терминология, маркапы);

    • Возможность введения словарей, терминологических баз, референсов

    • Программное обеспечение для управления проектами, которое позволяет лингвистам структурировать сложные переводческие проекты, передавать выполнение различных задач разным сотрудникам и наблюдать за процессом выполнения этих задач;

    • Программы управления памятью переводов (TMM), состоящие из базы данных сегментов текста на исходном языке и их переводов на один или более целевых языков, например Transit NXT;

    • Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определённые изменения в сомнительных случаях. Иногда такие программы называют машинным переводом с участием человека.


    Ресурсы:

    • Глоссарии - содержат термины и понятия, принятые в той или иной компании (либо утвержденные для определенной группы проектов);

    • Электронные словари позволяют быстро найти нужное слово, часто с учётом морфологии и возможностью поиска словосочетаний (Если необходимо разработать специализированный глоссарий, рассчитанный на конкретный проект, в этом случае готовые электронные словари не помощники – синонимия, полисемия).

    Для обеспечения точности и согласованности терминологии в системах CAT предлагаются разные решения, обычно представляющие собой единые централизованные хранилища терминов (своего рода универсальные электронные словари, поиск по которым может осуществляться непосредственно из основного редактора системы) и средства управления терминологией. Средства управления терминологией позволяют создать собственный терминологический ресурс или базу терминов, указать категории входящих в него данных и вид, в котором они представляются пользователю.

    Объективность использования:

    • можно переводить больше и быстрее;

    • эти инструменты позволяют обеспечить эффективность и единообразие, от этого зависит качество перевода;

    • появляется возможность снизить стоимость проектов, выполнять крупные многоязычные проекты;

    • важная информация здесь защищена: имеется в виду надежность, безопасность и контроль;

    достаточно удобны и легки в использовании.
    1. Объективная необходимость использования САТ-инструментария. Преимущества использования. Принципиальное отличие САТ и МП.


    Современный ритм жизни требует быстрых и качественных решений (информационное общество). При большом объеме хранимых документов поиск конкретной фразы вручную практически неосуществим. Невозможен быстрый перевод больших по объему текстов, унификация терминологии, например, в технических текстах. Нужны системы, которые помогут переводчику за небольшой отрезок времени качественно выполнить большие по объему переводы.

    Объективная необходимость:

    • можно переводить больше и быстрее;

    • обеспечивают эффективность и единообразие, следовательно, обеспечивают качество перевода;

    • снижают стоимость проектов; (pre-translation, словари заказчика)

    • позволяют осуществлять крупные многоязычные проекты; (позволяет нескольким переводчикам одновременно работать над общим проектом, осуществляя перевод, согласованный по терминологии и стилистике).

    • отличаются надежностью, безопасностью и контролем: важная информация защищена;

    • удобны в использовании: легкость выполнения работы.

    Особенно эффективно применение подобных систем в сферах перевода с высокой частотностью повторений текстов (в финансовой, технической или юридической деятельности).

    Одно из главных преимуществ CAT-tools – Translation Memory - лингвистическая база данных, в которой переводы сохраняются в рамках определенной структуры по мере их создания пользователем-переводчиком (очень экономит время); ещё одно преимущество – возможность подключения терминологических словарей, референсов (обеспечивают качество перевода терминологии), возможность проверки правописания, правильности перевода терминологии, соответствия маркапов (тэгов) в ПТ.

    1. МП предоставляют пользователю готовый перевод, системы CAT же являются инструментами, упрощающими процесс перевода.

    2. CAT предлагает варианты перевода отдельных сегментов, используя при этом подстановки из действующих баз памяти переводов и подключенных глоссариев с корпоративной терминологией. Переводчик может воспользоваться такими подстановками и принять их; отредактировать предложенные варианты перевода (если необходимо поменять грамматическую форму); перевести сегмент по-своему. МП же самостоятельно подбирает вариант перевода, ориентируясь на статистику.

    CAT-инструменты сохраняют форматирование документов. Например, переводчик работает над документом со сложной структурой, который содержит разноуровневые списки, стили, ссылки и другие элементы оформления.
    1. Машинный перевод. История МП. Главная проблема МП. Системы МП. Нейронный машинный перевод. Необходимость предварительной подготовки материалов и постредактирования при машинном переводе.

    Машинный перевод

    •Машинный перевод представляет собой процесс перевода текста с одного естественного языка на другой, выполняемый с помощью компьютерной программы.

    •Использование машинного перевода (МП) в процессе перевода человеком становится все более распространенным явлением. Постредактирование выходных данных МП теперь осуществляется в рамках регулярных переводческих услуг, где МП может использоваться как инструмент, а также как отдельная услуга с конкретными требованиями и собственным международным стандартом.

    История МП:

    •Лейбниц и Декарт независимо друга от друга выдвигают предположение о существовании некоего кода, соединяющего между собой слова разных языков.

    •1933 г. ─ французский инженер Жорж Арцруни получил первый патент на изобретение переводного устройства, название машины - «Механический мозг»

    •1937 ─ Арцруни представил рабочий образец своей машины

    •1933 г. ─ советский ученый Пётр Троянский обращается в Академию наук СССР с изобретённой им «машиной для подбора и печатания слов при переводе с одного языка на другой или на несколько других одновременно».

    •1938 г. ─ немецкий инженер Конрад Цузе изобрел ЭВМ

    •4 марта 1947 г. ─ Уоррен Уивер, Эндрю Бут и Норберт Винер в переписке формулируют концепцию машинного перевода.

    •Мысль использовать ЭВМ для перевода была высказана в 1947 году в США, сразу после начала распространения первых ЭВМ.

    •4 декабря 1948 года в СССР была подана заявка на изобретение цифровой электронно-вычислительной машины

    •1949 г. ─ Меморандум Фонду Рокфеллера:

    "I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text." Warren Weaver

    • 1951 г. ─ в СССР был построен первый в мире в основном полупроводниковый компьютер. На Западе в то время существовали лишь ламповые, которые были более проблемными.

    •1952 г. ─ первая конференция по МП в Массачусетском технологическом университете (Йошуа Бар-Хиллел, главный штатный исследователь проблем машинного перевода)

    •1955 г. ─ два первых компьютерных переводчика в СССР.

    •1956 г. ─ Объединение по машинному переводу, Москва (В. Ю. Розенцвейг)

    Главная проблема МП:

    Главной проблемой, с которой сталкиваются системы МП, является совокупная неоднозначность всех слов и всех грамматических правил. Например, машина может по-разному истолковать фразу «Я ел суши с тунцом».

    Типы систем МП:

    Системы машинного перевода делятся на три категории: системы на основе грамматических правил (Rule-Based Machine Translation, RBMT), статистические системы (Statistical Machine Translation, SMT) и наиболее перспективные гибридные системы, сочетающие преимущества тех и других.

    •Системы RBMT анализируют текст и строят его перевод на базе встроенных словарей и набора правил для данной языковой пары.

    •В системах SMT применяется принцип статистического анализа: в программу загружаются большие (в миллионы слов) объёмы текстов на исходном языке и их переводы, выполненные человеком.

    •Программа анализирует статистику межъязыковых соответствий, словоупотребления, синтаксических конструкций и т. д., и позже опирается на неё при выборе вариантов перевода — этот процесс называется самообучением. Систему может обучать и человек, корректируя выдаваемые переводы.

    Гибридные системы:

    •Это автоматическое обучение + «грамматика» на основе правил.

    •Это означает, что технологии объединены в новом подходе к МП – «статистическом синтаксисе», автоматическое обучение + «грамматика» на основе правил.
    1. 1   ...   8   9   10   11   12   13   14   15   16


    написать администратору сайта