Главная страница
Навигация по странице:

  • 1.4.2. Машинный перевод: элементы периодизации стратегий.

  • 1.4.3. Машинный перевод: элементы типологии систем.

  • Системы собственно машинного перевода

  • Системы человеко-машинного перевода

  • 1.4.4. Основные области использования машинного перевода.

  • 1.4.5. Некоторые известные системы машинного перевода.

  • Система GAT

  • Переводческий комплекс АНРАП

  • Система CULT

  • Системы семейства ALPS .

  • 1.4.6. Перспективы развития систем машинного перевода

  • Дополнительная литература

  • книга. Литература по лингвистике и литературоведению


    Скачать 2.85 Mb.
    НазваниеЛитература по лингвистике и литературоведению
    Анкоркнига
    Дата16.12.2019
    Размер2.85 Mb.
    Формат файлаdoc
    Имя файлаBaranov_A_N_Vvedenie_v_prikladnuyu_lingvistiku_2001.doc
    ТипЛитература
    #100632
    страница25 из 39
    1   ...   21   22   23   24   25   26   27   28   ...   39

    1.4. Машинный перевод


    1.4.1. Машинный перевод: элементы хронологии. Начало работ по ма­шинному переводу (МП) или автоматическому переводу (АП) относят к 50-м гг. XX в. Идея машинного перевода обязана своим происхождени­ем чисто практическим нуждам. В начале 50-х гг. происходит информа­ционный взрыв — существенно возрастают объемы научно-технической информации. Перевод всей научной и технологической периодики оказы­вается невозможным. Дополнительный импульс исследованиям в области МП дала «холодная война»: противостоящие общественно-политические системы внимательно следили за развитием научно-технического потен­циала друг друга. Именно по этой причине многие первые зарубежные системы МП работают с русским языком (см. ниже).

    Формальная дата начала эры машинного перевода — 1949 г. В этом году известный американский специалист по дешифровке Уоррен Уивер составил меморандум, в котором теоретически обосновал принципиаль­ную возможность создания систем МП. Он исходил из того, что структур­ное сходство между языками может быть формально описано, а это явля­ется необходимым условием разработки алгоритмов для ЭВМ. Меморан­дум был разослан двумстам специалистам в области лингвистики, деши­фровки и теории программирования. С этого времени в США появляются коллективы разработчиков МП (в Массачусетском технологическом ин­ституте — MIT, в Калифорнийском университете, в Национальном бюро стандартов в Лос-Анджелесе, в Техасском университете). Первая между­народная конференция по МП организуется в 1952 г. в MIT. Наконец, в 1954 г. проводится известный Джорджтаунский эксперимент, в про­цессе которого осуществляется перевод с русского языка на английский. Хотя программа работала со словарем всего лишь в 250 слов, успех этого эксперимента стимулировал дальнейшие исследования в области МП.

    В СССР первый эксперимент по МП прошел в 1955 г.: был осу­ществлен перевод на русский язык текстов по прикладной математике. К этому времени относится начало работ по МП в Институте прикладной математики АН СССР под руководством О. С. Кулагиной и И. А. Мель­чука. Коллектив разработчиков создал три экспериментальные систе­мы МП — с французского языка на русский (ФР-1), с английского на русский и с французского на русский (в новом варианте) [Кулагина 1979]. В 1959 г. открывается Лаборатория машинного перевода в МГПИ-ИЯ им. М. Тореза (ныне Московский государственный лингвистический университет), в которой возникли идеи, во многом предвосхитившие дальнейшее развитие теории МП и в какой-то степени систем искус­ственного интеллекта — концепция языка-посредника, понятие модели управления слова, роль словаря в МП и т. д. Серия публикаций этой лаборатории под общим названием «МП и ПЛ» (Машинный перевод и прикладная лингвистика), оказала существенное влияние не только на прикладную, но и на теоретическую лингвистику. Многие из этих идей нашли отражение в проекте системы англо-русского автоматичес­кого перевода (АРАП), которая, однако, не была завершена.

    Изначально предполагалось, что системы МП не должны быть огра­ничены проблемной сферой. Иными словами, машинный перевод должен осуществляться на текстах любых типов — от научно-технических до худо­жественных. Однако довольно быстро обнаружилось, что это невозможно. Выявились две группы причин — лингвистические и экстралингвистичес­кие. Лингвистические — сводились к тому, что для разработки систем МП недостаточно имеющихся знаний о функционировании языковой систе­мы. Нужны фундаментальные теоретические разработки в области изуче­ния языка, поскольку традиционной лингвистике (за очень небольшими исключениями) была чужда сама постановка задачи машинного перевода, предполагавшая создание компьютерных моделей анализа и синтеза вы­сказываний. Кроме того, многообразие функций языка, преимуществен­но имплицитный характер языковой способности человека существенно затрудняли формализацию знаний о языковой системе. К экстралингви­стическим причинам можно отнести осознание того факта, что процесс понимания — важнейшая составляющая естественного перевода — далеко не обеспечивается чисто лингвистическим анализом речевого сообщения. Понимание основывается на знаниях адресата, его способности делать выводы и умозаключения, кроме того оно связано с коммуникативной установкой адресата в данной ситуации общения и т. д.

    Возникшее разочарование было даже формально зафиксировано в 1966 г. в докладе консультативного комитета по автоматической обработ­ке естественных языков (ALPAC) при Национальной академии наук США. Основной упор в докладе делался на том, что ни одна из систем МП не оправдала возлагавшихся на нее надежд ни в аспекте качества пе­ревода, ни в аспекте экономичности. По приводившимся там данным, «естественный» перевод оказывался существенно дешевле машинного. Доклад привел к свертыванию государственного финансирования про­ектов создания систем МП в США, что прямо повлияло на позицию государственных структур по отношению к поддержке разработок в обла­сти машинного перевода во все мире. Однако несмотря на скепсис относительно перспектив МП, многие из первых систем МП, создан­ных в 60-е гг., продолжали эксплуатироваться заказчиками. Большинство конечных пользователей мало интересовало качество перевода (низкое качество — один из важнейших пунктов обвинения в докладе комитета ALPAC). Для потребителей было важнее быстро в общих чертах оценить информационный поток в научной и технической периодике, а затем материал, который вызвал интерес, переводился обычным способом — с участием переводчика. Кроме того, не прекратилось финансирование исследований в сфере МП частными компаниями, заинтересованными не только в отслеживании мировых тенденций научно-технического про­гресса, но и в переводе огромных объемов технической документации, требующемся при экспорте и импорте различной продукции, в том числе и высокотехнологичной.

    С середины семидесятых годов во всем мире наблюдается устойчивое возрастание интереса к МП. В Москве в 1974 г. в институте ИНФОРМ-ЭЛЕКТРО начались работы по созданию системы франко-русского пере­вода (ЭТАП-1) и системы англо-русского перевода (ЭТАП-2). В этом же году создается Всесоюзный центр переводов (ВЦП), в котором ряд науч­ных коллективов работает над системами машинного перевода — АМПАР (англо-русский перевод), НЕРПА (немецко-русский перевод) и ФРАП (французско-русский перевод). С этого времени промышленные системы машинного перевода разрабатываются и широко используются в США, Европе и Японии.

    1.4.2. Машинный перевод: элементы периодизации стратегий. Первые си­стемы МП характеризуются стратегией «прямого перевода». Сущность этого подхода к построению МП заключается в том, что исходный текст на языке L1 (= «входной язык») постепенно через ряд этапов преобразует­ся в текст языка L2 (= «выходной язык»). Преобразования сводятся к тому, что слово (словосочетание) на входном языке заменяется на его словар­ный эквивалент на выходном языке. Понятно, что в системах первого поколения, использующих стратегию прямого перевода, нет необходи­мости моделировать функционирование языковой системы в целом. Для работы таких систем оказывается вполне достаточно правил словарных соответствий. В редких случаях проводится анализ контекста для пере­вода неоднословных выражений, опять-таки представленных в словаре системы. Важно иметь в виду, что стратегия прямого перевода не дела­ет различий между пониманием (анализом) и синтезом (порождением), поскольку они фактически исключены из преобразований по правилам словарных соответствий. Прямой перевод всегда привязан к конкретной паре языков. Например, неоднозначность выражений входного языка разрешается только в той степени, в которой это оказывается необхо­димым для выходного языка. Стратегия прямого перевода в принципе неприменима для проектирования систем МП на более, чем один язык. По временным рамкам системы первого поколения в основном созда­вались в период с конца 40-х до середины 60-х гг. Один из типичных примеров системы такого типа — разбираемая ниже программа GAT.

    Существенная модификация стратегии «прямого перевода» обнару­живается в системах с «трансфером» — этапом межъязыковых операций, не сводимых только к замене лексем входного языка на словарные со­ответствия выходного языка. Наличие этапа трансфера предполагает по­строение «промежуточного» или «внутреннего» представления, которое далее «приспосабливается» к структуре предложения выходного языка. В отличие от первой стратегии, в архитектуре систем МП с трансфе­ром анализ (понимание) и синтез существуют как особые процедуры и обслуживаются различными алгоритмами. В некотором смысле систе­мы с трансфером оказываются промежуточным звеном между стратегией прямого перевода и последующей стратегией языка-посредника (см. ниже систему TAUM).

    Критика стратегии прямого перевода привела к созданию «стра­тегии перевода через язык-посредник» или «стратегии языка-посредника». Главная особенность этой стратегии заключаются в том, что между струк­турами входного языка и структурами выходного языка находится один или несколько промежуточных языков, на которые по соответствующим правилам последовательно «переписываются» выражения языка L1 l3). Анализ и синтез при использовании языка-посредника принципиально разделяются. Анализ ведется в категориях входного языка, а синтез — в категориях выходного. В качестве языка (языков)-посредников могут выступать языки представления синтаксической и семантико-синтакси-ческой структуры, чисто семантические языки, языки глубинной семан­тики, приближающиеся к концептуальному представлению в категориях теории знаний (фреймов, сценариев, планов). Системы машинного пе­ревода, основанные на знаниях (knowledge-based systems), возникшие в 80-х гг., рассматриваются как часть систем искусственного интеллекта. Достаточно условно эта стратегия соответствует второму поколению систем МП с тем уточнением, что системы второго поколения исполь­зуют почти исключительно синтаксические и семантико-синтаксические языки-посредники (см. ниже систему СЕТА).

    Последовательное проведение идеи языка-посредника привело к воз­никновению стратегии «универсального семантического языка», независи­мого от конкретного входного и выходного языка. Преимущества такой стратегии очевидны. Однако современное состояние семантической те­ории не оставляет надежд на успешную реализацию этой стратегии в ближайшем будущем. Таким образом, системы МП третьего поколения остаются в настоящее время весьма отдаленной перспективой.

    Как компенсация проблем, возникших со стратегией универсально­го семантического языка, развивается несколько промежуточных стра­тегий, позволяющих существенно улучшить параметры промышленных систем МП. Стратегия «сужения проблемной области» предлагает разра­ботчикам МП ориентироваться на узкие тематические сферы текстов. Это позволяет существенно облегчить словарь системы МП и ограничиться только теми особенностями устройства языковой системы, которые ре­ально представлены в данном подъязыке. Эта стратегия универсальна

    13)Уместно вспомнить известный тезис Романа Якобсона о том, что «Наука о языке не может интерпретировать ни одного лингвистического явления без перевода его знаков в другие знаки той же системы или в знаки другой системы» [Якобсон 1985 в, с. 363].

    для многих сфер прикладной лингвистики — от лексикографии до лин­гвистического обеспечения информационно-поисковых систем и систем искусственного интеллекта. Стратегия «ограниченного машинного пере­вода» позволяет включать в технологическую цепочку автоматического перевода человека — на этапе предредактирования, постредактирования или в режиме обработки текста (например, для разрешения синонимии и омонимии).

    1.4.3. Машинный перевод: элементы типологии систем. Компьютерные средства перевода обычно разделяют на три больших группы: систе­мы машинного перевода, системы человеко-машинного перевода (ЧМП) и терминологические базы/банки данных (ТБД). Системы собственно машинного перевода не исключают (даже, как правило, предполагают) участие человека на этапе предредактирования и постредактирования. В данном случае существенно, что после ввода текста в систему пере­вод осуществляется без вмешательства человека. Используются только алгоритмы и словари, введенные в ЭВМ.

    Системы человеко-машинного перевода, в свою очередь, разделяются на две подгруппы: системы машинного перевода с участием человека и си­стемы человеческого перевода с участием машины. В первом случае ком­пьютерная программа сама осуществляет перевод, однако на определен­ных этапах она может обратиться к человеку, предложив ему, например, выбрать наиболее подходящее слово для перевода, дать синоним для неиз­вестного выражения или определить структуру сложной синтаксической конструкции. Наконец, человеческий перевод с участием машины все­гда осуществляется в режиме реального времени, причем основную часть работы по переводу берет на себя человек. Переводчик обращается к ком­пьютеру для автоматической обработки отдельных фрагментов текста, для вызова информации из терминологических банков данных (часто уда­ленных), для автоматического форматирования результирующего текста, проверки орфографии и пунктуации и т. д. Компьютерные системы такого рода иногда называют автоматизированным рабочим местом переводчика.

    Терминологические банки данных удобны тем, что они легко мо­дифицируются и позволяют фиксировать самую последнюю словарную информацию по выбранной проблемной области. Часто они исполь­зуются для создания обычных двуязычных и многоязычных словарей, а также для разработки автоматизированных словарей систем МП. ТБД составляют важную часть рабочего места переводчика.

    1.4.4. Основные области использования машинного перевода. Первоначаль­ные иллюзии об универсальности применения МП быстро рассеялись. Собственно, и спрос на машинный перевод художественных текстов практически отсутствовал. Между тем область текстов научно-техниче­ской информации настолько велика, что человеческий перевод просто не в состоянии ее охватить. В службах научно-технической информации различных ведомств и организаций использование систем МП показало высокую эффективность. Требования к качеству перевода оказались до­вольно низкими, что позволило использовать в этой сфере системы МП первого поколения. Вторая сфера применения МП — крупные меж­дународные организации, использующие документы на многих языках. К числу таких организаций относится, например, ООН и официальные структуры Европейского Союза, в которых документы должны появляться практически одновременно на всех языках членов ЕС. Однако требования к качеству перевода здесь довольно высоки и этап постредактирования необходим даже для систем МП с хорошими характеристиками.

    Третья большая область использования МП — техническая докумен­тация. Экспорт продукции — особенно высокотехнологичной — требует перевода больших массивов технических описаний и инструкций. Так, эксплуатационная документация к самолетам достигает 100 и более тыс. страниц. Компании, связанные с экспортом, готовы даже нормиро­вать внутренний язык, используемый для технической документации, чтобы облегчить автоматический перевод этих документов на выход­ной язык. Например, в Европейской ассоциации авиапроизводителей (European Association of Aerospace Manufactures) под руководством Ван Дейка был разработан специальный стандарт АЕСМА «упрощенного ан­глийского языка», налагающий серьезные ограничения на используемую в документации лексику и синтаксические конструкции. Этот стандарт используется, в частности, в корпорации «Боинг» (см. по этому поводу [Wojcik 1997]).

    В целом можно сделать вывод, что в настоящее время системы МП успешно функционируют в тех областях, где либо не требуется абсолютная точность перевода, либо существуют существенные огра­ничения на использование структур естественного языка, где входной язык нормирован и упрощен. К числу проблемных областей последнего типа относится, например, подъязык метеосводок. В Канаде с 1975 г. в промышленном режиме функционирует система МП TAUM-METEO, переводящая тексты метеосводок с английского языка на французский.

    1.4.5. Некоторые известные системы машинного перевода. Количество ре­ально работающих и проектируемых систем МП к настоящему времени перевалило за сотню; в некоторых обзорах содержатся описания более, чем семидесяти систем МП [Леонтьева, Шаляпина 1990]. Остановимся на тех программах перевода, которые интересны с точки зрения введенных противопоставлений, характеризующих стратегии МП и типы систем МП.

    Система GATI4). Одна из первых систем МП, разрабатывавшаяся с 1952 г. в Джорджтаунском университете США. Проблемная область — перевод русскоязычных текстов по физике на английский язык. Страте­гия создания — прямой перевод, сопровождавшийся некоторыми син­таксическими перестановками, приближавшими русский порядок слов

    14)Сокращение от Georgetown Automatic Translation.

    к порядку слов английской фразы. В процессе разработки система после­довательно настраивалась на определенный текст, затем на следующий текст и т. д. В результате получилась структурно непрозрачная программа, которая практически не поддавалась модификации. Работы над системой были закончены в 1964 г., после чего она была передана для эксплуатации в Комиссию по атомной энергии и в Евроатом. При том, что програм­ма не имела под собой никакой серьезной лингвистической базы, она эксплуатировалась в Евроатоме до 1976 г.

    Системы СЕТА15) и GETA16). Система русско-французского машин­ного перевода, разрабатывавшаяся во Франции в Гренобльском универ­ситете с 1961 по 1971 гг. Стратегия построения — использование языка-посредника, независимого от структуры входного и выходного языков. Опыт разработки оказался не вполне удачным, поскольку сконструиро­ванный язык-посредник приводил к потере релевантной информации. Тем не менее с помощью СМП СЕТА были переведены русские тексты по математике и физике общим объемом 400 тыс. слов. В дальнейшем проект трансформировался в новый проект разработки СМП GETA, в которой реализовывалась стратегия построения СМП с трансфером. Грамматический модуль системы GETA состоит из трех типов программ: преобразование линейных цепочек в деревья (например, при морфоло­гическом анализе); преобразование одних деревьев в другие (например, при синтаксическом анализе и в ходе межъязыковых операций); преобра­зование деревьев в линейные цепочки (например, при морфологическом синтезе). Системы СЕТА и GETA являются научно-экспериментальны­ми, хотя в настоящее время предпринимаются усилия по разработке промышленной версии СМП GETA.

    Система TAUM17). Система TAUM, предназначенная для перевода ан­глийских текстов на французский язык, разрабатывалась в Монреальском университете с 1965 г. СМП TAUM строилась как система с трансфером. Изначально проект не имел направленности на конкретную проблемную область. Позднее система была переориентирована на перевод прогнозов погоды — TAUM—METEO — и на перевод текстов руководств и ин­струкций по эксплуатации авиационной техники — TAUM-AVLATION. Второе направление развития системы оказалось не вполне удачным из-за неэкономичности разработанного прототипа. Между тем СМП TAUM—METEO к настоящему времени является единственной в мире полностью автоматической системой машинного перевода. Успешность работы этой системы связана в значительной степени с жесткой струк­турой входного языка. В подъязыке метеосводок используется сильно редуцированный английский язык. Кроме того, имеются и значительные ограничения на макроструктуру текста.

    15) Centre d'etudes pour la Traduction Automatique.

    l6) Groupe d'dtudes pour la Traduction Automatique.

    17)Traduction Automatique de l'Universite de Montreal.

    Системы семейства ЭТАП18). Работа над системами началась в 1974 г. в ИНФОРМЭЛЕКТРО и была продолжена в Институте проблем передачи информации РАН; в 1980 г. была сдана первая очередь ЭТАП-1 (фран­цузско-русский перевод), а в 1985 — ЭТАП-2 (англо-русский перевод). СМП ЭТАП-2 предназначена для перевода связных текстов и заголовков патентов. Система ЭТАП-2 работала в режиме качественного перево­да на основе полного синтаксического анализа и в режиме пословного перевода, в процессе которого привлекался только морфологический анализ. Второй вариант перевода использовался в тех случаях, когда возникали проблемы с синтаксическим анализом фразы19). По архитек­туре системы семейства ЭТАП относятся к системам МП с трансфером: анализ — преобразование (трансфер) — синтез. Однако в идеологии их построения имеются важные концептуальные особенности: в качестве теоретической основы положены постулаты модели «СМЫСЛ—ТЕКСТ», предполагающей независимое лингвистическое описание входного и вы­ходного языков, интегральный язык представления морфологии, синтак­сиса и словаря, независимость лингвистического описания от алгоритмов программы, отказ от привязки синтаксиса и морфологии к конкретной проблемной сфере (разумеется, словаря это касается в меньшей степени). В СМП ЭТАП-1 перевод происходит через поверхностно-синтаксиче­скую структуру, а в СМП ЭТАП-2 перевод осуществляется на уровне нормализованных синтаксических структур, которые занимают проме­жуточное положение между поверхностно-синтаксической и глубинно-синтаксической структурами.

    Система ФРАП. Начало работ над системой ФРАП — французско-русский автоматический перевод — относится к 1975 г. В этом году во Всесоюзном центре переводов начала работать группа исследователей под руководством Н. Н. Леонтьевой. В техническом задании к системе указывалось, что СМП должна обеспечивать перевод небольшого ко­личества документов, не имеющих жестких тематических ограничений. Такая постановка задачи существенно осложнила разработку системы, поскольку большинство имеющихся реально работающих СМП привя­заны к конкретной проблемной области. Было реализовано две экспе­риментальные версии системы (первая версия — в 1980 г., вторая — в 1985 г.). Архитектура СМП ФРАП основывалась на стратегии перево­да через язык-посредник семантического типа. Синтаксический анализ в системе не обязательно должен всегда давать правильные синтакси­ческие структуры, однако на этапе работы семантического блока даже неправильные и неполные синтаксические структуры получают семанти­ческую интерпретацию, которая далее преобразуется в текст на выходном языке. Иными словами, выбранная стратегия оказывается «помехоустой­чивой». Синтаксический компонент системы не зависим от конкретной

    18) Электротехнический Автоматический Перевод.

    19) Полное описание системы ЭТАП-2 см. в [Апресян 1988].

    проблемной области; роль связующего мостика между разными тематиче­скими областями выполняет семантический компонент. В существующем варианте системы реализована лишь часть модели, выполняющая сле­дующие функции: построение подстрочника, грамматический режим, неполный семантический режим.

    Теоретическая особенность СМП ФРАП заключается в том, что в процессе работы системы текст входного языка интерпретируется не только на семантическом, но и на информационном уровне — в тер­минах категорий тезауруса той проблемной области, которая в данный момент обслуживается системой. Информационный уровень представле­ния должен обеспечивать в перспективе и построение реферата по тексту перевода.

    Переводческий комплекс АНРАП. Структурно комплекс состоит из двух больших систем — АМПАР (англо-русский перевод) и НЕРПА (не­мецко-русский перевод), разрабатывавшихся с конца 50-х гг. разными научными коллективами. Объединение этих систем связано с общим программным обеспечением, общим русским словарем и общим блоком русского морфологического синтеза. Переводческий комплекс предна­значен для использования в крупных информационных службах и пе­реводческих организациях для перевода текстов различных тематических областей. Для обеспечения тематической привязки предусматривается возможность подключения дополнительных терминологических слова­рей, описывающих конкретные тематические сферы. Система АМПАР занимает центральное положение в комплексе АНРАП. Теоретические основания СМП АМПАР были заложены в исследованиях И. К. Вель­ской. Руководили проектной группой АМПАРа сначала Ю. А. Моторин и позже Ю. Н. Марчук20). В промышленную эксплуатацию система при­нята в 1981 г. На 1987 г. система была установлена в ВЦП и пяти отрасле­вых организациях. СМП НЕРПА сдана в промышленную эксплуатацию в 1985 г. Технологически в системах АМПАР и НЕРПА реализована прямая стратегия перевода, опирающаяся на значительные по объему словари. В СМП АМПАР программа взаимодействует с шестью различ­ными словарями: 1) английский морфологический словарь; 2) словарь фразеологических выражений; 3) переводной словарь однозначных слов; 4) переводной словарь многозначных слов, представленных в виде про­цедурных правил выбора значения; 5) словарь перевода многозначных слов по умолчанию; 6) словарь русских слов с морфологической, слово­образовательной и синтаксической информацией. Обращение к каждому словарю образует отдельный цикл. Скорость перевода довольно высока (3-5 авторских листов в час), что является необходимым условием функ­ционирования промышленных систем МП, однако качество перевода невысоко. Постредактирование переводов оказывается необходимым.

    20)Подробнее описание системы АМПАР см. в [Марчук 1983].

    Система CULT21). Программа CULT представляет собой типичный пример системы человеко-машинного перевода. Разработка системы, предназначенной для перевода китайских математических и физических текстов на английский язык, началась в Китайском университете Гонкон­га в 1968 г. Работа программы CULP требует активного участия человека не только на этапе предредактирования, но и в процессе самого перевода. Так, пользователь в ряде случаев должен выявить границы составляющих, определить, в каком значении используется то или иное слово. Проблема ввода в ЭВМ китайской графики (иероглифов) была решена с помощью кодирования. По имеющимся данным можно судить, что активное уча­стие человека в процессе работы программы практически исключает этап постредактирования, что может служить показателем весьма успешной работы системы человеко-машинного перевода.

    Системы семейства ALPS. Программы, разрабатываемые фирмой ALPS, можно рассматривать как типичный пример компьютерного ин­струментария, образующего рабочее место переводчика. Анализ работы переводчика показывает, что до семидесяти процентов времени, за­трачиваемого на перевод, тратится на поиск слова в словаре, выбор и подстановку нужного значения в переводимый текст, а также на фор­матирование результирующего текста. Системы фирмы ALPS позволяют проводить экранное редактирование текста в многооконном текстовом редакторе, осуществлять оперативный поиск слова в словарных базах дан­ных, переносить информацию из баз данных в текстовый файл, а также делать пословный перевод текста, опирающийся на введенные в систему словарные источники. Предусмотрена возможность пофразового перево­да, которая, впрочем, пока не реализована в полном объеме. В настоящее время системы поддержки перевода, распространяемые на рынке фирмой ALPS, обеспечивают перевод на английский, немецкий, французский, португальский и испанский языки.

    1.4.6. Перспективы развития систем машинного перевода. С конца 70-х гг. наблюдается устойчивый рост интереса к системам МП. Именно в это время на рынке не как экзотика, а как технологическая реальность по­являются промышленные системы МП. При всех их недостатках они заполнили вполне определенную функциональную нишу в сфере перево­да, которую покинули обычные переводчики. Подавляющее большинство промышленных систем МП идейно устарели: они основываются на те­оретических представлениях 50—60-х гг. Это с одной стороны. С другой стороны, потенциал вспомогательного компьютерного инструментария Для облегчения переводческой деятельности — автоматические словари, специальные редакторы и т. п. — не реализован в полной мере. В этих Двух направлениях должно пойти развитие систем МП. Следует ожи­дать создания систем МП на основе интеллектуальных технологий (СМП

    21)Chinese University Language Translator

    как часть или вид системы ИИ). Кроме того, широкое распростране­ние должны получить программы, формирующие компьютерное рабочее место переводчика.
    Основная литература

    1. Апресян Ю.Д. и др. Лингвистическое обеспечение системы ЭТАП-2. М., 1988. Бакулов А. Д., Леонтьева Н. Н. Теоретические аспекты машинного пере­вода // Искусственный интеллект. Справочник. Кн.1. Системы общения и экспертные системы. М., 1990. С. 201-215.

    2. Бакулов А. Д., Леонтьева Н. Н., Шаляпина 3. М. Отечественные системы ма­шинного перевода//Искусственный интеллект. Справочник. Кн. 1. Системы общения и экспертные системы. М., 1990. С. 248-260. Бархударов Л. С. Язык и перевод. М., 1975.

    3. Беляева Л. Н., Откупщикова М. И. Автоматический (машинный) перевод // Прикладное языкознание. СПб., 1996. С. 360-388.

    4. Комиссаров В. Н. Теоретические основы методики обучения переводу. М., 1997.

    5. Леонтьева Н. Н., Шаляпина 3. М. Современное состояние машинного пере­вода // Искусственный интеллект. Справочник. Кн. 1. Системы общения и экспертные системы. М., 1990. С. 216-261.

    6. Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития // Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. М., 1989. С. 357-408. Щерба Л. В. Опыты лингвистического толкования стихотворений. II. «Сос­на» Лермонтова в сравнении с ее немецким прототипом // Щерба Л. В. Избранные труды по русскому языку. М., 1957. С. 97-109. Эткинд Е. Г. Поэзия и перевод. М.—Л., 1963.

    7. Якобсон Р. О лингвистических аспектах перевода // Якобсон Р. Избранные работы. М., 1985. С. 361-368.

    Дополнительная литература

    1. Виноградов В. С. Лексические вопросы перевода художественной прозы. М., 1978.

    2. Влахов С, Флорин С. Непереводимое в переводе. М, 1980. Дорошевский В. О задачах и проблемах перевода // Исследование по славян­ской филологии. М., 1974. С. 25-28. Комиссаров В. Н. Слово о переводе. М., 1973.

    3. Миньяр-Белоручев Р. К. Общая теория перевода и устный перевод. М., 1980. Найда Ю.А. К науке переводить. М., 1978.

    4. Райхштейн А. Д. Сопоставительный анализ немецкой и русской фразеологии. М., 1980.

    5. Ревзин И. И., Розенцвейг В. Ю. Основы общего и машинного перевода. М., 1964.

    6. Реформатский А. А. Перевод или транскрипция? // Восточно-славянская ономастика. М., 1972. С. 311-333.

    7. Рецкер Я. И. Теория перевода. М., 1974.

    8. Федоров А. В. Введение в теорию перевода. М., 1958.

    9. Федоров А. В. Основы общей теории перевода. М., 1968.

    10. Швейцер А. Д. Перевод и лингвистика. М., 1973.

    11. Albrecht J. Linguistik und Ubersetzung. Tubingen, 1973.

    12. CatfordJ. A Linguistic theory of translation: an essay in applied linguistics. Oxford,
      1965.

    13. Chesterman A. Memes of translation: the spread of ideas in translation theory.
      Amsterdam etc., 1997.

    14. Conference interpreting: current trends in research / Ed. by Y. Gambier, D. Gile
      and Ch. Taylor. Amsterdam etc., 1997.

    15. Diller H.-J., KomeliusJ. Linguistische Probleme der Ubersetzung. Tubingen, 1978.

    16. Fillmore Ch. J. Lexicography and ethnographic semantics // EURALEX'94. Plenary
      lecture. Amsterdam, 1994. P. 27-48.

    17. Koller W. Einfuhrung in die Ubersetzungswissenschaft. 4. Aufl. Heidelberg-
      Wiesbaden, 1992.

    18. Latyschew L. K. Ubersetzungstheorie in Wort und Beispiel. M., 1981.

    19. Ljudskanow A. Mensch und Maschine als Ubersetzer. Miinchen, 1972.

    20. Neubert A. Elemente der allgemeinen Theorie der Translation. Bucarest, 1970.

    21. Konigs F. Ubersetzung in Theorie und Praxis: Ansatzpunkte fur die Konzeption
      einer Didaktik der Ubersetzung. Bochum, 1979.

    22. Pontiero G. The translator's dialogue / Ed. by P. Orero and J. C. Sager. Amsterdam
      etc., 1997.

    23. Ruiicka R. Schwer- und Uniibersetzbares: Bemerkungen zur tschechischen und
      russischen Ubersetzung von Th. Manns «Dr. Faustus» // FS fiir Erwin Wedel
      Munchen, 1991. S. 355-361.

    24. Routledge encyclopedia of translation studies / Ed. by M. Baker. London, 1998.

    25. Schleiermacher F. Methoden des Ubersetzens. Darmstadt, 1973.

    26. Text typology and translation / Ed. by A. Trosborg. Amsterdam etc., 1997.

    27. Toury G. In search of a theory of translation. Tel Aviv, 1980.

    28. Ubersetzungswissenschaft. Eine Neuorientierung: zur Integrierang von Theorie und Praxis / Hrsg. von M. Snell-Hornby. Tubingen, 1986.

    Источники

    Сорокин В. В. Сборник рассказов. М., 1992.

    Ortega у Gasset J. Miseria у Esplendor de la Traduccion — Elend und Glanz der Ubersetzung. Deutsch von G. Kilpper. Stuttgart, 1956.

    Ortega у Gasset J. Miseria у Esplendor de la Traduccion — Elend und Glanz der Ubersetzung. Deutsch von K. ReiB. Munchen, 1977.

    Webster J. Daddy-Long-Legs. London, 1967.

    Webster J. Daddy-Long-Legs. Deutsch von Margret Boveri. Frankfurt am Main, 1979.

    Webster J. Judy Aboot. (= Daddy-Long-Legs). Deutsch von Margrit Boesch-Frutiger 1970.

    1   ...   21   22   23   24   25   26   27   28   ...   39


    написать администратору сайта