Системы автоматизированного перевода документов и машинный перевод

Автор работы: Пользователь скрыл имя, 01 Декабря 2015 в 09:39, реферат

Описание работы

За последние 10-15 лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись перевода научно-технической, официальной и деловой документации. Сегодня уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает о переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, при этом удовлетворять принятым в данной стране стандартам

Файлы: 1 файл

системы автоматизированного перевода документов и машинный перевод.doc

— 252.50 Кб (Скачать файл)

     В узких предметных  областях при большом количестве  исходных текстов и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тесты и текущая корреспонденция) переводится с использованием МП.

Память переводов

     Па́мять перево́дов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.

     Помимо ускорения  процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

     В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.

      Большинство систем  ПП как минимум поддерживают  создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Популярные программные системы ПП

В соответствии с недавними обзорами использования систем ПП к наиболее популярным системам относятся:

  • Deja Vu
  • OmegaT (бесплатная система, распространяемая по лицензии GNU)
  • SDLX
  • Trados (наиболее популярная программа, долгое время бывшая стандартом ПП)
  • Star Transit

Wordfast (реализована как набор макросов для MS Word)

 

 

Вклад систем автоматизированного перевода, получивших особое распространение в последние годы, переоценить трудно. Однако, наблюдается недостаток информации, в том числе на русском языке, с описаниями наиболее распространенных продуктов для автоматизированного перевода и их назначения. В данной статье предпринята попытка дать краткое описание программным продуктам автоматизированного перевода компании Trados.

SDL Trados TM

Модуль Trados Translator’s Workbench

Окно Trados Translator's Workbench

Модуль Translator's Workbench реализует основные функции Translation Memory (TM), сохраняя в Translation Memory выполненные переводы, пользователь системы TRADOS увеличивает эффективность последующих проектов.

Translator's Workbench (также Workbench) – это система баз данных, обеспечивающая хранение единиц  перевода. Каждая единица перевода (translation unit, TU) состоит из исходного  сегмента и его перевода.

Модуль WinAlign

Модуль WinAlign предназначен для пополнения Translation Memory путем обработки уже выполненных переводов (тех переводов, которые были выполнены до появления в распоряжении пользователя программы TRADOS).

WinAlign позволяет создавать  базы переводов, связывая сегменты  текста и готового перевода. Для  этого WinAlign сначала анализирует  тексты на исходном и целевом  языках, после чего связывает  отдельные исходные и целевые сегменты, создавая тем самым единицы перевода (translation units). Пользователь просматривает результаты этой синхронизации и затем сохраняет результат в виде текстового файла с последующим импортом в Translator’s Workbench.

Модуль TagEditor

Модуль TagEditor позволяет переводить HTML/SGML/XML, тегированные файлы и осуществлять предварительную обработку текста. Возможна работа с Excel и Power Point. В TagEditor осуществляется перевод документов в форматах HTML, SGML, XML, ASP, JSP. в TagEditor включен XML Validator, который гарантирует более точное форматирование при работе с XML файлами.

TRADOS Freelance

Версия Trados Freelance предназначена для внештатных переводчиков.

Существуют ограничения возможностей по сравнению с Classic TRADOS TM Solution и с TRADOS Language Service Provider - TRADOS Freelance не поддерживает коллективную работу с единой памятью ТМ.

TRADOS Freelance включает  следующие модули:

  • Translator’s Workbench: с ограничениями по поддерживаемым языкам. Пользователь может работать только с 5 языками, которые выбираются из общего списка на этапе установки. Нет возможности выделения ТМ по проекту.
  • TagEditor: без ограничений.
  • T-Window Collection: без ограничений.
  • WinAlign: ограничения: 5 языков и до 10 пар файлов в проекте.
  • MultiTerm Workstation: без ограничений.

SDL Trados Multiterm

MultiTerm представляет собой современную систему управления терминологией Trados. Основным интерфейсом управления терминологией является MultiTerm. Посредством этого интерфейса пользователи могут создавать терминологические базы данных, добавлять и редактировать термины, просматривать терминологическую базу данных, выполнять поиск, фильтрацию и экспорт данных. MultiTerm может использоваться как автономная система с локальной терминологической базой данных. Кроме того, MultiTerm может использоваться как клиентское приложение в многопользовательской среде, соединенное с удаленными или сетевыми терминологическими базами данных, для которых имеются соответствующие права доступа.

Компонент Multiterm Extract

MultiTerm Extract извлекает и выводит список потенциальных терминов и их вероятные переводы. Это позволяет извлекать термины из одноязычных или двуязычных документов, а так же из памяти переводов. В интерфейсе MultiTerm Extract возможно быстро и легко проверить извлеченные термины. Можно использовать значительное количество параметров экспорта, чтобы включить извлеченные термины в имеющиеся терминологические базы TRADOS MultiTerm или экспортировать в MultiTerm XML, или в формат с разделителями табуляцией. Также можно проверять согласованность терминологии между терминологической базой и переведённым файлом.

TRADOS MultiTerm Server

Данное серверное решение позволяет значительно упростить управление терминологией.

Trados MultiTerm Server предоставляет возможность доступа и распространения терминологии через Internet или Intranet.

MultiTerm Workstation – инструментарий  для работы с терминологией  на локальном месте.

Пользователь может добавлять терминологию в базу «на лету», не прерывая своего перевода в Word.

SDL Trados TM Server

TM Server позволяет  разместить базу Translation Memory на сервере  и обеспечить доступ к этому  серверу через Internet/Intranet. Решение  основано на масштабируемой клиент-серверной  архитектуре, которая поддерживает SQL Microsoft сервер и базы данных Oracle на Windows- и Unix-платформах. TRADOS TM Server . это система, которая отвечает самым жестким требованиям современного процесса перевода. С помощью TM Server обеспечивается высокоэффективное использование базы ТМ практически неограниченных размеров. ТМ Server обрабатывает задачи с десятками тысяч или миллионами модулей TU одинаково быстро вне зависимости от того, 2, 20 или 200 пользователей обращаются к базе данных одновременно.

Модуль TRADOS TM Server Manager

ТМ Server включает специальную компоненту TRADOS TM Server Manager для администрирования доступа клиентов к ресурсам ТМ. Механизм контроля лицензий обеспечивает контроль количества одновременно используемых в сети версий продукта.

SDL Trados TM Anywhere Server

Trados TM Anywhere является компонентом SDL Trados TM Server 7.1, позволяющим пользователям совместно использовать базы переводов (TM) SDL Trados посредством доступа через Интернет.

 

 


Информация о работе Системы автоматизированного перевода документов и машинный перевод