Системы автоматизированного перевода документов и машинный перевод
Реферат, 01 Декабря 2015, автор: пользователь скрыл имя
Описание работы
За последние 10-15 лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись перевода научно-технической, официальной и деловой документации. Сегодня уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает о переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, при этом удовлетворять принятым в данной стране стандартам
Файлы: 1 файл
системы автоматизированного перевода документов и машинный перевод.doc
— 252.50 Кб (Скачать файл) В узких предметных
областях при большом
Память переводов
Па́мять перево́дов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.
Помимо ускорения
процесса перевода
В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.
Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.
Популярные программные системы ПП
В соответствии с недавними обзорами использования систем ПП к наиболее популярным системам относятся:
- Deja Vu
- OmegaT (бесплатная система, распространяемая по лицензии GNU)
- SDLX
- Trados (наиболее популярная программа, долгое время бывшая стандартом ПП)
- Star Transit
Wordfast (реализована как набор макросов для MS Word)
Вклад систем автоматизированного перевода, получивших особое распространение в последние годы, переоценить трудно. Однако, наблюдается недостаток информации, в том числе на русском языке, с описаниями наиболее распространенных продуктов для автоматизированного перевода и их назначения. В данной статье предпринята попытка дать краткое описание программным продуктам автоматизированного перевода компании Trados.
SDL Trados TM
Модуль Trados Translator’s Workbench
Окно Trados Translator's Workbench
Модуль Translator's Workbench
Translator's Workbench (также
Workbench) – это система баз данных,
обеспечивающая хранение
Модуль WinAlign
Модуль WinAlign предназначен для пополнения Translation Memory путем обработки уже выполненных переводов (тех переводов, которые были выполнены до появления в распоряжении пользователя программы TRADOS).
WinAlign позволяет создавать базы переводов, связывая сегменты текста и готового перевода. Для этого WinAlign сначала анализирует тексты на исходном и целевом языках, после чего связывает отдельные исходные и целевые сегменты, создавая тем самым единицы перевода (translation units). Пользователь просматривает результаты этой синхронизации и затем сохраняет результат в виде текстового файла с последующим импортом в Translator’s Workbench.
Модуль TagEditor
Модуль TagEditor позволяет переводить HTML/SGML/XML, тегированные файлы и осуществлять предварительную обработку текста. Возможна работа с Excel и Power Point. В TagEditor осуществляется перевод документов в форматах HTML, SGML, XML, ASP, JSP. в TagEditor включен XML Validator, который гарантирует более точное форматирование при работе с XML файлами.
TRADOS Freelance
Версия Trados Freelance предна
Существуют ограничения возможностей по сравнению с Classic TRADOS TM Solution и с TRADOS Language Service Provider - TRADOS Freelance не поддерживает коллективную работу с единой памятью ТМ.
TRADOS Freelance включает следующие модули:
- Translator’s Workbench: с ограничениями по поддерживаемым языкам. Пользователь может работать только с 5 языками, которые выбираются из общего списка на этапе установки. Нет возможности выделения ТМ по проекту.
- TagEditor: без ограничений.
- T-Window Collection: без ограничений.
- WinAlign: ограничения: 5 языков и до 10 пар файлов в проекте.
- MultiTerm Workstation: без ограничений.
SDL Trados Multiterm
MultiTerm представляет собой современную систему управления терминологией Trados. Основным интерфейсом управления терминологией является MultiTerm. Посредством этого интерфейса пользователи могут создавать терминологические базы данных, добавлять и редактировать термины, просматривать терминологическую базу данных, выполнять поиск, фильтрацию и экспорт данных. MultiTerm может использоваться как автономная система с локальной терминологической базой данных. Кроме того, MultiTerm может использоваться как клиентское приложение в многопользовательской среде, соединенное с удаленными или сетевыми терминологическими базами данных, для которых имеются соответствующие права доступа.
Компонент Multiterm Extract
MultiTerm Extract извлекает и выводит список потенциальных терминов и их вероятные переводы. Это позволяет извлекать термины из одноязычных или двуязычных документов, а так же из памяти переводов. В интерфейсе MultiTerm Extract возможно быстро и легко проверить извлеченные термины. Можно использовать значительное количество параметров экспорта, чтобы включить извлеченные термины в имеющиеся терминологические базы TRADOS MultiTerm или экспортировать в MultiTerm XML, или в формат с разделителями табуляцией. Также можно проверять согласованность терминологии между терминологической базой и переведённым файлом.
TRADOS MultiTerm Server
Данное серверное решение позволяет значительно упростить управление терминологией.
Trados MultiTerm Server предоставляет возможность доступа и распространения терминологии через Internet или Intranet.
MultiTerm Workstation – инструментарий для работы с терминологией на локальном месте.
Пользователь может добавлять терминологию в базу «на лету», не прерывая своего перевода в Word.
SDL Trados TM Server
TM Server позволяет
разместить базу Translation Memory на сервере
и обеспечить доступ к этому
серверу через Internet/Intranet. Решение
основано на масштабируемой
Модуль TRADOS TM Server Manager
ТМ Server включает специальную компоненту TRADOS TM Server Manager для администрирования доступа клиентов к ресурсам ТМ. Механизм контроля лицензий обеспечивает контроль количества одновременно используемых в сети версий продукта.
SDL Trados TM Anywhere Server
Trados TM Anywhere является компонентом SDL Trados TM Serv