Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Машинный перевод, или прошу помощи зала

Re: Машинный перевод, или прошу помощи зала

Сообщение wisegirl » Чт авг 27, 2015 13:31

Так я об этом (невозможности использования МП в моей сфере) в самом начале сказала.
По поводу терминологии могу сказать следующее: есть некий привычный набор, состоящий из, скажем, 500-1000 всем привычных и устоявшихся терминов. При этом в каждом договоре юристы могут вводить сформированные ими самими с учетом контекста и сути сделки термины. При их переводе очень часто надо сначала "въехать" в суть сделки, потом понять, чего хотели этим термином сказать юристы, а потом уже попробовать перевести его на русский, сохранив смысл и, желательно, не растянув его на 5-6 слов вместо 2-3 в оригинале. В таких случаях мы опять приходим к необходимости индивидуального подхода, потому что переводить надо не слова, а смысл.
Стоит ли засорять юридические документы несущественным - не знаю, знакомые юристы с техническим образованием этого не любят
(c) mikhailo
Аватара пользователя
wisegirl

 
Сообщения: 2487
Зарегистрирован: Вт май 10, 2005 10:23
Откуда: Moscow





Re: Машинный перевод, или прошу помощи зала

Сообщение mikhailo » Чт авг 27, 2015 13:42

При нужной настройке словаря (когда все одиночные термины и словосочетания будут заранее введены в словарь) получите искомую лексику. Но, придется много переносить в рамках сегмента. Хотя, при быстрой работе на клавиатуре у меня скорость работы в таком режиме (cut&paste) получается быстрее, чем набор с нуля.


Читаю и завидую. В техпереводе часто полностью с лексикой и терминологией удаётся разобраться только после осмысления чернового перевода. А когда ещё и несколько не очень понятных вещей в тексте по-разному называются - без помощи заказчика порой и вообще не удаётся. И как вы словари перед началом перевода составляете?

- Существуют ли ситуации, когда одному (подобному) исходнику должны соответствовать несколько переводов?


Да очень много. В одних случаях глагол переводится существительным, в других — глаголом в повелительном наклонении, в третьих — неопределённой формой.

По моему опыту, в средне- и долгосрочной перспективе систему машинного перевода можно отдрессировать и получать на выходе вполне приличные результаты на лексически и синтаксически однородных текстах. Но в такой ситуации, разумеется, и система автоматизации перевода будет давать хорошие результаты. Если же тексты разнообразные, то, разумеется, МП проигрывает. Впрочем, приблизительно это уже высказано.


Чтобы МП давал приемлемое на выходе, надо разрабатывать регламентированный язык, чем сейчас для ИТ Промт вроде и занимается (т.е. по сути идти в сторону стандартизации входного сырья).
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Чт авг 27, 2015 14:15

Читаю и завидую. В техпереводе часто полностью с лексикой и терминологией удаётся разобраться только после осмысления чернового перевода. А когда ещё и несколько не очень понятных вещей в тексте по-разному называются - без помощи заказчика порой и вообще не удаётся. И как вы словари перед началом перевода составляете?


Мы же с Вами это уже проходили :). В предыдущей теме о МП (Настройка....).
Я делаю черновой перевод с помощью ПРОМТа. Вникаю в тематику, определяю, что и как нужно донастроить (советуюсь по вопросам терминологии с заказчиком). Как правило, иду по документу последовательно. Я анализирую сырой вариант МП, не редактируя его - я читаю МП и сравниваю с исходником.

Да очень много. В одних случаях глагол переводится существительным, в других — глаголом в повелительном наклонении, в третьих — неопределённой формой.


нет, не так. Я в другом смысле:
Например,
client = клиент
client = мандант

Чтобы МП давал приемлемое на выходе, надо разрабатывать регламентированный язык, чем сейчас для ИТ Промт вроде и занимается (т.е. по сути идти в сторону стандартизации входного сырья).


Никогда не слышал, чтобы ПРОМТ этим занимался. Контролируемым языком занимаются (крупные) производители товаров. Для своей документации и своих клиентов. Исторически изначально не для МП, а для технического персонала в других странах, которые крайне слабо знали английский (имею в виду автомобильных гигантов).
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Чт авг 27, 2015 14:25

esperantisto писал(а):Промт где-то с версии 8, ЕМНИП, включает, пусть и несколько ограниченно, работу с накопителями переводов, и, казалось бы, вот она — мечта: лучшее из двух миров. Но есть пару но:
б) самым существенным препятствием для применения Промта я бы назвал невозможность быстро и легко подключать глоссарии заказчика: вносить ручками даже пару сотен терминов в пользовательский словарь — затрахаешься, а если счёт оных идёт на тысячи — подобное занятие явно не имеет смысла;


В ПРОМТе реализован режим автоматического импорта внешнего словаря (в табличной форме) в свой словарь МП. Для повышения качества желательно указать часть речи. Несколько тысяч словарных статей будут импортированы примерно за несколько минут (если не ошибаюсь).
Но, качество при импорте будет неидеальным.
- могут быть ошибки (на уровне склонения/спряжения)
- будут отсутствовать настройки управления (предлоги и послелоги).

Например, для глагола "to access (TO)" нужно (вручную) указать "получить доступ (К КОМУ-ЧЕМУ)"

в) а если глоссарий обновился, что делать? Заново всё переводить с изменённым пользовательским словарём и редактировать всё это?


Что имеется в виду? Если заказчик изменил согласованную лексику?
Тогда нужно менять не только словарь МП, но и лексику в базе ТМ.
Со словарем проще.
А в базе намучаешься (это я проходил). Ед. и множ. числа, склонения и спряжения. И проверять, не "пересекаются" ли друг с другом словарные статьи.
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение mikhailo » Чт авг 27, 2015 15:18

Мы же с Вами это уже проходили :). В предыдущей теме о МП (Настройка....).
Я делаю черновой перевод с помощью ПРОМТа. Вникаю в тематику, определяю, что и как нужно донастроить (советуюсь по вопросам терминологии с заказчиком). Как правило, иду по документу последовательно. Я анализирую сырой вариант МП, не редактируя его - я читаю МП и сравниваю с исходником.


Понятно. Пока не вижу, как адаптировать это к своей ситуации.

Никогда не слышал, чтобы ПРОМТ этим занимался.


Перепутал. Яндекс этим занимается.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Чт авг 27, 2015 15:23

Константин Лакшин писал(а):Мне тут предстоит на конференции по МП вещать с табуретки про то, что мешает переводчикам в т. н. "premium segment" пользоваться достижениями в области МП.

Понятно, что пара слов на эту тему у меня найдется. Но было интересно и умных людей послушать.

Итак, какие будут соображения насчет того, почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?


Константин, Вы за нами успеваете :)?
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение esperantisto » Чт авг 27, 2015 16:08

OlegV писал(а):
в) а если глоссарий обновился…


Что имеется в виду? Если заказчик изменил согласованную лексику?


Именно оно.

Тогда нужно менять не только словарь МП, но и лексику в базе ТМ.


Достаточно это делать, когда подставляется совпадение из накопителя.
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Чт авг 27, 2015 16:25

Достаточно это делать, когда подставляется совпадение из накопителя.


Да, так можно.
Но, зачем Вам (или другим переводчикам, если работаете в команде) в базе "устаревшая и некорректная" лексика? рано или поздно единообразие текущего перевода будет нарушено.
Старый вариант перевода, скорее всего, не будет изменен (в базе).
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение esperantisto » Чт авг 27, 2015 16:41

OlegV, как раз-таки сегмент в накопителе заменится, и всего-то делов — заменить слово или два. А в случае МП придётся заново редактировать перевод.
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Чт авг 27, 2015 17:08

esperantisto писал(а):OlegV, как раз-таки сегмент в накопителе заменится, и всего-то делов — заменить слово или два. А в случае МП придётся заново редактировать перевод.


Сегмент заменится, если у вас будет 100%-я подстановка (по моему, так).

По поводу МП. Я практически никогда не менял настройку Традоса (6-8) по умолчанию, которая относится к МП. Там машинно переведенным сегментам назначается вес 85%. И такой Традос просто не даст мне импортировать МП в базу, если в ней есть соответствующая билингва с более высоким процентом.
А если высоких подстановок нет, то МП попадет в базу. Уже с актуальными терминами. И переводчику будут предлагаться как МП-сегмент, так и низкое совпадение (при наличии) - а он(а) уже будет решать на месте, какой вариант редактировать - после МП или "прямой" из базы.

В Студии можно реализовать примерно такой же подход. Только для МП использовать отдельную базу (и ее не обновлять).
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение eCat-Erina » Чт авг 27, 2015 23:50

В тему, но на английском про гранты и машинный перевод: http://www.theregister.co.uk/2015/08/26 ... ion_tools/
¡Ser feliz!
Дорогие коллеги, в условиях сложной геополитической ситуации, пожалуйста, постарайтесь сохранить ценные дружеские и профессиональные отношения друг с другом.
Аватара пользователя
eCat-Erina
मोक्ष
 
Сообщения: 37281
Зарегистрирован: Ср авг 07, 2002 12:14
Блог: Просмотр блога (159)
Язык(-и): англ>рус

Re: Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Пт авг 28, 2015 06:25

OlegV писал(а):Константин, Вы за нами успеваете :)?


Плетусь вроде пока в хвосте обоза.

У меня к вам пара уточняющих вопросов, если не возражаете.

Насколько я понимаю вы пользуетесь и МП, и накопителем.

Как вы совмещаете/согласуете результаты их деятельности? Первым МП, потом ТМ, наоборот, еще как-то и т. п.?

Желательно занудно и в трех (хотя бы) сценариях.

1) Продолжение для существующего заказчика/производителя/продукта -- незначительные изменения/minor (maintenance) release.
2) То же самое, но major release.
3) Новый заказчик/производитель, продукт давно вам известного/сопоставимого класса (когда человеку в теме кажется, что «опять двадцать пять»).
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Пт авг 28, 2015 10:42

Константин,

Я, главным образом, применяю связку Традос(ы) + ПРОМТ.

В общем виде процедура или сценарий выглядит следующим образом:

Trados_TM+MT_.jpg


- получаю исходник. На рис. отмечены не все форматы файлов (для SDLXLIFF алгоритм, в принципе, такой же),
- извлекаю неизвестные сегменты (с помощью самого Традоса или отдельных приложений),
- разрабатываю лексику для данного исходника и настраиваю МП, проверяю "сырой" МП, донастраиваю, при необходимости,

В идеале словарь МП должен содержать ВСЮ лексику.

terms_lexicon_for_MT_.jpg


В результате, именно я управляю терминологией на выходе МП, а не сам ПРОМТ ("вслепую"). Я, как настройщик, добиваюсь нужной мне лексики. Гугл мне в этом смысле - не помощник. Там результат всегда непредсказуемый, а в случае с ПРОМТом (десктопным) - очень даже предсказуемый.

Далее:

- выполняю пакетный перевод "неизвестных" сегментов,
- импортирую их в ТМ,
- пост-редактирую.

я взял эти скриншоты из своей презентации с TFR 2011 (http://argonaut.spb.ru/files/TFR11_OlegV.pdf)

Если нужно подробнее об интеграции Традоса (Студии) и ПРОМТа, дайте знать.
Последний раз редактировалось OlegV Пт авг 28, 2015 11:06, всего редактировалось 1 раз.
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение Elena Iarochenko » Пт авг 28, 2015 11:00

Константин Лакшин писал(а):
mikhailo писал(а):1. Любой машине на входе требуется сырьё с определёнными характеристиками. В переводе этого нет...


Интересное соображение. Очевидное, казалось бы, но мне в голову не пришло. Попробую позаимствовать, если не возражаете.

Так это же... м-м-м... очевидно!
По-моему, вся проблема в том, что исходные тексты написаны в вольном стиле.
Если бы авторам велели писать по определенным шаблонам - МП прекрасно справлялся бы с переводом (что не исключает общей проверки, но это и на конвейере упаковки есть живой человек, визуально контролирующий явный брак).
Сейчас есть отдельные удачные случаи. Надо просто пошире распространить эту систему.
Например, сама схема текста должна быть иной: четкие и короткие фразы в строгой последовательности. А сейчас что? "Заполните бак смазкой, предварительно отключив то и это, сняв крышку, засунув туда шланг от канистры, которую..." Форменная каша.
А для МП надо что-то вроде: Подготовьте канистру. Отключите то и это. Снимите с бака крышку. Засуньте туда шланг от канистры.
Elena Iarochenko

 
Сообщения: 15203
Зарегистрирован: Сб фев 09, 2002 16:05
Откуда: Италия
Язык(-и): IT, EN ->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Пт авг 28, 2015 11:19

Константин Лакшин писал(а):Желательно занудно и в трех (хотя бы) сценариях.

1) Продолжение для существующего заказчика/производителя/продукта -- незначительные изменения/minor (maintenance) release.
2) То же самое, но major release.
3) Новый заказчик/производитель, продукт давно вам известного/сопоставимого класса (когда человеку в теме кажется, что «опять двадцать пять»).


Фактически у меня - один сценарий (см. выше)

Практика показывает (предположим, что в базе ТМ все хорошо с переводом), что высокие совпадения (> 85%) прогонять через МП не нужно.
А пенальти 15% себя оправдывает.

По Вашим пунктам:

1) донастройка МП займет немного времени (от силы несколько часов - время буду тратить на проверку выхода МП)

2) донастройка МП займет больше времени: мне нужно разобраться (тематически) с новыми понятиями, терминами, а также убедиться, что существующая лексика (в словаре) МП не противоречит новой.
Бывало, что в обновленной документации авторы так (по-новому) описывают какой-то узел, что появляется необходимость изменить термин-перевод (это уже нужно будет сделать как в словаре МП, так и в ТМ, чтобы вручную не менять при подстановках).

3) главный вопрос - смогу ли я использовать уже разработанный (ранее) словарь МП для нового заказчика. Если нет, будет нужно создать новый словарь для него и добавить в него прежние словарные статьи с новым переводом. Либо переписываться с заказчиком и пытаться убедить поменять целевую терминологию.

В любом из этим случаев терминология в словаре МП и ТМ должна быть одинаковой. Именно подобным образом обеспечивается управление единообразием - еще до начала перевода. На этапе технического редактирования, как правило, нужно обращать внимание на стиль изложения.
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение mikhailo » Пт авг 28, 2015 11:28

Именно подобным образом обеспечивается управление единообразием - еще до начала перевода.


Всё больше и больше ощущение об идеальности ваших оригиналов. В 40% (навскидку) ёмких мануалов единства терминологии нет в оригинале.

Желательно занудно и в трех (хотя бы) сценариях.

1) Продолжение для существующего заказчика/производителя/продукта -- незначительные изменения/minor (maintenance) release.
2) То же самое, но major release.


Когда-то переводил документацию к одному ПО. После первой версии просто договорился с создателем о том, что все последующие изменения и дополнения он будет выделять цветом или шрифтом. В итоге доперевод по тексту всегда требовал меньше времени, чем морока с ТМ (правда объём дополнений всегда был небольшим - не более 5 стр).
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Пт авг 28, 2015 11:32

mikhailo писал(а):
Именно подобным образом обеспечивается управление единообразием - еще до начала перевода.


Всё больше и больше ощущение об идеальности ваших оригиналов. В 40% (навскидку) ёмких мануалов единства терминологии нет в оригинале.


Идеальных исходных документов не видел. Но, и с 40% не сталкивался. Может, повезло чуток :))
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Пт авг 28, 2015 17:07

Константин,

Мне тут предстоит на конференции по МП вещать с табуретки про то, что мешает переводчикам в т. н. "premium segment" пользоваться достижениями в области МП.


А конференция будет русско- или иноязычной?
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение Kat » Пт авг 28, 2015 20:34

Alter Ego писал(а):Там уже почти окончательно внедрили свой "традос".

Ну eLuna у нас все же не единственный инструмент, есть немало документов, для которых SDL Trados больше подходит, и есть порой необходимость поработать в оффлайне. Так что будем надеяться, что горстку лицензий на "Традос" нам все же оставят. Опять же вон Женева сейчас пробует на зуб новые версии, то есть отказываться от него явно не будут.
Аватара пользователя
Kat

 
Сообщения: 61
Зарегистрирован: Сб фев 07, 2004 08:59
Откуда: NN / NY
Язык(-и): Eng-Rus, Fr-Rus

Re: Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Сб авг 29, 2015 07:34

OlegV писал(а):А конференция будет русско- или иноязычной?


Ино
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Полезное программное обеспечение. Аллея Бродяги

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 7