Страница 1 из 4

Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 09:03
Константин Лакшин
Мне тут предстоит на конференции по МП вещать с табуретки про то, что мешает переводчикам в т. н. "premium segment" пользоваться достижениями в области МП.

Понятно, что пара слов на эту тему у меня найдется. Но было интересно и умных людей послушать.

Итак, какие будут соображения насчет того, почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 09:42
mikhailo
Итак, какие будут соображения насчет того, почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?


Соображение одно - на выходе ничего достойного получить пока не удаётся.

Причин вижу две

1. Любой машине на входе требуется сырьё с определёнными характеристиками. В переводе этого нет никогда, по крайней мере, пока копирасты на коне.
2. Стиль изложения у всех разный. Даже если МП и будет давать что-то более или менее приемлемое, но не в стиле переводчика, переделка перевода вместе с первоначальной настройкой может потребовать больше времени, чем просто перевод.


PS. Раз уж помощи просите ответная просьба к Вам - после выступления выложите здесь текст доклада.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 10:10
Andrew
Константин Лакшин писал(а):почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?


Помимо невнятности продукта на выходе? :lol:

Пожалуй, это объем трудозатрат. Как только суммарные затраты времени и сил на тюнинг кошки и допиливание результата после нее превышают выигрыш от ее применения (или в целом эквивалентны ему), экономический смысл последнего растворяется в воздухе как улыбка Чеширского кота. А в том самом premium segment без подкручивания и допиливания пока, увы, никак не обходится.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 10:49
OlegV
Константин Лакшин писал(а):Мне тут предстоит на конференции по МП вещать с табуретки про то, что мешает переводчикам в т. н. "premium segment" пользоваться достижениями в области МП.

Понятно, что пара слов на эту тему у меня найдется. Но было интересно и умных людей послушать.

Итак, какие будут соображения насчет того, почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?


"никак не получается" - это преувеличение. Хотя, это Ваше право :).

Исходя из своего опыта работы с МП и его пост-редактированием (прежде всего, после "чужого" МП), могу выделить основные проблемы:

1. Отсутствие или недостаточная разработка новой терминологии ДО пост-редактирования

Это характерно не только для МП. Увы (по моему опыту), в подавляющем числе случаев мне (как пост-редактору или переводчику) приходится самому искать нужные эквиваленты в базе или придумывать их. Часто какие-то переводы терминов есть, но в разных вариантах. Такой режим работы, конечно, полезен и интересен, но связан с потерей полезного времени.

Если в МП вместо новых исходных терминов появляется "целевая" ерунда, это раздражает и замедляет работу. Но, проблема - не в самом МП, а в некачественной подготовке МП для конкретного проекта.

2. Плохая настройка МП ДО пост-редактирования

Если терминология разработана, но не введена (или введена в недостаточном объеме) в словарь МП, то будут те же проблемы, что и в пп. 1. Если список DoNotTranslate не настроен, то на выходе будет каша.

3. Неидеальное качество ТМ

Если говорим, к примеру, о SMT, то неединообразная ТМ (на базе которой была натренирована система МП) будет самым прямым образом аукаться в МП. Зачастую крайне сложно бывает понять и выбрать корректный вариант перевода в базе. Особенно, если у сегментов одинаковой авторство - того пользователя, который "очистил" перевод в свою базу.

4. Неидеальное единообразие МП

Прежде всего, в SMT. "Да" вместо "нет", "и" вместо "или"..... это часто случается. Надо быть крайне внимательным и внимательно вчитываться в "гладкий" МП.

Вот такие дела :).

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 10:56
Bruja Agata
Есть очень большой объем текстов, предмет которых принято относить к технике, но на деле сочетающих сугубо техническую тематику с маркетингом. Если в части чисто технической правильно дрессированная кошка дает вполне удовлетворительный результат, которому необходима минимальная правка, то все остальное требует переделки "с нуля". Я как раз сейчас в таком проекте (использую собственные разработки заказчика), и переводить весь текст в кошке с ТМ безо всякого МП оказывается проще и быстрее, и на выходе получается единый по стилю документ.
При этом, подчеркиваю, у текстов узкая специализация, и терминологически там никаких разночтений быть не может.

P.S. Я, правда, не очень уверена в своей принадлежности к параллельному миру. Премиум сегмент -- это где (или от скольки)? :grin:

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 11:12
провокатор
Почти все вышесказанное, ИМХО, нерелевантно. Главное - безмозглость машинных переводчиков и принципиальная неадекватность подхода к переводу. Пока не создадут "искусственный интеллект" (а его на базе компьютеров никогда не создадут), нормального перевода не будет. Что нужно для создания ИИ - "знаю, но не скажу" (С).

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 11:47
noname
премиум на то и премиум, что индпошив (хотя для многих глобальных контор, например контор под зонтиком ООН, Традос нужен).

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 13:15
Bruja Agata
Традос никак не мешает индпошиву.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 13:19
Alter Ego
noname писал(а):контор под зонтиком ООН, Традос нужен

Там уже почти окончательно внедрили свой "традос".

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 14:48
rms
Константин Лакшин писал(а):...что мешает переводчикам в т. н. "premium segment"...


По каким критериям определяется "премиальность" переводчика и к чему здесь она?

Я не пользуюсь МП, в первую очередь, потому, что я не умею с ним работать: это не CAT-программа, которую можно освоить за 10 минут и "ринуться в бой". Надо изучать настройки, создавать свои словари (у меня из этого ничего путного не получилось, я так и не "научил" машину "перестраивать" типовые предложения, как мне надо). То есть надо учиться, потом тренироваться, потом всё это дело долго под себя настраивать (как рассказывал В. Афанасьев в одной из тем про МП на этом форуме). На все на это нужно время, которого у меня нет.

Еще. Простые предложения в типовых документах (то есть те сегменты, которые можно было бы переводить при помощи МП) я и сам перевожу со скоростью, близкой к скорости их прочтения. То есть МП, я так думаю, не сильно сэкономит мое время/силы.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 15:10
Bruja Agata
rms писал(а):Надо изучать настройки, создавать свои словари (у меня из этого ничего путного не получилось, я так и не "научил" машину "перестраивать" типовые предложения, как мне надо). То есть надо учиться, потом тренироваться, потом всё это дело долго под себя настраивать (как рассказывал В. Афанасьев в одной из тем про МП на этом форуме). На все на это нужно время, которого у меня нет.

Вот, кстати, good point. У меня сейчас это всё делает заказчик. Сама бы я не стала - времени надо уйму, а эффективность сомнительна, если вообще есть.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 17:07
hawkwind
Недавно потребовалось перевести (для себя) Service Manual на стиральную машинку Electrolux, написанный на венгерском. Гугл-перевод справился отлично при перегоне на английский. Для англичанина может получился бред, но для меня смысл сохраняется в любом виде.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Вт авг 25, 2015 17:58
wisegirl
Вряд ли в той области, в которой я работаю, применим МП.
Видела результаты Гугль-перевода - душераздирающее зрелище.
Если же говорить о подготовке и настройке, то я тоже быстрее переведу сама, а с типовыми фразами прекрасно справляется Традос, который я кормлю с 2007 года.
И вообще, "Пастернака не читала, но осуждаю" :lol: .

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Ср авг 26, 2015 00:23
Константин Лакшин
mikhailo писал(а):PS. Раз уж помощи просите ответная просьба к Вам - после выступления выложите здесь текст доклада.


Постараюсь. Но это все ближе к концу осени.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Ср авг 26, 2015 01:28
John Gower
Вставлю свои два тенге)))
1. Использование удалённых решений (Google, AsiaOnline, Bing и пр. ) может нарушать (и нарушает) различные NDA. Данные утекают непонятно куда. Премиум (знать бы, где его граница) хочет конфиденциальности и эксклюзивности.
2. Тексты могут быть слишком витиеватые, т.е. проблемы терминологии как таковой нет, нужна стилистическая обработка объём которой приводит к переписыванию всего текста. МП, увы, тут себя не окупит.
3. Тексты предполагается публиковать, соответственно, случайный огрех может повлечь репутационные издержки.
4. Общая консервативность и, простите, информационная непромытость. Представление о МП на уровне "гуртовщиков мыши".
5. Всё очень сильно зависит от языковой пары.
А вот теперь парадокс.
Где доказательство, что в премиуме не используют МП?

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Ср авг 26, 2015 06:33
Константин Лакшин
mikhailo писал(а):1. Любой машине на входе требуется сырьё с определёнными характеристиками. В переводе этого нет...


Интересное соображение. Очевидное, казалось бы, но мне в голову не пришло. Попробую позаимствовать, если не возражаете.

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Ср авг 26, 2015 06:40
Константин Лакшин
Оффтопик
rms писал(а):По каким критериям определяется "премиальность" переводчика и к чему здесь она?


Всяко не по ценовым. Не хотелось бы этой ветке отвлекаться. Если угодно, подходом, из которого часто проистекает необходимость перестройки, подкручивания и допиливания (это насчет того, «к чему здесь она).

В принципе, premium можно заменить много еще чем, вплоть до «отдельно взятые придурки». :)

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Ср авг 26, 2015 07:04
Константин Лакшин
John Gower писал(а):4. Общая консервативность и, простите, информационная непромытость. Представление о МП на уровне "гуртовщиков мыши".


Тут не понял.

[Хотя бы в некоторых парах/тематиках/случаях современный массовый/серийный МП с полки/из Интернета далеко ушел от гуртовщика и дает вполне приемлемые (не означает даже «пристойные») результаты, если меня интересует просто информация в первом-втором-третьем приближении.]

John Gower писал(а):Где доказательство, что в премиуме не используют МП?


Доказательств нет. Первоначальная постановка вопроса была про то, что мешает (использовать/использовать больше и лучше).

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Ср авг 26, 2015 07:20
провокатор
Константин Лакшин писал(а):Первоначальная постановка вопроса была про то, что мешает (использовать/использовать больше и лучше).

Мешает только одно: выдаваемая МП дрянь - верное средство лишиться нормального заказчика. При пользовании машпереводом производительность не повышается, а падает в разы, т.к. редактирование МП (для превращения бессмыслицы во что-то более-менее разумное) - занятие для идиотовкрайне трудозатратное и глупое, проще и быстрее перевести все "вручную".

Re: Машинный перевод, или прошу помощи зала

СообщениеДобавлено: Ср авг 26, 2015 07:27
Константин Лакшин
wisegirl писал(а):"Пастернака не читала, но осуждаю" :lol: .


«На площади я не был, но прессу я прочел». :?

wisegirl писал(а):Вряд ли в той области, в которой я работаю, применим МП.


Насколько я понимаю, ваше все -- юридистика и финансы. Почему вы считаете, что МП вряд ли применим? Я имею в виду не тотальный МП, а «точечный», в сочетании с ТМ, например.

(Типичный случай: была «компания», а стало «хозяйственное общество». Можно ручками, конечно. Но вроде бы можно было бы и МП (rule-based) поручить «доперевести» только то, что изменилось, подставляя все заметные системе зависимые слова в нужных формах.)