Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Машинный перевод, или прошу помощи зала

Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Вт авг 25, 2015 09:03

Мне тут предстоит на конференции по МП вещать с табуретки про то, что мешает переводчикам в т. н. "premium segment" пользоваться достижениями в области МП.

Понятно, что пара слов на эту тему у меня найдется. Но было интересно и умных людей послушать.

Итак, какие будут соображения насчет того, почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?
Константин Лакшин

 
Сообщения: 1915
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (54)





Re: Машинный перевод, или прошу помощи зала

Сообщение mikhailo » Вт авг 25, 2015 09:42

Итак, какие будут соображения насчет того, почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?


Соображение одно - на выходе ничего достойного получить пока не удаётся.

Причин вижу две

1. Любой машине на входе требуется сырьё с определёнными характеристиками. В переводе этого нет никогда, по крайней мере, пока копирасты на коне.
2. Стиль изложения у всех разный. Даже если МП и будет давать что-то более или менее приемлемое, но не в стиле переводчика, переделка перевода вместе с первоначальной настройкой может потребовать больше времени, чем просто перевод.


PS. Раз уж помощи просите ответная просьба к Вам - после выступления выложите здесь текст доклада.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3271
Зарегистрирован: Пн июл 12, 2004 07:22
Предупреждения: 1
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Машинный перевод, или прошу помощи зала

Сообщение Andrew » Вт авг 25, 2015 10:10

Константин Лакшин писал(а):почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?


Помимо невнятности продукта на выходе? :lol:

Пожалуй, это объем трудозатрат. Как только суммарные затраты времени и сил на тюнинг кошки и допиливание результата после нее превышают выигрыш от ее применения (или в целом эквивалентны ему), экономический смысл последнего растворяется в воздухе как улыбка Чеширского кота. А в том самом premium segment без подкручивания и допиливания пока, увы, никак не обходится.
Andrew
Хранитель огня
 
Сообщения: 8892
Зарегистрирован: Пн янв 14, 2002 12:28
Откуда: Rostov-on-Don
Блог: Просмотр блога (23)
Язык(-и): EN<->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение OlegV » Вт авг 25, 2015 10:49

Константин Лакшин писал(а):Мне тут предстоит на конференции по МП вещать с табуретки про то, что мешает переводчикам в т. н. "premium segment" пользоваться достижениями в области МП.

Понятно, что пара слов на эту тему у меня найдется. Но было интересно и умных людей послушать.

Итак, какие будут соображения насчет того, почему переводчики в некоторых из параллельных миров и рады бы МП попользоваться, но никак не получается?


"никак не получается" - это преувеличение. Хотя, это Ваше право :).

Исходя из своего опыта работы с МП и его пост-редактированием (прежде всего, после "чужого" МП), могу выделить основные проблемы:

1. Отсутствие или недостаточная разработка новой терминологии ДО пост-редактирования

Это характерно не только для МП. Увы (по моему опыту), в подавляющем числе случаев мне (как пост-редактору или переводчику) приходится самому искать нужные эквиваленты в базе или придумывать их. Часто какие-то переводы терминов есть, но в разных вариантах. Такой режим работы, конечно, полезен и интересен, но связан с потерей полезного времени.

Если в МП вместо новых исходных терминов появляется "целевая" ерунда, это раздражает и замедляет работу. Но, проблема - не в самом МП, а в некачественной подготовке МП для конкретного проекта.

2. Плохая настройка МП ДО пост-редактирования

Если терминология разработана, но не введена (или введена в недостаточном объеме) в словарь МП, то будут те же проблемы, что и в пп. 1. Если список DoNotTranslate не настроен, то на выходе будет каша.

3. Неидеальное качество ТМ

Если говорим, к примеру, о SMT, то неединообразная ТМ (на базе которой была натренирована система МП) будет самым прямым образом аукаться в МП. Зачастую крайне сложно бывает понять и выбрать корректный вариант перевода в базе. Особенно, если у сегментов одинаковой авторство - того пользователя, который "очистил" перевод в свою базу.

4. Неидеальное единообразие МП

Прежде всего, в SMT. "Да" вместо "нет", "и" вместо "или"..... это часто случается. Надо быть крайне внимательным и внимательно вчитываться в "гладкий" МП.

Вот такие дела :).
OlegV

 
Сообщения: 315
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Машинный перевод, или прошу помощи зала

Сообщение Bruja Agata » Вт авг 25, 2015 10:56

Есть очень большой объем текстов, предмет которых принято относить к технике, но на деле сочетающих сугубо техническую тематику с маркетингом. Если в части чисто технической правильно дрессированная кошка дает вполне удовлетворительный результат, которому необходима минимальная правка, то все остальное требует переделки "с нуля". Я как раз сейчас в таком проекте (использую собственные разработки заказчика), и переводить весь текст в кошке с ТМ безо всякого МП оказывается проще и быстрее, и на выходе получается единый по стилю документ.
При этом, подчеркиваю, у текстов узкая специализация, и терминологически там никаких разночтений быть не может.

P.S. Я, правда, не очень уверена в своей принадлежности к параллельному миру. Премиум сегмент -- это где (или от скольки)? :grin:
Bruja Agata

 
Сообщения: 4039
Зарегистрирован: Чт окт 24, 2002 23:07
Блог: Просмотр блога (1)

Re: Машинный перевод, или прошу помощи зала

Сообщение провокатор » Вт авг 25, 2015 11:12

Почти все вышесказанное, ИМХО, нерелевантно. Главное - безмозглость машинных переводчиков и принципиальная неадекватность подхода к переводу. Пока не создадут "искусственный интеллект" (а его на базе компьютеров никогда не создадут), нормального перевода не будет. Что нужно для создания ИИ - "знаю, но не скажу" (С).
"Дым костра и смех веселый,
И огнем глаза горят" (С)
провокатор

 
Сообщения: 3122
Зарегистрирован: Вт фев 10, 2009 08:31
Откуда: откуда-то оттуда
Язык(-и): de, fr -> ru, гуглом!!

Re: Машинный перевод, или прошу помощи зала

Сообщение noname » Вт авг 25, 2015 11:47

премиум на то и премиум, что индпошив (хотя для многих глобальных контор, например контор под зонтиком ООН, Традос нужен).
noname

 
Сообщения: 1788
Зарегистрирован: Чт фев 03, 2005 20:40

Re: Машинный перевод, или прошу помощи зала

Сообщение Bruja Agata » Вт авг 25, 2015 13:15

Традос никак не мешает индпошиву.
Bruja Agata

 
Сообщения: 4039
Зарегистрирован: Чт окт 24, 2002 23:07
Блог: Просмотр блога (1)

Re: Машинный перевод, или прошу помощи зала

Сообщение Alter Ego » Вт авг 25, 2015 13:19

noname писал(а):контор под зонтиком ООН, Традос нужен

Там уже почти окончательно внедрили свой "традос".
Alter Ego
Читатель Розенталя
 
Сообщения: 10064
Зарегистрирован: Вс дек 04, 2005 16:25
Откуда: Петербург

Re: Машинный перевод, или прошу помощи зала

Сообщение rms » Вт авг 25, 2015 14:48

Константин Лакшин писал(а):...что мешает переводчикам в т. н. "premium segment"...


По каким критериям определяется "премиальность" переводчика и к чему здесь она?

Я не пользуюсь МП, в первую очередь, потому, что я не умею с ним работать: это не CAT-программа, которую можно освоить за 10 минут и "ринуться в бой". Надо изучать настройки, создавать свои словари (у меня из этого ничего путного не получилось, я так и не "научил" машину "перестраивать" типовые предложения, как мне надо). То есть надо учиться, потом тренироваться, потом всё это дело долго под себя настраивать (как рассказывал В. Афанасьев в одной из тем про МП на этом форуме). На все на это нужно время, которого у меня нет.

Еще. Простые предложения в типовых документах (то есть те сегменты, которые можно было бы переводить при помощи МП) я и сам перевожу со скоростью, близкой к скорости их прочтения. То есть МП, я так думаю, не сильно сэкономит мое время/силы.
rms

 
Сообщения: 511
Зарегистрирован: Вс ноя 26, 2006 05:06
Откуда: ภูเก็ต/СПб

Re: Машинный перевод, или прошу помощи зала

Сообщение Bruja Agata » Вт авг 25, 2015 15:10

rms писал(а):Надо изучать настройки, создавать свои словари (у меня из этого ничего путного не получилось, я так и не "научил" машину "перестраивать" типовые предложения, как мне надо). То есть надо учиться, потом тренироваться, потом всё это дело долго под себя настраивать (как рассказывал В. Афанасьев в одной из тем про МП на этом форуме). На все на это нужно время, которого у меня нет.

Вот, кстати, good point. У меня сейчас это всё делает заказчик. Сама бы я не стала - времени надо уйму, а эффективность сомнительна, если вообще есть.
Bruja Agata

 
Сообщения: 4039
Зарегистрирован: Чт окт 24, 2002 23:07
Блог: Просмотр блога (1)

Re: Машинный перевод, или прошу помощи зала

Сообщение hawkwind » Вт авг 25, 2015 17:07

Недавно потребовалось перевести (для себя) Service Manual на стиральную машинку Electrolux, написанный на венгерском. Гугл-перевод справился отлично при перегоне на английский. Для англичанина может получился бред, но для меня смысл сохраняется в любом виде.
hawkwind

 
Сообщения: 8103
Зарегистрирован: Сб мар 31, 2007 15:24
Откуда: Владивосток
Язык(-и): eng - rus

Re: Машинный перевод, или прошу помощи зала

Сообщение wisegirl » Вт авг 25, 2015 17:58

Вряд ли в той области, в которой я работаю, применим МП.
Видела результаты Гугль-перевода - душераздирающее зрелище.
Если же говорить о подготовке и настройке, то я тоже быстрее переведу сама, а с типовыми фразами прекрасно справляется Традос, который я кормлю с 2007 года.
И вообще, "Пастернака не читала, но осуждаю" :lol: .
Воспитывать же взрослых людей - дело совершенно бесперспективное, даже если тебя зовут Иосиф или Адольф и ты находишься при исполнении
Аватара пользователя
wisegirl

 
Сообщения: 2119
Зарегистрирован: Вт май 10, 2005 10:23
Откуда: Moscow

Re: Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Ср авг 26, 2015 00:23

mikhailo писал(а):PS. Раз уж помощи просите ответная просьба к Вам - после выступления выложите здесь текст доклада.


Постараюсь. Но это все ближе к концу осени.
Константин Лакшин

 
Сообщения: 1915
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (54)

Re: Машинный перевод, или прошу помощи зала

Сообщение John Gower » Ср авг 26, 2015 01:28

Вставлю свои два тенге)))
1. Использование удалённых решений (Google, AsiaOnline, Bing и пр. ) может нарушать (и нарушает) различные NDA. Данные утекают непонятно куда. Премиум (знать бы, где его граница) хочет конфиденциальности и эксклюзивности.
2. Тексты могут быть слишком витиеватые, т.е. проблемы терминологии как таковой нет, нужна стилистическая обработка объём которой приводит к переписыванию всего текста. МП, увы, тут себя не окупит.
3. Тексты предполагается публиковать, соответственно, случайный огрех может повлечь репутационные издержки.
4. Общая консервативность и, простите, информационная непромытость. Представление о МП на уровне "гуртовщиков мыши".
5. Всё очень сильно зависит от языковой пары.
А вот теперь парадокс.
Где доказательство, что в премиуме не используют МП?
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1187
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (5)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Ср авг 26, 2015 06:33

mikhailo писал(а):1. Любой машине на входе требуется сырьё с определёнными характеристиками. В переводе этого нет...


Интересное соображение. Очевидное, казалось бы, но мне в голову не пришло. Попробую позаимствовать, если не возражаете.
Константин Лакшин

 
Сообщения: 1915
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (54)

Re: Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Ср авг 26, 2015 06:40

Оффтопик
rms писал(а):По каким критериям определяется "премиальность" переводчика и к чему здесь она?


Всяко не по ценовым. Не хотелось бы этой ветке отвлекаться. Если угодно, подходом, из которого часто проистекает необходимость перестройки, подкручивания и допиливания (это насчет того, «к чему здесь она).

В принципе, premium можно заменить много еще чем, вплоть до «отдельно взятые придурки». :)
Константин Лакшин

 
Сообщения: 1915
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (54)

Re: Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Ср авг 26, 2015 07:04

John Gower писал(а):4. Общая консервативность и, простите, информационная непромытость. Представление о МП на уровне "гуртовщиков мыши".


Тут не понял.

[Хотя бы в некоторых парах/тематиках/случаях современный массовый/серийный МП с полки/из Интернета далеко ушел от гуртовщика и дает вполне приемлемые (не означает даже «пристойные») результаты, если меня интересует просто информация в первом-втором-третьем приближении.]

John Gower писал(а):Где доказательство, что в премиуме не используют МП?


Доказательств нет. Первоначальная постановка вопроса была про то, что мешает (использовать/использовать больше и лучше).
Константин Лакшин

 
Сообщения: 1915
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (54)

Re: Машинный перевод, или прошу помощи зала

Сообщение провокатор » Ср авг 26, 2015 07:20

Константин Лакшин писал(а):Первоначальная постановка вопроса была про то, что мешает (использовать/использовать больше и лучше).

Мешает только одно: выдаваемая МП дрянь - верное средство лишиться нормального заказчика. При пользовании машпереводом производительность не повышается, а падает в разы, т.к. редактирование МП (для превращения бессмыслицы во что-то более-менее разумное) - занятие для идиотовкрайне трудозатратное и глупое, проще и быстрее перевести все "вручную".
"Дым костра и смех веселый,
И огнем глаза горят" (С)
провокатор

 
Сообщения: 3122
Зарегистрирован: Вт фев 10, 2009 08:31
Откуда: откуда-то оттуда
Язык(-и): de, fr -> ru, гуглом!!

Re: Машинный перевод, или прошу помощи зала

Сообщение Константин Лакшин » Ср авг 26, 2015 07:27

wisegirl писал(а):"Пастернака не читала, но осуждаю" :lol: .


«На площади я не был, но прессу я прочел». :?

wisegirl писал(а):Вряд ли в той области, в которой я работаю, применим МП.


Насколько я понимаю, ваше все -- юридистика и финансы. Почему вы считаете, что МП вряд ли применим? Я имею в виду не тотальный МП, а «точечный», в сочетании с ТМ, например.

(Типичный случай: была «компания», а стало «хозяйственное общество». Можно ручками, конечно. Но вроде бы можно было бы и МП (rule-based) поручить «доперевести» только то, что изменилось, подставляя все заметные системе зависимые слова в нужных формах.)
Константин Лакшин

 
Сообщения: 1915
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (54)

След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Полезное программное обеспечение. Аллея Бродяги

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8