Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Подготовка текста под машинный перевод

Подготовка текста под машинный перевод

Сообщение sparkster » Сб июн 08, 2019 01:03

Не могли бы подсказать, где можно почитать материал про подготовку текста под машинный перевод, чтобы сэкономить время на постредактировании?
Аватара пользователя
sparkster

 
Сообщения: 87
Зарегистрирован: Чт фев 26, 2015 08:04





Re: Подготовка текста под машинный перевод

Сообщение mikhailo » Сб июн 08, 2019 13:56

какого текста? под какой МП? В какой паре языков? На какие настройки МП (если G, DL, MS вы можете повлиять)?
Читайте
https://www.researchgate.net/publicatio ... ce_Content

Кое какие мысли и идеи есть, но пока не оформлены в виде почитать другим
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3739
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Подготовка текста под машинный перевод

Сообщение OlegV » Пн июн 10, 2019 14:26

sparkster писал(а):Не могли бы подсказать, где можно почитать материал про подготовку текста под машинный перевод, чтобы сэкономить время на постредактировании?


Какой инструмент МП Вы планируете использовать? Одна из основных проблем - плохо настроенный словарь МП. Под вашу задачу и лексику. Мой опыт показывает: чем лучше настроен словарь МП (еще до начала пост-редактирования), тем проще само пост-редактирование.
OlegV

 
Сообщения: 374
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Подготовка текста под машинный перевод

Сообщение Бычара » Вт июн 11, 2019 12:28

Овчинка выделки не стоит. МТ - удел совсем недопереводчиков.
И смайлики, конечно же, - три, как и положено по нормативам )))
Аватара пользователя
Бычара
Бык Маллиган
 
Сообщения: 2506
Зарегистрирован: Сб июл 16, 2011 14:23

Re: Подготовка текста под машинный перевод

Сообщение mikhailo » Вт июн 11, 2019 12:33

МТ - удел совсем недопереводчиков.


Как-то кучно с утра пошло....

Для одного технический перевод - примитивный, для другого МТ - удел недопереводчиков.....
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3739
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Подготовка текста под машинный перевод

Сообщение Бычара » Вт июн 11, 2019 14:35

Поясню для танкистов: любой перевод выполняется человеком, кто: а) знает иностранный язык (№?:во или за%:"сь, но знает); 2) владеет нормами языка, куда он переводит; 3) имеет хоть какой-то опыт.
Машинный перевод и подготовка текста под него - две разные вещи, обе не имеют смысла, кроме случаев текстов в виде перечислений дат и двух пар слов, с этим справится даже Бабель Фиш.
И смайлики, конечно же, - три, как и положено по нормативам )))
Аватара пользователя
Бычара
Бык Маллиган
 
Сообщения: 2506
Зарегистрирован: Сб июл 16, 2011 14:23

Re: Подготовка текста под машинный перевод

Сообщение mikhailo » Вт июн 11, 2019 15:00

Поясню для танкистов: любой перевод выполняется человеком, кто: а) знает иностранный язык (№?:во или за%:"сь, но знает); 2) владеет нормами языка, куда он переводит; 3) имеет хоть какой-то опыт.
Машинный перевод и подготовка текста под него - две разные вещи, обе не имеют смысла, кроме случаев текстов в виде перечислений дат и двух пар слов, с этим справится даже Бабель Фиш.


Поясню для тех, кто в танке, в подводном бункере, в Марианской впадине.....

Воспользуюсь простой аналогией.... Хороший повар знает, как готовить, и всегда сам выбирает продукты (готовится к последующей готовке). Нормальный учитель сам приложит силы к отбору тех учеников, с которыми он будет работать. Это нормально и естественно.....

Точно так же и подготовка к машинному переводу только тогда будет нормальной, когда заниматься ей будет человек, знающий и понимающий МП. А поскольку даже Промт сильно не раскрывает подробностей алгоритма, хотя и позволяет хоть что-то настроить, то проблема становится сложнее

Чтобы понять алгоритм - ему надо скормить 1-2-3-4-5-6-7 и, как повезёт, переработанных вариантов текста, посмотреть, что получится на выходе и в идеале, добиться чего-то вменяемого. После этого проанализировать изменения и вывести правила преобразования текста, которые затем проверить хотя бы на 10-ке примеров... После этого возникнет какое-то понимание того, что делается внутри. Причём с GL/DL очень желательно, чтобы какая-нибудь пачка параллельных текстов, переработанная за это время, не поменяла весовые коэффициенты в системе линейных уравнений алгоритмов машинного обучения..... Это опять таки делает ПРОМТ единственным МП, более/менее надёжным для анализа. Учитывая вышеизложенное, получаем, что, в принципе, данная работа тянет на хорошую, если не превосходную, курсовую, диплом, магистерскую работу толкового студента.....

В принципе этой работой давно должен был бы заняться отдел переводов какой-нибудь крупной компании в большим объёмом переводов за границу (свой текст править проще, требования к переведённому тексту там из-за наплыва не нейтивов в последнее время стали гораздо ниже), типа Атомстройэкспорта, Оборонэкспорта (особенно с его армейской дисциплиной), взяв за шкирку ПРОМТ и имея его вдоль и поперёк, чтобы там работали, а не просиживали штаны, меняя номерки в выпускаемых версиях...
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3739
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Подготовка текста под машинный перевод

Сообщение Бычара » Вт июн 11, 2019 15:20

Я не буду объяснять человеку, который делает ошибки в русском и английском языке, насколько он заблудился в трех тополях на Плющихе.
МТ - удел слабаков, чудаков и лентяев.
И смайлики, конечно же, - три, как и положено по нормативам )))
Аватара пользователя
Бычара
Бык Маллиган
 
Сообщения: 2506
Зарегистрирован: Сб июл 16, 2011 14:23

Re: Подготовка текста под машинный перевод

Сообщение Lohh_ness » Вт июн 11, 2019 15:31

взяв за шкирку ПРОМТ и имея его вдоль и поперёк, чтобы там работали, а не просиживали штаны, меняя номерки в выпускаемых версиях...


Тихо рыдаю над утопичностью представленной модели...
Je dépense donc je suis.
Lohh_ness

 
Сообщения: 1191
Зарегистрирован: Ср окт 12, 2011 00:31
Язык(-и): Eng<-> Ru

Re: Подготовка текста под машинный перевод

Сообщение rms » Вт июн 11, 2019 20:14

mikhailo писал(а):...взяв за шкирку ПРОМТ и имея его вдоль и поперёк, чтобы там работали, а не просиживали штаны, меняя номерки в выпускаемых версиях...


Интересно, зачем коммерческой организации, чтобы ее брали за шкирку - это ее уставу никак не соответствует. Мы не при коммунизме живем.
If you don't find a way to make money while you sleep, you will work until you die.
Аватара пользователя
rms

 
Сообщения: 1763
Зарегистрирован: Вс ноя 26, 2006 05:06
Откуда: 95% ภูเก็ต / 5% СПб

Re: Подготовка текста под машинный перевод

Сообщение rms » Вт июн 11, 2019 20:20

Бычара писал(а):МТ - удел слабаков, чудаков и лентяев.


Вы так говорите, будто это что-то плохое.
If you don't find a way to make money while you sleep, you will work until you die.
Аватара пользователя
rms

 
Сообщения: 1763
Зарегистрирован: Вс ноя 26, 2006 05:06
Откуда: 95% ภูเก็ต / 5% СПб

Re: Подготовка текста под машинный перевод

Сообщение Бычара » Ср июн 12, 2019 16:47

Да. Это вроде как ИИ, он даже не чует разницы в тонких смыслах
Для сводок, цифр, пары слов сойдёт, как хумус под мацу
И смайлики, конечно же, - три, как и положено по нормативам )))
Аватара пользователя
Бычара
Бык Маллиган
 
Сообщения: 2506
Зарегистрирован: Сб июл 16, 2011 14:23



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в MT + PEMT

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1