Страница 1 из 1

Подготовка текста под машинный перевод

СообщениеДобавлено: Сб июн 08, 2019 01:03
sparkster
Не могли бы подсказать, где можно почитать материал про подготовку текста под машинный перевод, чтобы сэкономить время на постредактировании?

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Сб июн 08, 2019 13:56
mikhailo
какого текста? под какой МП? В какой паре языков? На какие настройки МП (если G, DL, MS вы можете повлиять)?
Читайте
https://www.researchgate.net/publicatio ... ce_Content

Кое какие мысли и идеи есть, но пока не оформлены в виде почитать другим

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Пн июн 10, 2019 14:26
OlegV
sparkster писал(а):Не могли бы подсказать, где можно почитать материал про подготовку текста под машинный перевод, чтобы сэкономить время на постредактировании?


Какой инструмент МП Вы планируете использовать? Одна из основных проблем - плохо настроенный словарь МП. Под вашу задачу и лексику. Мой опыт показывает: чем лучше настроен словарь МП (еще до начала пост-редактирования), тем проще само пост-редактирование.

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 12:28
Бычара
Овчинка выделки не стоит. МТ - удел совсем недопереводчиков.

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 12:33
mikhailo
МТ - удел совсем недопереводчиков.


Как-то кучно с утра пошло....

Для одного технический перевод - примитивный, для другого МТ - удел недопереводчиков.....

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 14:35
Бычара
Поясню для танкистов: любой перевод выполняется человеком, кто: а) знает иностранный язык (№?:во или за%:"сь, но знает); 2) владеет нормами языка, куда он переводит; 3) имеет хоть какой-то опыт.
Машинный перевод и подготовка текста под него - две разные вещи, обе не имеют смысла, кроме случаев текстов в виде перечислений дат и двух пар слов, с этим справится даже Бабель Фиш.

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 15:00
mikhailo
Поясню для танкистов: любой перевод выполняется человеком, кто: а) знает иностранный язык (№?:во или за%:"сь, но знает); 2) владеет нормами языка, куда он переводит; 3) имеет хоть какой-то опыт.
Машинный перевод и подготовка текста под него - две разные вещи, обе не имеют смысла, кроме случаев текстов в виде перечислений дат и двух пар слов, с этим справится даже Бабель Фиш.


Поясню для тех, кто в танке, в подводном бункере, в Марианской впадине.....

Воспользуюсь простой аналогией.... Хороший повар знает, как готовить, и всегда сам выбирает продукты (готовится к последующей готовке). Нормальный учитель сам приложит силы к отбору тех учеников, с которыми он будет работать. Это нормально и естественно.....

Точно так же и подготовка к машинному переводу только тогда будет нормальной, когда заниматься ей будет человек, знающий и понимающий МП. А поскольку даже Промт сильно не раскрывает подробностей алгоритма, хотя и позволяет хоть что-то настроить, то проблема становится сложнее

Чтобы понять алгоритм - ему надо скормить 1-2-3-4-5-6-7 и, как повезёт, переработанных вариантов текста, посмотреть, что получится на выходе и в идеале, добиться чего-то вменяемого. После этого проанализировать изменения и вывести правила преобразования текста, которые затем проверить хотя бы на 10-ке примеров... После этого возникнет какое-то понимание того, что делается внутри. Причём с GL/DL очень желательно, чтобы какая-нибудь пачка параллельных текстов, переработанная за это время, не поменяла весовые коэффициенты в системе линейных уравнений алгоритмов машинного обучения..... Это опять таки делает ПРОМТ единственным МП, более/менее надёжным для анализа. Учитывая вышеизложенное, получаем, что, в принципе, данная работа тянет на хорошую, если не превосходную, курсовую, диплом, магистерскую работу толкового студента.....

В принципе этой работой давно должен был бы заняться отдел переводов какой-нибудь крупной компании в большим объёмом переводов за границу (свой текст править проще, требования к переведённому тексту там из-за наплыва не нейтивов в последнее время стали гораздо ниже), типа Атомстройэкспорта, Оборонэкспорта (особенно с его армейской дисциплиной), взяв за шкирку ПРОМТ и имея его вдоль и поперёк, чтобы там работали, а не просиживали штаны, меняя номерки в выпускаемых версиях...

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 15:20
Бычара
Я не буду объяснять человеку, который делает ошибки в русском и английском языке, насколько он заблудился в трех тополях на Плющихе.
МТ - удел слабаков, чудаков и лентяев.

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 15:31
Lohh_ness
взяв за шкирку ПРОМТ и имея его вдоль и поперёк, чтобы там работали, а не просиживали штаны, меняя номерки в выпускаемых версиях...


Тихо рыдаю над утопичностью представленной модели...

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 20:14
rms
mikhailo писал(а):...взяв за шкирку ПРОМТ и имея его вдоль и поперёк, чтобы там работали, а не просиживали штаны, меняя номерки в выпускаемых версиях...


Интересно, зачем коммерческой организации, чтобы ее брали за шкирку - это ее уставу никак не соответствует. Мы не при коммунизме живем.

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Вт июн 11, 2019 20:20
rms
Бычара писал(а):МТ - удел слабаков, чудаков и лентяев.


Вы так говорите, будто это что-то плохое.

Re: Подготовка текста под машинный перевод

СообщениеДобавлено: Ср июн 12, 2019 16:47
Бычара
Да. Это вроде как ИИ, он даже не чует разницы в тонких смыслах
Для сводок, цифр, пары слов сойдёт, как хумус под мацу