Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Чувствительность CAT-программ к совпадениям в TM

Чувствительность CAT-программ к совпадениям в TM

Сообщение sparkster » Вс апр 02, 2017 11:41

Столкнулся с тем, CAT-программы находят одинаковые фрагменты текста основываясь не на общих словах, присутствующих в тексте перевода и ТМ, а на проценте совпадения (одинаковости) предложений.

К примеру, есть текст и есть много книг (англ и русские версии одних тех же книг), из которых можно сделать ТМ, при помощи выравнивателя. Однако, Кошка в ТМ будет показывать только сильно похожие предложения, но не будет показывать предложения у которых есть пересекающиеся слова. Обрабатывать кучу текста для того, чтобы выскочило несколько совпадающих предложений - бессмысленно.

Что я хочу получить:
Фраза в тексте оригинала
The sun is shining, the birds are singing

Фраза, хранящаяся в ТМ
You can't be a knight in shining red armor for everybody, every day
Ты не можешь быть рыцарем в сияющих красных доспехах для каждого, каждый день.

Пересекающееся слово - shining
То есть я бы хотел получать результаты совпадений из TM по одному слову

В какой кошке такое можно реализовать?
Аватара пользователя
sparkster

 
Сообщения: 93
Зарегистрирован: Чт фев 26, 2015 08:04





Re: Чувствительность CAT-программ к совпадениям в TM

Сообщение AsIs » Вс апр 02, 2017 12:56

А зачем? Вам придется делать двойную работу: читать оригинал, читать "перевод", выискивать общее слово, перестраивать перевод... Для чего?
Чтобы узнать перевод одного слова (двух, трех, четырех), есть функция Concordance (=поиск общих слов независимо от вида предложения в целом).
AsIs

 
Сообщения: 1081
Зарегистрирован: Ср сен 22, 2010 16:13
Язык(-и): RU-EN-RU

Re: Чувствительность CAT-программ к совпадениям в TM

Сообщение mikhailo » Вс апр 02, 2017 14:11

В какой кошке такое можно реализовать?


В любой.

Но как вы отнесётесь к тому, если предложение You can't be a knight in shining red armor for everybody, every day - будет 999 в списке предложений, выданных CAT из-за совпадений других предложений по другим словам? Или у вас есть какие-то особые признаки слов, по которым нужно искать совпадения?

Для таких целей - советую Дежу, загонять ТМХ просто файлом проекта и использовать Дежевский фильтр в Whole Project view.

Всё будет именно так, как вы хотите.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Чувствительность CAT-программ к совпадениям в TM

Сообщение rms » Вт апр 04, 2017 08:51

mikhailo писал(а):Для таких целей - советую Дежу, загонять ТМХ просто файлом проекта и использовать Дежевский фильтр в Whole Project view.


Можно еще MemoQ - TMX файлом проекта, склеить с рабочим файлом в общий View и фильтровать.
If you don't find a way to make money while you sleep, you will work until you die.
Аватара пользователя
rms

 
Сообщения: 1892
Зарегистрирован: Вс ноя 26, 2006 05:06
Откуда: 95% ภูเก็ต / 5% СПб



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Полезное программное обеспечение. Аллея Бродяги

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 6