Столкнулся с тем, CAT-программы находят одинаковые фрагменты текста основываясь не на общих словах, присутствующих в тексте перевода и ТМ, а на проценте совпадения (одинаковости) предложений.
К примеру, есть текст и есть много книг (англ и русские версии одних тех же книг), из которых можно сделать ТМ, при помощи выравнивателя. Однако, Кошка в ТМ будет показывать только сильно похожие предложения, но не будет показывать предложения у которых есть пересекающиеся слова. Обрабатывать кучу текста для того, чтобы выскочило несколько совпадающих предложений - бессмысленно.
Что я хочу получить:
Фраза в тексте оригинала
The sun is shining, the birds are singing
Фраза, хранящаяся в ТМ
You can't be a knight in shining red armor for everybody, every day
Ты не можешь быть рыцарем в сияющих красных доспехах для каждого, каждый день.
Пересекающееся слово - shining
То есть я бы хотел получать результаты совпадений из TM по одному слову
В какой кошке такое можно реализовать?
|
||
Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы | ||