Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Сравнить два списка

Сравнить два списка

Сообщение sparkster » Ср авг 14, 2019 23:26

Задача такова: ведутся две терминологические базы в кошке (OmegaT) и в системе машинного перевода (Promt). Обе базы могут быть представлены в .txt с разделителями табуляции. Поскольку базы ведутся независимо, нужен способ, который позволит их сравнить, увидеть разницу и дополнить друг друга
Аватара пользователя
sparkster

 
Сообщения: 93
Зарегистрирован: Чт фев 26, 2015 08:04





Re: Сравнить два списка

Сообщение mikhailo » Чт авг 15, 2019 00:45

импорт в Эксель и сортировки/формулы/удаление дубликатов и т.п. или любыми компараторами после сортировки.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Сравнить два списка

Сообщение OlegV » Чт авг 15, 2019 14:28

sparkster писал(а):Задача такова: ведутся две терминологические базы в кошке (OmegaT) и в системе машинного перевода (Promt). Обе базы могут быть представлены в .txt с разделителями табуляции. Поскольку базы ведутся независимо, нужен способ, который позволит их сравнить, увидеть разницу и дополнить друг друга


Поинтересуйтесь у представителей компании PROMT, смогут ли они такую процедуру сделать с вашими базами. Возможно, у них есть отдельная утилита для подобных задач.
OlegV

 
Сообщения: 385
Зарегистрирован: Сб дек 11, 2004 15:57
Откуда: СПб
Язык(-и): EN->RU

Re: Сравнить два списка

Сообщение sparkster » Чт авг 15, 2019 21:01

OlegV писал(а):
sparkster писал(а):Задача такова: ведутся две терминологические базы в кошке (OmegaT) и в системе машинного перевода (Promt). Обе базы могут быть представлены в .txt с разделителями табуляции. Поскольку базы ведутся независимо, нужен способ, который позволит их сравнить, увидеть разницу и дополнить друг друга


Поинтересуйтесь у представителей компании PROMT, смогут ли они такую процедуру сделать с вашими базами. Возможно, у них есть отдельная утилита для подобных задач.

С них и начал. Сказали, что адаптация их продуктов осуществляется самим заказчиком
Аватара пользователя
sparkster

 
Сообщения: 93
Зарегистрирован: Чт фев 26, 2015 08:04

Re: Сравнить два списка

Сообщение rms » Чт авг 15, 2019 21:16

sparkster писал(а):Поскольку базы ведутся независимо, нужен способ, который позволит их сравнить, увидеть разницу и дополнить друг друга


Мне кажется, много чего можно придумать.
Я бы Олифантом все перевел в .tmx, затем tmx-ы загрузил в MemoQ как двуязычные файлы на перевод (не как TM). Если возможен несогласованный перевод одинаковых сегментов - провел бы автоматический QA с созданием списка inconsistencies и выполнил выбраковку. Дальше: создаем View -> выбираем дополнительные настройки, там выбираем Minimum Frequency = 1 и убираем флажок в Keep Duplicates. Получаем View из уникальных сегментов в двух TM-ах, причем в View, насколько я помню, отображаться будут сегменты первого по порядку файла, а второй отобразится по остаточному. Дальше работаем, как требуется. Надо посмотреть, чем вторая по порядку память Б отличается от первой по порядку памяти А - ставим блокировку на памяти А и изучаем уникальные сегменты памяти Б. Ну вот в таком духе. Потом можно экспортировать нужные сегменты обратно в .tmx и далее в .txt.
If you don't find a way to make money while you sleep, you will work until you die.
Аватара пользователя
rms

 
Сообщения: 1892
Зарегистрирован: Вс ноя 26, 2006 05:06
Откуда: 95% ภูเก็ต / 5% СПб

Re: Сравнить два списка

Сообщение sparkster » Пт авг 16, 2019 08:14

mikhailo писал(а):импорт в Эксель и сортировки/формулы/удаление дубликатов и т.п. или любыми компараторами после сортировки.
А какие компараторы можете порекомендовать?
Аватара пользователя
sparkster

 
Сообщения: 93
Зарегистрирован: Чт фев 26, 2015 08:04

Re: Сравнить два списка

Сообщение mikhailo » Пт авг 16, 2019 10:54

А какие компараторы можете порекомендовать?


Для plain текста — любые - Araxis, beyond compare, Emeditor
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Полезное программное обеспечение. Аллея Бродяги

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 17