Mikhail писал(а):Бродяга, поясните.
Поясняю. Сильного вреда от этой операции, конечно, нет. Дело только в том, что многие коды реально нужны, а при этой операции они будут удалены все.
А забавно реально то, что у вас база замусоривается так, что раз в две недели её приходится чистить. Попробуйте перед импортом Вордовых файлов делать цикл DOC->RTF->DOC. То есть сохранить исходный DOC, как RTF, закрыть его, открыть вновь, сохранить, как DOC, и уже этот DOC импортировать в Дежу. В подавляющем большинстве после этого тегов (и, как следствие, кодов) станет значительно меньше. Правда, данный подход не помогает в ситуации, когда DOC был получен, например, из PDF или из верстальной программы - там тегов будет сумасшедшее количество, и избавиться от них практически невозможно, даже после ручного переформатирования всего документа.
Ещё пара рекомендаций. По поводу цифр. Не совсем понятно, как они засоряют базу - это такие же символы, как и буквы. Лично я стараюсь их не чистить, а наоборот - обеспечивать корректный перевод цифр и сегментов, содержащих цифры (например, при переводе с английского на русский 1,234.56 меняется на 1 234,56). При этом чем больше корректно переведённых цифровых сегментов в базе, тем корректнее Дежа обрабатывает последующие сегменты. Но если уж очень хочется почистить (или вылизать), то можно использовать следующую простую методику. Откройте базу (TM) и выберите View->Toggle Sorting. После этого цифровые сегменты окажутся в самом начале списка, и с ними легче будет разобраться. То же самое можно делать и при переводе.
Насчёт однословных заголовков таблицы. Насколько я понял, речь идёт о ситуации, когда заголовок таблицы разбит на строки. Например, "Vehicle Speed" разбивается на "Vehicle" и "Speed", и при этом не хочется переводить "Vehicle", как "Скорость", а "Speed" как "автомобиля". Для этого случая существует функция Join (Ctrl+J), которая объединит эти сегменты в один, после чего останется перевести получившийся в результате "Vehicle{1}Speed", как "Скорость {1}автомобиля". После этого, конечно, придётся по ходу дела объединять и все последующие экземпляры таких заголовков, но перевод будет вставлен автоматически. Кстати, обратите внимание на пробел перед кодом в русском переводе выше (в оригинале его нет). Он нужен для того, чтобы когда этот же сегмент встретится в тексте без разбиения, он был выдан корректно. То есть, как "Скорость автомобиля", а не как "Скоростьавтомобиля".
Повторюсь насчёт кодов ещё раз. Они
реально нужны, и есть всегда и во всех кошках. Простой пример. Переводим инструкцию по ПО, содержащую предложение "Press the
OK button." В переводе, естественно, будет "Нажмите кнопку
OK." Предложение это в инструкции, скорее всего, будет встречаться немалое количество раз. И как вы представляете хранение его в базе без тегов (кодов)?
И это только простейший вариант. А представьте презентацию PowerPoint, в которой один сегмент может содержать разные шрифты разных цветов и размеров. Без тегов, естественно, никак. Правда, для переводов PowerPoint Дежа подходит не очень хорошо, в связи с отсутствием WYSIWYG и обязательным соответствием кодов в оригинале и переводе. Тут лучше TagEditor, отображающий всё, как есть (не без глюков, конечно), и позволяющий делать с тегами всё, что душе угодно, вплоть до вставки собственных, отсутствующих в оригинале (а при переводе PowerPoint это частенько приходится делать).