Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Убиваем священную корову (коды форматирования)

Убиваем священную корову (коды форматирования)

Сообщение veda » Вс апр 08, 2012 13:08

Все нам известна эта головная боль. Вот, после нескольких неудач экспортирования готовых переводов, решил поэкспериментировать с кодами Дежи х2. Кроликом будет большой файл Word с кучей картинок и списков донельзя загрязненный кодами и тупым форматированием (наверное, чужим с пдф), вплоть до написания букв одного слова через пробел.
Итак, задача - привести оригинал к файлу, содержащему мин. кол-во кодов. Жесткое условие - полное сохранение видимого форматирования.

Конвертирование, потом в Дежу, (количество кодов): Doc - 5482, Docx -27443. Нравится?
Надо отметить, невероятную скорость преобразования формата Docx в Деже, от 3 до 10 (!!!) раз быстрее старого формата.
После применения функции CZL CodeZapper 2_6: Doc - 2223, Docx -3102.

Вот пример замусоривания в DOCX:

{26222}In{26223} {26224}the{26225} {26226}i{26227}nterface{26228} {26229}of{26230} {26231}the{26232} {26233}WUT23{26234} {26235}a{26236}s{26237} {26238}s{26239}hown{26240} {26241}in{26242} {26243}Fi{26244}gure{26245} {26246}3,{26247} {26248}select{26249} {26250}Vi{26251}e{26252}w{26253}s{26254} {26255}

Пример обработки CZL CodeZapper 2_6 предложения:

Оригинал

{180}Circuit{181} {182}Status{183} {184}Trace{185}

После CZL

Circuit Status Trace

Далее, поиграемся с кодами ручками.

Контролируя изменения форматирования, удалось выявить, что Дежа спокойно относится к изменению кодов в исходнике, если они отвечают за жирн, курсив и пр. Т.е. экспортирование готового файла ПРОЙДЕТ НОРМАЛЬНО. Понадобится только восстановить измененный формат. Однако, если изменить код списка или таблицы - засада. Экспорта не будет.
Функции автовосстановления файла или авторемонта кодов не помогут.
Особенно трепетно стоит относиться к коду в начале предложения. Убитый код можно набрать прямо с клавиатуры и он будет работать. Главное - знать его номер и место.
Вот и подумалось, если сразу после открытия преобразованного файла создавать файлик Pack&Go, то потом в случае сбоя кодов можно будет найти виновника и восстановить файл. Вариант первый: просмотр вручную по предложению.
Вариант второй: макрос (последовательный поиск номера кода в оригинала). Такой макрос не представляет большой сложности и при наличии свободы в ближайшем будущем, мог бы его наваять.
На этом, позвольте раскланяться.
veda

 
Сообщения: 49
Зарегистрирован: Сб фев 04, 2012 18:18





Re: Убиваем священную корову (коды форматирования)

Сообщение mikhailo » Пн апр 09, 2012 01:19

Однако, если изменить код списка или таблицы - засада. Экспорта не будет.
Функции автовосстановления файла или авторемонта кодов не помогут.


Забейте в конец файла n-ное количество закрывающих фигурных скобок.

Пытался копаться в этом шлаке в xml докса. 100% результата добиться не удавалось - слетал xml - а поскольку DTD для ворда нет, разбираться не хватило времени, хотя отдельные группы тэгов удалял. Копаться в спецификации MS openxml желания не возникло.

Последняя версия CZ - 2.8. Надо с ней смотреть. А также CZAll.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Убиваем священную корову (коды форматирования)

Сообщение veda » Пн апр 09, 2012 14:24

Финт со скобочками знаком. Но ни разу не помог.

Да, в версии Дежи 8....505 внедрили фильтр CodeZapper для Word.
По непроверенным мной данным, чистит даже лучше (может настроен под Дежу), чем добавка к Word.

Атрил - молодцы!

Роюсь в импортных форумах, есть интересное. Постараюсь выложить здесь.
veda

 
Сообщения: 49
Зарегистрирован: Сб фев 04, 2012 18:18

Re: Убиваем священную корову (коды форматирования)

Сообщение veda » Пт апр 20, 2012 00:09

Есть прикольный внешний макрос, который может на время спрятать все коды в предложении оригинала. Как известно, они, коды эти, путаются под ...глазами, мешают уловить суть.
Нажал комбинацию - кодов нет, снова нажал - восстановились. Только макрос должен висеть в памяти все время. Но он совсем крошечный, ресурсов не ест.
Взял его с Прозы. Только превратил в exe. Выложу потом. Сегодня спать пора.
veda

 
Сообщения: 49
Зарегистрирован: Сб фев 04, 2012 18:18

Re: Убиваем священную корову (коды форматирования)

Сообщение Platov » Ср сен 07, 2016 16:30

veda писал(а):Контролируя изменения форматирования, удалось выявить, что Дежа спокойно относится к изменению кодов в исходнике, если они отвечают за жирн, курсив и пр.

А возможно как-то совсем удалить коды форматирования из оригинала? В инструкции об этом ничего не сказано. :-(
Platov

 
Сообщения: 3
Зарегистрирован: Ср сен 07, 2016 09:06



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Déjà Vu

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2