Страница 1 из 1

Убиваем священную корову (коды форматирования)

СообщениеДобавлено: Вс апр 08, 2012 13:08
veda
Все нам известна эта головная боль. Вот, после нескольких неудач экспортирования готовых переводов, решил поэкспериментировать с кодами Дежи х2. Кроликом будет большой файл Word с кучей картинок и списков донельзя загрязненный кодами и тупым форматированием (наверное, чужим с пдф), вплоть до написания букв одного слова через пробел.
Итак, задача - привести оригинал к файлу, содержащему мин. кол-во кодов. Жесткое условие - полное сохранение видимого форматирования.

Конвертирование, потом в Дежу, (количество кодов): Doc - 5482, Docx -27443. Нравится?
Надо отметить, невероятную скорость преобразования формата Docx в Деже, от 3 до 10 (!!!) раз быстрее старого формата.
После применения функции CZL CodeZapper 2_6: Doc - 2223, Docx -3102.

Вот пример замусоривания в DOCX:

{26222}In{26223} {26224}the{26225} {26226}i{26227}nterface{26228} {26229}of{26230} {26231}the{26232} {26233}WUT23{26234} {26235}a{26236}s{26237} {26238}s{26239}hown{26240} {26241}in{26242} {26243}Fi{26244}gure{26245} {26246}3,{26247} {26248}select{26249} {26250}Vi{26251}e{26252}w{26253}s{26254} {26255}

Пример обработки CZL CodeZapper 2_6 предложения:

Оригинал

{180}Circuit{181} {182}Status{183} {184}Trace{185}

После CZL

Circuit Status Trace

Далее, поиграемся с кодами ручками.

Контролируя изменения форматирования, удалось выявить, что Дежа спокойно относится к изменению кодов в исходнике, если они отвечают за жирн, курсив и пр. Т.е. экспортирование готового файла ПРОЙДЕТ НОРМАЛЬНО. Понадобится только восстановить измененный формат. Однако, если изменить код списка или таблицы - засада. Экспорта не будет.
Функции автовосстановления файла или авторемонта кодов не помогут.
Особенно трепетно стоит относиться к коду в начале предложения. Убитый код можно набрать прямо с клавиатуры и он будет работать. Главное - знать его номер и место.
Вот и подумалось, если сразу после открытия преобразованного файла создавать файлик Pack&Go, то потом в случае сбоя кодов можно будет найти виновника и восстановить файл. Вариант первый: просмотр вручную по предложению.
Вариант второй: макрос (последовательный поиск номера кода в оригинала). Такой макрос не представляет большой сложности и при наличии свободы в ближайшем будущем, мог бы его наваять.
На этом, позвольте раскланяться.

Re: Убиваем священную корову (коды форматирования)

СообщениеДобавлено: Пн апр 09, 2012 01:19
mikhailo
Однако, если изменить код списка или таблицы - засада. Экспорта не будет.
Функции автовосстановления файла или авторемонта кодов не помогут.


Забейте в конец файла n-ное количество закрывающих фигурных скобок.

Пытался копаться в этом шлаке в xml докса. 100% результата добиться не удавалось - слетал xml - а поскольку DTD для ворда нет, разбираться не хватило времени, хотя отдельные группы тэгов удалял. Копаться в спецификации MS openxml желания не возникло.

Последняя версия CZ - 2.8. Надо с ней смотреть. А также CZAll.

Re: Убиваем священную корову (коды форматирования)

СообщениеДобавлено: Пн апр 09, 2012 14:24
veda
Финт со скобочками знаком. Но ни разу не помог.

Да, в версии Дежи 8....505 внедрили фильтр CodeZapper для Word.
По непроверенным мной данным, чистит даже лучше (может настроен под Дежу), чем добавка к Word.

Атрил - молодцы!

Роюсь в импортных форумах, есть интересное. Постараюсь выложить здесь.

Re: Убиваем священную корову (коды форматирования)

СообщениеДобавлено: Пт апр 20, 2012 00:09
veda
Есть прикольный внешний макрос, который может на время спрятать все коды в предложении оригинала. Как известно, они, коды эти, путаются под ...глазами, мешают уловить суть.
Нажал комбинацию - кодов нет, снова нажал - восстановились. Только макрос должен висеть в памяти все время. Но он совсем крошечный, ресурсов не ест.
Взял его с Прозы. Только превратил в exe. Выложу потом. Сегодня спать пора.

Re: Убиваем священную корову (коды форматирования)

СообщениеДобавлено: Ср сен 07, 2016 16:30
Platov
veda писал(а):Контролируя изменения форматирования, удалось выявить, что Дежа спокойно относится к изменению кодов в исходнике, если они отвечают за жирн, курсив и пр.

А возможно как-то совсем удалить коды форматирования из оригинала? В инструкции об этом ничего не сказано. :-(