Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Теги {1}{2}{3} в MemoQ

Теги {1}{2}{3} в MemoQ

Сообщение nothing_special » Ср июл 30, 2014 14:02

Уважаемые коллеги!

Возникла проблема при работе с MemoQ 2013. Не заметила сразу, что при импорте документа, половина импортировалась нормально, а во второй половине в каждом сегменте слова разделены друг от друга тегами {1}{2}{3} и так далее. Переводить совершенно неудобно. Подскажите, есть ли способ исправить подобную ситуацию?
P.S. Форматирование исходного документа крутила-вертела и мучила разными методами, безрезультатно.
Вложения
memoQ - контракт карл_2014-07-30_14-47-15.png
Например:
memoQ - контракт карл_2014-07-30_14-47-15.png (21.74 КБ) Просмотров: 2530
Аватара пользователя
nothing_special

 
Сообщения: 16
Зарегистрирован: Ср мар 17, 2010 12:16
Откуда: Москва
Язык(-и): Англ, рус, ит





Re: Теги {1}{2}{3} в MemoQ

Сообщение Vic » Ср июл 30, 2014 14:17

Похоже, это связано с разборкой пдф текста в ФР.
Попробуйте использовать программку CodeZapper (не знаю, встроена ли она в 2013, проверьте; но если нет, она живет и отдельно).
Я использую в основном в Деже, в которой она встроена. При включении этой функции при импорте в проект количество тегов уменьшается в десятки раз. Практически, остаются только необходимые.
Vic

 
Сообщения: 1876
Зарегистрирован: Вт дек 16, 2003 13:40
Откуда: Москва

Re: Теги {1}{2}{3} в MemoQ

Сообщение nothing_special » Ср июл 30, 2014 14:19

Прогнать исходник через CodeZapper и реимпортировать? Я с реимпортом не дружу, у меня всё переведенное моментально стирается
Аватара пользователя
nothing_special

 
Сообщения: 16
Зарегистрирован: Ср мар 17, 2010 12:16
Откуда: Москва
Язык(-и): Англ, рус, ит

Re: Теги {1}{2}{3} в MemoQ

Сообщение Vic » Ср июл 30, 2014 14:30

Не совсем понял.
Измените имя исходного файла и прогоните CodeZapper (кстати, встроена ли эта функция в 2013?) и импортируйте в этот же проект. Соответственно, новый файл уже автоматически подключен к той же самой ТМ, с которой вы и работали. Так что с самого начала автоперевод, а уж далее будете работать с файлом без мусора.
Vic

 
Сообщения: 1876
Зарегистрирован: Вт дек 16, 2003 13:40
Откуда: Москва

Re: Теги {1}{2}{3} в MemoQ

Сообщение nothing_special » Ср июл 30, 2014 14:33

CodeZapper не импортирован в 2013. Сейчас попробую, спасибо)
Аватара пользователя
nothing_special

 
Сообщения: 16
Зарегистрирован: Ср мар 17, 2010 12:16
Откуда: Москва
Язык(-и): Англ, рус, ит

Re: Теги {1}{2}{3} в MemoQ

Сообщение esperantisto » Ср июл 30, 2014 14:37

Можно и без CodeZapper попробовать обойтись: для всего текста установить одинаковый цвет шрифта/кегль/кернинг/трекинг/гарнитуру/язык. Может получиться очень даже хорошо.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6747
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Теги {1}{2}{3} в MemoQ

Сообщение esperantisto » Ср июл 30, 2014 14:38

Окольный вариант: выгрузить в MQXLIFF, перевести в OmegaT с выключенными тэгами, импортировать.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6747
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Теги {1}{2}{3} в MemoQ

Сообщение nothing_special » Ср июл 30, 2014 14:42

Исходный документ я уже исправляла и форматировала разными способами. Сейчас попробую в RTF почистить теги, импортировать, а потом ручками вставить переведенное в нужный документ.
Аватара пользователя
nothing_special

 
Сообщения: 16
Зарегистрирован: Ср мар 17, 2010 12:16
Откуда: Москва
Язык(-и): Англ, рус, ит

Re: Теги {1}{2}{3} в MemoQ

Сообщение nothing_special » Ср июл 30, 2014 14:47

Не получилось ничего с RTF.
Аватара пользователя
nothing_special

 
Сообщения: 16
Зарегистрирован: Ср мар 17, 2010 12:16
Откуда: Москва
Язык(-и): Англ, рус, ит

Re: Теги {1}{2}{3} в MemoQ

Сообщение Vic » Ср июл 30, 2014 14:50

Судя по тому, что показано, там едва ли цвет, кегль и пр. Если бы были, это было бы логично. Скорее, это скрытые теги при разборке текста. Они бесполезные практически, тем не менее противные.
Vic

 
Сообщения: 1876
Зарегистрирован: Вт дек 16, 2003 13:40
Откуда: Москва

Re: Теги {1}{2}{3} в MemoQ

Сообщение nothing_special » Ср июл 30, 2014 14:53

В общем, времени на удаление и облегчение работы нет, придется мучиться так, ведь, как всегда, перевод нужен вчера)
Впосл., конечно, возьму за правило проверять документ полностью перед началом работы :evil: а то не очень приятно после 60% хорошего текста обнаружить вот это :149:
Аватара пользователя
nothing_special

 
Сообщения: 16
Зарегистрирован: Ср мар 17, 2010 12:16
Откуда: Москва
Язык(-и): Англ, рус, ит

Re: Теги {1}{2}{3} в MemoQ

Сообщение esperantisto » Ср июл 30, 2014 14:55

Если текст не сильно замороченно отформатированный, попробуйте с помощью Apache OpenOffice преобразовать в ODT и обратно, тоже помогает. Собственно, и сам ODT можно перевести в MemoQ.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6747
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Теги {1}{2}{3} в MemoQ

Сообщение mikhailo » Ср июл 30, 2014 15:10

CodeZapper вам в помощь
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3507
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Теги {1}{2}{3} в MemoQ

Сообщение John Gower » Ср июл 30, 2014 15:38

Можно вставить распознанный текст в Блокнот, а потом в Word. И тегов никаких.
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1332
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (6)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Теги {1}{2}{3} в MemoQ

Сообщение Валерий Афанасьев » Ср июл 30, 2014 18:39

TransTools Utilities шибко хорошо помогают. И, как по мне, так получше Код-Заппера будут.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Теги {1}{2}{3} в MemoQ

Сообщение Maxteams » Ср июл 30, 2014 18:43

Есть два способа избавиться от "Тэгов" в MemoQ:
1) Откройте исходный документ, до его импортирования в MemoQ, в Word. Выделите весь документ и очистите форматирование всего документа. В Word 2010 есть такая функция.
2) Откройте документ в Word, а затем сохраните его в формате "Простой текст", т.е. в *.txt. После этого открываем документ в Word и снова сохраняем в *.doc. Или можно импортировать txt-ый документ в MemoQ.
Есть еще один способ, но там много "телодвижений": нужно открыть документ в Word, вырезать его и скопировать в простой текстовый редактор, например в Notepad++, затем из Notepadd++ снова перенести документ в Word. И после этого сохранить документ.
В любом случае никаких "Тегов" после этого не будет.
CodeZapper - конечно хорошая штучка, но она полностью не очищает документ от тегов.
Maxteams

 
Сообщения: 46
Зарегистрирован: Чт май 12, 2011 18:55

Re: Теги {1}{2}{3} в MemoQ

Сообщение Vic » Ср июл 30, 2014 19:31

Maxteams писал(а):CodeZapper - конечно хорошая штучка, но она полностью не очищает документ от тегов.

Это верно. Но есть некая сложность. И дело не в лишних операциях ( а кстати, уж ежели решили использовать txt, то нафига его возвращать в Ворд?). К сожалению, в подавляющей части клиентом предоставляется вордовский (или в пдф формате, что то же самое по внешнему виду) файл и умный клиент отлично понимает, что за одни деньги он фактически получает две работы - и перевод как таковой, и отформатированный файл. Не зря время от времени возникает именно этот вопрос "слишком тегов"; они не возникают в других форматах.
Текстовый документ не понимает, что такое теги. Это хорошо. Но в вордовских (и не только в них, используются, скажем документы для InDesing или FraveMaker, да и любые аналогичные, которые так или иначе связаны с форматированием теста, обобщая - DTP). Так что есть теги плохие, мусорные, а есть и необходимые, например, атрибуты шрифта, специальные символы (например, верхний или нижний индексы и пр.) и т.д. CodeZapper удавит только мусорные теги, а все важные теги остаются. А если использовать текстовый файл - да, тегов вообще не будет, но тогда после перевода потребуется отформатировать весь документ. А это надо?
Vic

 
Сообщения: 1876
Зарегистрирован: Вт дек 16, 2003 13:40
Откуда: Москва

Re: Теги {1}{2}{3} в MemoQ

Сообщение Валерий Афанасьев » Ср июл 30, 2014 20:02

Еще, вдруг пригодится. М.б. не 100% в тему, но близко к ней.

1. ПДФ (неважно, редактируемый или нет) згнать в Файнридер.
2. Каждую страницу пометить целиком, всю область, полностью, как картинку.
3. Внутри получившейся полностью красной страницы повыделять инструментом "Текст" требующие перевода области. Получится куча зелененьких квадратиков на красном фоне. Я знаю, что это гимор, ибо в нем живу, но - вот так и точка.
4. Итог такого вот ручного анализа сохраняем как ПДФ (!). Получаем редактируемый ПДФ с сохранением макета исходника.
5. Вгоняем его в Инфикс. Подчищаем концы строк и текстбоксы, по вкусу. Настоятельно рекомендуется все несистемные шрифты типа Миринды Санс Фланклин заменить на системные типа Ариал Нэрроу или Таймас нашего, Романа. Форматирование чутку слетит, но лишь чутку, да и фиг с ним, все вопросы - в принтшоп? к проф. верстальщикам.
6. Экспортируем в xml. Вгоняем xml в "кошку".
7. Пролистываем (пока еще не претранслейтим), смотрим, не осталось ли где "левых" тегов. Если остались, возвращаемся в Инфикс и допиливаем. Иногда я "делаю это" раз по 6-7.
8. Переводим.
9. Возвращаем перевод в Инфикс. Допиливаем текстбоксы.
10. Наслаждаемся пидиэфкой точь-в-точь как настоящая. Ну прямо как живая.
11. Отправляем заказчику и идем пить пиво.

Выложено частично на ютюб, заходите, смотрите. Будут доп. вопросы, обращайтесь в личку, попробую показать процесс вживую в Тимвьюере.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Теги {1}{2}{3} в MemoQ

Сообщение Maxteams » Ср июл 30, 2014 20:32

Я по поводу 11-го пункта
11. Отправляем заказчику и ....
Это так не одна печень не выдержит!
Maxteams

 
Сообщения: 46
Зарегистрирован: Чт май 12, 2011 18:55

Re: Теги {1}{2}{3} в MemoQ

Сообщение mikhailo » Ср июл 30, 2014 20:46

Выложено частично на ютюб, заходите, смотрите. Будут доп. вопросы, обращайтесь в личку, попробую показать процесс вживую в Тимвьюере.


Ну-ну - хотелось бы посмотреть как Вы 120% перевод будете впихивать в текстбоксы под 100% оригинал, когда второй и так еле влазит на страницу. Привет 6пт и Narrow шрифты, от которых потом глаза на лоб вылазят, если нет моника 34".

Ваша методика хороша для перевода документов где пустые нижние поля 20-30% площади страницы, нет обтекаемых иллюстраций, оглавлений, алфавитных указателей.

Что касается CodeZappera - да он не удаляет тэги hintинга шрифтов и ещё кое какие. Но просмотрев в Деже их можно удалить из doc xml простым поиском и заменой. Недавно как раз пришлось перепиливать такой док, созданный в ЮВА.

Кстати прорекламирую ещё один интересный и полезный макрос - Методичка.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3507
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в MemoQ

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1