Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

MT2007 => Catnip

Сообщение Andrew Manson » Пн мар 05, 2007 13:12

Бродяга
Я тут выложил кумулятивный апдейт, ко-е что подправил, возможно исправит ошибку, возникающую у Вас.
Кстати, я тут продумал механизм формирования файла с переводом с сохранением макета оригинала (форматирование) для Ворда 2007 (docx), как сделаю - выложу в доступ.....
ftp://cosmos2.info.tm/downloads/MT2007_update2.rar

Andrej
А вы качните демку Солида с их сайта


Простите, откуда ? дайте ссылку...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27





Сообщение Бродяга » Пн мар 05, 2007 13:15

www.solidpdf.com

Кстати, после апдейта ошибка действительно ушла.
Последний раз редактировалось Бродяга Пн мар 05, 2007 13:17, всего редактировалось 1 раз.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Пн мар 05, 2007 13:17

mikegor
Какой пароль на архив ?

У Вас есть исходник, и когда система падает, или не так что-то делает, Вы знаете сразу или, по крайней мере можете быстро найти, где и что надо поменять.


Нет, ну можно ведь отладить до приемлемого (релизного) состояния, то есть практически без ошибок.....
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение mikegor » Пн мар 05, 2007 13:19

Да, забыл написать пароль. У меня всегда: trworkshop
An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!
Аватара пользователя
mikegor

 
Сообщения: 2334
Зарегистрирован: Пт дек 02, 2005 20:47
Откуда: Moscow
Язык(-и): нем-рус,дат-рус

Сообщение Бродяга » Пн мар 05, 2007 13:19

mikegor, проблема с немецким стара, как мир, причём это проблема не Традоса, а Ворда (именно он вставляет эти теги). Прогоните файл через DOC->RTF->DOC. Перед этим можно ещё и язык для всего документа указать.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение mikegor » Пн мар 05, 2007 13:25

Эти конкретно теги вставляет Файнридер. Конечно, я не спорю, в данном конкретном случае проблема решается без всяких дополнительных средств. DOC->RTF->DOC в таких случаях не помогает, а просто провести метлой по абзацу, или пометить весь текст и установить единые свойства шрифта (Формат - Шрифт - Интервал) - и лишние теги уйдут.
Но у меня сейчас под рукой не оказалось примеров, где такой простой способ не работает, потому что все, что было загажено лишними тегами, я так или иначе руками прочистил.
An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!
Аватара пользователя
mikegor

 
Сообщения: 2334
Зарегистрирован: Пт дек 02, 2005 20:47
Откуда: Moscow
Язык(-и): нем-рус,дат-рус

Сообщение Andrew Manson » Пн мар 05, 2007 13:55

mikegor
Посмотрел текст. Или я чего-то не понимаю, или Вы не тот мне файл прислали. По моему он достаточно хорошо отформатирован. И дежавю его схавал нормально....
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Пн мар 05, 2007 14:00

mikegor
Кажется я понял о чем речь, Вы имеете в виду, что происходит разбивка слова на несколько составляющих в тех местах, где нестандартные буквы встречаются, и эти части помечаются отдельными тегами ? В этом дело ?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение mikegor » Пн мар 05, 2007 14:08

{1}f{2}ü{3}r die Messgr{4}öß{5}e Temperatur{6}
Да, именно в этом, и это мешает. Причем здесь случай простой, и теги можно убрать нехитрыми средствами, но это далеко не всегда так. Я только что чистил базу Традоса. Экспортировал в tmx, и дальше удалял лишние теги текстовым редактором (UltraEdit). Там была куча лишних тегов <ph>...</ph> (но не все ph-теги лишние, некоторые нужны). Причем стояли они в совершенно произвольных местах, где-то внутри слов.
An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!
Аватара пользователя
mikegor

 
Сообщения: 2334
Зарегистрирован: Пт дек 02, 2005 20:47
Откуда: Moscow
Язык(-и): нем-рус,дат-рус

Сообщение Бродяга » Пн мар 05, 2007 14:31

mikegor писал(а):Экспортировал в tmx, и дальше удалял лишние теги текстовым редактором (UltraEdit).

Вы бы ещё в хекс-эдиторе это делали. Что, Oliphant ( http://www.translate.com/technology/tools/Olifant.html ) отменили?
Последний раз редактировалось Бродяга Пн мар 05, 2007 14:33, всего редактировалось 1 раз.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Пн мар 05, 2007 14:31

Кстати не подскажете, кто-нить занимался конвертированием DOC->XML->DOC ?

Косяки встречаются или все корректно проходит, я имею в виду восстановление исходного документа ?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Пн мар 05, 2007 14:32

Я не занимался, поскольку лениво было переводить ненужный документ.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение mikegor » Пн мар 05, 2007 15:03

Бродяга писал(а):Oliphant отменили?

Он у меня давно есть. Забыл просто о нем. А в УльтраЕдит совсем неплохо получается. Он поддерживает регулярные выражения, и очень быстро все делает.
An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!
Аватара пользователя
mikegor

 
Сообщения: 2334
Зарегистрирован: Пт дек 02, 2005 20:47
Откуда: Moscow
Язык(-и): нем-рус,дат-рус

Сообщение Andrew Manson » Сб мар 10, 2007 00:50

Доброго всем времени суток !

Выкладываю очередное обновление программы MT2007
ftp://cosmos2.info.tm/downloads/MT2007_update3.rar

Что изменилось:
1) Самое главное - теперь работает с форматом docx (Word 2007) в полном объеме с возможностью выгрузки перевода в файл docx с сохранением форматирования оригинала. Работает достаточно быстро, фильтрует "мусорные" символы в тексте.....Далее в планах - возможность редактирования мультимедийных (картинок и прочих) вставок в файле оригинала внешними средствами с сохранением изменений в файле перевода. (Если кто раньше для теста делал импорт файла docx для ознакомления - этот проект не пойдет, нужно заного создать новый проект)

(Замечание - на одной машине проявилась ситуация, кода сразу после создания проекта, последующего перевода и формирования файла перевода возникала ошибка, но при открытии уже запомненной базы перевода при формировании файла перевода все проходит нормально. На других машинах повторить не удалось. Если у кого возникнет - сообщите, буду дальше думать)

2) Бродяга, избавился от раздражающих Вас квадратиков в конце предложений.

3) Неприятная новость - собаки из Гугла поставили защитку на пользование сервисом их перевода. Если производить из моей программы массовый перевод текста с использованием сервиса Гугла, предложений через 100, иногда больше, они (Гугл) блокируют IP машины, с которой ведется перевод на неопределенное время (на работе уже сутки не пускают) и говорят, что, мол у Вас какой-то вирус пытается нас завалить 8-)... Но при использовании сервиса в процессе перевода (не массово - а при необходимости) все идет нормально.

Ранее я обещал рассмотреть возможность написания утилиты редактирования тегов в Вордовских файлах. В принципе я разобрался что там к чему, только не могу придумать удобный интерфейс как с этим работать. Как только все в голове устаканится - напишу, но это 2-3 недели примерно при благоприятных условиях, сейчас есть срочный заказ, времени мало, кстати перевод делаю на MT2007, причем файлы перевел в формат docx, почему-то мне кажется удобнее и лучше там работает.......
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Сб мар 10, 2007 10:00

Похоже, что форматирование текста внутренними тегами так и не поддерживается. Например, следующее предложение:

This is a text in bold and italic, containing a hyperlink.

вкачивается, как

This is a text in bold and italic, containing a .

Что-то надо делать!
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Сб мар 10, 2007 12:39

Бродяга писал(а):Похоже, что форматирование текста внутренними тегами так и не поддерживается. !


Здесь Вы правы, что с внутренними тегами я не работаю, мне просто кажется, что проще потом в готовом тексте перевода подкорректировать текст, чем разводить геморрой с тегами, судя по тому как с ними работает дежа, это тот еще гимор, постоянные несоответстия тегов, постоянные их корректировки. К тому же ворд выставляет кучу тегов там, где вроде бы и не надо, например в варианте немецкого с умлаутами одно слово может быть разбито на несколько кусков....Вот почему-то мне тексты для переводов достаются практически без сложого форматирования, может в этом все дело ?

А формат для всего предложения у меня ставится по формату первого слова в предложении....

А с гиперссылками Вы правы, здесь я посмотрю...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Сб мар 10, 2007 15:57

Нет, маэстро, с тегами работать придётся. Хотя бы как в Деже (никаких особых проблем при аккуратной работе там не возникает). А лучше - с отображением реального текста тегов (в защищённом виде). Расстановка форматирования в готовом переводе - это не тот подход. Можете себе представить документ страниц этак на 500, в котором различные шрифты с различным оформлением в каждом предложении? Каково будет его потом вручную переформатировать? А это вполне рядовой случай при переводе документации к какой-нибудь программе. К тому же часто теги несут реальную смысловую нагрузку, и их значения необходимо учитывать при переводе.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Сб мар 10, 2007 16:27

Бродяга писал(а):Нет, маэстро, с тегами работать придётся. Хотя бы как в Деже (никаких особых проблем при аккуратной работе там не возникает). А лучше - с отображением реального текста тегов (в защищённом виде).


Хорошо, возможно Вы правы, в конце концов Вам, долгое время работающим с данными системами должно быть виднее. Тогда насчет отображения реального текста тегов. В ворде, по крайней мере в 2007, для каждого выделенного блока в предложении, может быть несколько форматных тегов, если выводить их все, то за ними может потеряться сам текст. Тогда может имеет смысл хранить два варианта текста - с тегами и без них, как для оригинала, так и для перевода, между которыми можно будет переключаться ? Без тегов текст потом засовывать в общую базу переводов, а с тегами чисто в локальной базе по документу.... А может теги лучше переназвать по смыслу ? Например <жирный></жирный>, и так далее ?

К тому же часто теги несут реальную смысловую нагрузку, и их значения необходимо учитывать при переводе.


Какую смысловую нагрузку ? Пример ?
[/quote]
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Сб мар 10, 2007 17:21

Два примера.

1. Выделение элементов интерфейса в руководствах к программному обеспечению.

2. Встроенные непереводимые (автоматически генерируемые) названия элементов документа (таблиц, рисунков), например, во FrameMaker.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Бродяга » Вт мар 13, 2007 10:00

И совсем уж смешную вещь упомянуть забыл - у некоторых тегов есть переводимые атрибуты. Классический пример - на картинке.
Вложения
Picture.jpg
Picture.jpg (5.94 КБ) Просмотров: 5115
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Catnip (МТ2007)

Кто сейчас на конференции

Сейчас этот форум просматривают: Yandex [Bot] и гости: 1