Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

MT2007 => Catnip

Сообщение Бродяга » Вс мар 04, 2007 16:04

Ой, а как повторно открыть уже созданный проект? Соответствующий пункт меню - "серый"!
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34





Сообщение Andrew Manson » Вс мар 04, 2007 18:11

Бродяга писал(а):
ЗЫ. Функционал мне пока пробовать некогда - надо закончить один перевод. Один только вопрос по XML возник - что это за квадратики отображаются в конце каждого сегмента (см. картинку)?


дело в том, что если текст больше двух строк, то последняя строка не показывается, пока не войдешь в редактирование ячейки, поэтому я автоматом ставлю там возврат каретки. Это ни на что не влияет. Потом после записи в общую ТМ (чего пока нету), я их просто буду убирать. А сейчас при реальной работе с простыми вордовскими документами при генерации макеета перевода, они убираются и макет выглядит как в оригинале.
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Вс мар 04, 2007 18:27

"открыть перевод" и укажите файл с расширением .tm
полная работа с проектом пока не реализована,, пока достаточно работать с файлом перевода с сохранением всего функционла (конечно, если вы сохранили файл после импорта, как я писал автоматического сохранения не делается)
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Вс мар 04, 2007 22:47

Ребята, кто-нибудь еще поюзал программу ? Дайте какие-нибудь комментарии по поводу функционала, пожалуйста..... Я по статистике вижу, что уже больше 10 человек скачали, но что-то все молчат, кроме Бродяги.......
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Пн мар 05, 2007 00:05

Andrew Manson писал(а):дело в том, что если текст больше двух строк, то последняя строка не показывается, пока не войдешь в редактирование ячейки, поэтому я автоматом ставлю там возврат каретки.

У меня хоть десять показывается (войдя на редактирование), но в любом случае оканчивается квадратиком (он же прощёлканный (или пришедший из ниоткуда) Юникодный символ). Даже мне страшно, ибо привык к ¶.

Andrew Manson писал(а):"открыть перевод" и укажите файл с расширением .tm

Счаз!!! При любой подобной попытке я наблюдаю картину Рожкина "Шиш" в виде первого приведённого в этой ветке эксепшна. Сохраняй - не сохраняй...
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Пн мар 05, 2007 00:58

Бродяга писал(а):У меня хоть десять показывается (войдя на редактирование), но в любом случае оканчивается квадратиком (он же прощёлканный (или пришедший из ниоткуда) Юникодный символ). Даже мне страшно, ибо привык к ¶.

Предлагаю не пугаться и просто не обращать на него внимания 8-)

Бродяга писал(а):
Andrew Manson писал(а):"открыть перевод" и укажите файл с расширением .tm

Счаз!!! При любой подобной попытке я наблюдаю картину Рожкина "Шиш" в виде первого приведённого в этой ветке эксепшна. Сохраняй - не сохраняй...


Извиняюсь, профукал этот момент - при открытии базы автоматм инициализируются библиотеки работы с Вордом 2003. Завтра исправлю и выложу обновление...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Пн мар 05, 2007 09:02

Бродяга
Странно, проверил все на чистой машине, все работает, открывает сохраненные базы и без установленного ворда на машине.....
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Пн мар 05, 2007 11:26

Ещё раз проверил. "Файл"->"Открыть файл перевода"->Ба-бах!
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Пн мар 05, 2007 11:29

Бродяга писал(а):Ещё раз проверил. "Файл"->"Открыть файл перевода"->Ба-бах!


Уже после выбора файла или до ? И ошибку дает связанную с Interop.Word...?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение mikegor » Пн мар 05, 2007 11:46

Andrew Manson писал(а):Ребята, кто-нибудь еще поюзал программу ? Дайте какие-нибудь комментарии по поводу функционала, пожалуйста..... Я по статистике вижу, что уже больше 10 человек скачали, но что-то все молчат, кроме Бродяги.......

Я, например, скачал, поставил апдейт, попробовал создать проект, открыть файл. Это работает. Ну, а дальше надо фактически участвовать в разработке системы, а на это просто нет времени. Вообще вопрос, стоит ли тратить время на создание собственных средств производства? Что это дает? Почему просто не освоить Традос/ДежаВю/Транзит? Это не сложно, и времени займет гораздо меньше, чем собственная разработка.
Я бы, например, пошел путем создания небольших утилит, дополняющих функционал существующих кошек. Я, например, тут выкладывал совсем простенькую утилиту на Перле, которая вытаскивает текстовые блоки из Автокадовских файлов и записывает их в текстовой файл, который можно перевести в любой кошке, а затем снова импортировать в чертеж. Сделать эту утилиту было на порядки проще, чем писать собственную систему перевода автокадовских файлов.
А к Вам, как к программисту высокого уровня, есть такое деловое предложение: Сделайте утилиту, позволяющую удалять лишние теги из Вордовских файлов. Проблема в том, что после конвертации PDF->DOC получающийся файл забит лишними тегами, которые мешаются и в Дежа Вю, и в Традосе (в TagEditor-е особенно) и базу замусоривают.
An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!
Аватара пользователя
mikegor

 
Сообщения: 2334
Зарегистрирован: Пт дек 02, 2005 20:47
Откуда: Moscow
Язык(-и): нем-рус,дат-рус

Сообщение Andrej » Пн мар 05, 2007 12:11

mikegor писал(а):А к Вам, как к программисту высокого уровня, есть такое деловое предложение: Сделайте утилиту, позволяющую удалять лишние теги из Вордовских файлов. Проблема в том, что после конвертации PDF->DOC получающийся файл забит лишними тегами, которые мешаются и в Дежа Вю, и в Традосе (в TagEditor-е особенно) и базу замусоривают.


Вот!!!! Ужасно популярная прога бы была. Например, чтобы сначала она могла съесть док, проанализировать и выяснить, какие тэги подозрительно лишние. И предлагала бы их удаление, т.е. очистку документа, но при этом давала бы пользователю полную свободу действий. Кроме того, думала бы над тем, где можно убрать двойные пробелы (например, с заменой на табуляцию и без), ненужные разрывы страниц и т.д. Вот была бы вещь! Лично готов выложить за нее некую сумму американских денег. Кроме того, поле ведь непаханное, ни у кого такого решения вообще нет.
К сожалению, из-за разногласий с администрацией я более не участвую в работе данного форума и сайта и ничем не могу вам помочь. Поэтому прошу не писать мне личных сообщений на форуме, если надо, обращайтесь через эл. почту.
Andrej

 
Сообщения: 6417
Зарегистрирован: Вт авг 05, 2003 14:49

Сообщение Tanka » Пн мар 05, 2007 12:13

Я тоже такую программулину хочу! :wink:
Выступление острых углов не допускается.
Аватара пользователя
Tanka

 
Сообщения: 4556
Зарегистрирован: Вс июн 22, 2003 12:12
Откуда: Антверпен
Язык(-и): EN-RU

Сообщение Viktor N. » Пн мар 05, 2007 12:31

+1
Viktor N.

 
Сообщения: 2076
Зарегистрирован: Ср дек 24, 2003 14:15
Откуда: Бельгия
Язык(-и): Fr/En/De-->Ru

Сообщение Andrew Manson » Пн мар 05, 2007 12:32

mikegor писал(а):Ну, а дальше надо фактически участвовать в разработке системы, а на это просто нет времени. Вообще вопрос, стоит ли тратить время на создание собственных средств производства? Что это дает? Почему просто не освоить Традос/ДежаВю/Транзит? Это не сложно, и времени займет гораздо меньше, чем собственная разработка.


На вопрос стоит ли тратить время, отвечу так: стоит, если есть возможность и интерес сделать что-то, чего нет или не хватает у других, тем более если эта вещь бесплатна. Это мое личное мнение. Но если Вы говорите, что это не стоит затраченных усилий да и вообще не стоит тягаться с монстрами..... ну чтож может оно и так.....Если никому это не надо будет, брошу нафиг это дело... Но пока у меня еще интерес остается, буду потихоньку продолжать развивать это дело.


Я бы, например, пошел путем создания небольших утилит, дополняющих функционал существующих кошек. Я, например, тут выкладывал совсем простенькую утилиту на Перле, которая вытаскивает текстовые блоки из Автокадовских файлов и записывает их в текстовой файл, который можно перевести в любой кошке, а затем снова импортировать в чертеж. Сделать эту утилиту было на порядки проще, чем писать собственную систему перевода автокадовских файлов.
А к Вам, как к программисту высокого уровня, есть такое деловое предложение: Сделайте утилиту, позволяющую удалять лишние теги из Вордовских файлов. Проблема в том, что после конвертации PDF->DOC получающийся файл забит лишними тегами, которые мешаются и в Дежа Вю, и в Традосе (в TagEditor-е особенно) и базу замусоривают.


Поподробней можно ? Если можно, скиньте на мой имейл пример такого замусоренного файла с подробным описанием что там лишнее...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Пн мар 05, 2007 12:47

Andrew Manson писал(а):Уже после выбора файла или до ? И ошибку дает связанную с Interop.Word...?


До. Да.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Бродяга » Пн мар 05, 2007 12:49

mikegor писал(а):Вообще вопрос, стоит ли тратить время на создание собственных средств производства?

На данный момент это единственная программа, уже приемлемо работающая с файлами Ворда 2007, причём при его отсутствии.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrej » Пн мар 05, 2007 12:50

Подробно: переводчики часто получают файлы pdf для перевода. Так как формат pdf по умолчанию не предназначен для обработки, существует два пути - либо таскать оттуда текст вручную копи-пейстом (теряя все форматирование и графику), либо же воспользоваться программой-конвертером (лучший пока пример - Solid PDF Converter), который вытаскивает текст и графику и ПДФа, по возможности сохраняя форматирование.

Все вроде бы хорошо, но существует гигантский недостаток - при конвертироовании получаемый документ замусорен совершенно диким количеством тэгов, которые необходимо либо чистить, либо мириться с их наличием. Чаще всего эти тэги просто не убрать, так как, например, в Ворде их просто не видно. И как раз наличие этих тэгов не дает нормально работать с такими (полученными из ПДФ) документами в инструментах CAT.
К сожалению, из-за разногласий с администрацией я более не участвую в работе данного форума и сайта и ничем не могу вам помочь. Поэтому прошу не писать мне личных сообщений на форуме, если надо, обращайтесь через эл. почту.
Andrej

 
Сообщения: 6417
Зарегистрирован: Вт авг 05, 2003 14:49

Сообщение Andrew Manson » Пн мар 05, 2007 12:53

Понятно, попробую покрутить такие файлы, посмотрю, что можно с ними сделать...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrej » Пн мар 05, 2007 13:04

А вы качните демку Солида с их сайта и попробуйте отконвертить хотя бы двухстраничный ПДФ (с колонтитулами, парой рисунков, в два три-столбца чтобы был и т.д.). А потом а) включите режим непечатаемых символов и посмотрите в Ворде на эту беду (и учтите, что это далеко не вся красота, дай бог процентов 20-30) б) попробуйте загнать этот док в какой-нибудь КАТ-тул (ТэгЭдитор, Транзит, ДежаВю, да и ваш собственный). Вас многое неприятно удивит.
К сожалению, из-за разногласий с администрацией я более не участвую в работе данного форума и сайта и ничем не могу вам помочь. Поэтому прошу не писать мне личных сообщений на форуме, если надо, обращайтесь через эл. почту.
Andrej

 
Сообщения: 6417
Зарегистрирован: Вт авг 05, 2003 14:49

Сообщение mikegor » Пн мар 05, 2007 13:12

http://rapidshare.com/files/19496277/Ex ... s.rar.html
Вот примерчик файла (на немецком), сделанного из PDF при помощи Файнридера. Совсем простой пример: все специфические немецкие буквы (ä, ö, ü, ß) заключены в теги.
В TagEditor:
Код: Выделить всё
<cf>f</cf><cf>ü</cf><cf>r die

вместо просто "für die". Содержимое тэгов форум съедает, но там сидит ерунда типа:
Код: Выделить всё
cf bold="on" size="8" complexscriptsbold="on" complexscriptssize="8" fontcolour="0x0"

А Дежа видит обычно еще больше тэгов. У меня было так, что я причесал файл, и TagEditor уже все нормально показывал, а в Деже все равно лезли лишние тэги.
А от утилиты я бы ожидал примерно такого функционала: чтобы можно было просматривать файл и видеть скрытые тэги, примерно как в TagEditor, и был бы механизм поиска-замены, включающий регулярные выражения, позволяющий пары тегов удалять.
Andrew Manson писал(а):если есть возможность и интерес сделать что-то

Разумеется, если Вас эта задача увлекла, то почему бы и не сделать. Но просто, по опыту, такие самодельные системы обычно хорошо работают только в руках их создателей. У Вас есть исходник, и когда система падает, или не так что-то делает, Вы знаете сразу или, по крайней мере можете быстро найти, где и что надо поменять. А простой пользователь такой возможности лишен.
А бесплатность, Вы сами понимаете, это по нынешним российским условиям, - аргумент слабый.
Последний раз редактировалось mikegor Пн мар 05, 2007 13:15, всего редактировалось 3 раз(а).
An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!
Аватара пользователя
mikegor

 
Сообщения: 2334
Зарегистрирован: Пт дек 02, 2005 20:47
Откуда: Moscow
Язык(-и): нем-рус,дат-рус

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Catnip (МТ2007)

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2