Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

MT2007 => Catnip

Сообщение Boris Popov » Ср мар 14, 2007 19:44

Скачал. Посмотрел описание - импорта TMX нет. Появится импорт TMX - поковыряюсь с удовольствием, а пока понаблюдаю :-)
Do or Die
Аватара пользователя
Boris Popov
Спец по железу
 
Сообщения: 2218
Зарегистрирован: Пн авг 11, 2003 23:45
Откуда: Минск
Блог: Просмотр блога (20)
Язык(-и): EN<->RU





Сообщение Andrew Manson » Ср мар 14, 2007 23:07

Константин Лакшин писал(а):Во-первых, в служебном меню внизу хотелось бы видеть еще одну вкладку, на которую можно было бы легко занести произвольный кусок из предложения исходного текста и приписать ему перевод для использования до конца работы с файлом.


Типа временной записной книжки ? Без проблем.

Константин Лакшин писал(а):Во-вторых, не расскажете ли, что из результатов анализа предложения можно выделить в единицу хранения (в принципе, не в существующей версии)? Грубо говоря, можно ли сохранить "Маша мыла раму" как "имя собственное" + "мыла раму"?


В автоматической режиме или вручную ? Вообще у меня сейчас работает только поиск по совпадению (fuzzy logic), внутреннего разбора предложения на блоки как такового не проводится. Если Вы имеете в виду, что в процессе работы разбить предложение на блоки "Маша" и "мыла раму" с соответствием в оригинале, чтоб потом предлагать частично переведенные варианты перевода, где такие блоки встретятся, то изначально планировлось такое, и очевидно буду делать.
А если Вы имели в виду автоматически разбирать оригинал на такие (грамматические) блоки (это есть сейчас на вкладке словарный анализ - дерево слева), затем проводить такой же анализ в переводе и автоматом выставлять соответствия блокам, то это врядли, по крайней мере сейчас. Дело в том, что с английским языком я умею это проделывать, благо есть соответствующие и алгоритмы и базы, а вот с русским языком в этом плане туго - в основном платное все....
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Ср мар 14, 2007 23:18

Boris Popov писал(а):Скачал. Посмотрел описание - импорта TMX нет. Появится импорт TMX - поковыряюсь с удовольствием, а пока понаблюдаю :-)


Импорт TMX я-то по любому сделаю, только сейчас для меня это не критично (так как сам с другими кошками не работаю), в первую очередь сечас наверно буду реализовывать работу с внутренними тегами предложений (как обсуждалось с Бродягой), а потом сразу примусь за TMX.

Кроме того, в порядке разминки мозгов и отдыха от основной работы - продолжу развивать утилиту работы с тегами в ворде CorrectWordTags, первый вариант которой выложил в доступ, но только разумеется, если будут пожелания по развитию, сам я как-то обхожусь без этого, ну так и переводы не основная моя работа 8-) Поэтому если кому-то что-то в утилите нужно сделать - пишите, а также пишите, кому пригодилась и кто начал пользоваться, мне важно видеть отдачу от этого дела, чтоб не работать в пустоту 8-)
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Константин Лакшин » Чт мар 15, 2007 07:44

Первые впечатления...

1. Плюс - достаточно "прозрачный" и логичный интерфейс.
2. Минус - зависания в разных местах на относительно слабой машине (Celeron/1,3/256), которыми пока можно пренебречь (отчасти - самострел).

В развитие п. 2:

1. М. б. есть смысл предупредить насчет доверия к VBA project.
2. М. б. заморозить обновление изображения по мере извлечения из Ворда (хотя прикольно - видно, как программа старается).
3. М. б. вынести извлечение из исходного файла в отдельный модуль, во избежание, так сказать. (Кстати, а что используется для сегментации, помимо встроенного определения sentence?)
4. М. б. ввести запрет на обработку отдельных кусков (в моем случае - таблицы)?
(5. По ошибке указал уже переведенный файл (русский) как исходный. В нем видны недостатки сегментации на сокращениях с точками.)
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Сообщение Константин Лакшин » Чт мар 15, 2007 08:11

Andrew Manson писал(а):Типа временной записной книжки ?


Не совсем так. Оба вопроса на одну тему. Идеологически я противник неуправляемого поиска нечетких (fuzzy) совпадений. (Почти крылатая фраза: Fuzzy matching breeds fuzzy thinking.)

Без них максимальный выигрыш во времени и затратах умственных усилий на том, с чем я обычно работаю, дает подстановка отдельных сегментов внутри предложения. (Иногда помогает частотный анализ и конкорданс, а бывает, что в чистом виде сочетание опыта и "женской интуиции").

Поэтому меня интересует возможность задания сегментов (и подстановки переводов), которые (a) меньше формального предложения и (b) не дослужились до термина для занесения в словарь.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Сообщение Andrew Manson » Чт мар 15, 2007 08:44

Константин Лакшин писал(а):1. М. б. есть смысл предупредить насчет доверия к VBA project.


Об этом я писал ранее на первой или второй странице ветки...

Константин Лакшин писал(а):2. М. б. заморозить обновление изображения по мере извлечения из Ворда (хотя прикольно - видно, как программа старается).


Имеете в виде сам ворд спрятать ? Можно и спрятать, а зачем ? Мне, например кажется так даже удобней, если что-то вдруг пошло не так - в самом ворде видно на каком этапе что происходит... Дело вкуса...

Константин Лакшин писал(а):3. М. б. вынести извлечение из исходного файла в отдельный модуль, во избежание, так сказать. (Кстати, а что используется для сегментации, помимо встроенного определения sentence?)


Вынесение в отдельный модуль разные фильтры импорта - вообще это правильная мысль с точки зрения построения программы, но так как на данный момент есть всего 2 фильтра (док-файл через ворд и docx файл - прямой разбор файла), то пока можно и так оставить, с ростом количества фильтров надо будет подключение фильтров по плагинной технологии сделать...Это да.
Для сегментации сейчас используется только, как Вы назвали, определение "sentence", используя знание алгритмом построения предложений английского языка (для этого используется специальная модель, использующая базу WordNet)
Именно поэтому в 5-м пункте, где Вы загрузили русский текст, алгоритм отработал "тупо". Хотя, если форматирование исходного безобразное, то и при определении английского предложения могут быть сбои. Но это при загрузке файла doc через атоматизацию Ворда. При разборе файла формата docx без участия Ворда ситуация лучше. А вообще сегментацию внутри предложения буду делать по различию формата блоков внутри предложения, чтобы в переводе получать сегменты с оригинальным форматированием, но сделаю это не обязательным (как в деже), то есть если не укажешь блок в переводе, для него будет использоваться формат первого в предложении блока.

А если сделать предлагаемую Вами ручную разбивку на сегменты внутри предложения, или, просто записывать, как Вы предлагаете, переводы сегментов, то можно и автоматическую подстановку частично переведенных блоков сделать, или в отдельном окне для текущего предложения показывать все внутренние сегменты с переводами (если есть)(при переходе на следующее предложение это окно автоматом обновляется для текущего предложения). Какой вариант предпочтительнее ?
4. М. б. ввести запрет на обработку отдельных кусков (в моем случае - таблицы)?

Я это смогу сделать только при разборе файла docx, при работе через Ворд это проблематично сделать...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Cowboy » Чт мар 15, 2007 08:57

Константин Лакшин писал(а):Первые впечатления...
2. Минус - зависания в разных местах на относительно слабой машине (Celeron/1,3/256), которыми пока можно пренебречь

Нет уж извините... У меня ТРАДОС летает на такой машине, а эта программа зависает уже при открытии. А если попрбовать такую интересную фичу, как перевод с помощью гугла, то вообще можно между делом сходить пообедать и посмотреть пару фильмов.
С печатью интеллекта под глазами... (R) Ольга Арефьева
Аватара пользователя
Cowboy

 
Сообщения: 1430
Зарегистрирован: Чт сен 08, 2005 10:40
Откуда: Казахстан, пос. Иргиз
Язык(-и): английский <> русский

Сообщение Andrew Manson » Чт мар 15, 2007 09:08

Cowboy писал(а):Нет уж извините... У меня ТРАДОС летает на такой машине, а эта программа зависает уже при открытии. А если попрбовать такую интересную фичу, как перевод с помощью гугла, то вообще можно между делом сходить пообедать и посмотреть пару фильмов.


Согласен, но это проблема всех программ достаточной сложности, написанных под NET-ом, тут особо ничего не поделаешь, сами алгоритмы у меня достаточно оптимальные, ускорять особо там нечего.

А с переводом с Гугла - все зависит от скорости инета (ответа от сервера с вашей машины), но там есть засада, как я писал ранее - Гугл поставили защитку, если делать перевод всего текста с использованием этого сервиса, то соответственно идет большое количество последовательных запросов на их сервер, где-то после сотого запроса они блокируют IP вашей машины примерно на сутки.... При использовании сервиса в процессе перевода (не массовый перевод) - на закладке в нижней части экрана, все в порядке...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Константин Лакшин » Пт мар 16, 2007 07:16

Andrew Manson писал(а):Об этом я писал ранее на первой или второй странице ветки...

Пардон - не заметил.

Имеете в виде сам ворд спрятать ? Можно и спрятать, а зачем ? Мне, например кажется так даже удобней, если что-то вдруг пошло не так - в самом ворде видно на каком этапе что происходит... Дело вкуса...


Согласен, что дело вкуса. Соображения два: (а) разбазаривание ресурсов и (b) испытывающие/испытуемые, перепуганные странным поведением документа в ворде и зависаниями при прикосновении к нему, которые не станут с вами водиться.

Доп. к (b): В руководстве поминаются "букмарки". Как мне показалось, файл для разборки автоматически копируется. Так? Если не так, то страшновато пускать такого зверя в живой файл, в котором могут водиться его сородичи. Успокойте, пожалуйста.

Вынесение в отдельный модуль разные фильтры импорта - вообще это правильная мысль с точки зрения построения программы


Не только с этой точки зрения. Об идеологии можно поговорить в отдельной ветке.

Давайте рассмотрим гипотетическую ситуацию, в которой переводчик имеет возможность сегментировать исходный текст идеальным для себя образом (подробностями пока можно пренебречь).

Если у меня есть идеально сегментированный текст, грубо говоря, я могу (1) импортировать его в некую программу, которая не будет сопротивляться моим взглядам на сегментацию или (2) воспользоваться подручными средствами поиска и замены. Угадайте, что я выберу, если мне будут навязывать сегментацию? :=)

Для сегментации сейчас используется только, как Вы назвали, определение "sentence", используя знание алгритмом построения предложений английского языка (для этого используется специальная модель, использующая базу WordNet). Именно поэтому в 5-м пункте, где Вы загрузили русский текст, алгоритм отработал "тупо".


Давайте уточнимся: sentence (в моем сообщении) относилось к определению в VBA, т. е. к "тупому" варианту.

Хотя, если форматирование исходного безобразное, то и при определении английского предложения могут быть сбои.


Кстати о птичках: давным-давно, когда Лексикон был достаточно общепринятым редактором, на меня почти устрашающее впечатления произвела программка Add/Strip для Мака, которая необъяснимо хорошо боролась с форматированием пробелами и переносами (что лежало внутри, не знаю).
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Сообщение Константин Лакшин » Пт мар 16, 2007 07:45

А если сделать предлагаемую Вами ручную разбивку на сегменты внутри предложения, или, просто записывать, как Вы предлагаете, переводы сегментов, то можно и автоматическую подстановку частично переведенных блоков сделать, или в отдельном окне для текущего предложения показывать все внутренние сегменты с переводами (если есть)(при переходе на следующее предложение это окно автоматом обновляется для текущего предложения). Какой вариант предпочтительнее ?


Постараюсь в ближайшие 72 часа разразиться полным набором технических требований. В них нет ничего сверхъестественного, но, увы, как показывает опыт, крупнейшие и ведущие по части CAT воспринимают их с жутким скрипом.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Сообщение Andrew Manson » Пт мар 16, 2007 09:03

Константин Лакшин писал(а):Согласен, что дело вкуса. Соображения два: (а) разбазаривание ресурсов и (b) испытывающие/испытуемые, перепуганные странным поведением документа в ворде и зависаниями при прикосновении к нему, которые не станут с вами водиться.


Понятно, но: а) расход ресурсов будет одинаков а обоих случаях, не важно, показывается Ворд или нет. А вообще, мне кажется, что приоритетным должен являться прямой разбор файла без участия Ворда, что в нашем случае можно делать или с форматами Office Open XML (формат 2007-го офиса), или из XML файла. В этом случает не используется вспомогательное средство (Ворд), меньшее потребление ресурсов. Импорт docx файлов сейчас уже есть, импорт происходит достаточно быстро (уважаемый Бродяга тестировал по сравнению с другими кошками). Правда пока не все учитывается там, например пропадает табуляция, гиперссылки, но это поправимо. Кроме того, текст выцепляется "чистый" без знаков форматирования, которые попадаются при получении данных из Ворда. Конечно в последнем случае они чистятся, но все равно сложнее проводить сегментацию предложений. Ну и при парсинге самого файла намного проще работать с внутренними служебными тегами, описывающими формат сегментов в предложении. Пример работы с такими тегами - в моей программе CorrectWordTags. Единственное преимущество импорта через Ворд - это дополнительная функция в МТ2007, когда находясь в какой-либо секцции и нажав кнопку "Перейти" в Ворде выделяется и показывается эта секция. Удобно, чтобы окинуть взглядом сам текст, если из контекста не понятно (например куча картинок, а в кошке только подписи к рисункам - посмотреть к чему относится).

Константин Лакшин писал(а):Доп. к (b): В руководстве поминаются "букмарки". Как мне показалось, файл для разборки автоматически копируется. Так? Если не так, то страшновато пускать такого зверя в живой файл, в котором могут водиться его сородичи. Успокойте, пожалуйста.


Да, вы правы, файл копируется в папку проекта. Оригинал не трогается. Букмарки выставляются для каждого предложения, но только при разборе текста средствами Ворда.

Константин Лакшин писал(а):Если у меня есть идеально сегментированный текст, грубо говоря, я могу (1) импортировать его в некую программу, которая не будет сопротивляться моим взглядам на сегментацию или (2) воспользоваться подручными средствами поиска и замены. Угадайте, что я выберу, если мне будут навязывать сегментацию? :=)


Что для этого можете предложить? Делать просто импорт текста из внешнего источника или настраиваемые фильтры ?

Константин Лакшин писал(а):Давайте уточнимся: sentence (в моем сообщении) относилось к определению в VBA, т. е. к "тупому" варианту.

Уточниться стоит, потому что я сам иногда путаюсь, что
подразумевается под сегментом, что под предложением.... 8-)

Константин Лакшин писал(а):Кстати о птичках: давным-давно, когда Лексикон был достаточно общепринятым редактором, на меня почти устрашающее впечатления произвела программка Add/Strip для Мака, которая необъяснимо хорошо боролась с форматированием пробелами и переносами (что лежало внутри, не знаю).


Здесь проблема такого рода: представьте ситуацию - заголовок документа. Состоит из нескольких фраз, которые в документа для красоты отформатированы так:

фраза<Enter>
<Enter>
фраза<Enter>

фраза<Enter>

В ворде они все обозначаются разными параграфами. Чтобы алгоритм, определяющий предложения сработал, надо во-первых подать на него весь текст (а в обычном тексте в параграфах содержатся законченные блоки-предложения), то есть при обычном разборе на алгоритм подается параграф, внутри которого производится разбор - 1-я проблема. Чтобы снять эту проблему надо или отформатировать текст полагающимся образом, или попытаться сделать это автоматически. Автоматически в данном случае не получится, так как опять-же нужно анализировать текст с точки зрения знания правил построения предложения. Можно убрать "лишние" знаки форматирования, НО, кто даст гарантию, что эти несколько фраз действительно являются одним предложением ? - 2-я проблема. В общем получается, что перед импортом текста необходимо его форматировать дополнительно ручками или мириться с тем как программа его разбивает на предложения.....

Константин Лакшин писал(а):Постараюсь в ближайшие 72 часа разразиться полным набором технических требований. В них нет ничего сверхъестественного, но, увы, как показывает опыт, крупнейшие и ведущие по части CAT воспринимают их с жутким скрипом.


А вот за это спасибо, это было-бы очень-и-очень интересно почитать.........8-)
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Константин Лакшин » Сб мар 17, 2007 07:31

Andrew Manson писал(а):Что для этого можете предложить? Делать просто импорт текста из внешнего источника или настраиваемые фильтры?

Я бы предложил следующее:

1. Модуль 1 - извлечение текста из источника с, грубо говоря, расстановкой меток для его возврата после перевода.

Конечный продукт на этом этапе - текстовый файл со служебной разметкой предполагаемой сегментации.

2. Модуль 2 - конечная сегментация для перевода. Если конечный продукт п. 1 достаточно прозрачен, переводчик может изменить сегментацию "ручками" оптимальным для себя образом.

Ручками - не обязательно чисто вручную.

Пример: программа идеально разбила текст на грамматически оформленные предложения. Переводчик заведомо знает, что текст состоит из описания десяти действий с участием десяти "сущностей". Например, договор, согласно которому 10 лиц принимают на себя 10 одинаковых обязательств, но каждый раз перед другим лицом. Переводчик знает, что формулировки обязательств для всех одни и те же, а обозначение каждого из 10 лиц начинается с ЗАО, содержит от одного до трех слов и кончается кавычками.

В классической схеме накопителя переводов - переводим про одно лицо, а затем меняем в каждом предложении про следующее энное кол-во слов.

С другой стороны, можно "ручками" автоматом изменить сегментацию с учетом того, что знает переводчик, после чего все остальное (в принципе) будет компилироваться автоматически.

Еще один момент: в этом разделе где-то было про игры mikegor'a с импортом/экспортом из Автокада. Если mikegor победит, на входе ТМ будет сегмент, не обязательно соответствующий определению предложения, но именно то, что требуется перевести и вернуть на место, т. е. в нашем случае - в файл, порожденный его утилитой, из которого она должна вернуть его в Автокад в нужном виде.

3. Модуль 3 - Собственно переводческий инструмент (интерфейс), при помощи которого вводится текст на языке перевода. (Продолжение следует.)
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Сообщение Mikhail » Сб мар 17, 2007 08:41

Скачал описание MT2007. К сожалению скачать и попробовать саму программу возможности пока нет. Из описания непонятно, можно ли подключать уже имеющиеся базы TM, которые были сделаны в других программах. То что импорта из ТМХ нет я понял, предусмотрен ли сейчас какой-нибудь другой вариант?
...один из них мне сказал: «с такими позорными взглядами ты вечно будешь одиноким и несчастным».
Аватара пользователя
Mikhail

 
Сообщения: 1352
Зарегистрирован: Пн ноя 04, 2002 23:27
Откуда: Samara/Sakhalin
Язык(-и): en-ru

Сообщение Константин Лакшин » Вс мар 18, 2007 07:37

Про полные технические требования я, конечно, погорячился. В диком кратце примерно так...

1. Относительная независимость этапов обработки. Извлечение из исходного файла - сегментация для перевода - собственно перевод, включая подстановки из предыдущих работ и словарей - создание БД для использования в будущем - возврат в исходный файл. Желательно на всех этапах наличие промежуточного текстового файла, в котором пользователь может на свой страх и риск навести нужный ему лично порядок.

2. Про извлечение и сегментацию уже высказывался.

3. В собственно переводческом редакторе...

а) Подстановка произвольных сегментов, задаваемых переводчиком на этапе сегментации или в ходе работы.
б) Возможность работы с рамочными конструкциями в духе grep (известны также под именем skipgram). Т. е. вместо непрерывных сегментов (abc, adc, aec, afc и т. д.) хочу задавать сегмент a-X-c с возможностью подстановки b, d и т. д. на место X.
в) Возможность работы с "парами" для подстановки, в которых слева одна последовательность, а справа несколько (один ко многим вместо один к одному) и задания правил выбора варианта (от левого-правого контекста на n знаков или слов, до учета того, что было в последнем пред этим заголовке раздела или особенностей положения сегмента (таблица - не в таблице).
г) Задания приоритетов подстановки, т. е. независимо от выбранной степени fuzzy, если <описание условия>, подставлять совпадающее из моего списка Х (и не искать fuzzy в предшествующих переводах).
д) Возможность задавать подстановки на основе созданных списков, а не индивидуально. См., например, п. "б". Для всех Х из списка А, использовать значения a и b из списка Y, в остальных случаях из списка Z.
е) Принципиальная возможность подключения модулей морфологии и др. лингвистически ресурсов (анализ и синтез). Например, возможность создания "класса" исходных сегментов и замен, для которых указывается "пренебрегать словоизменением" при поиске в исходном тексте или "подставлять форму женского рода", если <описание условия>.

4. Возврат в сдаваемый файл после перевода. Более-менее то же самое, что в п. 1, т. е. возможность подрихтовать вручную. Например, пренебречь разметкой формата в исходном документе, но вставить доп. знаки для форматирования результата. Простейший пример: справка к какому-нибудь интерфейсу. В исходном тексте в предложении курсивом выделено четыре слова (названия элементов интерфейса), в переводе - два. Мне может быть проще вставить (проверить) некий универсальный служебный маркер для последующего восстановления форматирования названий элементов интерфейса на этом этапе, а не после возврата и исходный/конечный файл.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Сообщение Spider » Вс мар 18, 2007 22:03

Andrew Manson писал(а):Хоть бы кто, что-нибудь сказал, из этих людей, а то участвует всего 2-3 человека в обсуждении... 8-(

Andrew Manson, я тоже не удержался и скачал вашу програмку. Сразу оговорюсь, по сравнение с большинством присутствующих в этом форуме я полный ламер :oops: . Скачал все обновления по порядку, т.е. так как они упоминались в форуме, проделал все рекомендованные в форуме действия. Программа запускается, но ни один вордовский файл она у меня не открывает. :cry:
У меня стоят окна и офис ХР, отсюда вопрос, в начале форума, вы писали, что работаете с офисом 2003, а 2000 и ХР, вроде как не поддерживается. Если я правильно понял, то все дело в офисе ХР или нет?

Извините, если вопрос покажется глупым, но, как говорится, всего знать нельзя :roll:
Перевод - профессия, а не хобби!
Аватара пользователя
Spider

 
Сообщения: 726
Зарегистрирован: Вс мар 21, 2004 09:19
Откуда: Moscow

Сообщение Andrew Manson » Пн мар 19, 2007 08:26

Spider писал(а):Сразу оговорюсь, по сравнение с большинством присутствующих в этом форуме я полный ламер . Скачал все обновления по порядку, т.е. так как они упоминались в форуме, проделал все рекомендованные в форуме действия. Программа запускается, но ни один вордовский файл она у меня не открывает.


Все мы где-то в чем-то ламеры, но в тоже время в чем-то являемся профессионалами 8-)
Вы абсолютно правы, напрямую с Вордом программа работает только с 2003-м, но тем не менее Вы можете попробовать работу, скачайте и установите с майкрософтовского сайта примочку для офиса:
http://www.microsoft.com/downloads/deta ... laylang=en

которая позволяет для любых версий офисов работать с файлами офиса 2007-го. Откроете любой доковский файл, сохраните в формате Word 2007 (docx) и можете подать его на вход программы. Все должно сработать.

Константин Лакшин, большое спасибо за пожелания в доработке, буду думать 8-). Поставил себе в план развития.....


Mikhail писал(а): Из описания непонятно, можно ли подключать уже имеющиеся базы TM, которые были сделаны в других программах. То что импорта из ТМХ нет я понял, предусмотрен ли сейчас какой-нибудь другой вариант?


Подключать базы из других программ нельзя, насколько я понимаю как раз для того, чтоб разные проги могли работать с базами из разных программ и есть формат TMX, который является средством для обмена базами. Сейчас никакого импорта из других программ нет. Только свой внутренний формат. Но как появится импорт TMX - можно будет импортировать из других программ.
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Spider » Пн мар 19, 2007 10:50

Спасибо Andrew Manson, помогло. :P Програму поставил на свой ноутбук (не самую сильную машину), но все летает :lol:. Вот такой вопрос возник: а если есть оригинал и ранее выполненный перевод (без применения подобных програм), то кроме копи-пейста, можно эти два файла как-нибудь в базу свести? Что-нибудь типа эллайна сегментов двух файлов. Или это я уже слишком многого хочу :roll: .
Перевод - профессия, а не хобби!
Аватара пользователя
Spider

 
Сообщения: 726
Зарегистрирован: Вс мар 21, 2004 09:19
Откуда: Moscow

Сообщение Andrew Manson » Пн мар 19, 2007 11:00

Spider писал(а): Вот такой вопрос возник: а если есть оригинал и ранее выполненный перевод (без применения подобных програм), то кроме копи-пейста, можно эти два файла как-нибудь в базу свести? Что-нибудь типа эллайна сегментов двух файлов. Или это я уже слишком многого хочу :roll: .


Вы хотите не многого, а должного 8-) Обязательно буду делать, но не сейчас. Есть более насущные вещи для реализации, и в первую очередь - поддержка внутреннего форматирования предложения (секции) в переводе. А тем временем, пока эта поддержка находится в окончательной стадии теоретической доработки, снял техническое ограничение на кол-во подключаемых словарей (всего их теперь 21) и доделываю проверку орфографии как оригинала, так и перевода внутри программы.... В ближайшее время выложу обновление для доступа.
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Пн мар 19, 2007 14:33

Ну вот, выложил очередное обновление.
ftp://cosmos2.info.tm/downloads/MT2007_update4.rar
Все предыдущие апдейты удалил, так как данный является кумулятивным и может накрывать любые предыдущие конфигурации программы. Для людей, которые будут скачивать программу в первый раз, этот апдейт скачивать не надо, так как основной дистрибутив я поднял до этого 4-го апдейта....

Изменения:
1) снял техническое ограничение на количество подключаемых словарей. Теперь их 21. В основной дистриб они уже включены. Для тех, у кого более ранняя версия могут скачать их отдельно:
ftp://cosmos2.info.tm/downloads/DictER.rar
я не стал включать эти словари в апдейт, так как не уверен, что они прям всем необходимы. Здесь есть и большой англо-русский словарь, строительный, бизнес, компьютеры, безопасность, глазунова, аббревиатуры, социология, авиация и пр.

2) реализовал орфографическую проверку текста, как оригинала (англ.) так и перевода (рус). Кнопка орфографии - на тулбаре. Можно пополнять локальный пользовательский словарь отсутствующими словами. Замечание: варианты предлагаемой замены не очень полезны, так как предлагаются производные от ненайденного в словарях слова путем его склонения, добавления окончаний.... Действия при ненайденном слове: пропустить, добавить в словарь, заменить или из списка или из заполненного ручками поля замены..... В общем пробуйте...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Недопереводочник » Пн мар 19, 2007 14:55

Ткните, пожалуйста, пальцем, что качать тому, кто еще ничего не качал, но крайне хочет присоединиться к интересному проекту.
Недопереводочник

 

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Catnip (МТ2007)

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0