Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

MT2007 => Catnip

Сообщение oksana guroglu » Пт дек 07, 2007 13:42

:?: скачала я програмку, но воспользоваться не смогла...... она неподерживает Unicode, однако. Вот и повылазили всякие "бамбарбия кергуду". Что делать, подскажите... Мой комп кириллицу не подерживает. :evil:
oksana guroglu

 
Сообщения: 2
Зарегистрирован: Пт ноя 30, 2007 13:18





Сообщение Andrew Manson » Пт дек 07, 2007 20:42

mikhailo писал(а):1. Создаю новый перевод все указываю - а он мне оба на укажи-ка ты сначал тематику в настройках репозиториев (где еще вдобавок каталог Andrew Manson прописан). Ну что ж пришлось создать тему (зачем только этот гемор, если нету фиксированного списка тем переводов как в деже) и потом все вбивать по новой.

А зачем фиксированный ? Мне кажется лучше свой список строить в зависимости от того, что переводишь. Константин Лакшин просто выкосил этот мой список, приведенный для примера и построил там, как я понял, что-то связанное с заказчиками, предпочтениями переводов у разных заказчика и прочее....
Ну а вообще, наверно Вы правы, сделаю указание этого списка необязательным...
mikhailo писал(а):2. Загружаю файл - смотрю проблемы с сегментацией оригинала - надо править в ТМ. А как объединить сегменты ХЗ?

Подскажите, а какой исходный язык ? Дело в том, что у меня хорошо делает сегментацию английского языка, для меня практически идеально. Для примера из тысячи предложений неправильно сегментированно оказывается с пяток предложений (в основном из-за плохого форматирования документа), вот и не было необходимости выносить разработку склейки/резки в первую очередь....Хотя признаю, что это необходимо....Обязательно буду делать..


oksana guroglu писал(а):она неподерживает Unicode

Все программы, написанные на NET поддерживают юникод. Непонятно, что Вы имеете в виду. Если учесть Ваше
oksana guroglu писал(а): Мой комп кириллицу не подерживает
, то скорее всего у Вас просто не установлена поддержка кирилицы, ну так просто включите ее. Делается это за 5 минут.
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Пт дек 07, 2007 21:45

Andrew Manson писал(а):Все программы, написанные на NET поддерживают юникод.

Ага, счаз!!!
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Пт дек 07, 2007 21:58

Бродяга писал(а):Ага, счаз!!!

Да, Бродяга, да. Как я понял у девушки проблемы именно с отображением русских символов в интерфейсе, так как тексты программа изначально берет в юникоде, вернее utf-8, разновидности его. А .NET программы компиляются по умолчанию на всех операционках свыше 98-х виндов в юникод кодировке и такие проги не читаются в 98-й. То есть для 98х виндов программы нужно специально компилять в ASCII кодировке. Это связано с тем, что в 98-х виндах при прорисовке интерфейса использовались системные бибилиотеки, не понимающие юникод. Может быть и есть такие извращенцы, которые сейчас при программировании в NET используют ASCII кодировку, но я таких не знаю...

А проблема скорее всего в том, что на компе не стоит поддержка кирилицы (с юникод-шрифтами).
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Пт дек 07, 2007 22:08

Маэстро, вы это пользователям Традоса 6.0 расскажите. Или 6.5. Жуть же ведь была!!! И продолжается в старых мозгах...
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Пт дек 07, 2007 22:09

То есть я не понял, вы согласны со мной или нет ?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Пт дек 07, 2007 22:32

С вами-то я завсегда согласен. Вот только Традос 6.0 был написан с использованием .NET 1.0, но Юникодом там не пахло.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew » Пт дек 07, 2007 22:34

Через какое место в Традосе 6.х (да нередко и в последующих) использовался .NET я промолчу, чтобы потом самому себя не пришлось банить. По-моему, это не означает автоматически, что те же проблемы должны быть и у MT2007. Скорей всего, действительно в ОС не включено использование кириллицы. Хотя наверное, не стоит напрочь отметать и вероятность более глубоких проблем.
Andrew
Хранитель огня
 
Сообщения: 9921
Зарегистрирован: Пн янв 14, 2002 12:28
Откуда: Rostov-on-Don
Блог: Просмотр блога (23)
Язык(-и): EN<->RU

Сообщение mikhailo » Пт дек 07, 2007 22:43

Подскажите, а какой исходный язык ? Дело в том, что у меня хорошо делает сегментацию английского языка, для меня практически идеально.


Andrew Manson - дело не в языке, а в оригинале. В тексте, выдранном различными способами из акробата неправильная расстановка абзацев не редкость и не всегда есть время восстанавливать данный промежуточный продукт - да и зачем, если б это можно было сделать в ТМ. Для хороших файлов наверняка Ваш продукт довольно отлажен. А вот для кривых??
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Сообщение Andrew Manson » Ср дек 19, 2007 11:16

Краткий "Курс молодого бойца" - начало работы с MT2007. Документ кратко описывает как начать работать с системой, возможности системы для автоматизации перевода (автор Константин Лакшин).

http://mt2007.nm.ru/Documents/Manual_1.doc

На данный момент программа проходит ревизию с точки зрения существующего функционала, его качества и составляется список (план) работ по улучшению существующего функционала, добавления новых функций. В частности планируется переход с фиксированной направленности перевода (английский-русский) на произвольную, что естественно повлечет за собой расширение функционала для подключения (использованию) соответствующих словарей и прочие завязки на многоязычность...
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Вт фев 26, 2008 17:31

Наконец-то я добил новый функционал. Вышла новая версия - 1.0.3.0

Скачать обновление: http://cosmos2.ru/downloads/MT2007/MT20 ... .0.3.0.rar

Кратко о нововведениях:

1) Мультиязычная версия. Направление перевода можно выбирать из 12 языков: English, Russian, Danish, Dutch, Finnish, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish.

2) Улучшен встроенный орфографический модуль. Для всех указанных языков поддерживается орфографическая проверка. Орфографические словари взяты из пакета OpenOffice. Исправлено: 1) Теперь корректно предлагает замену неправильному слову. 2) Теперь можно остановить длительный процесс проверки. 3) Скорость проверки увеличена.

3) Добавлены новые фильтры входных файлов: OpenDocument Text (*.odt) и OpenDocument SpreadSheet (*.ods). Пока в редакции RC1 для отлова возможных ошибок.

4) Внесены изменения в модуль подстановки терминов (сегментов). 1) Для сегментов на основе регулярных выражений можно выставлять последовательность подстановки. 2) Для "плоских" сегментов можно включить/выключить учет регистра.

5) Добавлена возможность помечать переводимые секции цветом (переведено, частично переведено, непереведено, проблемная секция...) с автоматическим "закрытием" (пометкой зеленым цветом) текущей секции при переходе на следующую в процессе перевода и оставлять примечания (заметки) для каждой секции.

6) Можно настроить фоновый цвет для вводимых изменений в текст перевода в редакторе

7) Добавлена возможность склейки/резки секций (пункт меню "Редактировать").

Отдельное спасибо Лакшину Константину за дельные советы и тестирование промежуточных версий.

Более подробно: http://mt2007.nm.ru
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Вс мар 09, 2008 14:04

Какие-нибудь коменты будут?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Вс мар 09, 2008 14:40

Да празднуют все! Ещё с 23 февраля.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Вс мар 09, 2008 14:41

А Вы,Бродяга, чтож не ? Али пЫво кончилось ?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Бродяга » Вс мар 09, 2008 15:15

Да я так тут, зашёл...
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Andrew Manson » Вс мар 23, 2008 00:02

Доброго всем времени суток!

Разработал тут намедни пару программок, пишу сюда, вдруг кому полезны будут.


TextAlign для сопоставления предложений из файлов оригинала и перевода и формирования из них файла TMX.

Программа FictionAnalizer. Предназначена в основном для анализа русских текстов художественной направленности, однако может использоваться по своему назначению и для текстов не-художественного направления. Программа проверяет наличие дубляжа в предложении одинаковых или однокоренных слов. Все такие предложения составляются в список, перемещаясь по которому в основном окне производится выделение и показ текущего предложения, где все это можно и поправить, а затем сохранить в файл. В основном тексте дубляж выделяется цветом. Одинаковые слова - оттенками красного фона, однокоренные слова - оттенками синего. Анализ можно проводить и для пар (три-пар и более) предложений.

Кого заинтересовало - для скачивания прошу на мой сайт. Напоминаю его адрес - http://mt2007.nm.ru

Кстати, для МТ2007 разработал простенькую EBM - Example-based machine (для автоматического пополнения переводов частей предложений). В следующую версию скорее всего включу.
По крайней с такими простеникими задачами (см.ниже) справляется хорошо:

На входе два предложения:
Send me a letter - пошли мне письмо
Send me a postcard - пошли мне открытку

EBM из них поймет следующее:
Send me a - пошли мне
Send me - пошли мне
letter - писмо
postcard - открытку

Примерно так. Посмотрим как в реальной работе покажет себя.
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Пн мар 24, 2008 22:54

Прошу дать комментарии по программе TextAlign. Ее скачало с десяток человек. Мне нужно ваше мнение, какой функционал туда еще добавить. И вообще, оказалась ли она полезна в текущей работе тем, кто потестил ее?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Andrew Manson » Пн мар 31, 2008 20:54

Для интересующихся - на сайте у себя выложил конвертилку словарей из формата XDXF в МТ2007.

http://mt2007.nm.ru
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Сообщение Olik » Чт апр 10, 2008 09:21

Andrew Manson писал(а):Какие-нибудь коменты будут?

Планируется ли поддержка украинского языка?
Olik

 
Сообщения: 2489
Зарегистрирован: Пн сен 20, 2004 19:02
Откуда: Крым, Сакский р-н

Сообщение Andrew Manson » Чт апр 10, 2008 12:03

Olik писал(а):Планируется ли поддержка украинского языка?


Пока не знаю. Меня уже просили Узбекский язык включить. Вся проблема в том, что я для быстрого поиска в базе данных похожих предложений я использую некоторые морфологические модули. Для тех языков, которые включены в программу, они у меня есть, для других пока нету 8-) Как только найду - возможно включу. Для украинского, думаю, можно использовать русский стеммер, но не уверен. Стеммер - модуль откидывающий окончания слов, оставляет только неизменную от падежа форму слова...

А вы просто так интересуетесь или уже пробовали программу?
Andrew Manson

 
Сообщения: 261
Зарегистрирован: Чт мар 01, 2007 13:27

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Catnip (МТ2007)

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1