Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Морфологии в OmegaT

Морфологии в OmegaT

Сообщение Константин Лакшин » Пт апр 23, 2010 21:58

Вопрос общего характера.

Обнаружил вдруг, что к Омеге еще в конце 2008 года выпустили примочки для нечеткого поиска с элементами морфологии (в т. ч. для русского). Казалось бы, существенный шаг вперед, и даже в нужном направлении. Почему в Интернете по этому поводу практически гробовое молчание?

Кто-нибудь с ними работает? Если да, то какие впечатления?
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)





Re: Морфологии в OmegaT

Сообщение esperantisto » Сб апр 24, 2010 09:12

Константин, Вы про генераторы меток (tokenizers)?

а) про «в Интернете» не скажу, а в группе пользователей OmegaT на Yahoo! новость, естественно, обсуждалась, народ интересуется, периодически повторяется один и тот же вопрос: «А как их, собственно, установить?»;
б) это не собственная разработка команды OmegaT, а прикрученные сторонние модули;
в) вещь сама по себе хорошая, но чудес ждать не надо. Да, в некоторых случаях OmegaT с генератором меток подбирает совпадения, которые не видит без него, но и раньше подбор работал неплохо. Улучшилось распознавание терминов в том плане, что достаточно ввести термин в исходной форме, а OmegaT выловит его и во всяких падежах/родах/лицах. Однако для функционирования TransTips всё равно надо добавлять разные словоформы.
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Морфологии в OmegaT

Сообщение Константин Лакшин » Ср апр 28, 2010 10:33

esperantisto писал(а):Константин, Вы про генераторы меток (tokenizers)?


Угу, про них. Когда писал, некоторое время боролся с желанием написать просто по-русски «токенизатор».

а в группе пользователей OmegaT на Yahoo!... ...периодически повторяется один и тот же вопрос: «А как их, собственно, установить?»


Что меня и удивило. Вопросы про установить, ответы про причуды лицензирования... ...и все?

б) это не собственная разработка команды OmegaT, а прикрученные сторонние модули


Так в этом же и прелесть: потенциально полезных сторонних модулей есть -- было бы желание прикручивать!

Если чуть серьезнее, то я который год твержу, что в неудобной для переводчика практического форме существует масса полезного. В данном случае меня интригует отсутствие реакции зала.

Улучшилось распознавание терминов в том плане, что достаточно ввести термин в исходной форме, а OmegaT выловит его и во всяких падежах/родах/лицах. Однако для функционирования TransTips всё равно надо добавлять разные словоформы.


Но, насколько я понимаю, при этом никто не просит хотя бы списка подсказок во всех формах (несмотря на то, что алгоритм приведения всех форм к словарной (и наоборот) вроде бы присутствует и работает). Или я чего-то недопонял?
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Re: Морфологии в OmegaT

Сообщение esperantisto » Ср апр 28, 2010 11:49

Вопросы про установить, ответы про причуды лицензирования


В смысле? На вопросы про установку, как правило, даются ответы про установку. По крайней мере, в яхушной рассылке.

потенциально полезных сторонних модулей есть


Например?

было бы желание прикручивать!


Были бы люди это делать…

никто не просит хотя бы списка подсказок во всех формах


А зачем? И разве где-то это есть?
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Морфологии в OmegaT

Сообщение Константин Лакшин » Чт апр 29, 2010 03:39

esperantisto писал(а):В смысле? На вопросы про установку, как правило, даются ответы про установку. По крайней мере, в яхушной рассылке.


В том смысле, что практически ни слова про то, что происходит после установки, и никаких запросов на доработку.

esperantisto писал(а):
потенциально полезных сторонних модулей есть

Например?


Можно я пока ограничусь как бы списком списков?

http://www.rvb.ru/soft/catalogue/catalogue.html
http://macrocosm.narod.ru/index.html
http://www.solarix.ru/
http://www.rvb.ru/soft/
http://registry.dfki.de/
http://www.athel.com/


esperantisto писал(а):
никто не просит хотя бы списка подсказок во всех формах

А зачем? И разве где-то это есть?


Про такое в кошках не слыхал, а в поиске-замене, проверке орфографии, словарях (в явной или неявной форме) полно.

Вы про зачем всерьез?! Затем, например, чтобы не править окончания раз за разом ручками, или затем, чтобы была основа для задания подстановки форм в зависимости от контекста.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Re: Морфологии в OmegaT

Сообщение esperantisto » Чт апр 29, 2010 09:09

что происходит после установки


После установки они какбэ работают, а результаты работы сильно зависят от языка и самого генератора меток.

никаких запросов на доработку


На доработку генераторов? Так их бессмысленно задавать в группе по OmegaT.

Можно я пока ограничусь как бы списком списков?


Пользы не очень много: значительная часть — нативные приложения для Windows/Linux, а OmegaT написана на Java. Теоретически можно написать обёртку (как это сделано для Hunspell), но не для всего и, опять же, людей мало…
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Морфологии в OmegaT

Сообщение Константин Лакшин » Пн май 03, 2010 18:29

esperantisto писал(а):Пользы не очень много: значительная часть — нативные приложения для Windows/Linux, а OmegaT написана на Java.


Понял. На всякий случай -- вот кое-что на Java:

http://opennlp.sourceforge.net/
http://alias-i.com/lingpipe/
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Déjà Vu

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 5