Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Перевод на русский язык не распознаёт

Перевод на русский язык не распознаёт

Сообщение Vulpes » Вс дек 08, 2013 00:21

Привет,
У меня проблема с переводом на русский в OmegaT 3.0.5, я беру текстовые файлы(.txt) на немецком(н-р) (который encodingUTF - 8), перевожу в OmegaT на русский, потом генерирую окончательный вариант этого файла, и в целевой папке я открыв этот файл получаю не русский перевод, только символы в виде вопросов (это только когда с текстовыми файлами(.txt) работаю), а в .docx н-р всё нормально читает, а почему в .txt нет? . Что я могу сделать, чтобы перевод на русский происходил с нормальным расиознаванием текста? Не могли бы вы дать мне некоторые советы, о том что в таком случае надо делать? Разве OmegaT не распознаёт русские символы?

Спасибо заранее,
Vulpes

 
Сообщения: 7
Зарегистрирован: Вс дек 08, 2013 00:05





Re: Перевод на русский язык не распознаёт

Сообщение mikhailo » Вс дек 08, 2013 02:23

У меня проблема с переводом на русский в OmegaT 3.0.5, я беру текстовые файлы(.txt) на немецком(н-р) (который encodingUTF - 8), перевожу в OmegaT на русский, потом генерирую окончательный вариант этого файла, и в целевой папке я открыв этот файл получаю не русский перевод, только символы в виде вопросов (это только когда с текстовыми файлами(.txt) работаю), а в .docx н-р всё нормально читает, а почему в .txt нет? . Что я могу сделать, чтобы перевод на русский происходил с нормальным расиознаванием текста? Не могли бы вы дать мне некоторые советы, о том что в таком случае надо делать? Разве OmegaT не распознаёт русские символы?


Смотрите кодировки входных-выходных файлов. Вроде уже все программы научились работать с Юникодом.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3316
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Перевод на русский язык не распознаёт

Сообщение hawkwind » Вс дек 08, 2013 03:49

1. Кодировка по умолчанию

Простые текстовые файлы, в большинстве случаев имеющие расширение «txt», содержат только текст, и нет чёткого способа сообщить компьютеру, на каком языке этот текст написан. Самое большее, что ОмегаТ может сделать в этом случае, это считать, что текст написан на том же языке, что и язык, используемый операционной системой. Для файлов в 16-битной Юникод-кодировке такой проблемы не существует. Однако, если файл имеет 8-битную кодировку, может возникнуть неприятная ситуация.



2. Подход ОмегаТ
В целом, в ОмегаТ есть три метода борьбы с этой проблемой. Все они основываются на использовании файловых фильтров в меню Параметры.
Измените кодировку исходных файлов на Юникод.
откройте исходный файл в текстовом редакторе, который корректно распознаёт кодировку и сохраните файл в кодировке «UTF-8». Измените расширения файла с .txt на .utf8. ОмегаТ автоматически распознает его как UTF-8 файл. Этот подход наиболее разумен, так как позволяет избавиться от многих проблем в дальнейшем.
Укажите кодировку текстовых файлов
то есть файлов с расширением .txt : в секции Текстовые файлы диалогового окна «Файловые фильтры» измените кодировку исходных файлов с «<auto>» на кодировку, соответствующую вашим исходным .txt-файлам, например, на «.jp» для примера выше.
Измените расширение исходных текстовых файлов
например, для японских текстовых файлов с .txt на .jp: в секции Текстовые файлы диалогового окна «Файловые фильтры» добавьте новый Шаблон имени исходного файла (например, на *.jp для вышеприведённого примера) и выберите необходимые кодировки оригинала и перевода.
По умолчанию в ОмегаТ включены следующие настройки, чтобы вам было легче работать с некоторыми текстовыми файлами:
файлы .txt автоматически («<auto>») считаются сохранёнными в кодировке компьютера по умолчанию.
файлы .txt1 считаются сохранёнными в кодировке ISO-8859-1, которая покрывает большинство языков Западной Европы.
файлы .txt2 считаются сохранёнными в кодировке ISO-8859-2, которая покрывает большинство языков Центральной и Восточной Европы.
файлы .utf8 считаются сохранёнными в кодировке UTF-8 (она покрывает почти все языки мира).
hawkwind

 
Сообщения: 8118
Зарегистрирован: Сб мар 31, 2007 15:24
Откуда: Владивосток
Язык(-и): eng - rus

Re: Перевод на русский язык не распознаёт

Сообщение esperantisto » Вс дек 08, 2013 10:27

hawkwind дал хороший, развёрнутый ответ. Можно и нужно дополнить только ещё следующим: OmegaT позволяет настраивать ряд параметров ввода/вывода файлов, включая кодировку. Зайдите в Настройки → Файловые фильтры, выберите пункт «Текстовые файлы», нажмите «Изменить» и выставьте для .txt нужную кодировку вместо <авто>.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6688
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Перевод на русский язык не распознаёт

Сообщение hawkwind » Вс дек 08, 2013 13:03

А можно ли в окне перевода без копипаста вводить кавычки-елочки?
hawkwind

 
Сообщения: 8118
Зарегистрирован: Сб мар 31, 2007 15:24
Откуда: Владивосток
Язык(-и): eng - rus

Re: Перевод на русский язык не распознаёт

Сообщение esperantisto » Вс дек 08, 2013 13:06

А что мешает? Я ввожу без проблем.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6688
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Перевод на русский язык не распознаёт

Сообщение hawkwind » Вс дек 08, 2013 13:24

Через Alt?
hawkwind

 
Сообщения: 8118
Зарегистрирован: Сб мар 31, 2007 15:24
Откуда: Владивосток
Язык(-и): eng - rus

Re: Перевод на русский язык не распознаёт

Сообщение esperantisto » Вс дек 08, 2013 14:10

На русской раскладке у меня фирменное своё: AltGr+<, AltGr+>, а на английской пользуюсь стандартными последовательностями Compose < <, Compose > >.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6688
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Перевод на русский язык не распознаёт

Сообщение Vulpes » Вс дек 08, 2013 14:19

Спасибо всем большое за ваши советы и уделённое на это время, hawkwind спасибо за подробное описание, всё работает. :grin:
Vulpes

 
Сообщения: 7
Зарегистрирован: Вс дек 08, 2013 00:05

Re: Перевод на русский язык не распознаёт

Сообщение esperantisto » Вс дек 08, 2013 14:25

Кстати, в последних версиях (не помню точно, с какой) появилась возможность вставки практически любого символа через таблицу символов, вызываемую нажатием Ctrl+пробел (несколько раз, пока не появится).
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6688
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Перевод на русский язык не распознаёт

Сообщение hawkwind » Вс дек 08, 2013 14:27

У меня цифровой клавиатуры и таких клавиш нет. Просто думал, может, есть какая возможность, как в Ворде, заменить простые кавычки парными.
hawkwind

 
Сообщения: 8118
Зарегистрирован: Сб мар 31, 2007 15:24
Откуда: Владивосток
Язык(-и): eng - rus

Re: Перевод на русский язык не распознаёт

Сообщение Vulpes » Вс дек 08, 2013 14:28

Ещё 1 вопрос, почему в OmegaT не открывается .xml файл?
Vulpes

 
Сообщения: 7
Зарегистрирован: Вс дек 08, 2013 00:05

Re: Перевод на русский язык не распознаёт

Сообщение esperantisto » Вс дек 08, 2013 14:29

hawkwind, так Compose настраивается в свойствах DE (у меня — CapsLock). А AltGr — это правый (под правой рукой) Alt (на многих клавиатурах он и обозначен как AltGr, но не на всех).
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6688
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Перевод на русский язык не распознаёт

Сообщение esperantisto » Вс дек 08, 2013 14:30

Vulpes, какой именно файл? Т. е., какое именно приложение XML.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6688
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Перевод на русский язык не распознаёт

Сообщение Vulpes » Вс дек 08, 2013 14:38

самый простой файл сохраненный под .xml, вот то что внутри н-р:
Код: Выделить всё
<employees>
  <employee id="111">
    <firstName>Rakesh</firstName>
    <lastName>Mishra</lastName>
    <location>Bangalore</location>
  </employee>
  <employee id="112">
    <firstName>John</firstName>
    <lastName>Davis</lastName>
    <location>Chennai</location>
  </employee>
  <employee id="113">
    <firstName>Rajesh</firstName>
    <lastName>Sharma</lastName>
    <location>Pune</location>
  </employee>
</employees>
Vulpes

 
Сообщения: 7
Зарегистрирован: Вс дек 08, 2013 00:05

Re: Перевод на русский язык не распознаёт

Сообщение esperantisto » Вс дек 08, 2013 14:42

Дело в том, что OmegaT не работает «с XML», требуется конкретный фильтр под конкретное приложение (например, DOCX, ODF — всё это приложения XML, под которые есть фильтры).
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6688
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Перевод на русский язык не распознаёт

Сообщение Vulpes » Вс дек 08, 2013 14:45

понятно, спасибо.
Vulpes

 
Сообщения: 7
Зарегистрирован: Вс дек 08, 2013 00:05



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в OmegaT

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2