Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

SOS! Шрифт при экспорте из DV X2

Re: SOS! Шрифт при экспорте из DV X2

Сообщение mikhailo » Чт май 09, 2019 23:06

А вот еще один case.
Получил для перевода с французского на русский 2-страничный вордовский файл (.docx).
Конвертировал его в .doc, так мне удобнее работать.


1. ошибка — конвертировать в док надо конечный файл.
2. проблема — надо смотреть шрифты...
3. 3 версия всё же получше.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД





Re: SOS! Шрифт при экспорте из DV X2

Сообщение Viktor N. » Пт май 10, 2019 00:20

mikhailo писал(а):
А вот еще один case.
Получил для перевода с французского на русский 2-страничный вордовский файл (.docx).
Конвертировал его в .doc, так мне удобнее работать.


1. ошибка — конвертировать в док надо конечный файл.
2. проблема — надо смотреть шрифты...
3. 3 версия всё же получше.


Спасибо за отклик, mikhailo.
Но:
1. А зачем? Раньше у меня проблем после .docx --> .doc не было. И клиенты без замечаний принимали русские файлы .doc.
2. Во французском файле был обычный шрифт Times New Roman.
3. Учту на будущее.
А м.б. это последнее обновление Windows 10 как-то влияет? Разве что попробовать поэкспериментировать с другими вордовскими файлами, конвертированными в .doc.
Viktor N.

 
Сообщения: 2076
Зарегистрирован: Ср дек 24, 2003 14:15
Откуда: Бельгия
Язык(-и): Fr/En/De-->Ru

Re: SOS! Шрифт при экспорте из DV X2

Сообщение mikhailo » Пт май 10, 2019 09:58

1. А зачем? Раньше у меня проблем после .docx --> .doc не было. И клиенты без замечаний принимали русские файлы .doc.


Затем что САТ гораздо корректнее работает с более менее стандартизированным xml файлов docx, нежели с недокументированной проприетарщиной формата doc.

А м.б. это последнее обновление Windows 10 как-то влияет? Разве что попробовать поэкспериментировать с другими вордовскими файлами, конвертированными в .doc.


Судя по количеству стонов владельцев 10 на разных форумах - про неё можно сказать только одно - хочет человек много секса - пусть ставит 10 и включает обновления.....
Для 10, как никогда актуальным становится положение - поставил - настроил - отключил обновления и работай......

А в принципе, судя по фейлу с новой версией DejaVuX4 — Атрил, похоже, идёт ко дну, и в перспективе надо смотреть на другие САТ. К Деже по духу и функциям ближе MemoQ, чем Традостудия.....
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: SOS! Шрифт при экспорте из DV X2

Сообщение random_nick » Ср май 15, 2019 12:47

Viktor N. писал(а):Ирuc2аuc2зуuc2жсuc2еuc2гuc2оuc2дuc2нuc2янuc2аuc2мдuc2еuc2йuc2сuc2тuc2вuc2иuc2тuc2еuc2лuc2ьuc2нuc2онuc2евuc2еuc2зuc2ёuc2т

Рискну предположить, что на одной странице у вас одна кодировка, на другой - другая. Соответственно, проблема в том, что программа попыталась прочитать раздел с другой кодировкой используя ту кодировку, которая была на первой странице. С DOC вообще могут быть фокусы. Например, некоторые программы любят генерировать RTF, а обзывать его DOC, потому что Word все равно это откроет. Однако, стандартная кодировка у RTF другая ("A standard RTF file can consist of only 7-bit ASCII characters, but can encode characters beyond ASCII by escape sequences"), в результате имеем шанс получить вопросы, квадраты или мешанину из кодировок.
Однако, что бы это значило и как с этим бороться?

Не смешивать форматы. Лучше берите docx - там хотя бы кодировка изначально нормальная. И с осторожностью используйте форматы/программы, которые используют кодировки, отличные от UTF-8/16.
random_nick

 
Сообщения: 518
Зарегистрирован: Ср июн 26, 2013 02:33

Re: SOS! Шрифт при экспорте из DV X2

Сообщение Viktor N. » Ср май 15, 2019 16:16

random_nick писал(а):
Viktor N. писал(а):Ирuc2аuc2зуuc2жсuc2еuc2гuc2оuc2дuc2нuc2янuc2аuc2мдuc2еuc2йuc2сuc2тuc2вuc2иuc2тuc2еuc2лuc2ьuc2нuc2онuc2евuc2еuc2зuc2ёuc2т

Рискну предположить, что на одной странице у вас одна кодировка, на другой - другая.


Ваше предположение оказалось верным. Спасибо. :-) Теперь я проверил 2-ю страницу французского файла .doc, полученного путем конвертирования (конвертации?) из файла .docx. Оказалось, что для этой страницы окно, показывающее тип шрифта, пустое, размер шрифта - 12. А для первой страницы тип шрифта - Times New Roman, размер шрифта - 12.
Удивительно другое: на экране в MS Word 2003 текст этого файла отображался совершенно нормально, да и распечатался без проблем. Потому-то я и не заметил подвоха.
Viktor N.

 
Сообщения: 2076
Зарегистрирован: Ср дек 24, 2003 14:15
Откуда: Бельгия
Язык(-и): Fr/En/De-->Ru

Re: SOS! Шрифт при экспорте из DV X2

Сообщение random_nick » Ср май 15, 2019 18:07

Viktor N. писал(а):Удивительно другое: на экране в MS Word 2003 текст этого файла отображался совершенно нормально, да и распечатался без проблем. Потому-то я и не заметил подвоха.

Это особенности форматов DOC/DOCX. DOCX - обычный XML в кодировке UTF-8, заархивирован в ZIP, потенциально может включать бинарные вставки. DOC - бинарный формат, мини-файловая система, может включать несколько секций. ЕМНИП, каждая секция может иметь собственный набор правил для кодирования одной буквы. DOCX же, насколько понимаю, допускает только одну кодировку. Поэтому, теоретически, можем получить неприятную неожиданность при конвертации, особенно при использовании сторонних программ. Но это все насколько я понимаю, не претендую на истину в последней инстанции.
random_nick

 
Сообщения: 518
Зарегистрирован: Ср июн 26, 2013 02:33

Пред.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Déjà Vu

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2