Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Базовые принципы работы с ПДФ-файлами для новичков

Переводческое образование и самообразование

Базовые принципы работы с ПДФ-файлами для новичков

Сообщение mikhailo » Вт ноя 04, 2014 16:50

Набросал небольшой, тезисный туториал на тему работы с ПДФ на примере небольшой, но довольно сложной (на начальных этапах работы письменного переводчика) задачи.

Судя по количеству вопросов по данной теме и уровню понимания проблемы даже у некоторых разработчиков (привет SmartCat), надеюсь на его полезность.

Замечания и предложения по усовершенствованию, а также вопросы, которые попили крови — are welcome!
С вопросами просьба описывать собственные попытки решения проблемы. В противном случае ответа может не последовать.

Сложноватый пример выбрал потому, что жизненный опыт показал, чем сложнее решаемые задачи, тем скорее отсеиваются негодные и быстрее растут оставшиеся.

Туториал, исходный ПДФ и документ, который должен получиться: http://rghost.ru/58881328
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД





Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение natalia rostovskaya » Вт ноя 04, 2014 23:54

Mikhailo, большое спасибо! Очень полезный урок! :grin:
natalia rostovskaya

 
Сообщения: 812
Зарегистрирован: Вт дек 02, 2008 17:58
Язык(-и): исп/порт/рус

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение Эдуард Денисюк » Ср ноя 05, 2014 00:01

Возможно, было бы лучше если -- не docx -- а просто в doc было бы.
Эдуард Денисюк

 
Сообщения: 21
Зарегистрирован: Вс мар 11, 2012 10:32
Откуда: Беларусь / Belarus / 白俄罗斯
Язык(-и): IT-RU, EN-RU

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение Drunya » Ср ноя 05, 2014 00:15

Эдуард Денисюк писал(а):было бы лучше если -- не docx -- а просто в doc было бы

В pdf :-)
На замечание: «Вы написали с ошибкой», ответствуй: «Так всегда выглядит в моем написании».
— Из дневника Д. Х.
Аватара пользователя
Drunya
Биоволк
 
Сообщения: 8906
Зарегистрирован: Сб май 03, 2003 20:23

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение mikhailo » Ср ноя 05, 2014 08:57

Возможно, было бы лучше если -- не docx -- а просто в doc было бы.


Товарищи, просьба пояснять свою точку зрения.
С моей точки зрения и по опыту doc гораздо более проблемный формат для TM-программ, нежели docx, который по сути является неплохо документированной разновидностью XML.
Из всех ТМ мне ближе всего ДежаВюИкс(). В своё время она была, наверное самой проблемной по работе с doc, но, обычно, без проблем обрабатывала полученные из таких doc docx-файлы. Это первый фактор, обусловивший выбор формата docx.
Второй фактор следующий. Руководство рассчитано на новичков, студентов и выпускников. Они Ворды 2, 95, 97, 2000, 2002, 2003 видели, может быть только в статьях на различных сайтах, и явно не будут в них работать. У более новых версий Ворд форматом по умолчанию является docx.

Что касается pdf - новые версии офиса поддерживают сохранение в ПДФ без акробат-принтера. Поэтому не вижу проблем с сохранением результата в данный формат.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение esperantisto » Ср ноя 05, 2014 10:13

С моей точки зрения и по опыту doc гораздо более проблемный формат для TM-программ, нежели docx,


Мой опыт об обратном: DOCX проблематичнее. Даже после преобразования туда-сюда и работы напильником остаётся лес тэгов. Кроме того, как у меня, так и у других пользователей в случае оригинала в DOCX были проблемы с экспортом перевода из memoQ. Разумеется, сказанное не касается выбора формата для просто чтения.
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7037
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение chudo » Ср ноя 05, 2014 16:25

А у меня при работе в Традосе как раз чаще было так, как описывает mikhailo, то есть
mikhailo писал(а):
doc гораздо более проблемный формат для TM-программ, нежели docx

без проблем обрабатывала полученные из таких doc docx-файлы.
Тандем "вменяемый заказчик+вменяемый переводчик" в состоянии свернуть горы. (Шубин)
chudo

 
Сообщения: 3303
Зарегистрирован: Пн авг 23, 2004 15:20
Откуда: Ростов-на-Дону

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение Валерий Афанасьев » Чт ноя 06, 2014 02:14

mikhailo, +5! Так держать! Больше туториалов, хороших и разных :) Я все собираюсь сделать свой второй ролик по всяким хинтсам, типсам и триксам в Инфиксе, пока загрузка по работе не позволяет. Но м.б. на новогодних каникулах сподоблюсь.

esperantisto писал(а):
С моей точки зрения и по опыту doc гораздо более проблемный формат для TM-программ, нежели docx,


Мой опыт об обратном: DOCX проблематичнее. Даже после преобразования туда-сюда и работы напильником остаётся лес тэгов.


Тема вообще чертовски интересная для некоторых кругов переводчиков. А не замутить ли как-нибудь именно на эту тему онлайновый междусобойчик? Через Тимвьюер, там, или через WizIQ? Просто притащить конкретные файлы и вместе посмотреть, где там, чего и как. Мог бы получиться полезный обмен опытом. Лично я готов показать, как вся эта фигня работает (или не работает) у меня. Если коллеги покажут и подскажут, что и как лучше делать или не делать, было бы ведь здорово.

Я живу в среде MemoQ (2013R2) + docx. Если docx из Файнридера вылез дурной и с помощью ТрансТулза не чистится, сохраняю его в rtf. Но не в DOC. Не знаю, насколько хороша такая практика.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение mikhailo » Чт ноя 06, 2014 11:06

Валерий - не вопрос. Честно говоря, если бы не выходные и ещё один фактор, тоже вряд ли бы сподобился, хотя вместилища знаний уже и хотят отдать находящееся внутри. Вот только достойных кандидатов не видно.

Тема интересна, в основном, для опытных технических переводчиков. Что касается онлайна пока не знаю - в свое время после онлайн презентации Океем 3-й дежи с собственным кривым русским переводом, я даже как-то стал и бояться. (что мешало довести перевод презентуемого продукта до ума, или, видя то же, что и я, переключиться на английский — ума не приложу. Можно было бы написать продолжение к посту для молодёжи.)

Меня сейчас другое встревожило — в трёх последних попавшихся на глаза переводных русскоязычных стандартах/проектах стандартов при сравнении с оригиналами выявились серьёзные ошибки (об ISO 14520 уже написал уже здесь). Ещё, как оказалось, в отдельных органах стандартизации считается нормальным переводить стандарт с перевода (DIN EN переводить не с родного английского, а с немецкого). Даже не знаю, что и думать.

Что касается тэгов — в последней Деже вроде побороли проблему тэгов в доках из ФР - даже без чистки кодзаппером НИ ОДНОГО ТЭГА!!! (Отчасти это правда связано с частичной их визуализацией — курсив, подчёркивание и жирный шрифт последняя дежа показывает)
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение Aleksandr Selivanov » Пт янв 16, 2015 20:56

Оффтопик
mikhailo писал(а):Набросал небольшой, тезисный туториал на тему работы с ПДФ

mikhailo, разрешите разместить ваш туториал в «Энциклопедии переводчика»?
Совершенствовать среду обитания ..:.. «Звенящие кедры России» ..:.. Лайфхак = житейка
Аватара пользователя
Aleksandr Selivanov

 
Сообщения: 1039
Зарегистрирован: Вт дек 14, 2010 23:19
Откуда: Арицын, Вéрусь, Счастье

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение Alter Ego » Сб янв 17, 2015 00:30

mikhailo писал(а):Туториал, исходный ПДФ и документ, который должен получиться: http://rghost.ru/58881328

Файл удален.

???
Alter Ego
Читатель Розенталя
 
Сообщения: 13687
Зарегистрирован: Вс дек 04, 2005 16:25
Откуда: Петербург

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение mikhailo » Вс янв 18, 2015 11:51

Обновил ссылку
http://rghost.ru/60415685

mikhailo, разрешите разместить ваш туториал в «Энциклопедии переводчика»?


Почему нет. Размещайте. И второй туториал по переводу стандартов тоже можете разместить. Только копирайт не удаляйте. А то мало ли, вдруг кто какую идею надумает, а куда сообщить, не будет знать :grin:
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение Aleksandr Selivanov » Пн янв 19, 2015 00:24

mikhailo писал(а):Размещайте.

Готово. Базовые принципы работы с pdf-файлами.
Совершенствовать среду обитания ..:.. «Звенящие кедры России» ..:.. Лайфхак = житейка
Аватара пользователя
Aleksandr Selivanov

 
Сообщения: 1039
Зарегистрирован: Вт дек 14, 2010 23:19
Откуда: Арицын, Вéрусь, Счастье

Re: Базовые принципы работы с ПДФ-файлами для новичков

Сообщение Alter Ego » Пн янв 19, 2015 01:13

mikhailo писал(а):Обновил ссылку

Сработала, спасибо.
Alter Ego
Читатель Розенталя
 
Сообщения: 13687
Зарегистрирован: Вс дек 04, 2005 16:25
Откуда: Петербург



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Улица просвещения

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1