Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Коды в Deja Vu

Сообщение Бродяга » Пт ноя 10, 2006 16:28

sarm писал(а):В других случаях Дежа вставляет те коды, которые есть в паре из ТМ, а это, очень часто, просто мусор для переводимого текста.

В этом отношении я вас очень хорошо понимаю, и согласен с возможной необходимостью удаления подобных кодов. Проблема остаётся только в том, чтобы не грохнуть "нормальные" коды, полученные из "аккуратных" документов, которые пригодятся в будущем.

Насчёт номеров и названий деталей - однозначно таблица. В случае PDF попробуйте для её вытаскивания использовать BCL Jade. Кое-что придётся доделывать вручную, но результат будет весьма приятным. Хотя последний SolidConverter PDF (3.1) тоже таблицы неплохо распознаёт.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34





Сообщение sarm » Пт ноя 10, 2006 16:53

----------------------
Да вот только знать бы, что в будущем будет достаточное количество "аккуратных" документов. Мне, как правило, сие не ведомо, поэтому я и ратую за вылизанные ТМ.
----------------------
Solid стал пользовать недавно, результатами, в общем, доволен.
С BCL еще до конца не разобрался, много возможностей и настроек, но похоже, что инструмент "справный".

Бродяга, спасибо за поддержку!
sarm

 
Сообщения: 30
Зарегистрирован: Ср ноя 08, 2006 21:21
Откуда: Novosibirsk

Сообщение Бродяга » Пт ноя 10, 2006 17:02

У меня, к счастью, есть заведомо "аккуратные" заказчики и заведомо "поросята", которых, к счастью, значительно меньше. Для "поросят" использую отдельную "свинскую" TM, при этом "аккуратная" подключается только на чтение. Хотя не так давно на одном из крупных и "аккуратных" проектов только на чтение была подключена как раз "свинская" память, доставшаяся по наследству. Вычищать её не было ни времени, ни желания. "Свинства" из неё приходило не так много, и работу она практически не замедляла - в Деже индексация грамотно построена.

А гаек в BCL Jade действительно полно. Практически на все случаи жизни. Из замеченных глюков - во многих случаях не вытаскивается цвет шрифта. По крайней мере, из-под седьмого Акробата.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение sarm » Пт ноя 10, 2006 17:41

К слову о паразитных кодах. Недавно обнаружил, что при импортировании ТМХ (полученных в Транзите или Традосе), в Дежу в ТМ заносятся пустые пары, содержащие только код {1}. Причем эти пары идут через одну с нормальными. Что за беда? Убрать то их не проблема, но сам факт. ТМХ использовал 1.4
sarm

 
Сообщения: 30
Зарегистрирован: Ср ноя 08, 2006 21:21
Откуда: Novosibirsk

Сообщение Бродяга » Пт ноя 10, 2006 22:46

Не верьте в стандарт TMX. Нет его.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение sarm » Сб ноя 11, 2006 16:34

Вот это да! А я считал, что только ТМХ и обеспечивает совместимый перенос информации между разными CAT. Между прочим, когда я делаю тоже самое в Транзите или Традосе, подобного (пустых строк) не наблюдалось. Может это Дежа косячит?

Так а чем тогда пользоваться для корректного переноса баз? Разъясните, Бродяга, если не трудно?
sarm

 
Сообщения: 30
Зарегистрирован: Ср ноя 08, 2006 21:21
Откуда: Novosibirsk

Сообщение Бродяга » Сб ноя 11, 2006 17:10

Пользоваться, к сожалению, придётся именно TMX. Проблема в том, что это открытый XML-ный формат, в который каждый производитель кошек добавляет всё, что не лень. Да, в конце концов, даже пользователь ТРАДОСа может добавлять в него собственные поля.

В этом отношении наиболее свирепствует Транзит. Каждый сегмент содержит полный путь и имя файла, из которого он был получен. В других кошках это поле, естественно, не предусмотрено. При импорте оно либо будет создано и заполнено, либо просто пропущено. Это к вопросу о "вылизывании" баз. Вы видите далеко не всё, что реально записано в сегменты.

Причины возникновения пустых пар с кодами, скорее всего, связаны именно с этим. То есть, в оригинальной TM было нечто, что предыдущая кошка воспринимала, как необходимый элемент, а Дежа воспринимает, как тег или непереводимый сегмент. Попробуйте открыть файл TMX текстовым редактором (тем же Вордом) и посмотреть, что конкретно это за пары. Возможно, что что-то и прояснится.

Правда, только что возникло ещё и подозрение, что Дежа может некорректно работать с TMX 1.4. Подробно ничего сказать не могу. Попробуйте TMX 1.1.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Neva » Сб ноя 11, 2006 19:51

Бродяга писал(а):Насчёт "не подставляет перевод предложения только потому, что там код на другом месте" могу сказать, что это несколько странно. Программа обычно видит, что текст совпадает полностью, или даже частично, и подставляет подобный сегмент.


Ну, вот! Почему у меня все не как у людей? Моя ДЖ в половине случаев не подставляет сегмент, если там код на другом месте или отсутствует, например.
Neva

 
Сообщения: 1412
Зарегистрирован: Пн дек 23, 2002 17:14
Откуда: Московская область

Сообщение Neva » Сб ноя 11, 2006 20:15

Mikhail писал(а):Все коды из базы удалены. База не повреждена.


Стоп! Но ведь между скобЫчками еще и цифирьки стот? А куда же они деваются при этом?
Neva

 
Сообщения: 1412
Зарегистрирован: Пн дек 23, 2002 17:14
Откуда: Московская область

Сообщение Бродяга » Сб ноя 11, 2006 22:43

"Цифирьки" - это замена реальных тегов (чтобы тупые юзеры не ужаснулись). Многие из которых "весят" больше, чем текст сегмента. Не представляю универсального способа удаления их из базы. Если вы не тупой юзер и хотите ужаснуться - нажмите F6.

Насчёт Дежи скажу только, что, начиная с версии 7.0, она анализирует реальное содержимое этих тегов. В 3.0 она сохраняла в базе только "цифирьки".
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Neva » Вс ноя 12, 2006 17:06

Бродяга писал(а):"Цифирьки" - это замена реальных тегов.


Нет, ну что это за цифирьки я-то знаю. Мне интересно, куда они деваются при удалении скобочек вышеописанным методом. Скобки-то удалим, а цифирьки, которые между ними были, останутся?

Бродяга писал(а): В 3.0 она сохраняла в базе только "цифирьки".


Пардон, это как? Объясните, пожалуйста, тупому юзеру :lol:
Neva

 
Сообщения: 1412
Зарегистрирован: Пн дек 23, 2002 17:14
Откуда: Московская область

Сообщение Бродяга » Вс ноя 12, 2006 17:46

1. Куда денутся "цифирьки" или теги, я не представляю. Методику придумал не я. Возможно, что коды будут удалены целиком, как объекты. Подтвердить или опровергнуть не берусь.

2. В версии 3.0 содержимое самих тегов полноценно не сохранялось. В их составе сохранялись именно "цифирьки" в скобочках. При переносе TM, например, в ТРАДОС через TMX начиналась полная хренотень.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Neva » Вс ноя 12, 2006 21:48

Бродяга писал(а):1. Куда денутся "цифирьки" или теги, я не представляю. Методику придумал не я.


Прошу прощения, если ввела в заблуждение. Просто изначально вопрос задавался автору сего метода, т.е. Михаилу, кого я, собственно, и процитировала.
Neva

 
Сообщения: 1412
Зарегистрирован: Пн дек 23, 2002 17:14
Откуда: Московская область

Сообщение Бродяга » Сб ноя 18, 2006 12:18

Проверил. Действительно, при удалении скобок удаляются коды целиком. Технология достаточно полезная, но только при аккуратном использовании. Как я уже говорил, среди кодов бывает немало нужных, которые удалять не следует. Поэтому просто Ctrl+H использовать нельзя. Ручная последовательная замена - тоже не выход на больших базах. Остаётся фильтрация базы по проектам с последующим удалением кодов из "свинских" проектов. Или даже не по проектам, а по каким-то характерным признакам "свинства" (их часто можно определить). Спасибо братьям Бенитам за то, что встроили в Дежу поддержку SQL.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Пред.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Déjà Vu

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2