Marko писал(а):нормальный есть - Solid Converter PDF или последний Adobe Acrobat
Не, только тексты, созданные этим же человеком в этом же Adobe Acrobat. Пробовали "чужие" файлы тоннами - никакой разницы, всё равно доля ручной работы очень велика.
Adobe даже рекламирует онлайновый сервис за 20 енотов в год по преобразованию пдф в док. Скажу сразу - не пробовал заранее и умышленно - будет тот же хлам.
Marko писал(а):чтобы вредные pdf`ки адекватно конвертировал
Что такое "вредные"? Скривленные и в виде рисунков? Так их проще распознавать FineReader'ом.
Andrew писал(а):Да бог с ним, с экспортом, наладили бы импорт
Боюсь, коллега, что наоборот. В пдф корректно экспортирует почти любая китайска кака. Но наоборот - ни одна. Корректно, конечно, а не кое-как.
Валерий Афанасьев писал(а):вообще корректное извлечение текста из ПДФ средствами кошки невозможно в принципе...
Сам по себе Традос тут не при чем. Делает извлечение текста из любого формата отдельный программный сегмент, не имеющий никакого отношения к работе базы данных САТ.
Покойный Андрей Руляков мне рассказывал, как традосовские разрабочики годами бились хакерскими методами с проприетарными форматами Мелкософта. Только поэтому все поколения Традоса работали нестабильно.
Валерий Афанасьев писал(а):Мне вот больше интересно, что в Традосе есть (если есть) такого, ради чего я пересел бы на него с MemoQ.
Должно быть лишь это: стабильность работы с распространенными открытыми и проприетарными форматами файлов (кроме непробиваемых в принципе, типа пдф), а также совместимость файлов памяти, что разработчику невыгодно. Более ничего не надо. Что только не навернут сверху, даже перетаскивание памяти с собой, но всё равно это никому не надо.