Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Кошка across

Сообщение Бродяга » Чт июл 13, 2006 14:31

across писал(а):Ранее в across имелась возможность работать с MS Jet, но, в связи с тем, что Jet при большом количестве данных работает значительно медленнее, чем MS SQL было принято решение об использовании MSDE в Personal Edition.


MS Jet при грамотном программировании и индексации летает. Пример - DejaVu.
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34





Сообщение Andrew » Чт июл 13, 2006 14:31

Потенциальная возможность замедления еще не означает, что работа действительно затормозится. Думается, это программа (или разработчики) перестраховывается, заранее испрашивая себе индульгенцию. Я после таких сообщений серьезного торможения пока не отмечал, учитывая, что в целом across - продукт довольно неторопливый.
Andrew
Хранитель огня
 
Сообщения: 9921
Зарегистрирован: Пн янв 14, 2002 12:28
Откуда: Rostov-on-Don
Блог: Просмотр блога (23)
Язык(-и): EN<->RU

Re: Кошка across

Сообщение Макс » Чт июл 13, 2006 14:41

Gleb Lepeshkin писал(а):Кто-нибудь пользовался широко разрекламированной баннером "кошкой" accross. Смогли ли разработчики Nero сделать невозможное возможным, а именно избавить нас от глюкавости Традоса и таки сделать удобную, во всех отношениях, базу для работы с переводами?


Across - это кошмар какой-то...юзабилити - я бы поставил минус единицу, скорость близка к значению абсолютного нуля (если принять за обычный 0 Традос). Очевидный минус - тупая до невозможности, очевидный плюс - xml-файлы выглядят хоть по-человечески (кто-нибудь открывал xml-файлы для акросса в Excel? И не пытайтесь. :)
Аватара пользователя
Макс

 
Сообщения: 689
Зарегистрирован: Ср янв 29, 2003 19:23
Откуда: Королевство Тёмных Дорожек
Блог: Просмотр блога (7)
Язык(-и): русский-немецкий и обратно

Re: Кошка across

Сообщение Andrew » Чт июл 13, 2006 14:43

Макс писал(а):кто-нибудь открывал xml-файлы для акросса в Excel? И не пытайтесь. :)


А что такое эти самые "xml-файлы для акросса в Excel"?
Andrew
Хранитель огня
 
Сообщения: 9921
Зарегистрирован: Пн янв 14, 2002 12:28
Откуда: Rostov-on-Don
Блог: Просмотр блога (23)
Язык(-и): EN<->RU

Re: Кошка across

Сообщение Макс » Чт июл 13, 2006 15:39

Andrew писал(а):
А что такое эти самые "xml-файлы для акросса в Excel"?


Вы в акроссе работаете? Тогда, значит, Вы работаете с xml-файлами (взгляните на верхнюю строку), а xml - это изначально экселевский формат. Просто если начать открывать файлы xml для across в Excel найти его, допустим, на диске, и открыть - он будет очень долго этот файл обрабатывать. Что неудобно... :roll:
Аватара пользователя
Макс

 
Сообщения: 689
Зарегистрирован: Ср янв 29, 2003 19:23
Откуда: Королевство Тёмных Дорожек
Блог: Просмотр блога (7)
Язык(-и): русский-немецкий и обратно

Сообщение across » Чт июл 13, 2006 15:41

Бродяга писал(а):Не удержался, интереса ради поставил. Запустил, создал проект, попытался импортировать в него файл XML. При попытке загрузить имеющийся у меня для него DTD был поприветствован жизнерадостным сообщением (1.jpg).
И это несмотря на то, что DejaVu и даже ТРАДОС этот DTD вполне себе кушали. И не только они. Синтаксис там далеко не самый ужасный.

Обсудив возможные проблемы со службой поддержки отвечаю:
Для разбора xml across использует msxml и в случае, если документ XML некорректный - выводит сообщение об ошибке. С большой вероятностью можно сказать, что загружаемый Вами документ имеет некорректный формат. Если Вы предоставите первые две строчки, возможно мы сможем более детально сообщить, в чем проблема.
Бродяга писал(а):
Ну, думаю, ладно, закачаем, как есть. Закачку в итоге пришлось прервать (не было желания ждать несколько суток).

Время ожидания при загрузке состоит из следующих факторов:
1. Сложность загружаемого документа. Так как across выполняет полный анализ документа и выбирает из документа только текст для перевода, необходимо время на анализ что является данными для перевода
2. Вставка записей в таблицу. Для большого документа понятно, что количество сегментов большое и количество запросов также велико
3. Выполнение предварительного перевода. Для каждого загруженного сегмента выполняется поиск 100% совпадений с памятью переводов и, если такие присутствуют, вставка перевода

Более оптимизированные алгоритмы загрузки, уменьшающие время, будут использованы в следующей версии 3.5

Бродяга писал(а):Потом вылезло совершенно чумовое сообщение (2.jpg). Ребятушки, для вас что 10 000 параграфов много? Они могут замедлить работу? На SQL-сервере? В этом документе их более 100 000, и это далеко не самый здоровенный проект, с которым приходилось сталкиваться...


Предупреждение относится к последующей работе с документом в редакторе переводов. Редактор переводов загружает структуру документа в память, именно с этим и связано замедление работы, а не с MS SQL.
Это предупреждение больше является наследием предыдущих версий.
Пожелание записано, ушло на обсуждение
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение Бродяга » Чт июл 13, 2006 15:51

Загружаемый мной документ имел формат XML, соответствующий требованиям одного из прикладных отраслевых стандартов. Другие программы с ним работают. Дело-то в том, что тут даже до загрузки не дошло - слетело открытие DTD-шника. Сам DTD-шник вы можете посмотреть тут: http://www.xmlxperts.com/saexml.htm (используется, естественно, только часть, набранная шрифтом фиксированной ширины). Само понятие "корректности" XML не имеет особого смысла.

Загрузка всей структуры документа в память - это не дело. По этой причине со 100% вероятностью могу сказать, что для перевода документа, с которым я экспериментировал, ваша система непригодна. Не расстраивайтесь, TRADOS, SDLX и Transit - тоже. Но DejaVu с честью вышла из этой ситуации.
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение Макс » Чт июл 13, 2006 16:06

Скажите, пожалуйста, а почему в акроссе функция Translate to fuzzy реализована настолько не по-человечески по сравнению с Традосом? И планируется ли сделать что-то в данном направлении для её исправления?
Аватара пользователя
Макс

 
Сообщения: 689
Зарегистрирован: Ср янв 29, 2003 19:23
Откуда: Королевство Тёмных Дорожек
Блог: Просмотр блога (7)
Язык(-и): русский-немецкий и обратно

Сообщение esperantisto » Чт июл 13, 2006 17:48

Бродяга писал(а):Само понятие "корректности" XML не имеет особого смысла.


Чушь. Документы XML могут быть некорректными (неправильными), корректными, но недействительными и, наконец, корректными и действительными. См. любой курс/учебник/справочник по XML.
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Мои впечатления

Сообщение Boris Popov » Чт июл 13, 2006 18:56

Экспериментировал с across пару месяцев назад.
Поставил, получил бесплатный регистрационный ключ, зарегистрировал.
Попытался найти преимущества по сравнению с DejaVu - нашел только одно (предпросмотр перевода "на лету" в приложении, с которым ассоциирован формат исходного файла).

Неприятно удивила общая "неторополивость" интерфейса пользователя. Надо сильно "постараться", чтобы написать ТАКОЙ код - программа тормозила "на ровном месте" на четвертом пне 3 ГГц с гигом оперативки.

На импорте TM из >100000 сегментов программа зависла "намертво".
Пожал плечами и отложил дальнейшее изучение across до того момента, когда у меня будет много свободного времени.

Выйдет версия 3.5 - скачаю, посмотрю еще раз. РАБОТАТЬ в across - пока не собираюсь.
Do or Die
Аватара пользователя
Boris Popov
Спец по железу
 
Сообщения: 2218
Зарегистрирован: Пн авг 11, 2003 23:45
Откуда: Минск
Блог: Просмотр блога (20)
Язык(-и): EN<->RU

Сообщение Бродяга » Чт июл 13, 2006 19:47

Поигрался с относительно небольшим и простеньким проектом в Word. Неторопливость откровенно удручает. Импорт базы в 40 с лишним тысяч пар занял недопустимое количество времени. Предварительный анализ - тоже немало. Ручной перевод, правда, работает с достойной скоростью.

Проблемы с отсутствующими шрифтами, которых можно было ожидать, вылезли во всём своём великолепии. Серьёзно проверять программу - времени нет. Иначе бы нарыл в ней многое.

Умиляет локализация. Интерфейс - тоже на любителя, хотя могло быть и хуже.

Почему-то вспомнился Булгаков:

"Впрочем, ваша пьеса тоже хорошая, - молвил Иван Васильевич, пытливо всматриваясь в меня, - теперь только стоит ее сочинить, и все будет готово..."
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Re: Кошка across

Сообщение Tanja Sholokhova » Чт июл 13, 2006 20:10

Макс писал(а): а xml - это изначально экселевский формат.

?!
Чтобы что-то сделать, нужно это делать.
Tanja Sholokhova

 
Сообщения: 1581
Зарегистрирован: Чт апр 21, 2005 12:17

Сообщение Vic » Чт июл 13, 2006 23:15

Я где-то около двух недель назад попробовал across. Поигрался и бросил - мне это крайне не понравилось. Но, поскольку фирма открыла еще раз эту тему, хочу указать некоторые негативные моменты.

О задумчивости больше и не повторяю. Тем более, что попробовал относительно небольшой проект - ползет по сравнению с Традосом (уж не говорю Transit).

Может быть, что-то не понял, но после импорта ТМ в across и при переводе файлов, которые в принципе должны бы дать полный перевод (он уже имеется в ТМ), результаты меня удивили. Например, в случае 100 % совпадений равно только 9%. Даже если установить 90-99% - получается 50%. А более 40% - от 90 до 0 совпадений. Поскольку использованы уже переведенные файлы, в Традосе при автоматическом перевода получается именно 100%. Так что результаты across я понять не могу.

Мастер сопоставления (И все-таки о задумчивости: файл на 20 страниц, 1900 параграфов, анализ более 25 минут; поскольку это только часть документа - полный документ 120 страниц - получается, что анализ всего документа превышает > 2,5 часов. При открывании этого же 20-страничного файла - 16 минут.) Автоматическое сопоставление практически не работает (поскольку текст в 2 столбца + разница по длине английский - русский). Так что приходится вручную. Но, с моей точки зрения, WinAling намного удобнее, чем возиться с across.

А вот то, что необходимо закрывать Офис при работе across - это приводит меня в ступор. Т.е., скажем, чтобы открыть документ для перевода в across, я должен закрыть Ворд, почту и т.д. и только после этого можно открывать документ. В чем смысл - понять не могу.
Vic

 
Сообщения: 1972
Зарегистрирован: Вт дек 16, 2003 13:40
Откуда: Москва

Сообщение Макс » Пт июл 14, 2006 07:38

Vic писал(а):
О задумчивости больше и не повторяю. Тем более, что попробовал относительно небольшой проект - ползет по сравнению с Традосом (уж не говорю Transit).

Причём Вы знаете, Янус месяца два назад устроил онлайновую конференцию с разработчиками программы (не с нашими, а из Германии). Я задал им вопрос: собственно, где быстродействие? Где режим fuzzy match? Человек на том конце линии меня _явно_ _не_ понял. То есть, он начал показывать некоторые вещи в акроссе, глядя на которые мы поняли, что у него в Германии акросс просто _летал_ быстрее, чем у нас Ворд! Мы были под сильным впечатлением...что такого нет у нас, что есть у тех же немцев? Почему у них акросс летает, а у нас еле ползает? Хотя компы у нас мощные, фирма не скупится...
Аватара пользователя
Макс

 
Сообщения: 689
Зарегистрирован: Ср янв 29, 2003 19:23
Откуда: Королевство Тёмных Дорожек
Блог: Просмотр блога (7)
Язык(-и): русский-немецкий и обратно

Сообщение Макс » Пт июл 14, 2006 07:41

Бродяга писал(а):
Умиляет локализация. Интерфейс - тоже на любителя, хотя могло быть и хуже.


Moment mal...его что, _локализировали на русский_? :shock:
Аватара пользователя
Макс

 
Сообщения: 689
Зарегистрирован: Ср янв 29, 2003 19:23
Откуда: Королевство Тёмных Дорожек
Блог: Просмотр блога (7)
Язык(-и): русский-немецкий и обратно

Сообщение across » Пт июл 14, 2006 08:21

Немного был занят, только сейчас отвечаю на большое количество Ваших вопросов. От across, по-моему, уже ничего живого не осталось...
Ну во-первых скорость работы across, ее неторопливость
Начну со скорости работы интерфейса. Поставил across Personal Edition на тестовый компьютер (P3-1Ггц, 512Мб памяти). Интерфейс работает так же, как обычный Windows, никаких отличий в скорости открытия меню, окон и прочего не наблюдается. При загрузке и переключении по каким-то функциональным блокам, слегка задумывается - загружается (опять же, как Windows). Никаких существенных задержек замечено не было. Если у Вас в интерфейсе что-то работает не так, сообщите, пожалуйста, детальную информацию о конфигурации системы, используемой операционной системе, используются ли у Вас какие-либо средства защиты компьютера (антивирусные программы), установлены ли у Вас какие-то темы Windows (стандартные или не стандартные). Со слов "тормозит интерфейс" проблему определить невозможно.
Далее, скорость работы системы с данными.
Основной принцип across - показывать переводчику только данные, относящиеся к переводу и не относящиеся к форматированию. Таким образом, across должен разбирать каждый загружаемый документ, понимать, что является данными, а что форматированием и специальными символами. Это относится ко всем видам документов. А теперь представьте себе разнообразие форматов, разнообразие каких-то нестандартных ситуаций в форматах, все это должен знать across и уметь правильно разобрать. Именно поэтому загрузка документа в across занимает бОльшую часть времени.
Помимо загрузки тяжелая функция - предварительный перевод. Функция, которая вызывается сразу же при загрузке документа. Тут все зависит от объемов памяти переводов и объема текстов. Каждое предложение при загрузке проверяется на соответствие, причем программа анализирует не только прямые совпадения текстов, но и выполняет дополнительный анализ. Пример одного из дополительных анализов: если у Вас в памяти переводов уже находится фраза "Copyright 2005 Company", и при загрузке встречается в документе "Copyright 2006 Company", то программа возьмет перевод фразы "Copyright 2005 Company" и изменит только год.
Таким образом, набор действий, выполняемых при работе с данными действительно большой, что требует какого-то времени. В настоящее время ведутся изменения в работе некоторых алгоритмов, которые должны увеличить скорость работы.
Помимо этого большое пожелание: если Вы сравниваете скорость работы системы с другими CAT, учитывайте, пожалуйста, что функции при сравнении должны быть тоже аналогичными. Если сравниваемая CAT не выполняет анализа и не делает разбор что есть текст для перевода, а что - ненужная переводчику информация при загрузке, а выполняет просоте копирование файла, то, конечно же, сравниваемая CAT будет работать при загрузке в РАЗЫ быстрее. Если при загрузке не выполняется предварительный перевод, то опять же загрузка выполнится в РАЗЫ быстрее.
Вопросы неудобства интерфейса и юзабилити
В across за основу интерфейса при проектировании были взяты основы интерфейса Windows. Почему? Потому что если уже пользователь умеет работать с Windows и основными программами при едином оформлении интерфейса пользователю гораздо проще ориентироваться в незнакомой программе. Смотрим основы интерфейса: основная среда across (можем параллельно открыть MS Outlook из пакета MS Office). При загрузке системы появляется набор иконок для быстрого доступа ко всем функциям. Левая панель, сгруппированные по функциональному назначению иконки. Ничего нового. Справа основная область, при выборе в левой панели основная область меняется. Опять ничего нового. Нажатия правой кнопкой мыши, панель инструментов, заголовки. Снова ничего нового. Вопросы удобства или неудобства пользования, как я понимаю, могут возникнуть при работе с основной областью, про нее у нас много размышлений и обсуждений, если Вы сообщите что конкретно неудобно, мы рассмотрим и Ваше пожелание.
Это все по часто повторяющимся вопросам, далее пишу на ответы на нечастые вопросы…
Еще одно огромное пожелание: если есть какие-то неудобства работы и неудовлетворенность, пишите пожалуйста их более детально, потому как целья общения с Вами я считаю получние списка того, что не нравится и что мы можем изменить.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение across » Пт июл 14, 2006 08:26

Макс писал(а):Скажите, пожалуйста, а почему в акроссе функция Translate to fuzzy реализована настолько не по-человечески по сравнению с Традосом? И планируется ли сделать что-то в данном направлении для её исправления?

Не совсем понятно что Вы имеете ввиду под функцией Translate to fuzzy. Если подразумевается нечеткий поиск в памяти переводов, то чем Вас е устраивает реализованный в across механизм?
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Re: Кошка across

Сообщение across » Пт июл 14, 2006 08:40

Макс писал(а):Вы в акроссе работаете? Тогда, значит, Вы работаете с xml-файлами (взгляните на верхнюю строку),

across не переводит все форматы в xml, у него лдя этого своя структура хранения, реализованная в БД
Макс писал(а):Просто если начать открывать файлы xml для across в Excel найти его, допустим, на диске, и открыть - он будет очень долго этот файл обрабатывать. Что неудобно... :roll:

"файлы xml для across" мне тоже не совсем понятен этот термин. Для across не требуется никаких специальных xml файлов.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение across » Пт июл 14, 2006 09:32

Бродяга писал(а):Загружаемый мной документ имел формат XML, соответствующий требованиям одного из прикладных отраслевых стандартов. Другие программы с ним работают. Дело-то в том, что тут даже до загрузки не дошло - слетело открытие DTD-шника. Сам DTD-шник вы можете посмотреть тут: http://www.xmlxperts.com/saexml.htm (используется, естественно, только часть, набранная шрифтом фиксированной ширины). Само понятие "корректности" XML не имеет особого смысла.

Не могли бы Вы уточнить, что значит "слетело открытие DTD-шника" и как Вы это определили? Насколько я понимаю, Вы пытались загрузить XML (добавление документа в проект), сам XML использует представленный DTD? Все же для обнаружения в чем проблема нам необходимо увидеть как минимум первые 2-3 строчки XML файла.
Бродяга писал(а):Загрузка всей структуры документа в память - это не дело. По этой причине со 100% вероятностью могу сказать, что для перевода документа, с которым я экспериментировал, ваша система непригодна. Не расстраивайтесь, TRADOS, SDLX и Transit - тоже. Но DejaVu с честью вышла из этой ситуации.

Да, сейчас чем больше документ, тем больше памяти съедает across, в планах стоит задача по устранению этого недочета, только когда он будет исправлен я пока что точно сказать не могу
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Re: Мои впечатления

Сообщение across » Пт июл 14, 2006 09:41

Boris Popov писал(а):На импорте TM из >100000 сегментов программа зависла "намертво".

Можно уточнить какой формат импортируемого файла ТМ использовался?
Импорт в зависимости от количества сегментов, конечно же, зависит напрямую, но я пока что ни разу не видел, как при импорте TM across зависал (выполняли импорт глоссария Windows, глоссарий был предоставлен в формате TMX).
В случае возникноваения подобных проблем наши клиенты присылают импортируемый файл, который анализируется службой поддержки.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Across

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2