Mikhail писал(а):Насколько я понимаю, DejaVu (и прочие САТ) оперируют именно сегментами как минимальными единицами. Т.е. "внутренние повторения" - это повторения одинаковых сегментов (предложений) в рамках проекта. Внутрь сегмента DejaVu при подсчете статистики не лезет. Если очень хочется, то частотность отдельных слов и выражений заданной длины по всему проекту (файлу) можно посчитать с помощью Лексикона (Lexicon).
Если верить тому, что пишут тут
http://tech.groups.yahoo.com/group/dejavu-l/message/111351(а кому еще верить, если не им?), то все-таки в Internal Repetitions в Deja Vu считают не сегменты. Но и не слова, а (как мне и казалось, на моем fuzzy-уровне технической грамотности :)) нечто среднее между ними ("суб-сегменты") ... А вот duplicates, как писал AsIs, как раз сегменты и есть. Так что остается только присоединиться к мнению из той же ветки выше — Internal Repetitions для переводчика хорошо, но никаких ж/б выводов (например, скидка заказчику или, как было в моем случае, обязательства по срокам) лучше не давать.
Пы.Сы. Ведь знала же, что кто-то где-то уже этим вопросом задавался, да искать было некогда...