Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Статистика - проблема с подсчетом повторов

Статистика - проблема с подсчетом повторов

Сообщение Трули Ёрз » Вт окт 25, 2016 18:57

Клиент прислал объемный по кол-ву текста файл (таблица в экселе), в котором, говорит, 50% повторов. Поэтому рекомендуют использовать кошку (обычно не требуется) и оплачивать повторы будут соответственно.
Прислали свой подсчет - насколько я знаю, они считают Традосом.
Открыла в Омеге (у меня 3.6.0, сейчас пытаюсь скачать 4), не дает она даже близко к 50% повторов. Всего 1/7 часть повторов показывает.
Что я делаю не так? То ли давно не пользовалась и туплю, то ли чего-то не вижу...
Пробовала без тегов- все то же.
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8304
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru





Re: Статистика - проблема с подсчетом повторов

Сообщение esperantisto » Вт окт 25, 2016 19:47

Повторы в разных программах считаются по-разному, поэтому точного совпадения не будет никогда. Однако у меня при переводе файлов из memoQ особо заметных расхождений с «их» статистикой не случалось. В общем, надо смотреть конкретный файл.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6715
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Статистика - проблема с подсчетом повторов

Сообщение Трули Ёрз » Вт окт 25, 2016 21:24

К сожалению, я не могу показать файл.
У меня тоже раньше не бывало совсем уж гигантских расхождений.
Но тут мне нужно сказать им срок на указанное ими кол-во слов.
А 50% повторов или 5% повторов - это все-таки разница.

Вообще файл какой-то психоделичный.
Беру один лист из этого файла (создаю новый файл), там 800 слов. открываю омегой - она мне показывает текста на 6000. Что это? Скрытый текст? Я не могу его найти. Делаю поиск фразы из Омеги, которой в файле заказчика явно не видно, - не находит. Как такое может быть?
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8304
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru

Re: Статистика - проблема с подсчетом повторов

Сообщение esperantisto » Вт окт 25, 2016 21:41

А все ли строки и столбцы видны?
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6715
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Статистика - проблема с подсчетом повторов

Сообщение Трули Ёрз » Вт окт 25, 2016 22:04

Да, все видны, но если бы были скрытые, то поиск бы дал результат.
А тут вообще не находится такой текст.
А еще в этом листе на самом деле есть повторы - омега показывает их цветом. Они же должны отображаться в статистике как repetitions? А их там - 0.

(Никогда такого не было, уже голова кругом, а ответ клиенту внятный не могу дать, потому что не понимаю, сколько там на самом деле текста.)
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8304
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru

Re: Статистика - проблема с подсчетом повторов

Сообщение Трули Ёрз » Вт окт 25, 2016 22:16

Поставила 3.6.0_4. Появились repetitions в статистике.
Дикое количество невидимых слов осталось.

Количество повторов по всему файлу так и не приблизилось к статистике клиента.
Последний раз редактировалось Трули Ёрз Вт окт 25, 2016 22:28, всего редактировалось 1 раз.
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8304
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru

Re: Статистика - проблема с подсчетом повторов

Сообщение esperantisto » Вт окт 25, 2016 22:20

Не видя файл, увы, только гадать остаётся. Не припомню, чтобы подобная проблема раньше обсуждалась. На всякий случай попробуйте версию 4.0.1,хотя, вроде, в отношении статистики новшеств никаких не вводили.
«Dolareto pli bonas ol dankego» © M. Ĵvaneckij
«Drinki en trajnoj eblas. Sed neniam kun kondukisto» © sennomulo
esperantisto

 
Сообщения: 6715
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Статистика - проблема с подсчетом повторов

Сообщение mikhailo » Ср окт 26, 2016 10:23

Проблема, скорее всего, в следующем.

Есть внутренние повторы в переводимом файле, а есть повторы вообще, в которых учитываются и совпадения с копилкой переводов (ТМ) в кошке. Полагаю, у вашего клиента в Традосе она более полная.

А вообще - забейте вы на эту ерунду - прислали вам файл, прислали цену - устраивает — работайте, нет - отказывайтесь и не заморачивайтесь.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3422
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Статистика - проблема с подсчетом повторов

Сообщение Vic » Ср окт 26, 2016 11:09

Трули Ёрз писал(а):Беру один лист из этого файла (создаю новый файл), там 800 слов. открываю омегой - она мне показывает текста на 6000. Что это? Скрытый текст? Я не могу его найти. Делаю поиск фразы из Омеги, которой в файле заказчика явно не видно, - не находит. Как такое может быть?

Совершенно верно. Это закрытый текст в таблице. Один клиент регулярно присылает такие файлы с невидимыми строками. Я работаю с Деже, но принцип вообще говоря аналогичен.
Ситуация следующая. Если импортировать исходный файл, Дежа показывает примерно такое же число слов, что и просто, скажем, посчитать пальцами. Но если импортировать новый файл, скопированный с исходного файла (с закрытыми строками или столбцами), Дежа показывает полное число в таблице, при этом видны только фрагменты, которые не закрыты.
Конечно, Омега не Дежа. Но попробуйте просто сделать два пробных файла - один исходный, а второй - с частью скрытыми строками или столбцами, а затем импортируйте их.
Vic

 
Сообщения: 1872
Зарегистрирован: Вт дек 16, 2003 13:40
Откуда: Москва

Re: Статистика - проблема с подсчетом повторов

Сообщение Трули Ёрз » Ср окт 26, 2016 19:03

mikhailo писал(а):Полагаю, у вашего клиента в Традосе она более полная.

К сожалению, речь только о повторах внутри файла, никакой ТМ нет.
mikhailo писал(а):А вообще - забейте вы на эту ерунду

А я пока не могу забить, потому что мне на данном этапе нужно сказать срок, за который я могу натопать энное кол-во слов.
Если повторов там не половина, как заявлено, то мне нужно это учесть.
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8304
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru

Re: Статистика - проблема с подсчетом повторов

Сообщение Трули Ёрз » Ср окт 26, 2016 19:07

Vic писал(а):Дежа показывает полное число в таблице, при этом видны только фрагменты, которые не закрыты.

А в Омеге видно то, чего я не могу обнаружить в файле.
То есть я представляю себе ситуацию: я, ни о чем не подозревая, загоняю файл в Омегу и начинаю работать. А он все не кончается и не кончается.... Там же не написано, какие строки скрытые.
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8304
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в OmegaT

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1