Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Определение частотности словосочетаний в tmx-файле

Определение частотности словосочетаний в tmx-файле

Сообщение sparkster » Вс дек 27, 2020 14:12

У меня есть tmx-файл с большим проектом проектом и необходимо получить список слов и словосочетаний на языке оригинала, которые чаще всего там встречаются, например, получить статистику по 300 самых частовстречаемым словам. Есть ли какая-нибудь программа для этого?
Аватара пользователя
sparkster

 
Сообщения: 93
Зарегистрирован: Чт фев 26, 2015 08:04





Re: Определение частотности словосочетаний в tmx-файле

Сообщение Vic » Вс дек 27, 2020 15:23

В Деже есть инструмент Лексикон. Позволяет сделать то, что вы хотите.
Задаете максимальное число в анализируемых фразах (от 1 до сколь угодно, но логично ограничить 3-5 слов) и получите частоту слов в базах.
Vic

 
Сообщения: 1972
Зарегистрирован: Вт дек 16, 2003 13:40
Откуда: Москва

Re: Определение частотности словосочетаний в tmx-файле

Сообщение John Gower » Пт ноя 26, 2021 20:54

Я так понимаю, джентльмена интересуют 300 самых частотных знаменательных слов?
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en



Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Полезное программное обеспечение. Аллея Бродяги

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8