Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Машинный перевод для непереводчиков

Re: Машинный перевод для непереводчиков

Сообщение mikhailo » Сб июл 23, 2022 20:09

После этого

https://www.science.org/content/article ... rs-disease

может вообще не стоит увлекаться чтением той литературы?
А то приобщится ваш коллега к лиге πDR-асов от медицинской науки....

Касательно остального - приспособить можно что угодно, но учитывая то, что большинство медицинских документов конфиденциальные, едва ли в датасетах для натаскивания переводческих машин медицинские переводы составляли существенную часть....
Какие словари кроме Мультитрана? reverso и linguee по медицине помогают или для контекстуального поиска есть другие более подходящие ресурсы?

А чем вашего знакомого бумажные словари не устраивают. По медицине основные словари давно уже переведены в Лингво... И в отличие от мультитрана там хотя бы можно сослаться на словарь в обосновании выбора перевода...

И что можно посоветовать для приближения перевода именно к медицинской терминологии без больших вложений денег, для личного применения?


Большие — это какие? Для кого-то 100 000$ не много, а кому-то и 5000₽ большие деньги....
Чтобы что-то куда-то присобачивать надо сначала задаться вопросом - а есть ли где достаточно большой датасет выверенных параллельных медицинских текстов? Если да, то дальше можно думать - САТ, Промт, Lingvanex... Если нет - о чём разговор....

Касательно PDF - а чем автора просто скопировать текст в суматре например, не устраивает? Возня с графиками и картинками в любой программе - вручную...
Касательно бесплатного - сайчас за пару сотен проще купить какой-нибудь 10-летний сканер с ФайнРидер 8/9 в комплекте. Новые версии данной программы не лучше, а часто хуже (по производительности, необходимым ресурсам и т.п.)...

Касательно бесплатного сопоставителя - LF-Aligner, но результаты вряд ли порадуют... Все сопоставители, и платные и бесплатные, хорошо работают только на и так почти идеально параллельных текстах.
А на адаптированных, с пропусками или дополнениями переводчика, переработанными с учётом местных реалий книгами лажают так, что проще вручную сопоставить в двух рядом расположенных окнах простого текстового редактора с нумерацией строк.

Касательно распознавания речи - почти все онлайновые движки, дающие более/менее результат, не наши и либо уже блокируют Россию, либо могут сделать это в любой момент (сейчас показательным моментом будет, что сделает гугл после штрафа). Вряд ли стоит строить на них серьёзные расчёты.
Voco плохо распознаёт незнакомую лексику (которой в медицине будет будь-здоров), хотя наверняка многое ещё и играет микрофон/дикция.... Но коллеги, вряд ли будут в восторге от чёткого дикторского начитывания, учитывая тот факт, что многие даже громкие клавиатуры коллег переваривают с трудом.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД





Re: Машинный перевод для непереводчиков

Сообщение Tanya M » Сб июл 23, 2022 22:32

mikhailo писал(а):
Касательно остального - приспособить можно что угодно, но учитывая то, что большинство медицинских документов конфиденциальные, едва ли в датасетах для натаскивания переводческих машин медицинские переводы составляли существенную часть....

Их много неконфиденциальных, такого типа. Тысячи. Вопрос только, какая часть из них переводилась и вошла.
https://pubmed.ncbi.nlm.nih.gov/?term=FPV
https://pubmed.ncbi.nlm.nih.gov/?term=canine+distemper
Это просто примеры, тема не эта.

А чем вашего знакомого бумажные словари не устраивают. По медицине основные словари давно уже переведены в Лингво... И в отличие от мультитрана там хотя бы можно сослаться на словарь в обосновании выбора перевода...

Спасибо, передам. Я перечислила как примеры только то, что знаю сама, а я с медициной по работе сталкивалась крайне мало. Если человек не переводчик, он вообще не может быть в курсе, что переведено и что лучше, что хуже.

Большие — это какие?

Я думаю, больше 1 тр уже большие. Опять же сужу по себе. Если я ищу что-то бесплатное, то именно бесплатное. 5 тр это уже платное, но относительно недорогое (смотря что за эти деньги можно получить, вот Abby было хорошим вложением)

Чтобы что-то куда-то присобачивать надо сначала задаться вопросом - а есть ли где достаточно большой датасет выверенных параллельных медицинских текстов? Если да, то дальше можно думать - САТ, Промт, Lingvanex... Если нет - о чём разговор....

Спасибо, ясно. Датасет взять негде.

Касательно PDF - а чем автора просто скопировать текст в суматре например, не устраивает? Возня с графиками и картинками в любой программе - вручную...

Спасибо, погуглила, тоже передам. Сама не пользовалась.

Касательно бесплатного сопоставителя - LF-Aligner, но результаты вряд ли порадуют...

Вот это скорее всего как раз не требуется, т.к. нужен просто перевод и лучше результат в 2 колонки, чтобы видеть, в чем накосячил машинный переводчик.

Касательно распознавания речи - почти все онлайновые движки, дающие более/менее результат, не наши и либо уже блокируют Россию, либо могут сделать это в любой момент (сейчас показательным моментом будет, что сделает гугл после штрафа). Вряд ли стоит строить на них серьёзные расчёты.

У меня с ними было мало опыта, недавно порадовал Голосовой блокнот, помог сэкономить время на стенографировании. Иностранными не пользовалась.

Поскольку в технической части в том, что касается перевода, я не продвинута, и скорее продолжаю оставаться начинающим пользователем, даже имея свою собственную предположительно хорошую программу MemoQ, то и все мои идеи, как помочь человеку, тоже на уровне как собрать самолет на коленке, поэтому спасибо большое за советы и комментарии продвинутого пользователя.

А что скажете насчет SmartCat? Там есть бесплатная опция и вроде как машинный или ручной перевод по выбору, и распознавание файлов на перевод из разных форматов.
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Машинный перевод для непереводчиков

Сообщение mikhailo » Вс июл 24, 2022 11:01

А что скажете насчет SmartCat? Там есть бесплатная опция и вроде как машинный или ручной перевод по выбору, и распознавание файлов на перевод из разных форматов.


Распознавание - FineReader на дефолтных настройках. За исключением самых простых случаев - результат распознавания для серьёзной работы не пригоден.
МП смарткат - а вы про него слышали хоть один нормальный отзыв? В Абби, из которой вышел смарткат, раньше не было специалистов по МП.
Сам смарткат - больше инструмент для менеджмента БП - удобный контроль и учёт.
Для профессионального переводчика он не может предложить каких-то выдающихся фишек.
А с учётом того, сколько воя было, когда упал Мультитран, падение или отключение Смартката, который являлся, а может и до сих пор является резидентом страны из недружественного союза, может у некоторых вызвать инфаркт.

Спасибо, ясно. Датасет взять негде.

Своими ручками. Если есть связи в ИИЯ - попросить препода озадачить студентов на заданиях по сопоставлению подобранными медицинскими/ветеринарными текстами.
Второй вариант - базы БП, специализирующихся на медицинском переводе...

нужен просто перевод и лучше результат в 2 колонки

Это может почти любая CAT и даже в простом Word/OOWriter можно легко сделать такую табличку.

Ссылки, которые вы привели, напоминают мне старые реферативные журналы. И тема вроде не медицина, а скорее ветеринария.
Вряд ли там переводили заметные объёмы в паблик.

С 1000 рублей - вашему знакомому всё придётся делать своими руками.

Поскольку ...., я не продвинута


И не надо сюда с типичными женскими манипуляциями. Читайте справки, литературу, чтобы продвинуться.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Машинный перевод для непереводчиков

Сообщение Tanya M » Вс июл 24, 2022 11:43

mikhailo писал(а):
Ссылки, которые вы привели, напоминают мне старые реферативные журналы. И тема вроде не медицина, а скорее ветеринария.

Так точно. Ветеринарная медицина. Это библиотека публикаций в рецензируемых журналах, где можно найти новые и старые статьи. Привела я ссылки как пример того, какого типа литературу надо читать.

И не надо сюда с типичными женскими манипуляциями. Читайте справки, литературу, чтобы продвинуться.

Это не манипуляции, просто что-то узнаю урывками и часто случайно, а системно что-то осваивать все времени нет. Аналогичная ситуация и с фотоаппаратом, и с видеомагнитофоном, которым давно не пользуюсь, но освоила в свое время только азы. Но в любом случае за годы фриланса с 2014 я знаю уже гораздо больше всякой такой фигни, чем пока переводила в офисе. Кругозор малость расширился. Посмотрю и про все новое, что Вы посоветовали.

Глобального ничего с привлечением вузов к составлению терминологических баз моему коллеге не требуется, т.к. чтение будет чисто для себя... хотя идея в принципе хорошая....

МП смарткат - а вы про него слышали хоть один нормальный отзыв? В Абби, из которой вышел смарткат, раньше не было специалистов по МП.


Я про него до недавнего времени вообще не слышала, т.к. клиенты работают с мемсорсом или xml, а личный у меня Memoq. Но вот один новый клиент использует смарткет. К моей радости оказалось, что из него можно вытащить xliff, работать в memoQ и потом залить обратно готовый файл в смарткет.
Поэтому я посмотрела для коллеги, есть ли там бесплатное использование. И вроде бы оно есть и обещают они много, а что на самом деле, - надо пробовать, видимо.
https://www.smartcat.com/machine-transl ... ster_popup

нужен просто перевод и лучше результат в 2 колонки

Это может почти любая CAT и даже в простом Word/OOWriter можно легко сделать такую табличку.


Я для себя обычно делаю вручную, преобразуя текст в таблицу и соединяя 2 столбца, когда бывает необходимость. Но если в статьях много форматирования и будут сотни страниц, это будет занимать много времени. Учитывая, что человек - не офисный работник, а врач, это будет очень трудозатратно. Или есть какие-то более простые варианты, чем вычищать и двигать все вручную?

Это может почти любая CAT

И опять же тогда вопрос, какая есть бесплатная кошка, простая в применении для непереводчика, которую можно использовать хотя бы для создания таких табличек (машинный перевод тогда можно делать через гугл вручную и добавлять в табличку, как я понимаю). И нужно это чисто для удобства, чтобы видеть, где наврал машинный перевод.
Еще раз спасибо!
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Машинный перевод для непереводчиков

Сообщение John Gower » Чт июл 28, 2022 17:08

Tanya M
У меня хорошо речь распознавал голосовой ввод Макбука, там можно скачать этот модуль чтоб без сети рабоать. Русский и английский понимает хорошо.
Смарткат позволяет выгружать перевод в формате две колонки Ворд
Не уверен, что гугл может делать что-то предсказуемо ровно - будет то густо, то пусто
У Промта есть специализированное решение для фармакологии (оффлайн, нейронно) Получается неплохо, с терминами не лажает, если свои добавите - будет вам счастье, но текст не прямо вот гладкий, надо обработать рашпилем и напильником....
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Машинный перевод для непереводчиков

Сообщение Tanya M » Сб июл 30, 2022 21:10

John Gower, спасибо.
Исследую Promt с фармой.
Мне еще ответили из Memsource, бесплатных опций нет, но есть 14-дневный пробный период, то есть хотя бы можно накопить и разом перевести кучу статей.
И ответили из Smartcat, если зарегистрироваться как фрилансеру, то 200000 слов в 48 часов их машинный перевод переводит бесплатно. Распознавание тоже в пределах какого-то количества знаков бесплатно.
Я там сделала для коллеги пробный бесплатный, а второй который уже надо было делать вручную я сделала, скачав хliff. Загрузила его в свой Memoq, выгрузила rtf, перевела в гугле (потому что у меня не подключен машинный перевод к MemoQ), и залила обратно в смарткет уже переведенный гуглом xliff. Кривовато, но проблему решает, если хочется получить в смарткете файл с машинным переводом сверх лимита бесплатного перевода под редактуру с выгрузкой в формате исходника срочно. То есть со срочными переводами сверх лимита я смогу ему помогать через Memoq.
Интересно, что с в смарткет залить обратно их вордовский файл после редактуры нельзя, можно только xliff - насколько я поняла.
Но главное удобство - это быстрый перевод увесистого текста в 2 колонки и возможность сразу видеть два языка, для специалистов это удобство при написании статей.
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Машинный перевод для непереводчиков

Сообщение Tanya M » Сб июл 30, 2022 22:39

John Gower писал(а):Tanya M
У Промта есть специализированное решение для фармакологии (оффлайн, нейронно) Получается неплохо, с терминами не лажает, если свои добавите - будет вам счастье, но текст не прямо вот гладкий, надо обработать рашпилем и напильником....

Нашла, 9 тр, https://promt.shop.allsoft.ru/basket/ad ... eferer2=pp
Спасибо, передам.
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Машинный перевод для непереводчиков

Сообщение AsIs » Вс июл 31, 2022 17:34

Tanya M писал(а):Также, думаю, может пригодиться преобразование речи в текст
В программе QTranslate, кстати, голосовой ввод тоже есть. И бесплатно, и портативно, и языков тьма, и DeepL есть, и голосовой набор. Нафик вам этот промт за стотыщ с одной парой анг-рус?
Изображение
AsIs

 
Сообщения: 1081
Зарегистрирован: Ср сен 22, 2010 16:13
Язык(-и): RU-EN-RU

Re: Машинный перевод для непереводчиков

Сообщение somnolent » Ср сен 14, 2022 18:46

Пишут, что в Deepl добавлен украинский, индонезийский (?) и японский языки.
Аватара пользователя
somnolent

 
Сообщения: 2908
Зарегистрирован: Пт апр 30, 2010 07:20
Откуда: ff104w98l
Язык(-и): endophasie

Re: Машинный перевод для непереводчиков

Сообщение AsIs » Чт сен 15, 2022 23:22

somnolent писал(а):Пишут, что в Deepl добавлен украинский, индонезийский (?) и японский языки.
Это легко проверить, если зайти на их сайт. Только японский там был с самого начала. Добавили украинский, индонезийский и турецкий.
AsIs

 
Сообщения: 1081
Зарегистрирован: Ср сен 22, 2010 16:13
Язык(-и): RU-EN-RU

Re: Машинный перевод для непереводчиков

Сообщение mikhailo » Пт сен 23, 2022 00:38

Интересная статья

https://habr.com/ru/post/689580/
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Машинный перевод для непереводчиков

Сообщение Tanja Sholokhova » Пт сен 23, 2022 19:47

mikhailo писал(а):Интересная статья

https://habr.com/ru/post/689580/


"konst90
23.09.2022 в 10:57
Тогда возникает резонный вопрос: если это так просто, почему этого не сделал Google?"
Чтобы что-то сделать, нужно это делать.
Tanja Sholokhova

 
Сообщения: 1581
Зарегистрирован: Чт апр 21, 2005 12:17

Re: Машинный перевод для непереводчиков

Сообщение Tanya M » Сб окт 29, 2022 14:35

Коллеги, возвращаясь к вопросу машинного перевода для неспециалистов. Доктор, для которого я задавала здесь вопрос, использует Deepl и в целом для его целей подходит. Но он просит совета, есть книга в pdf на 6703 страницах, очень важная для врачей. Ее можно прогнать через какую-то программу в таком объеме, не деля на кусочки, чтобы как можно больше врачей получили представление о содержании в целом? Пусть даже это будет что-то платное. Я просто пока не использовала никаких платных опций вообще и не знаю, с какой стороны и куда копать. Тематика - ветеринария, и нужно в данном случае прогнать только 1 книгу.
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Машинный перевод для непереводчиков

Сообщение somnolent » Сб окт 29, 2022 17:12

Прогнать пару-тройку "тяжёлых" мест через Deepl. Сделать tmx-ки. Упихать tmx-ки в Промт. Прогнать эти куски через Промт. М.б. Промт чему-нить при этом научится. Прогнать несложные куски через Промт. Посмотреть результат. Повторить цикл. Прогнать всю книгу через Промт с наработанной памятью. Ну, это чиста теоритически. Промт бывает Portable. Даже ставить на ПК не нужно.
Аватара пользователя
somnolent

 
Сообщения: 2908
Зарегистрирован: Пт апр 30, 2010 07:20
Откуда: ff104w98l
Язык(-и): endophasie

Re: Машинный перевод для непереводчиков

Сообщение AsIs » Пн окт 31, 2022 07:29

По 10 рублей за страницу могу прогнать.
AsIs

 
Сообщения: 1081
Зарегистрирован: Ср сен 22, 2010 16:13
Язык(-и): RU-EN-RU

Re: Машинный перевод для непереводчиков

Сообщение Tanya M » Вт ноя 01, 2022 01:18

Прогнали пока куски по 500 страниц через бесплатную версию мемсорса, на этом он иссяк, но как раз хватило на книгу 6000 страниц. В одноязычный формат он pdf не выгружает, но 2 колонки выдал. Дальше посмотрю, что скажет врач, подойдет ли такой перевод ему и коллегами для ознакомления....
Про пробную версию мемсорса можете все иметь ввиду, кому нужно поэкспериментировать и у кого там нет регистрации. 14 дней бесплатно (но тут получилось и ограничение по объему уже с этой огромной книгой).

10 р. за страницу для 6000 страниц это очень дорого, мы помощь животным оказываем, помогая врачам, которые помогают волонтерам. Это не коммерческий проект. Но в любом случае спасибо за предложение помощи.

Если кто-нибудь посоветует, как над было поступить с электронной книгой в pdf, чтобы она нормально потом загрузилась и выгрузилась, буду признательна. Я ее честно распознавала двое суток в Abbyy, но в итоге она просто не сохранилась в ворде (только 300 страниц из 6000). :grin:
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Машинный перевод для непереводчиков

Сообщение somnolent » Вт ноя 01, 2022 07:12

Оффтопик
Выяснил что, Promt со шведским не работает. Какие-нибудь переводчики оффлайн со шведским есть? Кто-нибудь знает такой?
Аватара пользователя
somnolent

 
Сообщения: 2908
Зарегистрирован: Пт апр 30, 2010 07:20
Откуда: ff104w98l
Язык(-и): endophasie

Re: Машинный перевод для непереводчиков

Сообщение mikhailo » Вт ноя 01, 2022 07:59

Если кто-нибудь посоветует, как над было поступить с электронной книгой в pdf, чтобы она нормально потом загрузилась и выгрузилась, буду признательна. Я ее честно распознавала двое суток в Abbyy, но в итоге она просто не сохранилась в ворде (только 300 страниц из 6000).


Работать по главам....

Для перевода можно было просто извлечь текст копи-пастом. Потом для приведения книги в читаемый вид — переверстать книгу, параллельно исправляя ошибки перевода.

Альтернативно можно было попробовать извлечение текста для перевода в Infix c последующим импортом перевода обратно, но тоже по главам...
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Машинный перевод для непереводчиков

Сообщение esperantisto » Вт ноя 01, 2022 11:27

somnolent писал(а):Оффтопик
…переводчики оффлайн со шведским есть? Кто-нибудь знает такой?


См. здесь: Let’s try Neural Machine Traslation, в частности, OPUS-CAT (попробовал в паре анг→шве через модуль для OmegaT, что-то переводит, но качество мне трудно оценить, я шведский не настолько хорошо знаю).
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Машинный перевод для непереводчиков

Сообщение somnolent » Чт ноя 03, 2022 07:23

esperantisto писал(а):
somnolent писал(а):Оффтопик
…переводчики оффлайн со шведским есть? Кто-нибудь знает такой?


См. здесь: Let’s try Neural Machine Traslation, в частности, OPUS-CAT (попробовал в паре анг→шве через модуль для OmegaT, что-то переводит, но качество мне трудно оценить, я шведский не настолько хорошо знаю).

Спасибо.
Аватара пользователя
somnolent

 
Сообщения: 2908
Зарегистрирован: Пт апр 30, 2010 07:20
Откуда: ff104w98l
Язык(-и): endophasie

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в MT + PEMT

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1