Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

[Статья] Гугл + ИИ + русский язык

Re: [Статья] Гугл + ИИ + русский язык

Сообщение naty » Пт апр 28, 2017 02:23

Прочитала эту тему, провели на работе эксперимент. Взяли один абзац из текста на английском, забили его в окно гуглтранслейта. У двух человек получилась чушь. У двух – неправильный, но человекоподобный перевод. Сидим рядом, выходим в Интернет из одной корпоративной сетки. Почему такое происходит, у кого-нибудь есть идеи? Заранее спасибо.
naty

 
Сообщения: 524
Зарегистрирован: Ср мар 02, 2005 01:22
Откуда: РФ
Язык(-и): EN↔RU, ITA↔RU





Re: [Статья] Гугл + ИИ + русский язык

Сообщение LyoSHICK » Пт апр 28, 2017 08:09

Без точного описания эксперимента трудно сказать, но по опыту: кавычка, запятая, прописная-строчная буква могут сильно повлиять на результат.
Аватара пользователя
LyoSHICK
Стажёр
 
Сообщения: 9082
Зарегистрирован: Чт сен 14, 2006 11:57
Откуда: Москва

Re: [Статья] Гугл + ИИ + русский язык

Сообщение MRT2 » Пт апр 28, 2017 08:53

Нужно проверить текст на отсутствие различных непечатаемых знаков разметки. Часто бывает, что при копировании, в текст автоматически вставляется символ переноса абзаца после каждой строки. Гугл естественно воспринимает его как указание к началу нового предложения со следующей строки и разрывает существующие предложения. Самый простой способ проверить наличие символов переноса абзаца, просто изменить масштаб интернет-страницы гуглпереводчика в вашем браузере. Если строчки текста автоматически переносятся со строки на строку, значит текст отформатирован верно.
MRT2

 
Сообщения: 3
Зарегистрирован: Вт апр 11, 2017 17:20

Re: [Статья] Гугл + ИИ + русский язык

Сообщение MRT2 » Пт апр 28, 2017 11:35

Ещё пара (может быть не совсем очевидных) тонкостей:

1. При прямом копировании текста из файлов pdf и djvu, cимвол переноса слова часто превращается в дефис, разбивая слово на два. Иногда пропадают пробелы между словами, или наоборот удваиваются. Возможно это связано с переуплотнением или разрежением текста в исходном Word'овском документе.

2. В pdf и djvu текстовый слой часто не виден, поскольку он расположен под картинкой сканированного документа. То есть мы совсем не видим то, что копируем. Нужно проверять, правильно ли распознан текст, который лежит в этом слое.

3. В Word 2010 есть возможность сохранять документ как pdf. Но если мы выставим в параметрах сохранения пункт "Теги структуры документа ...", то не сможем впоследствии корректно скопировать из Adobe Reader (только из него) изначально переуплотненный или разреженный текст.

4. Для перевода гуглом с любого "неанглийского" языка на русский, нужно действовать в два этапа. Сначала исходный текст переводим на английский, и только потом уже полученный английский текст копируем в новое окно гугла, где переводим его на русский.
MRT2

 
Сообщения: 3
Зарегистрирован: Вт апр 11, 2017 17:20

Re: [Статья] Гугл + ИИ + русский язык

Сообщение naty » Пт апр 28, 2017 12:53

Мы копировали из окошка корпоративного мессенджера. Оказалось, что двое, никому ничего не сказав, убрали дефис. Когда я его тоже убрала, перевод стал одинаковым. Спасибо!
naty

 
Сообщения: 524
Зарегистрирован: Ср мар 02, 2005 01:22
Откуда: РФ
Язык(-и): EN↔RU, ITA↔RU

Re: [Статья] Гугл + ИИ + русский язык

Сообщение borysich » Пт апр 28, 2017 13:02

naty писал(а):...Оказалось, что двое, никому ничего не сказав, убрали дефис...

Эти явно против ИИ ... :mrgreen:
Communication usually fails, except by accident (Osmo A. Wiio)
Аватара пользователя
borysich

 
Сообщения: 4018
Зарегистрирован: Пн фев 16, 2009 18:51
Язык(-и): En>Ru

Re: [Статья] Гугл + ИИ + русский язык

Сообщение naty » Пт апр 28, 2017 14:40

borysich писал(а):
naty писал(а):...Оказалось, что двое, никому ничего не сказав, убрали дефис...

Эти явно против ИИ ... :mrgreen:

Нет, они его защитники. У меня поначалу даже нехорошие мысли появились, что-то вроде "ноосфера добра к тому, кто добр к ней". :-)
naty

 
Сообщения: 524
Зарегистрирован: Ср мар 02, 2005 01:22
Откуда: РФ
Язык(-и): EN↔RU, ITA↔RU

Re: [Статья] Гугл + ИИ + русский язык

Сообщение Faber » Пт апр 28, 2017 19:25

Zummer писал(а):Некоторые (российские) бюро переводов продолжают настойчиво сколачивать команды переводчиков для пост-редактирования машинного перевода патентов.

Я, кажется, догадываюсь, откуда здесь ноги растут - есть одна крупная международная переводческая компания, по меньшей мере, с 2012 г. пытающаяся найти бриллианты в дорожной пыли - получить от поставщиков качественный патентный перевод под ключ в паре EN>RU по цене 6-7 центов за слово. При средней цене на международном рынке около 20 центов. Ну-ну. Флаг им в руки. И барабан на шею.

Другой источник подобных чудес - одна известная питерская переводческая компания, выигравшая в 2016 г. тендер Роспатента на перевод рефератов изобретений и полезных моделей RU>EN по цене (если я правильно помню) 200 р./стр. При том, что для правильного перевода реферата нужно хотя бы бегло прочесть описание на 10-20-30 страницах.
Crede experto. It costs. But it's worth it.
Аватара пользователя
Faber

 
Сообщения: 157
Зарегистрирован: Пт мар 06, 2009 12:47
Откуда: Saint Petersburg, Russia
Язык(-и): En <--> Ru

Re: [Статья] Гугл + ИИ + русский язык

Сообщение MRT2 » Вс апр 30, 2017 09:07

Интересная статья, рассказывающая о принципах нейроперевода "на пальцах":
Машинное обучение это весело!
Это очень сильная идея:
Во-первых, этот подход ограничен лишь количеством обучающих данных и количеством вычислительной мощности, которую вы можете выделить на перевод. Исследователи машинного обучения изобрели этот метод всего два года назад, но такие системы уже работают лучше, чем статистические системы машинного перевода, на разработку которых ушло 20 лет.
...
Кроме того, последовательные методы перевода языков развиваются настолько быстро, что очень трудно идти с ними в ногу. Многие последние фишки (например, добавление механизма внимания или отслеживания контекста) значительно улучшают результаты, но эти изменения настолько новы, что про них даже еще не написано в Википедии.
MRT2

 
Сообщения: 3
Зарегистрирован: Вт апр 11, 2017 17:20

Пред.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в MT + PEMT

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1