Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Программы распознавания русской речи

Программы распознавания русской речи

Сообщение Наталья Шахова » Ср ноя 11, 2015 16:36

Пришла рассылка про программу Voco, и снова захотелось попробовать переводить устно (на русский). Поискала в ГП (и вообще в мире) обсуждение программ распознавания русской речи - последняя тема нашлась в ГП в феврале 2014. Но жизнь-то не стоит на месте. Кто с чем работает? Денег не жалко, но хочется купить то, с чем легко и удобно работать.
Аватара пользователя
Наталья Шахова

 
Сообщения: 10116
Зарегистрирован: Ср ноя 05, 2003 19:48
Откуда: Москва
Язык(-и): англ.>рус.





Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Вт янв 12, 2016 13:34

Вы, наверное, имели в виду пост viewtopic.php?f=16&t=58197
По мне это рабочее решение, speechpad.ru и voicenote.in, основанные на сервисах Гугла, дозрели до вполне адекватного функционала уже более года назад для русского (про основные европейские вообще молчу). У speechpad.ru есть платная интеграция в приложения, что позволяет экономить время. Отдельной качественной программы для работы в оффлайне для русского пока не встречал. Nuance Dragon NaturallySpeaking уже который год обещают выпустить поддержку русского языка, а воз и ныне там.
Но если пользоваться решениями Гугла или любыми другим облачными решениями, то остро встает вопрос о защите информации. Да и сложности с тонкой настройкой под свой голос и под собственные терминологические базы остаются.
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

Re: Программы распознавания русской речи

Сообщение BInc » Вт янв 12, 2016 16:12

Для оперативного ввода небольших текстов я вот такой штукой пользуюсь иногда:

https://dictation.io/
Never imagine yourself not to be otherwise than what it might appear to others that what you were or might have been was not otherwise than what you had been would have appeared to them to be otherwise.
Аватара пользователя
BInc

 
Сообщения: 421
Зарегистрирован: Ср май 21, 2008 21:51
Откуда: Киев
Язык(-и): Eng>Rus, Eng>Ukr

Re: Программы распознавания русской речи

Сообщение Tanya M » Чт ноя 03, 2016 20:41

Прошел еще год :grin:
А кто-нибудь пользуется http://www.realspeaker.net ?
(о программе пишут здесь http://www.proz.com/forum/russian/21986 ... page3.html)
Заходила на сайт разработчика, оставляла свои контакты, но в ответ тишина.
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение Bookworm » Пт ноя 04, 2016 15:51

Tanya M писал(а):Заходила на сайт разработчика, оставляла свои контакты, но в ответ тишина.


Я тоже вот так полазил по сайтам разработчиков и понял, что пока сам не сделаю - толку не будет. Написал на Embarcadero приложение, интегрирующее Google Speech API с Традосом. Выглядит это так: зажимаю комбинацию клавиш (мне удобно Win+Shift), в трее начинает мигать индикатор записи звука, диктую примерно 10 слов (больше за раз Гугл не переваривает), отпускаю клавиши - и надиктованный текст появляется в Традосе. Не на 100 % идеально, иногда надо подправлять окончания (ну и разумеется расставлять знаки препинания), но в целом очень повышает производительность труда и снижает утомляемость. Диктую по 5-6 тыс. слов в день без напряга, скорость получается примерно 800 слов в час, а то и выше.
Я никогда не верил в сказки про равенство людей: физик-ядерщик легко может разобраться в законодательстве или выучить несколько иностранных языков, но ни один гуманитарий не сможет запустить ядерный реактор.
Аватара пользователя
Bookworm

 
Сообщения: 1907
Зарегистрирован: Вс июн 14, 2009 11:28
Откуда: Тула
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Пт ноя 04, 2016 16:00

Bookworm писал(а):скорость получается примерно 800 слов в час, а то и выше.
--- Кхм, и это при том, что приходится потом править текст и тормозиться на поиск терминов?
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

Re: Программы распознавания русской речи

Сообщение Bookworm » Пт ноя 04, 2016 16:05

Правки там минимальные, поиск терминов - вещь редкая, если перевод идет по знакомой тематике. А самое главное - меньше утомляемость. Попробуйте ручками набрать 6000 слов, это примерно 42 тысячи нажатий на клавиши. Поэтому в таком режиме спокойно работаешь без падения производительности, а руками 2000 набил - и уже устал.
Я никогда не верил в сказки про равенство людей: физик-ядерщик легко может разобраться в законодательстве или выучить несколько иностранных языков, но ни один гуманитарий не сможет запустить ядерный реактор.
Аватара пользователя
Bookworm

 
Сообщения: 1907
Зарегистрирован: Вс июн 14, 2009 11:28
Откуда: Тула
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Пт ноя 04, 2016 16:15

Bookworm писал(а):Правки там минимальные, поиск терминов - вещь редкая, если перевод идет по знакомой тематике. А самое главное - меньше утомляемость. Попробуйте ручками набрать 6000 слов, это примерно 42 тысячи нажатий на клавиши. Поэтому в таком режиме спокойно работаешь без падения производительности, а руками 2000 набил - и уже устал.

Спасибо за уточнение. Рискну возразить, что кое-кого речевые усилия утомляют еще больше, чем шевеление пальцами. Все зависит от лужености глотки. Я сочетаю оба метода (голосовой и клавиатурный ввод). Наговариваю в Гуглодок, через аудиофункционал этого сервиса. Обратил внимание, что со временем качество распознавания постепенно повышается, особенно по простым текстам, без редких слов. Вхожу под своей гугловской учеткой, возможно Гугл персонализирует алгоритмы распознавания речи? Если так, то великолепно.
С какой скоростью вы наговариваете? В свободно-расслабленном темпе или тараторите? Я пробовал тараторить (при простых переводах), качество распознавания речи почти не упало, но быстро развивается утомление.
"Правки там минимальные"---у меня нет, процентов 3-5 от объема.
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

Re: Программы распознавания русской речи

Сообщение Bookworm » Пт ноя 04, 2016 16:25

Я диктую достаточно быстро, как и в жизни говорю ))) Не пытаюсь диктовать "с нажимом", как при чтении лекции. Действительно, на качество распознавания это практически не влияет.
Кстати, еще один фактор экономии времени - практически нет опечаток, которые потом приходится долго и нудно отлавливать. Я за сегодня надиктовал 3800 слов, сейчас в Верифике запустил проверку орфографии - 2 опечатки всего.
Я никогда не верил в сказки про равенство людей: физик-ядерщик легко может разобраться в законодательстве или выучить несколько иностранных языков, но ни один гуманитарий не сможет запустить ядерный реактор.
Аватара пользователя
Bookworm

 
Сообщения: 1907
Зарегистрирован: Вс июн 14, 2009 11:28
Откуда: Тула
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение Bookworm » Пт ноя 04, 2016 16:26

Мне все же кажется, что на управление мелкой моторикой пальцев уходит больше "вычислительной мощности" мозга, чем на речь. При диктовке я вполне могу в фоне смотреть фильм в уголке монитора, и это меня не отвлекает и не сбивает, а при печати так уже не получается.
Я никогда не верил в сказки про равенство людей: физик-ядерщик легко может разобраться в законодательстве или выучить несколько иностранных языков, но ни один гуманитарий не сможет запустить ядерный реактор.
Аватара пользователя
Bookworm

 
Сообщения: 1907
Зарегистрирован: Вс июн 14, 2009 11:28
Откуда: Тула
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Пт ноя 04, 2016 16:37

Bookworm писал(а):надиктовал 3800 слов, сейчас в Верифике запустил проверку орфографии - 2 опечатки всего

Спасибо, познавательно. 2 опечатки на 3,8 килознака - поразительно. У меня на порядки больше. Видимо у вас великолепная дикция, или Гугл уже "персонализировал" ваш голос? С гугло-распознавалкой голоса в текст у меня постоянная проблема - все сложные термины он не может склонять по падежам, все сложные термины выдает в именительном падеже - "... при радиоционнАЯ абляцИЯ печени пациенты сталкиваются...". И везде при малейшей паузе в надиктовке новый фрагмент начинает с заглавной буквы. К тому же, как Вы сами заметили, Гугл глотает только надиктовки примерно по 10 слов. Это очень сильно сбивает темп и нагружает мозг((
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

Re: Программы распознавания русской речи

Сообщение Bookworm » Пт ноя 04, 2016 16:57

Отсутствие опечаток не от дикции, а от того, что Гугл ведь выдает слова из словаря, то есть он в принципе не сможет выдать "кАрова". По крайней мере, Google Speech API работает именно так, и словарь там очень обширный, не перестаю удивляться, что он выдает даже крайне редкие слова. А вот с падежами - да, приходится постоянно следить, окончания слов Гугл нередко путает. Заглавную букву я подавил программным путем, тоже раздражало. А по кускам диктовать как-то привык, тем более что и сегменты в Традосе обычно получаются не очень огромные и надиктовываются за 1-2 захода,
Я никогда не верил в сказки про равенство людей: физик-ядерщик легко может разобраться в законодательстве или выучить несколько иностранных языков, но ни один гуманитарий не сможет запустить ядерный реактор.
Аватара пользователя
Bookworm

 
Сообщения: 1907
Зарегистрирован: Вс июн 14, 2009 11:28
Откуда: Тула
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Пт ноя 04, 2016 17:00

Большое спасибо за Ваши полезные соображения!
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

Re: Программы распознавания русской речи

Сообщение Tanya M » Пт ноя 04, 2016 22:40

От меня тоже спасибо. Вот это высказывание "Написал на Embarcadero приложение, интегрирующее Google Speech API с Традосом." меня, конечно, спустило в небес на землю, мне еще далеко до понимания процесса. Но попробую порыть в направлении Гугла для начала.
Для начала я сегменты и вручную согласилась бы переносить в Традос, чтобы дать рукам отдохнуть. :grin:
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение Bookworm » Пт ноя 04, 2016 23:59

У меня иногда возникают мысли о мелкой монетизации этого приложения :grin: Но там упирается в то, что Google должен одобрить коммерческое использование его API, а это малореальное дело. Поэтому могу предлагать только из-под полы :grin:
Я никогда не верил в сказки про равенство людей: физик-ядерщик легко может разобраться в законодательстве или выучить несколько иностранных языков, но ни один гуманитарий не сможет запустить ядерный реактор.
Аватара пользователя
Bookworm

 
Сообщения: 1907
Зарегистрирован: Вс июн 14, 2009 11:28
Откуда: Тула
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Сб ноя 05, 2016 08:17

Bookworm писал(а): Поэтому могу предлагать только из-под полы :grin:

Зачем же? Вот https://speechpad.ru/ уже пару лет предлагает платный плагин. Есть плагин для Хрома, официальные продажи. Обычный ИПшник. С Традосом и со всеми другими приложениями под Виндоуз дружит, но криво. Столь же криво, как и все другие аналогичные софтинки. Пользовал их все, потом отказался, так как не повышают продуктивность и усложняют процесс. Тем не менее спрос в этом сегменте постоянно есть.
Если ваша разработка эффективнее, то ИМХО это хорошая возможность.
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

Re: Программы распознавания русской речи

Сообщение Bookworm » Сб ноя 05, 2016 12:43

Да, я про них в курсе, но пока не выяснил, как они договорились с Гуглом и договорились ли вообще :grin:
Я для доступа к Speech API использую бесплатные ключи разработчика. Теоретически на каждый такой ключ есть ограничение на число запросов в сутки, реально я его выбираю очень редко, а если выбираю - просто переключаюсь на следующий ключ (4-5 ключей хватает за глаза). Если же делать все по-хорошему, то надо с Гуглом делиться доходами, причем это тоже непросто: там они сначала изучают саму идею и говорят, хотят они с нее получать деньги или нет (причем "нет" от них идет гораздо чаще, чем "да"). Я в свое время поковырялся со всем этим и решил не связываться.
Я никогда не верил в сказки про равенство людей: физик-ядерщик легко может разобраться в законодательстве или выучить несколько иностранных языков, но ни один гуманитарий не сможет запустить ядерный реактор.
Аватара пользователя
Bookworm

 
Сообщения: 1907
Зарегистрирован: Вс июн 14, 2009 11:28
Откуда: Тула
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Сб ноя 05, 2016 13:10

Bookworm писал(а):Я в свое время поковырялся со всем этим и решил не связываться.

Жаль, списпад спичпадом, а иметь хороший плагин русскоязычного голосового ввода, адаптированный под продукты SDL, хотели бы многие переводчики. Странно, что сами SDLщики ничего пока ничего не предпринимают в этом направлении. Видимо, пока для наиболее денежных языков основные нужды удовлетворяет интеграция Trados с Dragon Dictate.
Основной недостаток спичпада - нет шансов на "персонализированное" распознавание голоса пользователя. Если человек наговаривает под своей учеткой в Гуглодок, то есть шансы (не уверен, правда), что Гугл снизойдет до такого бонуса. Спичпад же лишает такой возможности, несмотря на другие преимущества.
Не подскажите, Гугл начал/начнет персонализацию настроек распознавания голоса для владельцев учетных записей, работающих с голосовым? Подозреваю, что начал, но не уверен.
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

Re: Программы распознавания русской речи

Сообщение Tanya M » Сб ноя 05, 2016 13:15

vladimir.sviridov писал(а):https://speechpad.ru/


Спасибо! :heart: Для меня в принципе новый опыт, никогда не пользовалась, а тут стихотворение "Однажды в студеную зимнюю пору" начитала, программа все правильно услышала!
Аватара пользователя
Tanya M

 
Сообщения: 682
Зарегистрирован: Вт май 20, 2014 18:22
Откуда: Москва
Язык(-и): русский-английский

Re: Программы распознавания русской речи

Сообщение vladimir.sviridov » Сб ноя 05, 2016 13:23

Tanya M писал(а):
vladimir.sviridov писал(а):https://speechpad.ru/


Спасибо! :heart: Для меня в принципе новый опыт, никогда не пользовалась, а тут стихотворение "Однажды в студеную зимнюю пору" начитала, программа все правильно услышала!

Рад, что пригодилось)) У спичпада есть возможность (платная) голосового ввода в приложения Виндоуз, включая Традос. Однако не без "граблей" (писал выше).
Аватара пользователя
vladimir.sviridov

 
Сообщения: 15
Зарегистрирован: Вс янв 03, 2016 22:34
Откуда: Россия, Липецк
Язык(-и): En-Ru, Ru-En

След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Полезное программное обеспечение. Аллея Бродяги

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 11