Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Вебинар по чистке и оптимизации ТМ/ТМХ

Проф. организации, семинары, конкурсы и др. события

Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вс мар 16, 2014 00:18

Это анонс моего внепланового вебинара. Об этом уже не раз и не только мной писалось, но тема не уходит.

1. Неожиданно для меня, ко мне поступило сразу несколько обращений с просьбой рассказать об инструментах и приемах чистки ТМ от мусора и вообще наведении в ней порядка.

2. Поскольку мне лень по несколько раз повторять одно и то же, я решил ответить на все вопросы сразу и заодно показать вживую, на экране своего компьютера, как это делается.

3. Можно было бы написать статью, но: а) мне лень писать статью, б) статья, имхо, недостаточно интерактивна и в) сам формат вебинара мне в общем нравится. Оттого проведу вебинар.

4. Вообще данная тема весьма подробно раскрыта в целом ряде интернет-ресурсов, но как-то рассеяна по множеству страниц множества форумов и блогов. Если по-хорошему, то надо бы собрать в кучу весь этот накопленный опыт, зернышко к зернышку, грамотно скомпилировать и сделать действительно хороший материал... Может быть, кто-нибудь займется и сделает?

5. Но сейчас я не стану компилировать чужой опыт (опять, лень), а поделюсь своим собственным и лично выстраданным. То, как я работаю с ТМ, как говорится, "здесь и сейчас".

6. Многим коллегам известно, что:
• При конвертации ТМ в ТМХ и обратно,
• При экспорте/импорте ТМ из одной "кошки" в другую,
• При попытке импортировать в свою "кошку" чужую ТМ
и прочих подобных операциях, а также если долго не присматривать за своей собственной (своими собственными) ТМ долгое время, эти ТМ натурально захламляются и начинают:
• тормозить "кошку" и компьютер,
• выдавать неверные переводы,
• забиваются дубликатами,
• ненужными тегами или
• (что еще хуже) обрывками тегов.
Более того, иногда оказывается, что в ТМ EN-RU полно сегментов RU-EN. Для ряда "кошек" сие не критично, но для некоторых - критично.
Ну и также очень "мило" встречать в ТМ разного рода кракозябры в неизвестной кодировке, ряды вопросительных знаков вместо текста и т.п.
Про такую мелочь как исправить при необходимости en-GB на en-US даже и не говорю.

7. Многие слышали про Okapi Olifant, а некоторые еще и слышали про Heartsome TMX Editor. Но не все знают хотя бы основные приемы при работе с этими программами.

8. На вебинаре я разберу достоинства и недостатки Олифанта и Хартсама и покажу как я с ними работаю.

9. Мы также рассмотрим:
основные дефекты, встречающиеся в файлах ТМХ (преусловутые повторы, обрывки чужих тегов, непереведенные сегменты и т.д.) и до-очистку файла ТМХ в Экселе с применением пары симпатичных макросов. Т.е., repair and maintenance.

10. Продолжительность вебинара составит примерно 90 минут.

11. В конце буквально несколько слов скажу об основных инструментах для проверки качества ТМ/ТМХ, таких как XBench, Checkmate и Verifika. Но вообще вдумчивый разбор инструментов QA/QC - это тема для отдельного вебинара.

12. Вебинар будет проводиться через Team Viewer (подписка на Визике у меня закончилась, а возобновлять - пока нет причин). Тимвьюер, как показала практика - вполне годный инструмент. Я пробовал через скайп, но там демонстрация рабочего стола почему-то все время обрывается. Правда, я не знаю (не пробовал), потянет ли он конференцию, если участников будет больше 10. Заодно и узнаем :-)

13. Стоимость билета на этот вебинар будет равна стоимости билета на мультик 3Д в нашем "Люксоре" - 400 рублей.

14. Дата и время проведения пока неизвестны, известно лишь, что это будет последняя неделя марта, где-то между 24-м и 30-м. Желающие поучаствовать могут высказывать свои пожелания по данному вопросу, как раз к следующей субботе и уточним. Повтор в другой день возможен, если наберется аудитория.

15. Сдублирую объявление в форум МТ.

16. Желающие поучаствовать сообщают мне в ЛС адрес электронной почты, на который будет отправлена ссылка.

P.S. В очередной попавшей ко мне в компьютер ТМ размером 800+ тыс. сегментов после очистки осталось 300 тыс. Зато она теперь работает (хиленько, если честно, ну дык чужая же, но работает же :lol: ), а не грузит компьютер попусту.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ





Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Uncle A » Вс мар 16, 2014 11:42

Валера, ты это дело запишешь для потомства? Вдруг мне когда-нито приспичит поработать с кошками? Опа! Перевожу Афанасьеву денюжку, а он мне - запись открывает. И я резко умнею.
Я больше не принимаю участия в работе форума ГП. Если кому-то вдруг понадоблюсь, со мною можно связаться через личное сообщение.
Аватара пользователя
Uncle A
Дядюшка
 
Сообщения: 7556
Зарегистрирован: Пн окт 06, 2008 15:39
Откуда: Москва
Блог: Просмотр блога (18)
Язык(-и): английский-русский

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение B@r_Irina » Вс мар 16, 2014 11:56

Uncle A писал(а):Валера, ты это дело запишешь для потомства? Вдруг мне когда-нито приспичит поработать с кошками?

Поддерживаю! :-)
Аватара пользователя
B@r_Irina
Голубь мира
 
Сообщения: 1377
Зарегистрирован: Ср ноя 27, 2013 21:34
Язык(-и): En-Ru-Fr

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вс мар 16, 2014 12:39

Запись будет.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение mikhailo » Вс мар 16, 2014 13:04

И я резко умнею.


Разжёванное в рот обычно старикам раньше клали, когда грызть самим зубов не оставалось.

Для резкого поумнения надо брать базу сегментов так на сотню тысяч и начинать её крутить, тем более что и названия программ даны, Валера довольно отзывчив, как впрочем и комьюнити на различных форумах.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вс мар 16, 2014 13:40

Я именно это и планирую сделать. Т.е., мы возьмем ТМ, да, пожалуй на 200-300 тыс. сегментов (если меньше, то не показательно, если больше - долго ворочаться будет). И в процессе занятия эту ТМ почистим Олифантом+Экселем, а потом Хартсамом+Экселем. И сравним результаты. Моя задача сейчас - найти у себя в завалах хлама ТМ погрязнее, для учебных целей. С максимальным разнообразием дефектов. Т.е., это будет не рассказ об инструментах (ну, и рассказ какой-никакой тоже, но не это основное), а вполне себе практическое занятие.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Ср мар 19, 2014 13:38

Вебинар будет проведен в пятницу 28 марта в 15.00 по московскому времени. Дата и время продиктованы внешними обстоятельствами. Те, кто хотел бы поучаствовать, но в указанное время не сможет, смогут позже обратиться и получить запись.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Shkoda » Вс мар 23, 2014 14:05

ух ты ж, как это я вовремя попала! Я лет 500 не заходила в ГП и тут как раз ... а куда записываться?
Меня лично интересует пара слов по верифике, а это надеюсь будет. Потом. Но и эта тема мне тоже интересна
Shkoda

 
Сообщения: 58
Зарегистрирован: Вс сен 21, 2008 18:11

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вс мар 23, 2014 16:22

Shkoda, проверьте личные сообщения.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение AsIs » Вс мар 30, 2014 20:23

Валерий Михайлович, каюсь, не перевел пока денежку, как обещал. У Сбербанка какие-то "технические неполадки" в онлайн системе. А качать запись без оплаты пока совесть не позволяет. Через банкомат тоже не могу, так как он там просит номер карты, а не счета. Не уверен, туда ли уйдут деньги, если в графе для номера карты указать номер счета. Но мне по-прежнему интересно. Как только у меня будет квитанция об оплате, я обращусь к вам, если ссылку уже не будет работать, сможете выложить еще раз, да? Спасибо. Извините за задержку с оплатой. Не корысти ради, а токмо волею пославшего мя Сбербанка...
AsIs

 
Сообщения: 1081
Зарегистрирован: Ср сен 22, 2010 16:13
Язык(-и): RU-EN-RU

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вс мар 30, 2014 21:48

Ссылка действительна еще по крайне мере месяц. Чуть позже (постараюсь, но не гарантирую, в течение следующей недели) сделаю сокращенную версию минут на 20-25 и выложу на ютюб в свободный доступ.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение ElenaViktorovna » Пн мар 31, 2014 14:40

Валерий, спасибо большое за вебинар и за материалы! Было интересно узнать о новых для меня программах и посмотреть, как работать с ними на практике.
Аватара пользователя
ElenaViktorovna

 
Сообщения: 42
Зарегистрирован: Пн янв 25, 2010 22:52
Язык(-и): EN - RU

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Пн мар 31, 2014 23:39

Смысл вебинаров и вообще любых учебных материалов в том, чтобы от них получалась реальная практическая польза. Практика показывает, что в рамках одного вебинара, даже продолжительного, рассказать обо всех приемах, методах и способах оптимизации переводческого процесса не получается. Даже и так можно сказать, что слишком продолжительные вебинары с попыткой в рамках одной сессии раскрыть как можно больше вопросов, могут быть утомительны и не очень эффективны. Нужно найти разумный баланс между объемом рассматриваемого материала и глубиной его рассмотрения.

Я внимательно слежу (подписался и вам советую) на каналы на Ютюбе от Кевина Лосснера http://www.youtube.com/channel/UCRRuN1N8ySuZimi5L_dosjA и от человека под ником CATguru: http://www.youtube.com/channel/UC2EFKLWWI4gh9BGpMf0-_5g , а также на каналы компаний Kilgray и SDL

Для себя я решил попробовать сделать серию вебинаров под условным общим названием "Организация, оптимизация и автоматизация труда переводчика". Сейчас, как я уже упоминал выше, я пытаюсь по горячим следам проведенного вебинара сделать ролик длиной примерно 30 минут для выкладки на ютюб. Пока получается не очень, оказывается, делать учебные ролики это само по себе тот еще челлендж :lol: Но я постараюсь.

Здесь каждая тема тащит за собой еще одну, а потом еще одну, а потом и целый ворох тем сразу. Ну да ладно. Любая дорога начинается с чего-то там.

Всем коллегам, которые обращаются с просьбой купить запись указанного в шапке вебинара, я предлагаю немного обождать, сделаю ролик, выложу, вы его посмотрите и решите для себя (а заодно и мне подскажете), что нужно добавить, что можно убрать, что хорошо и что плохо в подборе и подаче материала. Я тогда основную запись подредактирую и приведу ее в более смотрибельный вид.

Например, не хватает ссылок на многочисленные полезные ресурсы в Интернете и м.б. я потом сделаю отдельный обзор по всем найденным мной полезным ссылкам.

Всем участникам проведенного вебинара: Когда начнете самостоятельно чистить свои tmx и приступите к наступанию на первые грабли, обязательно обращайтесь за помощью. Будем повторять пройденное. Очень хорошо, что ТимВьюер показал себя в целом годным инструментом, по крайней мере, для общения 1-1.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Ср апр 02, 2014 21:28

Очистка и оптимизация файлов tmx с помощью программ Okapi Olifant и Notepad++

http://youtu.be/BOc8c907XqI

Я выложил на Ютюб часть проведенного вебинара, а именно обработку файлов tmx в Олифанте и немного - в Notepad++. Это мой первый опыт изготовления учебного видеоматериала и его выкладки на публичный ресурс. Буду признателен за отзывы о форме, содержании, внятности, доходчивости и полноте изложения материала, а также за пожелания по будущим темам.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение John Gower » Чт апр 03, 2014 23:06

Валерий Афанасьев
Очень познавательное видео, жаль, что мне на Ваши вебинары никогда не попасть из за времени :-(
Что можно сделать в "организационной" части:
1. Лучше убрать с Рабочего стола то, что не относится к данному. Понятно, что это не "лабораторная среда", но в отдельных случаях это предотвращает случайное нажатие на "посторонние" папки.
2. Нет смысла показывать как качать и устанавливать ПО если аудитория считается достаточно грамотной в тех. вопросах. На это тратится практически 15% времени, тем более, что эти действия (выбор по умолчани)
3. Можно сократить вводную часть, оставив только картинки с чистым/замусоренным столом. Если вебинар про чистку ТМХ и зрители его смотрят - значит они в курсе, что именно "мусорит" базы.
4. (На правах вкусовщины) на 03:34, я бы в презентации добавил "например en-GB vs en-US". Многие работают в других языковых парах и им немножко обидно за немецкий и французский =)))
5. Не стоит, кмк, брать для иллюстрации базы размером больше 100 тыс. сегментов. Сто тысяч и обрабатываются быстрее и всё равно весьма наглядны.

По содержанию просто супер, догадываюсь, что на исходном вебинаре было ещё круче и многие практические моменты остались "за кадром"
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Пт апр 04, 2014 12:05

John Gower, большое спасибо за отзыв и высказанные замечания. А то там уже 65 просмотров, а высказались только вы.

Фильм действительно получился: а) длинноватым и б) "всякого шума" в нем многовато. Нелегко, оказывается, записывать такие ролики. Пусть пока повисит как есть, потом перезапишу, постараюсь сократить до макс. 30 минут.

John Gower писал(а):1. Лучше убрать с Рабочего стола то, что не относится к данному. Понятно, что это не "лабораторная среда", но в отдельных случаях это предотвращает случайное нажатие на "посторонние" папки.


А.. Э... Да. Наверное. Я пошаманю, сделаю несколько рабочих столов, один специально для вебинаров и таких вот занятий.

John Gower писал(а):2. Нет смысла показывать как качать и устанавливать ПО если аудитория считается достаточно грамотной в тех. вопросах. На это тратится практически 15% времени


Вопрос ...э.. непростой. На самом деле, ролик пишется с расчетом именно на "чайников". Причем, сделанных из лучших пород дерева. На индивидуальных занятиях слушатели у меня дважды не смогли найти в интернете и закачать Олифант, а одна слушательница умудрилась где-то отыскать и загрузить его устаревший релиз, который не работает. Так что, где брать программу и как ее загружать, показывать все же буду. Но, вы, пожалуй правы, продолжительность именно этой части можно и подсократить.

John Gower писал(а):3. Можно сократить вводную часть, оставив только картинки с чистым/замусоренным столом. Если вебинар про чистку ТМХ и зрители его смотрят - значит они в курсе, что именно "мусорит" базы.


То же самое. Люди видят мусор в базах, но что это за мусор, где он лежит и как выглядит понимают не все. Опять, все это для "чайников", элементарные операции или первые шаги. Мы еще до чистки базы в Экселе доберемся, там вообще кошмар с мусором, который Олифант не видит, но который превращает ТМ из рабочего инструмента в бесполезный хлам. Но, снова же, посокращать надо, да. 42 минуты это слишком много.

John Gower писал(а):5. Не стоит, кмк, брать для иллюстрации базы размером больше 100 тыс. сегментов. Сто тысяч и обрабатываются быстрее и всё равно весьма наглядны.


К сожалению, у меня нет "учебных" небольших ТМ, с репрезентативными выборками ошибок и дефектов. Все мои маленькие базы ~100 тыс. - чистые. Я использую для показа старые базы из архива, реальные, "боевые", нечищенные, именно такие, с которыми слушателям и зрителям потом самим придется бодаться.

Мне кажется, что здесь главная плюшка как раз и заключается в том, чтобы показать гражданам переводчикам, что, казалось бы, огромная ТМ, в которой "столько всего...", у них не работает или работает плохо именно потому, что в ней половина сегментов (если не больше) - просто хлам. На базе, в которой изначально был миллион сегментов, а после чистки осталось 200 тысяч, это смотрится особенно эффектно. На "сотке" этого не видно. Но я еще подумаю.

Сейчас закопался в разных макросах и прочих приблудах для Экселя, а также в скрытых косяках и их отлове. Интересненько, но многодельно. М.б. буду делать два ролика по финальной зачистке, в один, наверное, все не уместится. А это еще и план фильма (сценарий) составить надо...
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение chudo » Пт апр 04, 2014 14:26

Валерий, тоже хочу выразить благодарность. Спасибо за полезную информацию. Хочется попробовать и почистить одну большую базу, так как уже очевидно, что она сильно замедляет поиск, но времени пока нет. Надеюсь, я все-таки доберусь до Олифанта и Экселя.
По пункту 3 в вышеприведенном списке соглашусь с Валерием - да, я имела представление о том, что может "мусорить" базу, но очень обобщенное. В вебинаре это было перечислено наглядно. А дальше переводчик может сам решить, какие типы сегментов удалять, а какие оставить.
Очень полезная информация по ссылкам, куда идти и что скачивать. Про то, как скачивать, наверное, и правда пользователи должны знать, но раз не все знают, то лучше показать.
Тандем "вменяемый заказчик+вменяемый переводчик" в состоянии свернуть горы. (Шубин)
chudo

 
Сообщения: 3303
Зарегистрирован: Пн авг 23, 2004 15:20
Откуда: Ростов-на-Дону

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение John Gower » Пт апр 04, 2014 18:57

Я бы тогда разделил этот вебинар на два отдельных.
1. Обзор инструментов: что бывает, сколько стоит, где взять, как установить
2. Использование инструмента Х или инструментов Х и Y для того-то и того-то.
Тогда более продвинутые перейдут сразу к делу, а менее уверенные в себе пойдут долгой дорогой.
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Пт апр 04, 2014 20:08

Смысл, пожалуй, есть. Наверное, я так и сделаю. Продолжительность ролика не должна быть больше 20-30 минут. Да и то, полчаса уже, наверное, за пределом восприятия. Иначе тяжело смотреть, согласен. По себе сужу. Пусть повисит еще неделю как есть, потом порежу на две части. Или на три.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Константин Лакшин » Вт апр 08, 2014 07:24

Валерий Афанасьев писал(а):Мне кажется, что здесь главная плюшка как раз и заключается в том, чтобы показать гражданам переводчикам, что, казалось бы, огромная ТМ, в которой "столько всего...", у них не работает или работает плохо именно потому, что в ней половина сегментов (если не больше) - просто хлам. На базе, в которой изначально был миллион сегментов, а после чистки осталось 200 тысяч, это смотрится особенно эффектно.


Валерий Михайлович, а можно встрять со злостным оффтопиком? :mrgreen:

По-моему, плюшку/стрелку неплохо было бы перевести на разработчиков.

В том смысле, что общепринятая схема работы с ТМ в некотором роде принципиально порочна.

Когда имеется новый документ объемом в 1000 слов и ТМ на миллион сегментов (неважно, насколько захламленная), казалось бы, что вменяемый инструмент должен бы предлагать вариант «предварительной оптимизации», т. е. создания временной ТМ, в которую из миллиона копируются только сегменты, «более-менее» (если в процентах, то как пользователь скажет) имеющее отношение к переводимой тысяче слов. (Ведь тормоза в основном из-за того, что при каждом переходе к новому предложению кошка «листает» весь миллион (чтобы в конце сообщить, что ничего полезного не найдено)).
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Площадь событий

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 7