Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Вебинар по чистке и оптимизации ТМ/ТМХ

Проф. организации, семинары, конкурсы и др. события

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение John Gower » Пн апр 21, 2014 20:36

Как мне кажется, нужно общаться с теми, кто пытался поднимать статистические МП движки, где проблема мусорных тегов и обрывков очень остра.
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en





Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Пн апр 21, 2014 21:01

Константин Лакшин писал(а):Валерий, и еще критиканский вопрос: а вы про допустимые/недопустимые для ТМХ сочетания символов принципиально ничего не объяснять не собираетесь? И вообще про устройство ТМХ?


Нет. Ничего принципиального. Просто я: а) недостаточно владею данным вопросом и б) смысл всех этих упражнений в том, чтобы просто показать некоторые приемы быстрого избавления ТМ/ТМХ от наиболее вопиющих дефектов. Все то, до чего дошел сам или с помощью коллег.

Достаточно кустарно, согласен, и на большее не претендую. Если эти мои ролики подтолкнут коллег на создание своих собственных, более совершенных и исчерпывающих, я буду очень рад. На самом деле, одна из целей, которые я преследую публикацией этих роликов заключается еще и в том, чтобы сподвигнуть других опытных коллег поделиться своими знаниями и навыками, используя средства более массовой информации, чем наш уютный и милый, но такой маленький ГП.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение mikhailo » Пн апр 21, 2014 21:50

Валерий, и еще критиканский вопрос: а вы про допустимые/недопустимые для ТМХ сочетания символов принципиально ничего не объяснять не собираетесь? И вообще про устройство ТМХ?


А что Вас интересует? Объяснений Валеры как раз достаточно, чтобы избавиться от этих проблем. Олифант как раз вылавливает эти символы. Вот тут немного подробнее
http://translation-blog.com/invalid-xml ... -in-a-tmx/

ОК. Буду перезаписывать, обязательно сделаю дисклеймер со ссылкой на эту ветку.


К чему? Достаточно будет просто пометить, что рекомендованный регвыр не проверяет вложенности тэгов. На уровне данного семинара этого вполне достаточно, особенно с учётом того, что и проблема эта в общем то специфическая.
Any man who is under 30, and is not a liberal, has not heart; and any man who is over 30, and is not a conservative, has no brains. - Sir Winston Churchill
mikhailo

 
Сообщения: 3880
Зарегистрирован: Пн июл 12, 2004 07:22
Язык(-и): EN,DE,IT>RU; СУРДОПЕРЕВОД

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Пн апр 21, 2014 22:09

mikhailo писал(а):Достаточно будет просто пометить, что рекомендованный регвыр не проверяет вложенности тэгов.


Ну, или так. Хотя в удаленном ролике я вообще-то об этом говорил. И в новом, который постараюсь выложить завтра, тоже скажу. Действительно, такое бывает, что внутри тегов лежит релевантная информация, потерять которую жалко. Сам видел. Если найду подходящие примеры у себя в архивах, обязательно покажу. Если такие конкретные примеры есть у кого-нибудь из коллег, буду признателен, для пополнения коллекции.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение John Gower » Пн апр 21, 2014 23:31

Может быть имеет смысл в вебинаре (не публичных видео) рассказать о превентивных мерах. То есть, как работать в кошке/кошках чтобы мусора было поменьше. Пусть даже это будет мемокьюцентричный курс. Ведь можно рассказывать не только о лечении, но и о профилактике. Или нет?
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вт апр 22, 2014 00:11

John Gower писал(а):Ведь можно рассказывать не только о лечении, но и о профилактике. Или нет?


Если честно, то я не очень представляю себе что это за превентивно-профилактические меры. М.б., поясните примером?

Пока же я рассматриваю ситуацию, когда крупное БП или отдел переводов крупной корпорации подряжает в какой-нибудь мега-гига-проект типа Штокмана сотню-две переводчиков и эти переводчики, на просторах от Калгари до Алматы, работают на компьютерах с разными ОС, разными CAT, в разных версиях Офиса, распознают сканы разными версиями Файнридера и т.п. и т.д. И все это длится год, другой, третий... В отсутствие человека, который ведет и чистит общую ТМ проекта, после первого же десятка тысяч страниц переведенных документов эта ТМ будет представлять собой ту картинку, которую я показал в первом ролике. Я не знаю, какие тут можно принять меры, кроме выделения штатной единицы ТМ-щика (практически нереально). Или подрядить единого генподрядчика в лице БП и вменить ему в обязанность в т.ч. следить за чистотой ТМ. Ну, или чистить самому.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Константин Лакшин » Вт апр 22, 2014 08:08

mikhailo писал(а):А что Вас интересует?


Меня интересовало, почему ВА не захотел хоть немножко познакомить обучаемых с основами. Прочее меня интересующее украдено до нас прописано в стандартах.
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вт апр 22, 2014 10:50

Могу еще добавить, что на сайтах Okapi Olifant http://okapi.sourceforge.net/ и OkapiWiki http://www.opentag.com/okapi/wiki/?title=Main_Page все расписано исключительно подробно.

Пересказывать содержимое написанного там - не вижу смысла. Да, чтобы въехать, мозги напрячь придется. Но совсем чуть-чуть.

Другое дело, Олифант имеет своеобразный интерфейс и своеобразный функционал, каковые могут поначалу показаться несколько запутанными и требуют некоторой привычки.

Поэтому быстренько показать, куда в какие кнопочки тыкать и что из этого получится, вот это широким переводческим массам может оказаться практически полезным для "срочно, вот, прямо здесь и сейчас, проект горит". Эдакий "Олифант за пять минут".

ЗЫ: В автошколах ДОСААФ курсантам объясняли устройство автомобиля, что там у него под капотом и все такое. Но вообще из них готовили водителей, а не автомехаников, как-то так.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение borysich » Вт апр 22, 2014 11:39

ЗЫ: В автошколах ДОСААФ курсантам объясняли устройство автомобиля, что там у него под капотом и все такое. Но вообще из них готовили водителей, а не автомехаников, как-то так.

ОФФ:
А на практике (в войсках) это выглядело примерно так: первый год службы ребята проводили в основном в автопарке, занимаясь ремонтом техники, набивая шишки руки и накачивая мускулатуру перекидыванием двигателей и агрегатов; и лишь на втором году их, уже досконально знающих матчасть, допускали до баранки.
Communication usually fails, except by accident (Osmo A. Wiio)
Аватара пользователя
borysich

 
Сообщения: 4529
Зарегистрирован: Пн фев 16, 2009 18:51
Язык(-и): En>Ru

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Константин Лакшин » Вт апр 22, 2014 21:21

Валерий Афанасьев писал(а):практически полезным для "срочно, вот, прямо здесь и сейчас, проект горит"


Или практически вредным. Вы во время семинара, кажется, предлагали в Notepad++ поискать и тут же удалить все, что начинается с &#. С большой вероятностью ничего страшного не произойдет, т. е. убиты будут только вредные управляющие символы.

Но... С того же сочетания начинается, например, еще и вполне себе безвредное обозначение диаметра, не говоря уж о греческих буквах, которые вполне могли по недосмотру попасть в ТМХ в виде шестнадцатиричных кодов. Мне кажется, что об этом полезно предупреждать.
Переводчик в свободное время, 24/7/365.
Константин Лакшин

 
Сообщения: 2427
Зарегистрирован: Вт авг 26, 2003 20:36
Блог: Просмотр блога (68)

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение John Gower » Вт апр 22, 2014 21:55

Валерий Афанасьев писал(а):
John Gower писал(а):Ведь можно рассказывать не только о лечении, но и о профилактике. Или нет?


Если честно, то я не очень представляю себе что это за превентивно-профилактические меры. М.б., поясните примером?

Охотно. 1) rtf-документ после сканирования (псевдо-док). Почему его не стоит пихать в кошку. 2) Стили в Word и форматирование "на глаз". 3) Параметры экспорта/импорта в кошках касающиеся "мусора".
Было бы любопытно посмотреть, какая "кошка" более устойчива к замусориванию, но это, увы, требует немалых сил и времени.
Это может быть не отдельный семинар, а, скажем, дополнение к существующему курсу по чистке ТМХ.
В той же Студии в режиме обозревателя ТМ теги отображаются в виде текста, что позволяет удалить их вручную, в часто используемых или "ценных" сегментах (содержат важный термин или выражение), особенно когда экспорт не возможен или технически затруднителен. В моём сценарии был сервер, и экспортировать ТМ для чистки было не очень ловко. Я понимаю, что это экзотика и мало кто с этими проблемами сталкивается, но вдруг..
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Вт апр 22, 2014 23:48

Константин Лакшин писал(а):Мне кажется, что об этом полезно предупреждать.


Об этом обязательно нужно предупреждать. Причем, неоднократно. Типа "через сто метров грабли". Потом еще раз: "До граблей осталось совсем немного". Еще ближе к граблям: "Вот лежат грабли". Подойдя к граблям вплотную: "Вот что будет, если на них наступить". Я при перезаписи ролика (к сожалению, опять работы накидали аж до субботы, так что пока откладывается) раз стопиццот скажу об этом. Но, опять,практика показывает, что за один раз приходится иметь дело с ограниченным набором дефектов. Для устранения которых достаточно ограниченного набора инструментов. Что-то покаже, чего-то не покажу, лишь потому, что у меня такого никогда не было. Пусть другие тоже показывают, если хотят.

John Gower писал(а):
Валерий Афанасьев писал(а):Если честно, то я не очень представляю себе что это за превентивно-профилактические меры. М.б., поясните примером?

Охотно. 1) rtf-документ после сканирования (псевдо-док). Почему его не стоит пихать в кошку. 2) Стили в Word и форматирование "на глаз". 3) Параметры экспорта/импорта в кошках касающиеся "мусора".


Теперь понял. Действительно, по теме "Подготовка документа к переводу" можно замутить целую отдельную серию лекций. Один лишь Файнридер это вообще что-то :lol: Но я вряд ли буду заниматься этим, по крайней мере, системно. М.б., отдельные частные случаи покажу, типа каких-то приемов работы с pdf. Но - отдельные и частные. То, с чем сам бьюсь каждый день. Не более того.

Разработка какого-то системного курса требует немалых сил и времени. Это только кажется, что там лекцию прочитать, фигня вопрос. На самом деле, упражнение то еще. И заниматься этим делом без достойной оплаты как-то неинтересно. Лекции про tmx это так, мелочевка. Немного хобби, немного - освоение ютюба и прочих тимвьюеров, немного - тренировка навыка преподавания, немного - реклама себя, любимого.

Когда я еду читать курс повышения квалификации куда-то в компанию, я долго и нудно готовлюсь. Еду, там дней несколько впахиваю как раб на галере, но все это и оплачивается соотвественно. Жаль, случается не настолько часто, чтобы я бросил свою нынешнюю работу.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение John Gower » Ср апр 23, 2014 07:08

Валерий Афанасьев
*особый акцент* Так никто ж не говорит "об даром". Я отлично понимаю, что это всё стоит сил и времени.
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Сб апр 26, 2014 00:00

Перезаписал вторую часть. 32 минуты. Дисклеймер в конце по поводу регулярных выражений как смог - сделал.

Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Пн апр 28, 2014 22:59

Часть 3, фильм 1: Выявление скрытых, неявных дефектов в файле tmx, очищенном стандартными средствами Олифанта. Загружаем tmx в CAT программу и смотрим, что из этого получилось.



На следующих занятиях будем вытаскивать текст в Эксель и доочищать там. Поскольку это занятие довольно муторное и небыстрое, роликов будет несколько.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Чт май 01, 2014 02:51

Часть 3 Фильм 2 подвешен, думаю, еще будет фильм 3 и фильм 4.

Канал на ютюбе, на всякий случай, http://www.youtube.com/channel/UC4bzEP_87jxXUC_LgjY0TvQ
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение John Gower » Чт май 01, 2014 17:04

Большое спасибо!
Смотрю с большим удовольствием.
Last grace of style
Аватара пользователя
John Gower

 
Сообщения: 1413
Зарегистрирован: Ср июл 21, 2010 14:09
Блог: Просмотр блога (8)
Язык(-и): en-ru, ru-en, de-ru, de-en

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Сб май 03, 2014 20:42

Добавил еще один ролик: http://www.youtube.com/watch?v=6qpGwP4bZ-I

Удаляем пробелы в начале и конце строк, удаляем двойные пробелы, меняем местами ячейки с русским и английским текстмо с помощью макроса. Ищем (и находим) новые скрытые дефекты.

Остался последний: удалить дубликаты строк, подчистить еще по мелочи, сохранить и загрузить получившееся в "кошку".

Потом еще обзор Heartsome и CheckMate, но это уже как-нибудь потом.
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Валерий Афанасьев » Сб май 03, 2014 23:02

Вот, заключительный: http://www.youtube.com/watch?v=kYIfI0GquQs
Валерий Афанасьев
Нефтяник
 
Сообщения: 11525
Зарегистрирован: Чт июл 25, 2002 13:56
Откуда: ВИИЯ

Re: Вебинар по чистке и оптимизации ТМ/ТМХ

Сообщение Shkoda » Сб окт 18, 2014 17:28

не знаю, к месту или нет, но Heartsome теперь бесплатен

http://www.proz.com/forum/heartsome_sup ... ource.html

https://github.com/heartsome/tmxeditor8
Shkoda

 
Сообщения: 58
Зарегистрирован: Вс сен 21, 2008 18:11

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Площадь событий

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 10