Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Даешь словарь для Лингво!

Модератор: Dragan

Re: Даешь словарь для Лингво!

Сообщение Трули Ёрз » Вт июл 10, 2012 13:09

leiris писал(а):да, только там столько ошибок распознавания

А "в моей папке на обменнике" - это для всех или для особо отличившихся? и где этот обменник? :-(
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8833
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru





Re: Даешь словарь для Лингво!

Сообщение esperantisto » Вт июл 10, 2012 13:22

Видимо, в колхозе на руборде, там и спрашивайте про доступ (я сам давно не пользовался, мои данные устарели).
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Даешь словарь для Лингво!

Сообщение leiris » Ср июл 11, 2012 09:34

Трули Ёрз писал(а):А "в моей папке на обменнике" - это для всех или для особо отличившихся? и где этот обменник?

читайте шапку того топика. здесь все же другой форум
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение Трули Ёрз » Ср июл 11, 2012 14:57

Ок, спасибо!
None of them knew they were robots
Аватара пользователя
Трули Ёрз

 
Сообщения: 8833
Зарегистрирован: Пн сен 09, 2002 17:15
Откуда: разрушено марсианами
Язык(-и): fr-ru; eng-ru

Re: Даешь словарь для Лингво!

Сообщение leiris » Вс окт 07, 2012 20:31

итак, кто желает произвести первый этап работ:
отсканирована и распознана примерно треть словаря. Нужно из файла ворд удалить следующее (см. картинки):

- буквы алфавита

Изображение

- индекс и номер страницы, если они фигурируют на странице (это не всегда так)

Изображение

только удалить так, пожалуйста, чтобы не происходило сдвига строк (то есть желательно удалять не строку, а только надписи). Больше ничего пока там трогать не надо. В файле ворда примерно 180 страниц.
кто желает взяться? напишите мне в личку
сканирование оставшейся части потихоньку тоже продолжается
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Вс окт 07, 2012 20:56

файл взят в работу.
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение Dragan » Пн окт 08, 2012 12:36

leiris
отсканирована и распознана примерно треть словаря

К сожалению, меньше, т.к. там 648 стр.
"Не тот беден, кто ничего не имеет, но кто желает многого; и не тот богат, кто собрал много, но кто ни в чем не нуждается." - святитель Иоанн Златоуст.
Dragan

 
Сообщения: 5455
Зарегистрирован: Вт дек 27, 2005 11:45
Откуда: Санкт-Петербург
Блог: Просмотр блога (11)

Re: Даешь словарь для Лингво!

Сообщение esperantisto » Пн окт 08, 2012 12:50

А что мешает разделить отсканированные страницы и частями разбросать по добровольцам для распознавания?
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Даешь словарь для Лингво!

Сообщение Dragan » Пн окт 08, 2012 13:13

Узкое место - сканирование. Я это делаю очень медленно, т.к. словарь у меня, сканер на работе, а работы очень много.
"Не тот беден, кто ничего не имеет, но кто желает многого; и не тот богат, кто собрал много, но кто ни в чем не нуждается." - святитель Иоанн Златоуст.
Dragan

 
Сообщения: 5455
Зарегистрирован: Вт дек 27, 2005 11:45
Откуда: Санкт-Петербург
Блог: Просмотр блога (11)

Re: Даешь словарь для Лингво!

Сообщение esperantisto » Пн окт 08, 2012 15:26

А, вот оно что. Я думал, заминка за распознаванием.
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Даешь словарь для Лингво!

Сообщение leiris » Сб окт 20, 2012 18:55

новости
сканирование и распознавание закончено. в ближайшее время подготовлю файл-пдф с алфавитными закладками, покопаюсь немного с распознанным файлом и - можно будет распределять страницы на вычитку.
уважаемые участники проекта, напишите мне, силь ву пле, в личку, сколько страниц вы желаете / можете вычитать

побуквенно, количество страниц выглядит примерно так:
A 9-52 = 43
B 53-91 = 38
C 92-178 = 86
D 179-213 = 34
E 214-257 = 43
F 258-291 = 33
G 292-312 = 20
H 313-323 = 10
I 324-335 = 11
J 336-340 = 4
K 341 = 1
L 342-360 = 18
M 361-411 = 50
N 412-417 = 5
O 418-427 = 9
P 428-494 = 66
Q 495-497 = 2
R 498-529 = 31
S 530-576 = 46
T 577-614 = 37
U 615-617 = 2
V 618-639 = 21
W 640-641 = 1
сокращения - 642-648 = 6
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Сб окт 20, 2012 19:02

добавлено:
даже если вы не сильны во французском, вы можете выполнить очень важную техническую работу,
например, исправив только тильды и род существительных
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Чт окт 25, 2012 18:43

отчет о работе.
сделана предварительная обработка файла. еще недельку я на него посмотрю, напишу инструкцию для правщиком и раздам каждому страниц по 20 или 30, чтобы удовлетворение от завершения работы приходило быстрее )))
к сожалению, пока я получил только четыре письма от желающих участвовать... прибавим сюда dragan... = пять... прибавим меня (тоже ведь не сижу без дела) = шесть
не густо... но это уже много: такими силами мы сможем все
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Вс окт 28, 2012 15:28

ПРАВКА
Итак, я предлагаю такую схему работы
I. Исправляем форматирование (многое я уже исправил по всему файлу, например, все вот эти знаки !|{}?:_■+"<

идущие подряд три значка доллара ($$$) не трогаем! Это специально сделанные мной замены тильд!

1. ищем значки /-*—>\«»%°^ и правим их: как правило, это неправильно распознанные тильды
значок / часто является неправильным распознаванием указания рода f или множ. числа pl
остальные в основном при неправильном распознавании тильды
но не забывайте, что бывают и такие сочетания: ~ sucre/non-sucre отношение сахар/несахар
то есть в таких сочетаниях значок / править не надо!

2. ищем все маленькие тире -
иногда так неправильно передается перенос или тильда, исправляем

3. ищем все остальные значки и правим при необходимости

4. неспешно просматриваем по всему файлу начало каждой строки. Каждая строка должна начинаться либо с франц. заголовка за которым идет указание рода, либо с тильды. Исправляем неправильное.
не забываем, что если заголовком является прилагательное или глагол, то никаких грамматических указаний после заголовка нет
иногда тильда неправильно распознается как следующие сочетания русских букв: ям ты тш тм
иногда строка начинается с пробела - часто это либо просто отсутствие тильды и ее надо подставить, либо это слово должно быть на предыдущей строке

кроме того, иногда в одной строке может быть несколько заголовков или тильд. Такие строки нужно разбивать.
Например, дано:
~ à meuler шлифовальный диск;
шлифовальный круг ~ de pâte laminée блинок теста ~ pulvérisateur распылительный
диск
должно быть:
~ à meuler шлифовальный диск; шлифовальный круг
~ de pâte laminée блинок теста
~ pulvérisateur распылительный диск
или дано так:
disque-couteau m дисковый нож disques m pl égalisateurs калибрующие ролики (калибрующе-вытягивающей машины) dissection f диссекция, вскрытие disséquer вскрывать; рассекать dissociation f диссоциация; разложение, распад ~ hydrolytique гидролиз ~ thermique термическое разложение
должно быть:
disque-couteau m дисковый нож
disques m pl égalisateurs калибрующие ролики (калибрующе-вытягивающей машины)
dissection f диссекция, вскрытие
disséquer вскрывать; рассекать
dissociation f диссоциация; разложение, распад
~ hydrolytique гидролиз
~ thermique термическое разложение

II.
когда сделана правка форматирования - проверяем орфографию

Если есть вопросы, задавайте их прямо здесь в топике, ответы могут пригодится всем правщикам
сегодня или завтра разошлю правку и словарь в пдф: по 20-30 страниц, исходя из страниц исходного словаря
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Вс окт 28, 2012 15:44

забыл важное!

форматирование правьте в блокноте или другом текстовом редакторе (именно поэтому я раздаю документ в формате txt, сохраненном в юникодовской кодировке utf8), там вам лучше будет видна строчность документа, чем в ворде

а вот для орфографической правки можно потом скопировать сделанное в ворд и править в ворде, и мне отправлять потом файл ворда
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Вс окт 28, 2012 16:50

разослал файлы на вычитку.
Участники, проверьте ваши ЛС
Aniña D chaudiere-compression
Трули Ёрз a-appat
Dragan conserves-decanteuse
chudo comprime-conserverie
esperantisto capsulateur-chaud-froid
Tanka appater-bishof
Truchement bisque-capsulage

таким образом разослана на вычитку почти треть словаря. Это очень хорошо.
Все вопросы по вычитке задавайте прямо в топике.
Не забудьте внимательно прочитать инструкцию!
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Вс окт 28, 2012 20:17

сделал концовку словаря под лингво от W до Z
думаю, что словарь будет выглядеть примерно так:
Изображение

если есть пожелания, высказывайтесь
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение esperantisto » Вс окт 28, 2012 20:58

1) ЛС получил.
2) А что, выносить выражения в подстатьи не предполагается?
«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)
esperantisto

 
Сообщения: 7035
Зарегистрирован: Ср фев 25, 2004 12:14
Откуда: Менск
Язык(-и): En→Ru/Be, De→Ru/Be

Re: Даешь словарь для Лингво!

Сообщение leiris » Вс окт 28, 2012 21:12

2) А что, выносить выражения в подстатьи не предполагается?

предполагается,
думаю сделать две версии: без вынесенных подстатей и avec
это на самом деле будет "делом на одну трубку", если будет хорошо сделано форматирование
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Re: Даешь словарь для Лингво!

Сообщение leiris » Пн окт 29, 2012 10:45

Olga_S - буква V
leiris

 
Сообщения: 295
Зарегистрирован: Ср май 30, 2012 20:22

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Словари

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9