eCat-Erina писал(а):Признаюсь честно, после этой фразы дальше не читала, т.к. уже можно было не: нужны хорошие человеческие переводы, чтобы было чем машины кормить.
Так что речь не о кризисе, а о вполне дальновидной и хорошо взвешенной стратегии.
Параллельные корпусы человеческих переводов (тексты в машинно обработанной форме) существуют не один десяток лет, да и большинство моделей, насколько мне известно, было разработано (за пределами универов) в IBM, а не гуглом. Т.е. гугл просто доносит до пользователей (в расширенной объеме, конечно) то, что было уже разработано ранее (как google maps), плюс пытается вовлекать пользователей. Мне кажется, "кризис" - крайне неудачное слово, потому что гугл одновременно следует (пользуется плодами) той "дальновидной и хорошо взвешенной стратегии", которую не сам изобрел, и одновременно экспериментирует в нарушениях этой стратегии, привлекая непроверенные источники.
Andrew писал(а):там вполне четко очерчивались и границы применимости различных методов, и оценки объемов, на которых эти методы начнут давать неприемлемые аберрации при бесконтрольном их применении.
Статистически довольно очевидно, что garbage in garbage out. Но интересно, а вдруг наши в 60-ые опередили развитие науки на 50 лет? Сомнительно, но надо, конечно, сравнивать конкретные модели МП. Правда, в совке многое оставалось погребенным в "ящиках" и трудно полноценно судить, насколько методы времен Лебедева сопоставимы с теми, что используются сейчас. Я не могу вспомнить, были ли аналоги современныx statistical alignment models...