Hello.
Я смотрю, статистический подход к переводу оказался заразен
(кстати, философский вопрос, гугль это сам не понимает, или сделал "подарок" конкурентам, ну типа того прикола с порохом в дровах?
)
http://company.yandex.ru/technology/translation/
=====
...
Машинный перевод Яндекса — статистический. Такой перевод основывается не на правилах языка (системе эти правила даже не известны), а на статистике. Чтобы выучить язык, система сравнивает сотни тысяч параллельных текстов — содержащих одну и ту же информацию, но на разных языках. Это могут быть, например, большие тексты с разноязычных версий сайтов организаций. Изначально система находит параллельные тексты по адресам документов
=====
— чаще всего такие адреса различается только пометками, например, «en» или «us» для английской версии и «ru» для русской
...
=====
....и переведены тем-же самым яндексом... Рекурсия в действии
))
Интересно, что там у нас слышно про нормальный анализ текста по правилам, распознавание смысла и тд и тп?
Vladimir
PS честно говоря мне не нравиться что компютеры развиваются слишком быстро и происходит "прогибание" технологий под человека, причем под те "особенности" которые уже давно надо было вычистить и из самого человеческого языка, как вредный хлам...
То есть я думаю что истина где-то посредине - нужно и из человеческого языка постепенно изводить вредные не однозначные конструкции, кстати говоря приводящие к возникновению проблем вроде ментальных вирусов и всем давно известным массовым психологическим проблемам("тараканам" и "гусям" по-народному
).