Мозаичный форум - Показать сообщение отдельно

tvv385 · 18.03.2011, 06:35

Hello.

Я смотрю, статистический подход к переводу оказался заразен

(кстати, философский вопрос, гугль это сам не понимает, или сделал "подарок" конкурентам, ну типа того прикола с порохом в дровах?

)

http://company.yandex.ru/technology/translation/
=====
...
Машинный перевод Яндекса — статистический. Такой перевод основывается не на правилах языка (системе эти правила даже не известны), а на статистике. Чтобы выучить язык, система сравнивает сотни тысяч параллельных текстов — содержащих одну и ту же информацию, но на разных языках. Это могут быть, например, большие тексты с разноязычных версий сайтов организаций. Изначально система находит параллельные тексты по адресам документов
=====
— чаще всего такие адреса различается только пометками, например, «en» или «us» для английской версии и «ru» для русской
...
=====
....и переведены тем-же самым яндексом... Рекурсия в действии

))

Интересно, что там у нас слышно про нормальный анализ текста по правилам, распознавание смысла и тд и тп?

Vladimir
PS честно говоря мне не нравиться что компютеры развиваются слишком быстро и происходит "прогибание" технологий под человека, причем под те "особенности" которые уже давно надо было вычистить и из самого человеческого языка, как вредный хлам...
То есть я думаю что истина где-то посредине - нужно и из человеческого языка постепенно изводить вредные не однозначные конструкции, кстати говоря приводящие к возникновению проблем вроде ментальных вирусов и всем давно известным массовым психологическим проблемам("тараканам" и "гусям" по-народному

).

18.03.2011, 06:35	#7
tvv385 Старожил Регистрация: 24.01.2008 Сообщений: 2,854	статистический перевод и распознавание смысла Hello. Я смотрю, статистический подход к переводу оказался заразен (кстати, философский вопрос, гугль это сам не понимает, или сделал "подарок" конкурентам, ну типа того прикола с порохом в дровах? ) http://company.yandex.ru/technology/translation/ ===== ... Машинный перевод Яндекса — статистический. Такой перевод основывается не на правилах языка (системе эти правила даже не известны), а на статистике. Чтобы выучить язык, система сравнивает сотни тысяч параллельных текстов — содержащих одну и ту же информацию, но на разных языках. Это могут быть, например, большие тексты с разноязычных версий сайтов организаций. Изначально система находит параллельные тексты по адресам документов ===== — чаще всего такие адреса различается только пометками, например, «en» или «us» для английской версии и «ru» для русской ... ===== ....и переведены тем-же самым яндексом... Рекурсия в действии )) Интересно, что там у нас слышно про нормальный анализ текста по правилам, распознавание смысла и тд и тп? Vladimir PS честно говоря мне не нравиться что компютеры развиваются слишком быстро и происходит "прогибание" технологий под человека, причем под те "особенности" которые уже давно надо было вычистить и из самого человеческого языка, как вредный хлам... То есть я думаю что истина где-то посредине - нужно и из человеческого языка постепенно изводить вредные не однозначные конструкции, кстати говоря приводящие к возникновению проблем вроде ментальных вирусов и всем давно известным массовым психологическим проблемам("тараканам" и "гусям" по-народному ). __________________ ничто так не останавливает буйный полет мысли, как pragma Ada83; ;)