中文摘要 |
Peter F. Brown等人提出統計式的機器翻譯後(Statistical Machine Translation),目前翻譯的基本單位已由單詞轉變成詞組(Phrase),雖然詞組為本的機器翻譯已經可以達到不錯的效果,但使用者仍在詞組閱讀上遇到不順暢的情形,而目前研究機器翻譯的研究領域很少針對詞組流暢化進行探討。我們觀察到譯者在英中翻譯時,常常會加入一些不存在於英文句中的詞彙使句子能夠更加流暢,如果只是簡單的詞對詞翻譯,無法在中文句子顯示這些額外附加的詞彙在中文句子中。有鑑於此,我們提出流暢化詞組機器翻譯(Fluent Phrase Machine Translation, FPMT)的機率模型來決定加入詞彙後的中文詞組是否流暢,以及使用語料庫(Corpus)和網路搜尋結果(Search Result)來找出附加的詞彙。實驗結果顯示,我們提出的流暢化詞組機器翻譯模型得到的中文詞組,其效能比IBM Model4的方法佳,可以有效的補回缺少的詞彙,在人工評估上,更顯示我們的方法確實可以提升翻譯的流暢化。 |