中文摘要 |
本文提出了機器翻譯中句法分析的一種語義排歧模型,該模型以《知網》?主
要語義知識源。《知網》是一個以漢語和英語的詞語所代表的概念?描述物件,
以揭示概念與概念之間以及概念所具有的屬性之間的關係?基本內容的常識
知識庫,它?我們的排歧提供了豐富的語義資訊。排歧模型結合了基於規則及
基於統計的方法,應用於分析所?生的中間結構中,從“優選?的角度進行詞
義及結構的排歧。
排歧模型首先利用大規模的語料庫獲取義原的同現集合,該語料庫未進行任何
的語義標誌,因此獲取過程是無指導的。然後它根據轉換模板構造出義原的語
義限制規則。《知網》中的詞語義項由義原組成,義項的語義限制規則可以由
其構成義原的語義規則得到。
在語義排歧階段,我們首先確定輸入句的每個實義詞的上下文相關詞集。由於
實義詞的語義關係在對當前句子的語法結構確定及各詞語詞義的選擇起著相
當重要的作用,我們對一個句子的評價就建立在對該句中實義詞的評價基礎之
上。把詞語的當前上下文相關詞集與詞語各義項的限制規則所描述語義特徵資
訊進行比較,根據比較的相似度選擇最合適的義項。同時將相似度的最大值作
?該詞語的評價值。中間分析結果中各實義詞的評價分值可以成?評價此中間
結果的依據,以此在多個中間結構中選出最佳的結果。這樣,我們在解決詞義
歧義的基礎上同時也解決了結構歧義。
本文所提出的語義排歧模型已在機器翻譯系統中具體地實現。實驗例句的測試
表明該排歧模型對解決句法分析中的辭彙歧義、結構歧義是有效的,並且優於
傳統的YES/NOT 的方法。本文首先提出了排歧模型的主要思想,並簡要介紹了《知網》。然後給出了從
語料庫中抽取義原同現資訊及將其轉化成語義限制規則的方法。接著文章詳細
介紹了排歧演算法,包括構建上下文相關詞集,義原間、語義規則和上下文詞
集間的相似度計算。最後文章給出了模型的試驗實例結果。 |