介詞在自然語言的處理上一直扮演著重要的角色;而介詞所表示的不同語意關係,更直接影響了介詞的翻譯。我們將設法由機讀語料中擷取出介詞的翻譯法則。我們將以介詞with為例,先依其不同的翻譯特性加以分析,共分成片語、直接受詞、功能、原因、情狀、屬性、共事、對象、關係等九類。其中對直接受詞類,我們利用了句法的次分類資訊;功能及屬性兩類,我們則提出先分類再利用辭彙語意結構來選擇翻譯時所運用的辭彙。我們引入屬性和關係兩類是用以描述V-O-P-N結構中的O和N兩者的關係,以彌補格位分析的不足。實驗以朗文當代英漢雙語詞典中的雙語例句為訓練語料,抽取句子的V-O-P-N結構,觀察其在同義詞詞林的類語意碼,再利用決策串列(decision list)來產生法則。外部測試的結果獲得超過75%的高正確率。 |