中文複合詞有很大部份是由動補結構所組合產生,它們在語料中常呈現合分詞不一致或錯誤的情況,本文以動補結構中合分詞類型最複雜的結構「V到」為例,探討其合分詞及語意區分問題。我們根據「到」是否有「到達」的語意,利用七條原則及簡易判準──即以賓語類型{地點、時間、狀態}為標準--採人工的方式進行標記,並評估合分詞正確率,結果證明「吃到」可以由目前的70.6%正確率提升到94.5%。以「V到」結構整體來看,在9個例詞500條隨機選取的例句中,合分詞正確率可達到93.4%,基於此合分詞結果的語意合成正確率也達到86%。顯示複雜的動補結構合分詞問題可經由簡易人工規則來改善。未來我們計畫將人工規則轉為自動化處理程式並檢驗其正確性。 |