中文摘要 |
詞義辨識(Word Sense Disambiguation,WSD)是自然語言處理中很重要的一環,本文利用Naïve Bayes的分類器(classifier)選用目標詞的詞性,相鄰詞及詞性,搭配語,語法依存關係及語義特徵等共九項特徵,以Le and Shimazu(2004)所提出的Forward Sequential Selection Algorithm來得到最佳的特徵組合。我們以Senseval-2中的English lexical sample做為訓練語料以及測試語料,得到61.2%的正確率,與Senseval-2參賽第一名的隊伍64.2%的正確率相差3%,與第4名史丹福大學的參賽隊伍相差0.5%。 |