月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
中文名詞組的辨識:監督式與半監督式學習法的實驗
並列篇名
Chinese NP Chunking: Experiments with Supervised,and Semisupervised Learning
作者 林晏僖高照明高成炎
中文摘要
本文先利用Taku Kudo所發展的SVM工具Yamcha訓練中文名詞組辨識的初始模型,並嘗試以不同於多數文獻的IOB表示法及前二後二位置的語法標記資訊,找到適用於中文的參數。接著利用半監督式學習法中自我學習的概念,利用網路上未標記的資料,強化supervised-learning的模型。實驗結果證明,supervised learning這個步驟裡,我們選用的參數比前人的更合適;而我們所提出的半監督式學習法,可以提昇辨識結果,特別是在動詞修飾名詞的情形,半監督式學習法可以大幅提高辨識的正確率。
英文摘要
This paper utilizes Yamcha, a SVM tool designed by Taku Kudo, to train an NP-chunking model for Chinese. In addition to IOB and two words surrounding the focused word, we experimented on new features and exploited unlabeled data from web pages to enhance the previous model. Our experiments with supervised learning indicate that our chosen feature sets outperform those reported in previous studies. In addition, the proposed method of semisupervised learning is proved to be effective in distinguishing a noun phrase from a verb phrase both consisting of V N combination, thus enhancing the overall accuracy.
起訖頁 1-14
關鍵詞 名詞組辨識YamCha監督式學習半監督式學習NP-chunkingYamChasupervised learningsemi-supervised learning
刊名 ROCLING論文集  
期數 2008 (2008期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 利用統計方法及中文訓練資料處理台語文詞性標記
該期刊-下一篇 強健性語音辨識中能量相關特徵之改良式正規化技術的研究
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄