月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
基於特製隱藏式馬可夫模型之中文斷詞研究
並列篇名
Chinese Word Segmentation using Specialized HMM
作者 林千翔張嘉惠
中文摘要
中文斷詞在中文的自然語言處理上,是個相當基礎且非常重要的工作。近年來的斷詞系統較傾向於機器學習式演算法來解決中文斷詞的問題,但使用傳統的作法,隱藏式馬可夫模型在解決中文斷詞的問題上,無法達到較好的斷詞效能(F-measure約80%),所以許多研究都是使用外部資源或是結合其他的機器學習演算法來幫助斷詞。本研究的目的是使用「特製化」(specialization)的概念來提升隱藏式馬可夫模型的準確率,我們的作法是給予隱藏式馬可夫模型更多的資訊,在完全不修改模型之訓練及測試過程的前提下,透過兩階段特製化的方式,分別為擴充「觀測符號」,以及擴充「狀態符號」的方式,大大地改善了隱藏式馬可夫模型的斷詞準確性。第一階段中,我們使用長詞優先法,來增加額外的資訊於隱藏式馬可夫模型中,使得模型擁有更多的斷詞資訊做學習。於實驗結果發現,只使用這個最簡單的長詞優先斷詞方法,確實能大幅地提升隱藏式馬可夫模型的效能。而第二階段中,我們則使用詞彙式隱藏式馬可夫模型Lexicalized HMM)的概念,也就是只根據某些特製詞(specialized words)來做特製化,將狀態做延伸,實驗結果也證明詞彙式隱藏式馬可夫模型可再次提升系統斷詞效能。
起訖頁 1-21
刊名 ROCLING論文集  
期數 2006 (2006期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 MiniJudge: Software for minimalist experimental syntax
該期刊-下一篇 以字串特徵做為文本資料之錯誤偵測
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄