月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
以字串特徵做為文本資料之錯誤偵測
作者 劉吉軒鄭雍瑋
中文摘要
資訊擷取是從自然語言文本中辨識出特定的主題或事件的描述,進而萃取出相關主題或事件元素中的對應資訊。然而資訊擷取的結果會有錯誤情況發生,若單只依靠人工的方式進行錯誤的檢查及更正,將會是耗費大量人力及時間的工作。在本論文中,我們提出一種字串特徵為主的錯誤偵測方法,以資料描述的概念進行字串外表特徵的捕捉與轉換,再透過C4.5或SVM機器學習分類方法,自動建構適當的二元資料分類模型,進而達到辨別正確與錯誤資料的目的。實驗結果顯示,本研究所提出的錯誤偵測方法,可以有效偵測出資訊擷取成果中不正確的值組,確保高品質的資訊擷取成果產出,促使資訊擷取技術更廣泛的實際應用。
起訖頁 1-20
關鍵詞 錯誤偵測資料描述資訊擷取
刊名 ROCLING論文集  
期數 2006 (2006期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 基於特製隱藏式馬可夫模型之中文斷詞研究
該期刊-下一篇 Learning to Parse Bilingual Sentences Using Bilingual Corpus and Monolingual CFG
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄