月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
資訊科技國際期刊 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
新聞事件偵測與追蹤之分群分類演算法
作者 黃純敏陳聰宜詹雅筑
中文摘要
過去研究在進行文件群聚分析時,如以詞庫方式斷詞者,多採CKIP進行中文斷詞處理。礙於其處理傳輸量的嚴格限制,以及斷詞過於瑣碎的缺點,使得研究在處理字詞上,需多次批次上傳,斷詞結果亦需進一步過濾與合併。本研究以平行處理方式比較CKIP與自行開發的中文斷詞系統(Chinese Corpus Segmentation,CCS)搭配國家圖書館主題標目,做為文件分群之前置處理,研究結果證實使用專業詞庫確實可提升分群成效,事件偵測準確率高達85%。在事件追蹤實驗中以SVM、KNN及Naive Bayes三種分類演算法做為測試評比對象,結果顯示,SVM表現最佳,其分類準確度高達91.33%。
英文摘要
Numerous studies relied on CKIP to process Chinese term segmentation as a preprocessing for cluster analysis. Due to its strict limitation of transmission volume and the need of further processing of term filtering and merging, this study adopted a professional corpus composed of subject headings along with a self-developed Chinese Corpus Segmentation (CCS). The results showed that CCS outperforms CKIP in terms of performance and term quality in processing cluster analysis with a high precision rate of 85%. Furthermore, in order to provide high quality news tracking results, we compared SVM, KNN, and Naïve Bayes with regard to the accuracy of classification result. Results showed that SVM was the best among the others, with a high precision rate of 92%.
起訖頁 70-78
關鍵詞 事件偵測與追蹤中文斷詞分群分類News Event Detection and TrackingChinese Term SegmentationClusterClassification
刊名 資訊科技國際期刊  
期數 201406 (8:1期)
出版單位 朝陽科技大學資訊學院
該期刊-上一篇 塔米爾文語音辨識系統之設計研究
該期刊-下一篇 應用灰色決策於伽瑪校正架構之硬體實作分析
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄