月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
以多重表示選擇文章分類的樣本
並列篇名
Using Multiple Representations to Select Instances for Text Classification
作者 陳耀輝王志偉
中文摘要
以機器學習方式產生分類模型是一種常見將文章自動分類的技術,但若有標記不精確的訓練資料,就可能得到錯誤的分類結果,而樣本選擇能藉由減少訓練資料集的大小來改善這個問題。本論文提出以不同的文章表示法建立多個分類模型,並據以分析訓練文章是否標記錯誤,然後刪除標記錯誤的文章,以提升訓練資料的品質。我們以電影評論的文字資料集作為實驗語料庫,透過詞彙頻率、主題模型、及詞彙向量三種表示法分別建立文章分類模型,並依據分類結果選擇樣本。實驗結果顯示,本論文所提出來的樣本選擇方法可以提升文章分類的準確度。
起訖頁 194-203
關鍵詞 文章分類樣本選擇支援向量機
刊名 ROCLING論文集  
期數 2016 (2016期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 非負矩陣分解法於語音調變頻譜強化之研究
該期刊-下一篇 Computing Sentiment Scores of Verb Phrases for Vietnamese
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄