熱門:
首頁
臺灣期刊
法律
公行政治
醫事相關
財經
社會學
教育
其他
大陸期刊
核心
重要期刊
DOI文章
首頁
臺灣期刊
其他
ROCLING論文集
2016 (2016期)
本站僅提供期刊文獻檢索。
【月旦知識庫】是否收錄該篇全文,敬請
【登入】
查詢為準。
最新
【購點活動】
篇名
以多重表示選擇文章分類的樣本
並列篇名
Using Multiple Representations to Select Instances for Text Classification
作者
陳耀輝
、
王志偉
中文摘要
以機器學習方式產生分類模型是一種常見將文章自動分類的技術,但若有標記不精確的訓練資料,就可能得到錯誤的分類結果,而樣本選擇能藉由減少訓練資料集的大小來改善這個問題。本論文提出以不同的文章表示法建立多個分類模型,並據以分析訓練文章是否標記錯誤,然後刪除標記錯誤的文章,以提升訓練資料的品質。我們以電影評論的文字資料集作為實驗語料庫,透過詞彙頻率、主題模型、及詞彙向量三種表示法分別建立文章分類模型,並依據分類結果選擇樣本。實驗結果顯示,本論文所提出來的樣本選擇方法可以提升文章分類的準確度。
起訖頁
194-203
關鍵詞
文章分類
、
樣本選擇
、
支援向量機
刊名
ROCLING論文集
期數
2016 (2016期)
出版單位
中華民國計算語言學學會
該期刊-上一篇
非負矩陣分解法於語音調變頻譜強化之研究
該期刊-下一篇
Computing Sentiment Scores of Verb Phrases for Vietnamese
新書閱讀
最新影音
優惠活動