月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
中文文件自動分類之研究
並列篇名
A Study of Document Auto-Classification in Mandarin Chinese
作者 楊允言謝清俊陳淑美陳克健
中文摘要
本論文中,我們提出利用雙連字串(Bigram)替代關鍵詞的方法,來做中文文件自動分類的實驗。其目的,是要讓電腦來幫忙做中文文件分類,減輕人的負擔。我們從工商時報民國87年7月到81年1月間取樣出來的2306篇財經類新聞報導,包括產業、企業、機械、電機、資訊五大類,共24小類,先以人工將之分類,並分為訓練資料(2095篇)及測試資料(211篇)兩部分,根據次數、集中度、和不同的分類比重方式來做自動分類實驗,並比較其結果。實驗結果,測試資料有67%左右的正確率(召回率),若取前三名有80%的正確率;至於訓練資科則有97%的正確率。在文中,我們探討了關鍵詞的篩選以及文件自動分類的方法,採用向量模式時,並討論了標準化的方法;同時,我們針對電腦與人工在做分類以及相似性排序時的不同點提出簡單的比較與討論,讓我們了解之間的差異。
起訖頁 217-233
刊名 ROCLING論文集  
期數 1993 (1993期)
出版單位 國立高雄師範大學輔導與諮商研究所
該期刊-上一篇 Corpus-based Automatic Compound Extraction with Mutual Information and Relative Frequency Count
該期刊-下一篇 FAWRMT: WITH SPECIAL EMPHASIS ON GRAMMAR DESIGNS AND PARTITIONED PARSING
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄