文件分類是一項決定一篇文件是否屬於一個或多個已事先定義好的類別之工作,而自動化分類則可以有效地幫助分類的處理。在本篇論文中,我們提出了一個以階層混合式的專家模組(hierarchical mixture of experts model)為基礎的文件分類方法。這個模組使用了分割──克服原理(divide-and-conquer principle),在一個事先定義好的階層架構下定義較小的分類問題,而最後的分類器則是使用類神經網路中的倒傳遞網路來完成分類機制。另外,在特徵選取(feature selection)上,我們也做了一些有別於傳統方法的改變。最後,我們以部份路透社(Reuters-21578)的新聞性文件做為測試資料,實驗結果顯示我們所提出的方法能有效地改善文件分類的正確率。 |