新聞事件自動摘要乃針對敘述相似事件的多篇新聞文章編製摘要內容,其目的為幫助讀者過濾資訊並快速瞭解事件的來龍去脈,以節省閱讀大量新聞文件的時間,主要的研究議題為偵測不同新聞文章中相似及相異的內容,以達到過濾重複資訊的目的。本論文以概念分群(Concept Clustering)為基礎,偵測新聞事件所要表達的語意,進而挑選涵蓋豐富語意的語句為摘要。過程為:1)利用前後文關係(Context)及語意網路(Semantic Network),描述概念詞彙;2)使用K-Means對概念詞分群,期萃取更精確的概念,同時解決語意歧異的問題;3)根據概念分群結果,並利用語句資訊量、語句位置及語句概念等特徵,計算每個語句之重要性,最後挑選重要性高的語句作為摘要內容。實驗中使用DUC 2003(Document Understanding Conference)所提供的新聞事件進行評估。評估結果於ROUGE-1指標比平均成績還好,於ROUGE-L指標接近最好的結果。 |