本文主要以兩種摘要技巧對路透社新聞文件進行自動文件摘要處理,分別為由語句出現的位置來判斷其重要性,以及擴充標題詞彙兩種摘要技巧。我們對文件進行分析探討,找出文件主題通常是佔據了哪些位置,以擷取這些重要位置的句子為摘要。另外,我們認為標題對於文件是相當重要的,因此我們透過WordNet找尋標題的相關詞彙,對標題詞彙進行擴充,來找出更多與標題相關的字,增加標題的重要性,進而協助在文件中找尋與標題較相關的摘要語句。在實驗評估方面,我們提出一個以分類方式進行自動摘要評估的想法,並建立了一個分類系統來評估摘要結果。最後,本文提出了一種綜合擴充標題詞彙與重要位置的摘要方法,此方法得到71.9%分類精確率的實驗結果,相較於65.6%的基準分類精確率改善了9.6%((71.9%-65.6%)/65.6%=9.6%)。 |