台灣地區手機的普及率已居全球之冠,國內外產業界陸續開始提供手機新聞簡訊的服務。由於手機螢幕不大,手機上新聞簡訊的自動摘要要求,與一般文獻探討的不同。為保障訂閱者的權利,其摘要長度必須盡可能接近但不超過指定的字數,如69字或45字。此指定字數比一般標題長但比長句子還短,而且必須把新聞的重點盡可能完整的呈現出來。由於此摘要是提供給人閱讀,所以還要考慮其可讀性與連貫性等因素。本文提出一套適用於中文手機環境的新聞簡訊自動摘要方法,以降低新聞簡訊服務的營運成本。過去的研究顯示,越高的摘要壓縮比(摘要結果越短),摘要的成效越低,亦即困難度越高。手機新聞簡訊自動摘要,正好屬於高壓縮比、長度有限的極短摘要。本方法的特點在於衡量新聞句子的重要性,並找出句子與標題的相似點,結合成摘要候選句,最後依照其長度比例與相似度排序,供使用者選用。透過40篇即時新聞的驗證,顯示從系統提示的第一候選句,即可獲得最佳摘要的比例達62.5%到65%。若從系統提示的所有候選句中挑選,可得最佳摘要的比例達75%到80%。相對的,系統無法做出好摘要的比例,則約20%到25%。 |