近年網路訊息的爆發式成長,人們每天都能接觸到海量的訊息,但文章中常常包含非必要的資訊、雜訊,降低人們閱讀的效率,若能使用自動文章摘要(Automatic Document Summarization)的技術,將文章中重點萃取出來,便可大幅節省人們閱讀的時間。目前的自動摘要方法,主要分為抽取式(Extractive)摘要與重寫式(Abstractive)摘要,且大部分研究皆驗證在英文的資料集上。本論文提出兩種新穎序列生成架構於重寫式摘要,包含「以BERT為編碼器之指針生成摘要法」與「融合BERT與Transformer之指針生成摘要法」。此外,目前重寫式摘要研究多半是以英文語料為研究目標,因此在本研究中,我們探討這些模型於中文重寫式摘要的任務成效,以作為後續研究的重要比較基礎。 |