中文摘要 |
自動語音文件摘要技術,可應用於資訊的檢索、語意壓縮及資料記錄等方面。目前自動語音摘要存在幾個問題,首先是語音辨識準確率的提升,以及如何對語音內容萃取重要資訊、生成在句法及語意上合理的摘要結果。本論文提出ㄧ應用主題相關語料庫和語意相依法則於中文語音文件之摘要。首先,語音文件透過大詞彙連續語音辨識的方法,將語音辨識成文字,並獲得摘要單元斷點、音節以及詞等資訊。語音摘要部份,就語音本質從五個分數去分析,分別為:語音辨識信賴分數、詞重要性分數、語言分數、句法結構分數及語意相依法則分數,而後利用動態規劃搜尋演算法(dynamic programming algorithm, DP)獲得初步摘要結果。最後,為了使摘要語音串接輸出能具平滑特性,我們將摘要語音的有效語音段取出,計算語音頻譜特徵,考慮串聯單元彼此間的流暢度,挑選語音文件中重複的單元以串接生成摘要語音。由實驗結果得知,本研究所提出之自動語音摘要架構與人工摘要結果相比,能有效地萃取重要資訊,串接合成流暢的摘要語音。 |