針對口語化語音中之不流暢語流(disfluency)現象,本文提出以不定長度特徵之條件隨機域。利用狀態轉移特徵函數、觀測特徵函數以及相對應之參數,針對不流暢語流進行修正。其中觀測特徵函數可整合多種知識來源,包括前後文相關特徵、不流暢相關特徵以及圖樣符合相關特徵。在狀態方面我們使用可變動長度單位,包括詞、字元串集(chunk)以及句子三種不同狀態。在評估上,則使用現代漢語口語對話語料庫(MCDC)做為訓練以及測試語料。其中被修正詞(editing word)錯誤率為17.3%,相對於DF-gram、HMM、最大熵以及N-gram加校正之混合模型的方法分別降低了11.7%、8.7%、8%以及3.9%。在給定中斷點的情況下,被修正詞錯誤率為6.1%。實驗證明所提之模型優於其他方法,並可有效偵測並修正口述語言中之不流暢語流。 |