中文摘要 |
基於聲學模型的多語辨識器對於辨識標準語音已達相當程度的正確性,但對於發音變異語音辨識的正確性仍嫌不足。由於產生發音變異現象的情況具有相當的多樣性,且偵測變異之聲學模型辨識器的準確度仍存有誤差,這些現象皆影響發音變異模型之產生。本研究基於聚類狀態模型(Senone Model, SEM),在狀態(State)的單位下觀察聲音訊號的變化,藉以較準確的模擬細微發音變異現象。另外也提出了基於發音事件的非監督式發音事件模型建立,透過此模型進一步驗證基於聲學模型的偵測變異驗證結果,以改善聲學特性所造成的錯誤偵測。對於發音變異模型進行之實驗結果顯示,本論文所提出之方法,對發音變異語句之辨識正確率上,具有相當程度的改進。 |