自動語音辨識系統通常會因語音訊號是否受各種環境雜訊干擾而產生某種程度上的影響。正因如此,語音強健(Speech Robustness)技術的發展長久以來一直被視為一個非常重要的研究領域,過去已有許多方法成功地被提出,可以在抗雜訊上有不錯的效果。其中,統計圖等化法(Histogram Equalization)能有效地補償語音訊號受噪音干擾而所產生的失真情形,因而被公認為非常有效果的方法之一。但前人所提出的統計圖等化法,往往需要大量的記憶體使用空間或是處理器運算時間,本論文探討利用數據擬合(Data Fitting)方法創造一逆函數(Inverse Function),有效且快速地將測試語句累積密度函數近似至參考分佈的累積密度函數,以正規化雜訊語音特徵,藉由逆函數的使用,能夠節省統計圖等化時所需要的記憶體使用空間以及處理器運算時間。同時,本論文亦探討數據擬合統計圖等化法與時間軸上特徵值移動平均(Moving Average)之結合,來減輕非穩性噪音(Non-stationary Noise)所造成的異常尖峰或波谷的影響。此外,本論文更進一步將所提出的數據擬合統計圖等化法與其他特徵擷取或補償方法進行整合,初步實驗結果證實本論文所提出之方法,能有效補償語音受雜訊干擾所造成的失真情形,進而有效提昇辨識效能。實驗語料庫為由歐洲電信標準協會所發行的AURORA-2語料,實驗結果初步地顯示數據擬合統計圖等法化確實為一有效的語音強健技術。 |