由於發展環境和應用環境兩者之間的不匹配,導致於語音辨識系統效能經常會下降,而引起這不匹配的主要原因之一是加成性雜訊,處理加成性雜訊的方法我們可以分成三類,語音強化法、強健性語音特徵參數、以及語音模型調適法,而本論文所討論的方法主要是屬於強健性語音特徵參數之技術。在本論文中,我們主要的重點在於探討不同的信號特徵對於語音端點偵測的影響,所利用的特徵分別為低頻帶頻譜強度、全頻帶頻譜強度、累積量化頻譜、以及高通對數能量等。利用以上這些不同的特徵進行語音之端點偵測,所得之純雜訊的位置資訊可以提供頻譜消去法與靜音對數能量正規化法中所需的雜訊頻譜或能量的估測。在實驗環境上我們採用Aurora2語料庫,在八種背景雜訊以及訊雜比0~20dB下做實驗。在第五章中所呈現的實驗數據與分析可證明以上所述的各種特徵顯然可用以有效的鑑別出一段語音中純雜訊部分與語音部分,使之後所使用的頻譜消去法與靜音對數能量正規化法等強健性語音特徵技術,得以明顯提升在雜訊環境下語音辨識的精確度,增加語音辨識系統的強健性。 |