本論文探討語音辨識技術於藍芽(Bluetooth)無線環境下之效能。我們分別在藍芽實際與模擬使用環境下,應用TCC-300語料庫及HTK軟體,進行一系列語者無關(Speaker Independent)的語音辨識實驗。此外,為彌補通道效應之影響,我們亦引用若干強健性技術以提升辨識率。為評估藍芽實際使用環境下之語音辨識效能,我們將TCC-300語料庫轉錄成室內使用環境0公尺、4公尺以及走廊使用環境50公尺三個藍芽操作環境語料庫,此語料庫可提供語音辨識或其他相關語音處理研究之用。實驗結果顯示,在訓練環境與測試環境完全匹配情況下,測試距離為0、4與50公尺所獲得之音節辨識率分別為55.82%、53.54%、以及42.74%,辨識率隨著距離增加而下降,而且遠低於在原來的TCC-300語料庫進行相同測試所得之69.25%的辨識率。另外,在環境不匹配的情況下,辨識率更是大幅度地下滑。本論文即針對辨識效能衰退原因進行探討,並提供可能的改進方向。另一方面,無論是重新收集大量藍芽實際使用環境的訓練語音,或是將原始訓練語音轉錄成藍芽實際使用環境的訓練語音,均非常耗費時間及人力,有鑑於此,我們提出一套模擬藍芽實際使用環境的系統,可以自動將訓練語音模擬至藍芽實際使用環境,進而訓練出可以模擬藍芽實際使用環境的語音辨識模型。以此模擬模型辨識藍芽語音的辨識率與前述環境匹配情況下所得辨識率之差距分別為0公尺之5.18%(55.82%-50.64%)、4公尺之5.6%(53.54%- 47.94%)、以及50公尺之14.22%(42.74%- 28.52%),初步證實此系統具有模擬藍芽實際使用環境的實用價值。值得注意的是,本研究進行大語彙語音辨識實驗,在語音控制等實際應用上,通常指令數量相當有限,其辨識率將遠高於本論文實驗結果,據此,藍芽無線環境下之語音辨識對家庭自動化等應用應深具潛力。 |