本論文探討西文語音辨識系統之設計與實作策略。吾人依照西語的發音規則,挑選出242 個常用單音節之語音特徵,作為主要的訓練與辨識方式。將每個常用單音節,每輪每次以連續唸兩個相同單音的方式錄音,來作為西語語詞的特性依據。吾人錄製六輪共十二次的聲紋特性,來建立西文語音之訓練資料。系統採用梅爾頻率倒頻譜係數及線性預估倒頻譜係數,來萃取單音節語音之特徵參數;運用藏式馬可夫模型,作為單音之辨識模型。在CPU 時脈為1.6GHz 的AMD Sempron 2800+之個人電腦與Ubuntu 9.04 作業系統下,針對4217 筆西文語詞,吾人約可達到86%之正確辨識率,平均所需辨識時間約在1.5 秒以內。而本系統所需的訓練時間約為兩小時。 |