在自動語音辨識技術的發展上,語音強健性一直都是一門重要的研究議題。在眾多的強健性技術中,針對語音特徵參數進行強化與補償為其中之一大主要派別。其中,近年來已有為數不少的新方法,藉由更新語音特徵時間序列及其調變頻譜來提升語音特徵的強健性。本論文即是從語音特徵時間序列的調變頻譜域著手,採用機率式潛藏語意分析之概念,對調變頻譜施以機率式分解並進行成分分析、進而擷取出較重要的成分以求得更具強健性的語音特徵。本方法之所有實驗皆於國際通用的Aurora-2連續數字資料庫進行,相較於使用梅爾倒頻譜特徵之基礎實驗,本方法能達到62.84%的相對錯誤降低率。此外,我們也嘗試將所提方法跟一些知名的特徵強健技術做結合;實驗顯示,相對於單一方法而言,此結合法可進一步提升辨識精確率,代表所提之新方法與許多特徵強健技術有良好的加成性。 |