任何語言都有許多潛在的規律性,若能擷取與分析這些特性,電腦就能進一步被用來理解人類語句或自動產生能表達某種語意的語句。統計式語言模型(Statistical Language Models)透過機率模型的建立來描述語言生成的規律性,其模型參數可由大量的文字語料庫所訓練而成。語音辨識常使用N連(N-gram)語言模型,它以估測每一個詞在其先前緊鄰N-1個詞已知的情況下出現的條件機率,來判斷語音辨識結果的可能性;但因其訓練並不是以降低語音錯誤率為目標,導致在語音辨識效能表現上有所侷限。有別於傳統連語言模型,近年來有許多直接以最小化語音辨識錯誤率為目標的鑑別式語言模型(Discriminative Language Model)被提出。本論文介紹了多種基於不同訓練精神的鑑別式語言模型,並比較與討論它們在中文大詞彙連續語音辨識上的表現。另外,我們提出語句相關之鑑別式語言模型,改進了傳統鑑別式語言模型在測試過程中所有測試語句皆使用相同語言模型特徵權重參數向量的缺點,讓不同測試語句擁有各自的組合係數來線性結合不同訓練語料所訓練而得的語言模型特徵權重參數向量,以期新的權重參數向量能更加符合測試語句的特性。實驗結果顯示本論文所提出的語句相關之鑑別式語言模型,相較於僅使用三連語言模型、或使用傳統鑑別式語言模型的基礎大詞彙連續語音辨識系統,能有相當程度的語音辨識率提升。 |