中文摘要 |
本論文探討風險最小化(Risk Minimization)準則在中文大詞彙連續語音辨識(Large Vocabulary Continuous Speech Recognition, LVCSR)之初步研究,內容包括了聲學模型訓練、非監督式聲學模型調適與搜尋演算法等方面。本論文以公視電視新聞語料庫作為中文廣播新聞實驗題材。在聲學模模型訓練方面,我們使用了最小化音素錯誤(Minimum Phone Error, MPE)鑑別式訓練方法;實驗結果顯示,最小化音素錯誤訓練能較傳統最大相似度訓練相對地降低約12%的字錯誤率。另一方面,在聲學模型調適上,我們則探討最小化音素錯誤線性迴歸(Minimum Phone Error Linear Regression, MPELR)調適法在非監督式聲學模型調適的使用;實驗結果顯示,最小化音素錯誤線性迴歸可以再進一步相對地降低約5%的字錯誤率。最後,在搜尋演算法方面,本文探討詞錯誤最小化(Word Error Minimization,WEM)搜尋方法;實驗結果初步顯示,詞錯誤最小化搜尋方法較傳統最大化事後機率解碼方法來的稍佳。 |