線性映射轉換函數於聲學模型調適之強健式語音辨識

曹昱; 蘇煜程; 王緒翔

月旦知識庫會員登入｜元照網路書店｜月旦品評家

熱門：

首頁

臺灣期刊 法律公行政治醫事相關財經社會學教育其他

大陸期刊 核心重要期刊

DOI文章

	本站僅提供期刊文獻檢索。　　【月旦知識庫】是否收錄該篇全文，敬請【登入】查詢為準。最新【購點活動】
篇名	線性映射轉換函數於聲學模型調適之強健式語音辨識
作者	曹昱、蘇煜程、王緒翔
中文摘要	隨著科技的發展與網路的普及，語音識別系統（automatic speech recognition，ASR）已應用於多項可攜式裝置。然而多項研究成果顯示，語音辨識技術的應用仍然受限於一項存在已久卻未完全解決的問題，就是聲學環境不匹配所造成語音辨識效能不佳的問題。聲學環境不匹配表示在語音辨識系統中，由於語者本身的發聲狀況、背景雜訊、通道及麥克風特性，造成語料的訓練環境以及測試環境有所差異，這樣的差異會嚴重影響語音辨識系統的效能。聲學環境的不匹配可以從語音訊號、特徵向量以及聲學模型等三個象限來觀察，如圖一所示。假設訓練環境的語音訊號、特徵向量以及聲學模型象限的表現形式分別是S_X、F_X、Λ_X，相對應測試環境的象限為S_Y、F_Y、Λ_Y，則我們可以在這三個象限觀察到三種不匹配值，分別是D_S(.)，D_F(.)、D_M(.)。對於改善聲學環境不匹配的研究，主要可以分成三大類。第一大類試圖降低D_S(.)對原始語音訊號，S_X，的影響。主要的方法為語音增強技術（speech enhancement），包含了濾波器技術（filtering techniques）、頻譜回復技術（spectral restoration techniques）、以及模型技術（speech model based techniques）。
起訖頁	9-24
刊名	計算語言學通訊
期數	201206 (23:2期)
出版單位	中華民國計算語言學學會
該期刊-上一篇	IJCLCLP Call for Papers