月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
計算語言學通訊 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
線性映射轉換函數於聲學模型調適之強健式語音辨識
作者 曹昱蘇煜程王緒翔
中文摘要
隨著科技的發展與網路的普及,語音識別系統(automatic speech recognition,ASR)已應用於多項可攜式裝置。然而多項研究成果顯示,語音辨識技術的應用仍然受限於一項存在已久卻未完全解決的問題,就是聲學環境不匹配所造成語音辨識效能不佳的問題。聲學環境不匹配表示在語音辨識系統中,由於語者本身的發聲狀況、背景雜訊、通道及麥克風特性,造成語料的訓練環境以及測試環境有所差異,這樣的差異會嚴重影響語音辨識系統的效能。聲學環境的不匹配可以從語音訊號、特徵向量以及聲學模型等三個象限來觀察,如圖一所示。假設訓練環境的語音訊號、特徵向量以及聲學模型象限的表現形式分別是S_X、F_X、Λ_X,相對應測試環境的象限為S_Y、F_Y、Λ_Y,則我們可以在這三個象限觀察到三種不匹配值,分別是D_S(.),D_F(.)、D_M(.)。對於改善聲學環境不匹配的研究,主要可以分成三大類。第一大類試圖降低D_S(.)對原始語音訊號,S_X,的影響。主要的方法為語音增強技術(speech enhancement),包含了濾波器技術(filtering techniques)、頻譜回復技術(spectral restoration techniques)、以及模型技術(speech model based techniques)。
起訖頁 9-24
刊名 計算語言學通訊  
期數 201206 (23:2期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 IJCLCLP Call for Papers
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄