月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
中文計算語言學期刊 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
探究端對端混合模型架構於華語語音辨識
並列篇名
An Investigation of Hybrid CTC-Attention Modeling in Mandarin Speech Recognition
作者 張修瑞趙偉成羅天宏陳柏琳
中文摘要
近年來端對端(End-to-End)語音辨識的出現,簡化了許多傳統語音辨識的繁複流程。端對端語音辨識中,最主要的模型架構分別為連結時序分類(Connectionist Temporal Classification, CTC)與注意力模型(Attention Model)。本論文嘗試結合上述兩種模型架構(即CTC-Attention混合模型)於華語會議語音辨識之使用,以期能進一步提升語音辨識的效能。為此,我們分析模型結合時混合權重調整的影響,並進一步探究CTC-Attention混合模型對於短句的辨識效果。在中文會議語料的實驗結果顯示,相較於傳統語音辨識的TDNN-LFMMI模型,CTC-Attention混合模型在語句較短時,可具有較好的一般化能力(Generalization)。
英文摘要
The recent emergence of end-to-end automatic speech recognition (ASR) frameworks has streamlined the complicated modeling procedures of ASR systems in contrast to the conventional deep neural network-hidden Markov (DNN-HMM) ASR systems. Among the most popular end-to-end ASR approaches are the connectionist temporal classification (CTC) and the attention-based encoder-decoder model (Attention Model). In this paper, we explore the utility of combining CTC and the attention model in an attempt to yield better ASR performance. we also analyze the impact of the combination weight and the performance of the resulting CTC-Attention hybrid system on recognizing short utterances. Experiments on a Mandarin Chinese meeting corpus demonstrate that the CTC-Attention hybrid system delivers better performance on short utterance recognition in comparison to one of the state-of-the-art DNN-HMM settings, namely, the so-called TDNN-LFMMI system.
起訖頁 39-50
關鍵詞 CTCAttention端對端中文語音辨識短句辨識CTCAttention-based Encoder-DecoderEnd-to-End Mandarin Chinese Speech RecognitionShort Utterance Recognition
刊名 中文計算語言學期刊  
期數 201906 (24:1期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 Discovering the Latent Writing Style from Articles: A Contextualized Feature Extraction Approach
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄