月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
基於半監督式學習之廣播節目語音逐字稿自動轉寫系統
並列篇名
Automatic Transcription of Broadcast Radio Speech Based on Quality Estimation-Guided Semi-Supervised Training
作者 王星月許吳華廖元甫
中文摘要
廣播節目製作時通常只有收錄語音訊號,沒有保留相對應的節目內容詮釋資料(metadata),導致節目播出後,很難檢索節目內容,或是加以組織再利用。針對此問題,常用的方法是以語音辨認器,自動轉寫廣播節目內容,產生語音逐字稿,但是目前缺乏已標記好的廣播語音語料庫,因此無法訓練出適合轉寫廣播節目的語音辨識器。所以在本論文中,我們探討如何同時使用語音訊號特徵參數、辨認器辨認結果與語言模型參數,訓練一語音品質估算(Quality Estimation,QE)器,取代傳統只依賴語音辨認器的信心值估算(Confidence Measure),從源源不絕,但未標記的大量廣播語料中,挑選適合訓練語音辨認器的語料,進行半監督式聲學模型訓練,以提升轉寫廣播語料逐字稿的效能。實驗中以一不佳錄音品質NER-set1與一優良NER-set2之廣播節目測試語料集,測試種子語音辨認器與經半監督式訓練後,新的語音辨認器轉寫語音逐字稿的效能。實驗結果顯示經半監督式訓練後,新的語音辨認器可以把NER-set1與NER-set2的字元辨認錯誤率(CER)從原始種子模型的25%與14.24%,壓低至23.61%與13.24%。此外,若進一步改用進階語言模型,更可將CER再改善至23.25%與12.63%。
起訖頁 197-212
關鍵詞 半監督式學習品質估算信心度評估語音辨認系統
刊名 ROCLING論文集  
期數 2017 (2017期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 PTT網站餐廳美食類別擷取之研究
該期刊-下一篇 完全基於類神經網路之語音合成系統初步研究
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄