月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
基於卷積類神經網路之廣播節目音訊事件偵測系統
並列篇名
Automatic Audio Event Detection of Broadcast Radio Programs Based on Convolution Neural Networks
作者 陳智偉許吳華廖元甫
中文摘要
廣播電臺節目中通常包含語音,音樂與其他音訊事件(如笑聲或特效聲)。若能偵測並切割這些音訊事件,就能進一步對廣播節目進行加值運用。例如,轉寫語音片段的逐字稿,或是辨認音樂片段的歌名與曲名,以利檢索。針對此問題,在本論文中,我們首先設計,並以人工標註出一廣播節目音訊事件資料庫,再利用Convolutional Neural Network(CNN)自動擷取有效的特徵音訊參數,對廣播電臺的音檔做音訊事件偵測與切割,最後轉成具時間資訊的音訊事件標註檔。實驗方面我們從教育電臺節目中,選出新聞類與不同性質的談話類節目共14個,經人工標注後,獲得總長度共約60小時的音檔,並用來訓練與測試CNN和傳統Gaussian Mixture Model(GMM)的效能。實驗結果顯示以CNN直接搭配頻譜參數,在偵測語音與非語音,音樂與非音樂或其它與非其它音訊事件等的錯誤率(equal error rates,EER),分別為2.27%、12.52%與9.51%,皆低於傳統以GMM搭配Mel-Frequency Cepstral Coefficients(MFCCs)的3.65%、15.68%與13.25%。
起訖頁 21-36
關鍵詞 廣播節目資料庫音訊事件偵測卷積類神經網路
刊名 ROCLING論文集  
期數 2017 (2017期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 運用類神經網路方法之語音端點偵測研究
該期刊-下一篇 基於次頻道遞迴類神經網路之麥克風陣列電視回聲消除系統
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄