月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
基於i-vector與PLDA並使用GMM-HMM強制對位之自動語者分段標記系統
並列篇名
Speaker Diarization based on I-vector PLDA Scoring and using GMM-HMM Forced Alignment
作者 張乘若李鴻欣王新民張智星
中文摘要
近年來,i-vector搭配PLDA(Probability Linear Discriminant Analysis)的系統已經在自動語者分段標記(Speaker Diarization)的研究上獲得了很好的結果。不過,由於ivector需要由較長的音訊片段抽取出來才具有較佳的語者特性,所以較無法有效地處理時間極短的語句區段。為此,本論文提出一個新的自動語者分段標記框架:先由K平均(K-means)演算法得到初步的自動語者分段標記結果,並據此建立初步語者模型,再配合利用GMM-HMM(Gaussian Mixture Models-Hidden Markov Models)進行強制對位(Forced Alignment)以及語者分群(Speaker Clustering)來進行自動語者分段標記。從實驗上我們可以發現,雖然單獨利用GMM-HMM語者分群並未比使用GMM-HMM強制對位所得到的召回率(Recall)以及精準率(Precision)來得好,但是利用GMM-HMM語者分群的結果再重新進行GMM-HMM強制對位卻可以得到較好的召回率以及精準率,故由GMM-HMM語者分群以得到更細小的語者說話區段對自動語者分段標記的問題是有幫助的。此外,這篇論文也探討針對不同時間長度的音訊片段對自動語者分段標記的影響。
起訖頁 119-135
關鍵詞 自動語者分段標記I-vectorPLDAGMM-HMM強制對位語者分群
刊名 ROCLING論文集  
期數 2017 (2017期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 探究不同領域文件之可讀性分析
該期刊-下一篇 Amplifying a Sense of Emotion toward Drama- Long Short-Term Memory Recurrent Neural Network for dynamic emotion recognition
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄