本論文將語者轉換技術用於修復語音資料庫的音質,其原由是在建立文字轉語音系統時,所使用的語音資料庫之部分受限於錄音器材與錄音環境而音質不佳,為了讓這些音質不佳的語料能夠被重新不浪費地使用於建立文字轉語音系統,本論文將利用語者轉換技術於語料庫的音質修復,利用同一語者的特性讓語者轉換的問題轉變成音質轉換的研究問題。在轉換技術上,聲學參數用WORLD聲碼器來分析語音訊號,轉換模型用傳統高斯混和模型以及深度學習模型,也嘗試了多種輸入及輸出參數組合,最後也探討以不同語速的語料進行音質修復的結果。客觀以及主觀測試結果顯示,轉換(修復)過的音質有明顯提升。另外也嘗試轉換同一位語者錄製的中英夾雜語料,該語料有一樣的問題,即使是跨語言轉換,實驗結果顯示有降低部分回音和雜訊。 |