本論文實作了一個中文的文轉音系統(Test-to-Speech)系統,它使用大量的詞彙來做為合成單元(Synthesis units),並且配上適當的韻律階層。韻律階層可以使語意更加清晰,也可以幫助選取適當的合成單元。因此本篇論文主要包含兩個重點:韻律階層的求取和以大量詞彙作為合成單元的架構,在韻律階層的求取上,我們實驗了利用剖析器為基礎的方法以及著名的統計式方法-CART(Classification And Regression Trees)來進行求取。我們使用大量詞彙來當成我們的合成單元,可以免去許多語音處理不易做好的連音處理。我們也利用韻律預估模組所得到的參數,進行音量和音長的調整。最後我們完成一套包含12224個二字詞以及2690個三字詞的中文文轉音系統,並開放於線上試用。 |