中文摘要 |
基於GMM對映之語音轉換方法常遇到的一個問題是,轉換出的頻譜包絡會發生過於平滑(over smoothing)的現象,因此本論文嘗試以線性多變量迴歸(linear multivariate regression, LMR)來建構另一種頻譜對映的方法,希望能夠改進頻譜過平滑的問題。首先,我們推導了LMR對映矩陣的解析求解公式,然後我們錄製平行語料,採用離散倒頻譜係數作為頻譜特徵,分割語音信號成聲、韻母之音段,再使用LMR對映方法來建造出一個語音轉換系統。應用此系統,我們就可進行內部、外部之平均轉換誤差的量測,並且和傳統GMM對映法所量測出的誤差距離作比較,量測的結果顯示,本論文研究的LMR_F對映法,不論是在內部或外部之測試情況,都可以獲得比傳統GMM對映法較小的平均轉換誤差。此外,我們也進行了主觀的語音品質聽測之實驗,聽測實驗的結果顯示,我們研究的LMR_F對映法,其轉換出的語音品值,能夠比傳統GMM對映法的稍好一些。 |