優良的語言文脈訊息是語音合成的關鍵部分,傳統的文脈訊息都是依賴於自然語言處理(Natural Language Processing,NLP),使用parser分析文字。但是parser設計困難無法專門為語音合成設計;所以我們想直接以字元為處理單元建立一個end-to-end的語音合成系統,在這想法下我們改用字元層級(character-level)的word2vec與遞迴類神經網路,直接將輸入字元序列轉換成隱藏特徵向量當做語言合成的文脈訊息。最後我們利用一中英夾雜語音合成系統測試此想法,語音合成的實驗的結果表明,我們提出的方式的確比傳統使用parse的方式有更好的性能。 |