本研究為使用多層感知器(Multilayer Perceptron, MLP)基於聲學特徵參數的情緒辨識系統,此實驗使用一個新的台灣語言語料庫,此語料庫以仿照EMO-DB的方式錄製,包含台灣常見的三種語言,分別為國語、台語及客語。每種語言各由五男五女錄製而成,且事後以人工篩選的方式,將較不易分辨情緒的音檔刪除,本研究將使用180維的聲學特徵以多層感知器進行單一語言、跨語言及混合語言的實驗。在用單一語言作為訓練集時,國、台、客語分別得到60%、48.9%、54.4%的辨識率,而經過語者正規化與使用混合語料做為訓練集後國、台、客語分別得到最好63.5%、53.1%、64.6%的辨識率。 |