中文摘要 |
本研究主要目的是探討平衡訓練語料與不平衡訓練語料對於語音情緒辨識的影響。此外由於情緒標記的主觀性可能帶來誤差,因此在此論文中也探討在輸入狀態下資料標記錯誤與否對於系統未加權平均辨識率(Unweighted Accuracy, UA)之影響。實驗工作主要是設計一個類神經網路之語音情緒辨識系統,並使用INTERSPEECH 2009 Emotional Challenge中所釋出之FAU-Aibo情緒語料庫,以作為辨識率之基準。實驗結果顯示,在假設訓練語料正確標記時,資料平衡與資料不平衡時的未加權平均辨識率分別為39.6%與34.6%;在容許訓練語料錯誤標記時,資料平衡與資料不平衡時的未加權平均辨識率分別為41.8%與35.7%。因此在利用類神經系統作為辨識工具時,若能考慮訓練語料錯誤標記的因素,並適當的提供標記錯誤參數,系統之未加權平均辨識率將可以明顯改善。 |