現在已有許多公開情緒語料庫被實驗於語音情緒辨識的研究上,但是並沒有一個語料庫以台灣常用的語言所錄製。語音情緒辨識會因為語音中不同的文本和語言等資訊影響最後的辨識結果,因此公開的外國語言語料庫不一定適用於台灣語言的情緒辨識研究中。為了解決語料庫的問題我們自行錄製的台灣語言情緒語料庫,採用了最普遍的國語、台語以及客家語三種語言。我們的語料庫仿照德語公開語料庫EMO-DB錄製,對每種語言採用十位語者、十句文本以及七種情緒,每個語言收錄七百句,並且在錄製完後進行人工辨識,以一定的人工辨識率做為篩選條件,以確保一定的辨別度。錄製完後以一個龐大的聲學特徵集搭配支持向量機作為後端分類器,以此實驗做為三種語言的基準辨識率。 |