「語者辨識」(Speaker Recognition或Talker Recognition)在「語音處理」(Speech Processing)與「生物測定」(Biometrics)研究領域中已有數十年的歷史,其目的大致涵蓋兩項:1)判斷一段語音為何人所說,在此又稱為「語者識別」,(Speaker Identification);2)判斷一段語音是否為某特定人士所說,在此則稱為「語者確認」(Speaker Verification)。而這兩項目的也可能同時存在於一項應用中,例如先判斷一段語音是否出自某一群人當中,若是,則再判斷其確切為一群人當中的何人所說。目前語者辨識系統的運作方式一般包括兩個階段,一為訓練,另一為測試。訓練的用意在於從語音資料中萃取語者的特性,並表示為某種參數集;而測試階段則在於判斷未知的語音是否出自參數集所代表的語者。自1996年起,美國國家標準與技術研究院(National Institute of Standard and Technology,NIST)舉辦了非常多的語音辨識相關技術評比(Benchmark Tests),其中「語者辨識」一直是每年評比項目的重點,顯示這項研究議題的重要性與發展性。 |