自1996年起,美國國家標準與技術研究院(National Institute of Standard and Technology,NIST)舉辦了無數次的語音辨識相關技術評比(Benchmark Tests),藉由訂定標準的效能量測方法與建立特定任務(task)測試語料庫,比較世界各研究單位之辨識系統效能,以促進state-of-the-art技術的不斷提昇。NIST所舉辦的評比項目可歸納於圖一,其中除了「語者辨識」(Speaker Recognition)與「語言辨識」(Language Recognition)評比自1996年起迄今仍持續進行外,許多評比項目常隨著實際應用需求的變化而被其他新的評比項目所取代。例如最早的語音辨認技術評比為「廣播新聞辨認」(Broadcast News Recognition);自1999年後,技術較量的舞台已轉移至「口語文件檢索」(Spoken Document Retrieval)與「電話對話辨認」(Conversational Telephone Recognition)。自2002年後,語音辨認、語者辨識、與文件檢索等概念更進一步整合為一共同的評比項目,稱為Rich Transcription(RT)。其目的是希望使自動語音辨識結果有更高的可讀性,讓人們更有效地運用大量的語音資料。 |