本文提出一個能從中文語料庫中自動選取連續國語語音特性平衡句的方法,解決了以往必須由人工選造特性平衡句時所遭遇的費時費力的困難,這個方法除了可以有效的找到包含所有辨識單元(例如單音節)、足供訓練用的特性平衡句外,也可以自動加選句子使所選曲的特性平衡句與來源語料庫擁有近似的辨識單元的統計分佈,故以它來對語音處理系統進行測試時,所得的結果更能夠反映出系統實際的效能。由於它是一個自動的系統,當應用領域或辨識單元改變時(例如改成聲母、韻母),在不更動原本架構下,只要重新定義新的辨識單元或語料庫,即可輕易的調適到新的應用領域(Domain)。在我們以國語1333個帶聲調的音節為辨識單元的實驗中,這套方法得到相當不錯的成果。 |