中文摘要 |
近年來鑑別式訓練(Discriminative training)的目標函數Lattice-free Maximum mutual information(LF-MMI)在自動語音辨識(Automatic speech recognition, ASR)上取得了重大的突破,有別於傳統交互熵訓練(Cross-Entropy training, CE)和鑑別式訓練(Discriminative training)的二階段訓練,LF-MMI提供更快的訓練與解碼。儘管LF-MMI在監督式環境下斬獲最好的成果,然而在半監督式環境的表現仍有待研究。在半監督式環境最常見的訓練方法是自我學習(Self-training)中,由於種子模型(Seed model)常因語料有限而效果不佳。且LF-MMI屬於鑑別式訓練之故,更易受到標記錯誤的影響。為了減緩上述的問題,過往常加入置信度過濾器(Confidence-based filter)對訓練語料做挑選。過濾語料可在不同層級上進行,分為音框層級、詞層級、句子層級。 |