本論文探討非監督式學習於中文電視新聞自動轉寫之初步應用。在聲學模型訓練上,我們提出以發音確認(Utterance Verification)技術來克服訓練語料沒有正確人工轉寫的問題,所謂的發音確認是使用候選詞信心度評估(Candidate Word Confidence Measure)來對某語句及其轉寫進行篩選的動作,用以決定此語句及轉寫是否有足夠的可靠度,進而成為訓練語料。我們先使用大詞彙連續語音辨識器對龐大且無人工轉寫的語料進行自動轉寫,再使用發音確認(Utterance Verification)針對辨識後的語料進行篩選,從中擷取較正確可靠的語料片段,以供聲學模型訓練使用,此舉不僅可大大節省人力成本,在效果上,經訓練過的聲學模型也和單純以人工轉寫結果所訓練出來的模型相距不遠;同時,較正確可靠的文字語料片段,則用於語言模型調適,以增進辨識效能。同樣地,候選詞信心度評估也被應用到非監督式聲學模型調適上,我們初步將它與「最大相似度線性迴歸」(Maximum Likelihood Linear Regression)聲學模型調適技術作結合,以語音辨識所產生之詞圖(Word Graph)作為調適標的。我們以公共電視台的新聞語料為研究題材,結果顯示非監督式聲學模型訓練與調適的結合的確可有效降低字錯誤率(Character Error Rate),驗證了此作法之可行性。 |