非監督式學習於中文電視新聞自動轉寫之初步應用

郭人瑋; 蔡文鴻; 陳柏琳

月旦知識庫會員登入｜元照網路書店｜月旦品評家

熱門：

首頁

臺灣期刊 法律公行政治醫事相關財經社會學教育其他

大陸期刊 核心重要期刊

DOI文章

	本站僅提供期刊文獻檢索。　　【月旦知識庫】是否收錄該篇全文，敬請【登入】查詢為準。最新【購點活動】
篇名	非監督式學習於中文電視新聞自動轉寫之初步應用
作者	郭人瑋、蔡文鴻、陳柏琳
中文摘要	本論文探討非監督式學習於中文電視新聞自動轉寫之初步應用。在聲學模型訓練上，我們提出以發音確認（Utterance Verification）技術來克服訓練語料沒有正確人工轉寫的問題，所謂的發音確認是使用候選詞信心度評估（Candidate Word Confidence Measure）來對某語句及其轉寫進行篩選的動作，用以決定此語句及轉寫是否有足夠的可靠度，進而成為訓練語料。我們先使用大詞彙連續語音辨識器對龐大且無人工轉寫的語料進行自動轉寫，再使用發音確認（Utterance Verification）針對辨識後的語料進行篩選，從中擷取較正確可靠的語料片段，以供聲學模型訓練使用，此舉不僅可大大節省人力成本，在效果上，經訓練過的聲學模型也和單純以人工轉寫結果所訓練出來的模型相距不遠；同時，較正確可靠的文字語料片段，則用於語言模型調適，以增進辨識效能。同樣地，候選詞信心度評估也被應用到非監督式聲學模型調適上，我們初步將它與「最大相似度線性迴歸」（Maximum Likelihood Linear Regression）聲學模型調適技術作結合，以語音辨識所產生之詞圖（Word Graph）作為調適標的。我們以公共電視台的新聞語料為研究題材，結果顯示非監督式聲學模型訓練與調適的結合的確可有效降低字錯誤率（Character Error Rate），驗證了此作法之可行性。
起訖頁	1-12
刊名	ROCLING論文集
期數	2004 (2004期)
出版單位	中華民國計算語言學學會
該期刊-上一篇	聚集事後機率線性迴歸調適演算法應用於語音辨識
該期刊-下一篇	A Noise Estimator with Rapid Adaptation in Variable-Level Noisy Environments

新書閱讀

元照讀書館

優惠活動

月旦品評家

元照讀書館

．研討會新訊

月旦知識庫

月旦法律分析庫
月旦醫事法網
月旦會計財稅網

期刊數位服務

社群平台

讀者服務

關於元照

讀者服務專線：+886-2-23756688　傳真：+886-2-23318496
地址：臺北市館前路28 號 7 樓　客服信箱