台語文字與語音語料庫之建置

廖子宇; 呂仁園; 高明達; 江永進; 張智星

月旦知識庫會員登入｜元照網路書店｜月旦品評家

熱門：

首頁

臺灣期刊 法律公行政治醫事相關財經社會學教育其他

大陸期刊 核心重要期刊

DOI文章

	本站僅提供期刊文獻檢索。　　【月旦知識庫】是否收錄該篇全文，敬請【登入】查詢為準。最新【購點活動】
篇名	台語文字與語音語料庫之建置
並列篇名	Development of a Taiwanese Speech and Text Corpus
作者	廖子宇、呂仁園、高明達、江永進、張智星
中文摘要	台語在台灣是三大主要語言之一，台語的使用人口約為70%的人口，可是，其台語方面的相關研究卻是很少、研究論文主要還是以華語為主。優質的計算語言學研究需要大規模的語料來支持，本計畫目的是建立大規模的台語語料庫，建立台語計算語言學研究發展的厚實基礎。同時希望以此經驗嘗試建立台灣弱勢語言的計算語言學研究發展模式。本計畫中，將建立一個台語語料，語料來源類型為台語朗讀、新聞、戲劇及談話。建立200個小時的台語文字與語音語料。
英文摘要	The main goal of this paper is to develop a large scale Taiwanese corpus. In the mean time, we try to establish a successful model for the computational linguistic research on other minority Taiwanese languages such as Haka.In this paper, we will build a Taiwanese speech corpus. The source of speech corpus is Taiwanese dramas and news from TV stations. The goal of the corpus is 200 hours speech material with annotation.
起訖頁	102-111
關鍵詞	corpus、speech recognition、Taiwanese、transcription
刊名	ROCLING論文集
期數	2012 (2012期)
出版單位	中華民國計算語言學學會
該期刊-上一篇	基於決策樹演算法之台語連音變調預估模組
該期刊-下一篇	以聲符部件為主之漢字學習系統設計研究

新書閱讀

元照讀書館

優惠活動

月旦品評家

元照讀書館

．研討會新訊

月旦知識庫

月旦法律分析庫
月旦醫事法網
月旦會計財稅網

期刊數位服務

社群平台

讀者服務

關於元照

讀者服務專線：+886-2-23756688　傳真：+886-2-23318496
地址：臺北市館前路28 號 7 樓　客服信箱