探究不同領域文件之可讀性分析

曾厚強; 陳柏琳; 宋曜廷

熱門：

首頁

臺灣期刊 法律公行政治醫事相關財經社會學教育其他

大陸期刊 核心重要期刊

DOI文章

	本站僅提供期刊文獻檢索。　　【月旦知識庫】是否收錄該篇全文，敬請【登入】查詢為準。最新【購點活動】
篇名	探究不同領域文件之可讀性分析
並列篇名	Exploring Readability Analysis on Multi-Domain Texts
作者	曾厚強、陳柏琳、宋曜廷 (Yao-Ting Sung)
中文摘要	可讀性（Readability）是指閱讀材料能夠被讀者所理解的程度，當讀者閱讀高可讀性的文件時，會產生較好的理解及學後保留效果。由於文件的可讀性在知識傳遞扮演極為重要的角色，因此西方的可讀性公式發展的非常早。然而這些傳統的可讀性研究大多使用較淺層的語言特徵來發展線性的可讀性公式，其實並不足以反映文件難度。Graesser、Singer和Trabasso便指出，傳統語言特徵公式無法反映閱讀的真實歷程，文件的語意語法只是文件的淺層語言特徵，沒有考量文件的凝聚特性。Collins-Thompson亦指出傳統可讀性公式僅著重在文件的表淺資訊，而忽略文件重要的深層特徵。這也讓傳統可讀性公式在預測文本可讀性的結果常遭受到質疑。直到今日，可讀性的研究仍持續不斷。研究人員為了克服傳統可讀性公式的缺點，嘗試利用更細緻的機器學習演算法來發展出非線性的可讀性模型，並納入更多元的可讀性指標來共同評量文本的可讀性，以提升可讀性模型的效能。然而可惜的是，研究人員發現採用一般語言特徵的可讀性模型在應用於特定領域文時，一般語言特徵並無法判斷詞彙在不同領域文本時背後所代表的意義。
起訖頁	116-118
關鍵詞	可讀性、詞向量、卷積神經網路、表示學習法、快速文本
刊名	ROCLING論文集
期數	2017 (2017期)
出版單位	中華民國計算語言學學會
該期刊-上一篇	基於鑑別式自編碼解碼器之錄音回放攻擊偵測系統
該期刊-下一篇	基於i-vector與PLDA並使用GMM-HMM強制對位之自動語者分段標記系統