可讀性(Readability)是指閱讀材料能夠被讀者所理解的程度,當讀者閱讀高可讀性的文件時,會產生較好的理解及學後保留效果。由於文件的可讀性在知識傳遞扮演極為重要的角色,因此西方的可讀性公式發展的非常早。然而這些傳統的可讀性研究大多使用較淺層的語言特徵來發展線性的可讀性公式,其實並不足以反映文件難度。Graesser、Singer和Trabasso便指出,傳統語言特徵公式無法反映閱讀的真實歷程,文件的語意語法只是文件的淺層語言特徵,沒有考量文件的凝聚特性。Collins-Thompson亦指出傳統可讀性公式僅著重在文件的表淺資訊,而忽略文件重要的深層特徵。這也讓傳統可讀性公式在預測文本可讀性的結果常遭受到質疑。直到今日,可讀性的研究仍持續不斷。研究人員為了克服傳統可讀性公式的缺點,嘗試利用更細緻的機器學習演算法來發展出非線性的可讀性模型,並納入更多元的可讀性指標來共同評量文本的可讀性,以提升可讀性模型的效能。然而可惜的是,研究人員發現採用一般語言特徵的可讀性模型在應用於特定領域文時,一般語言特徵並無法判斷詞彙在不同領域文本時背後所代表的意義。 |