中文別字自動偵測與校正是個相當重要的工具,許多分析別字類型的研究指出,「字音混淆」、「字形混淆」與「字義混淆」是別字產生的主要原因,因此近年來許多別字自動校正的研究也都採取分別針對字音、字形、字義造成的混淆進行探討。但對於字形相似別字的校正正確率仍不夠好,主要原因之一是因為在中文字字形結構的資訊不夠完整。本文的目的是利用中文部件組字與形構資料庫的筆畫結構資料提出一個演算法,計算兩個中文字筆畫結構序列的相似程度,並用於字形相似類別字的偵測與校正。實驗結果顯示筆畫結構用在偵測與校正字形相似別字的效能較原先以部件的方法來得有效。 |