基於Seq2Seq模型的中文文法錯誤診斷系統

王鈞威; 簡聖倫; 陳義昆; 吳世弘

月旦知識庫會員登入｜元照網路書店｜月旦品評家

熱門：

首頁

臺灣期刊 法律公行政治醫事相關財經社會學教育其他

大陸期刊 核心重要期刊

DOI文章

	本站僅提供期刊文獻檢索。　　【月旦知識庫】是否收錄該篇全文，敬請【登入】查詢為準。最新【購點活動】
篇名	基於Seq2Seq模型的中文文法錯誤診斷系統
並列篇名	A Chinese Grammatical Error Diagnosis System Based on Seq2Seq Model
作者	王鈞威、簡聖倫、陳義昆、吳世弘
中文摘要	本文將以中文句子的錯誤診斷為實例，說明如何利用深度學習演算法序列對序列（Seq2Seq）模型，使用其中的編碼器與解碼器架構，實作出能夠從學習者的句子當中生成出修改過後的句子，並且識別錯誤的類型。一個句子是由許多詞所組成，我們透過修正前與修正後的兩個句子配成一對讓演算法進行學習，盡可能的使模型識別原始與正確之間的關係，並將有錯誤或是不通順的句子加以修正與改正。此研究利用Pytorch所提供的範例更改為我們所想要的功能，以此理論作為基礎的中文文法錯誤診斷系統；此研究分為兩部分：首先利用NLP-TEA2至NLP-TEA5的Shared Task所提供的資料訓練模型。其次因應資料集數量不夠讓機器充分學習，所以我們利用Ge等人所提出的方式來擴大訓練的資料集。過去Chen在NLP-TEA3的Shared Task使用條件隨機域（Conditional Random Field，CRF）得到當時最佳的準確度與精確度。所以我們主要針對NLP-TEA3當時所完成的任務結果來做比較，另外為了確保我們所使用的序列對序列的可行性與公平性，在此我們重新訓練CRF不做任何的調整與現在的序列對序列一樣做比較。
起訖頁	358-367
關鍵詞	文法錯誤診斷系統、深度學習、序列對序列模型、條件隨機域
刊名	ROCLING論文集
期數	2019 (2019期)
出版單位	中華民國計算語言學學會
該期刊-上一篇	國語語音辨識系統中之人名語言模型
該期刊-下一篇	應用文脈分析於中英夾雜語音合成系統

新書閱讀

元照讀書館

優惠活動

月旦品評家

元照讀書館

．研討會新訊

月旦知識庫

月旦法律分析庫
月旦醫事法網
月旦會計財稅網

期刊數位服務

社群平台

讀者服務

關於元照

讀者服務專線：+886-2-23756688　傳真：+886-2-23318496
地址：臺北市館前路28 號 7 樓　客服信箱