月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
基於BERT任務模型之低誤報率中文別字偵測模型
並列篇名
Low False Alarm Rate Chinese Misspelling Detection Model Based on BERT Task Model
作者 沈峻毅張道行
中文摘要
中文別字偵測技術可以應用在教育及出版等許多實務領域。雖然近期許多研究提出了一些能提高效能的模型,但這些模型卻有著誤報率偏高的缺點。在真實的應用中,減少誤報情況的發生是很重要的,因為使用者在操作時,一直出現誤報的情況,會讓使用者體驗不佳,所以如何生成低誤報率且高效率的模型,成為一個要處理的問題。本文採用BERT在Single Sentence Tagging任務模型來解決中文別字偵測的問題,並配合此模型設計了訓練資料的大量生成方法。實驗顯示本文所提方法對SIGHAN 2015測試資料集的誤報率(False Alarm Rate)達到0.0297。與先前其他低誤報率方法相比,此方法有最低的誤報率以及最高的召回率。
英文摘要
Chinese misspelling detection technology can be applied in fields such as education and publishing. This research topic has garnered considerable attention. Recently, although many studies have proposed models that are based on deep learning and that are capable of improving detection accuracy, these models have the disadvantage of high false alarm rates. In real application scenarios, it is important to reduce the occurrence of false alarms because false alarms, while using the system, lead to poor user experience. Therefore, it is important to create a model with low false alarm rate and high efficiency. In this paper, BERT Single Sentence Tagging task model is used to solve the Chinese misspelling detection problem. To work with this model, mass training data generation methods were designed. Experiments showed that the method employed in this study has a false alarm rate of 0.0297 for the SIGHAN 2015 test set. Compared to other previous methods with low false alarm rates, this method has the lowest false alarm rate and the highest recall rate.
起訖頁 1-12
關鍵詞 BERT中文別字偵測低誤報率BERTChinese misspelling detectionlow false alarm rate
刊名 ROCLING論文集  
期數 2020 (2020期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 基於混合注意力機制與長短期記憶之股票趨勢預測
該期刊-下一篇 基於深度學習之中文文字轉台語語音合成系統初步探討
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄