月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
繁體中文文本中對於日文人名及異體字的處理策略
作者 林川傑詹嘉丞陳彥亨鮑建威
中文摘要
本論文提出一個可於進行繁體中文文章斷詞時,處理非繁體中文詞彙的方法。包括以日文漢字或中文書寫的日文人名,或是以異體字書寫的同義詞等。處理人名時,我們提出了姓名組合機率模型。處理日文人名時,我們也提出一個異體字對應的方法,可將日文姓氏及名用字對應至繁體中文用字。這方法甚至可以處理同一句子中同時出現日文及繁簡中文書寫方式的情形。在加入各種特殊類別以及中日人名處理方法後,斷詞效能F-measure由94.16%提昇至96.06%。另外對109篇標有日文人名的中文新聞文章進行斷詞實驗,測試集裡862個日文人名被成功斷成詞的比例為83.18%。論文中亦針對以異體字書寫的中文詞提出了一套可行的處理方式。
起訖頁 123-138
關鍵詞 中文斷詞日文人名判斷異體字Chinese word segmentationJapanese name identificationvariant form
刊名 ROCLING論文集  
期數 2011 (2011期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 Unsupervised Overlapping Feature Selection for Conditional Random Fields Learning in Chinese Word Segmentation
該期刊-下一篇 動補結構的及物性及修飾對象
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄