月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
命名實體識別運用於產品同義詞擴增
並列篇名
Using Named Entity Recognition Increases the Synonym of Products
作者 洪智力黃政華鍾瑞嘉陳良圃楊秉哲
中文摘要
本研究提出產品名稱機率比對法,嘗試解決命名實體識別領域中,常被忽略的同義詞辨識問題。在意見探勘領域中,正確並使用相同的用詞用語描述一項產品或服務,能有效提升意見探勘或情感分析的成果。然而,口碑或意見為使用者自行產生的內容(UGC; user generated content),口碑文章缺乏一定的撰寫規則與統一的命名規定,不同作者甚至相同作者對於相同的產品,常會產生命名不一致的現象,導致口碑敘述的產品名稱和正式產品名稱不一致。此產品名稱不一致的現象,在搜尋或整理口碑文章時,則會產生資訊遺漏的問題。本研究提出產品名稱機率比對法,透過產品共現詞彙集、Word2vec語言模型,擴增產品的同義詞,並使用機率比對方式,嘗試找到適合的產品同義詞,以解決資訊遺漏的問題。根據本研究的初步實驗顯示,本研究所提出的方法對於同義詞辨識問題,有發展的潛力。
英文摘要
This research proposes the probability mapping approach for a product name to attempt to resolve the synonym identification problem, which is usually ignored in the field of Named Entity Recognition. Using the same name to describe a product or service may effectively improve the results of opinion mining or sentiment analysis. However, as WOM is a user generated content (UGC), different names may be used by the same or different users. Besides, there is no unified naming rule when writing the WOM. Even though the authors are the same or different, they may use different names to describe the same products. In this case, searching or organizing the WOM article without the consideration of the naming issue may lead to the problem of information loss. Thus, we propose the probability mapping approach via the co-occurrence naming dataset and the Word2vect language model in order to reduce the naming issue. According to our initially experimental results, the probability mapping approach for a product name present its potential in the naming issue.
起訖頁 271-283
關鍵詞 意見探勘命名實體辨識深度學習同義詞辨識Opinion MiningNamed Entity RecognitionDeep LearningSynonyms Identification
刊名 ROCLING論文集  
期數 2016 (2016期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 基於深層類神經網路及表示學習技術之文件可讀性分類
該期刊-下一篇 Design of an Input Method for Taiwanese Hokkien using Unsupervized Word Segmentation for Language Modeling
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄