月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
應用興趣點辨識技術從Web中挖掘新商家資訊
並列篇名
Mining POIs from Web via POI recognition and Relation Verification
作者 許國信莊秀敏周建龍張嘉惠
中文摘要
本論文提出一套系統能從網頁中自動化的挖掘新的店家資訊的方法。透過地址相關的特殊的關鍵字(如:台北市+新開幕)進行搜尋,找到可能包含地址及新開幕店家的網頁,再利用地址辨識模型先從結果中擷取地址,並從周圍透過興趣點辨識模型擷取商家名稱(Store Name Recognition),最終使用地址與興趣點關聯配對(POI Relation)模型推斷該商家名稱是否位於該地址。我們特別著重在商家名稱辨識以及POI Relation的模型建立。針對興趣點辨識模型的資料準備,我們將黃頁上的商家名稱透過實體篩選以及資料前處理,應用Distant Learning及序列標記,可以訓練出F1值0.816的興趣點辨識模型。其次關於POI Relation預測則是針對反例的準備進行研究,其中效能最好的模型有0.754的準確率。整體系統效能則使用兩個興趣點辨識模型搭配三種關聯分類模型,共進行六次實驗並分析,最好的組合平均每個IP每天能找到約49個新的興趣點。
英文摘要
This paper presents a system that could automatically extract new POIs from Web. First, we use special queries (e.g. Taipei+New Open) to find Web pages that might contain addresses for new stores. For web pages that contain addresses, we then apply store name recognition model to extract possible POIs. Finally, we train a model to find the most possible POI for the address found in the page. In this paper, we focus on POI name recognition and POI relation prediction. For POI recognition, we use store names from yellow pages as seed to prepare the training data via distant learning. Through entity selection and data processing, we obtain a model with 0.816 F1-measure as opposed to 0.432 F1-measure for a dictionary-based baseline. As for POI relation prediction, we compare three different strategies for negative example preparation. The best model could get 0.754 accuracy. We combine two POI recognition models with three classification models to test the overall performance. The best combination could extract 49 POIs every day with a single IP.
起訖頁 53-67
關鍵詞 興趣點辨識模型二元分類關聯分類模型Address RecognitionPOI Entity RecognitionPOI Relation Prediction
刊名 ROCLING論文集  
期數 2017 (2017期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 A Novel Trajectory-based Spatial-Temporal Spectral Features for Speech Emotion Recognition
該期刊-下一篇 Exploring Lavender Tongue from Social Media Texts
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄