月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
結合詞向量技術與分群演算法於信用卡商戶名稱辨識
並列篇名
Combining Word Vector Technique and Clustering Algorithm for Credit Card Merchant Detection
作者 Fang-Ju Lee (Fang-Ju Lee)Ying-Chun Lo (Ying-Chun Lo)Jheng-Long Wu (Jheng-Long Wu)
中文摘要
透過客戶消費資料萃取相關之使用者行為,是蒐集客戶資訊的方式之一。現行文字探勘的領域中,大多以文本分類之相關研究為主,顯少有文本分群之研究主題。從非結構化之交易消費說明中,找尋字詞之間的關係,運用不同詞向量技術,突破分類需事先區分條件之限制,建立自動化辨識分析方法,提升分群之準確率。在本研究中將以銀行信用卡交易消費說明內容,進行Jieba中文斷詞並採用Word2Vec特徵值萃取,搭配基於密度分群法(DBSCAN)和階層分群法,交叉組合進行實驗。預測結果以MUC、B3和CEAF之F1平均值67.58%較為顯著。
英文摘要
Extracting relevant user behaviors through customer’s transaction description is one of the ways to collect customer information. In the current text mining field, most of the researches are mainly study text classification, and only few study text clusters. Find the relationship between letters and words in the unstructured transaction consumption description. Use Word Embedding and text mining technology to break through the limitation of classification conditions that need to be distinguished in advance, establish automatic identification and analysis methods, and improve the accuracy of grouping. In this study, use Jieba to segment Chinese words, were based on the content of credit card transaction description. Feature extractions of Word2Vec, combined with Density-Based Spatial Clustering of Applications with Noise (DBSCAN) and Hierarchical Agglomerative Clustering, crosscombination experiments. The prediction results of MUC, B3 and CEAF's F1 average of 67.58% are more significant
起訖頁 32-39
關鍵詞 詞頻-逆向文件頻率Word2VecBERT餘弦相似度分群演算法密度分群法K-平均演算法階層分群法TF-IDFWord2VecBERTCosine SimilarityClustering AlgorithmsDBSCANK-meansHierarchical Clustering
刊名 ROCLING論文集  
期數 202212 (2022期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 運用響應式知識蒸餾機制增進中文多標籤文本分類效能
該期刊-下一篇 臺灣口音中英雙語之多語者影音合成系統
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄