中文摘要 |
"在文本的情感分析(Sentiment Analysis)的任務中,基於詞典的方法因具有高可解釋性且容易使用,中文維度型情感詞典(Chinese Valence-Arousal Words, CVAW)已是重要的基礎工具,本研究的主要目的則是發展一種自適應方法(Adaptive Method)擴充該情感詞典,使其可擴充並適應到不同領域,故本研究利用深度學習的嵌入(Embedding)技術,從健保領域專家標記結果取得新詞的維度型情感(Dimensional Sentiment),擴充中文維度型情感詞典為自適應中文維度型情感詞典。為驗證該方法之有效性,我們以中文維度型情感詞典作為基線(Baseline),並加入支援向量機(Support Vector Machine, SVM)及極限梯度提升(Extreme Gradient Boosting, XGBoost)等熱門演算法進行比較,實驗結果顯示,自適應中文維度型情感詞典在交叉驗證實驗中之均方誤差(Mean Square error, MSE)為0.95、皮爾森相關係數(Pearson's Correlation coefficient)為0.71,效能略優於基線及其他機器學習演算法。未來亦將結合標記推薦系統,完善具方向性的標記及學習循環,使自適應中文維度型情感詞典能更有效的持續發展。" |