中文摘要 |
網際網路擴張迅速,Web 2.0服務擴張造就了一具有大量使用者意見的資訊載體。而使用者意見中包含了客觀的描述(fact)及主觀的意見(opinion),主觀的意見中又包含了情緒、情感(sentiment)的資訊。這些資訊不論對提供商品的業者、使用服務的客戶或是人際關係都具有很高的應用價值。以旅遊經驗為例,使用者的經驗回饋產生了大量龐大的意見資訊,然而目前的資訊技術尚很難藉由自動化的方式大量從中挖掘出有用的參考資訊。本研究蒐集了大量來自網路社群之旅遊景點意見(包含有八大旅遊景點分類,包含了1,275個店家、景點等營業場所,共達9,771筆使用者回饋的訊息),並提出詞組規則探索之方法,試圖建立起一個可自動化大量進行使用者意見分析的流程,並基於當前其他學者提出的方法及研究貢獻加以改良,尤其是加入了情境相關詞彙的偵測及量化,對於情感分析能產生更好的效果。本研究提出的分析架構以上述使用者的資料作為訓練及測試用,並從中標記並建立出包含有4,865筆旅遊意見相關的詞彙庫,再合併以SVM為分類器,於單獨判斷極性的部分得到最佳F1 Score 99.8%;於綜合判斷極性及情感強度則得到最佳F1 Score 89.1%,皆呈現出此混和式的分類架構有相當理想的成效,可見適當之詞彙庫使用策略配合調校合適之分類器應能對特定領域之網路情感意見分析有相當大助益。 |