基於訊息配對相似度估計的聊天記錄解構

劉至咸; 張嘉惠

月旦知識庫會員登入｜元照網路書店｜月旦品評家

熱門：

首頁

臺灣期刊 法律公行政治醫事相關財經社會學教育其他

大陸期刊 核心重要期刊

DOI文章

	本站僅提供期刊文獻檢索。　　【月旦知識庫】是否收錄該篇全文，敬請【登入】查詢為準。最新【購點活動】
篇名	基於訊息配對相似度估計的聊天記錄解構
作者	劉至咸、張嘉惠
中文摘要	一般而言，為建立Retrieval-based聊天機器人，我們可以從聊天紀錄中來產所需的問答配對（Question-Answer Pair），然而問答配對並非完全依序地呈現在聊天紀錄中，不同內容的問答配對可能互相穿插，而從互相穿插的訊息中分離出內容不同的會話的任務稱為對話解構（conversation disentanglement）。現有的對話解構研究大多透過計算兩個訊息的相似度來解決問題，在此論文中，我們發透過計算訊息相似度判斷訊息是否屬於相同會話是非常困難的，但若我們透過計算相似度來預測訊息的回覆關係則可以解決此問題。此外我們指出過去研究中的模型無法處理未經訓練的訊息，並無法在實務上運用的缺陷。此論文中，我們使用IRC與Reddit資料集進行實驗，並使用聊天記錄進行對話解構。其中人工合成的Reddit資料集提供額外的大量訓練資料，且BERT模型在此資料集上的回覆關係預測獲得良好的效能。
起訖頁	423-423
關鍵詞	對話解構、回覆關係預測、BERT模型應用
刊名	ROCLING論文集
期數	2019 (2019期)
出版單位	中華民國計算語言學學會
該期刊-上一篇	漢語及物化的大數據研究
該期刊-下一篇	標註英中同步樣式文法之研究

新書閱讀

元照讀書館

優惠活動

月旦品評家

元照讀書館

．研討會新訊

月旦知識庫

月旦法律分析庫
月旦醫事法網
月旦會計財稅網

期刊數位服務

社群平台

讀者服務

關於元照

讀者服務專線：+886-2-23756688　傳真：+886-2-23318496
地址：臺北市館前路28 號 7 樓　客服信箱