中文摘要 |
伴隨著網際網路快速發展與多媒體資訊的大量增長,影音的傳遞與瀏覽越來越多並且成為我們日常生活的重要活動,這使得關於語音文件檢索(Spoken Document Retrieval, SDR)的研究成為一個有魅力的研究主題。一般而言,SDR的研究主要可分成兩大研究方向:第一個研究方向為建立具強健性的索引(Robust Indexing)以表達語音文件中詞彙和語意內涵,並且減緩語音辨識錯誤所造成的影響;第二個研究方向為發展有效的檢索模型(Effective Retrieval Models),基於索引所代表的詞彙和語意內涵來量化使用者輸入的查詢(Query)和語音文件的相似程度,以協助使用者找到相關資訊,可分為向量式模型、統計式語言模型。近年來,隨著類神經網路的突破,這類的方法也被大量應用在檢索的任務上。雖然這幾年取得長足的進步,但如同傳統文字文件檢索,語音文件檢索也面臨輸入查詢過於簡短不能完整地表達使用者資訊需求的情況。因此,不少研究是利用使用者一次檢索後,將點擊的文件視為相關文章並做為查詢意向(Query Intent)的依據,並在下一次提供更為精確的檢索結果,可視為與準相關回饋(Pseudo Relevance Feedback)相似的流程,但必須進行兩次檢索的程序而會有耗時的問題。 |