本篇論文提出新穎之相關回饋(Relevance Feedback)方法並應用於混合式機率檢索系統(Mixture Probability Model)以提昇檢索效能。相關資訊回饋法以往最常用的技術是查詢句擴充法(Query Expansion),本回饋方式是架構在以混合式機率模型為主的檢索系統上,為了加強檢索效能,我們是在查詢句擴充法中,強調不同查詢詞的重要性,所以提出查詢詞權重重調整(Query Term Reweighting)技術;此外,我們也利用檢索出來的前N名文件和資料庫的每份文件個別重調成新的文件語言模型,以提供較好的文件語言模型提供檢索時使用。在查詢字權重之重調整部分以最佳相似度(Maximum Likelihood)為估測準則,而文件語言模型之調整部分先後以最佳相似度與最佳事後機率(Maximum a Posteriori)為估測準則供我們對照比較,並使用了EM(Expectation Maximization)演算法去估測出適當的參數。實驗結果顯示使用資訊回饋及貝氏語言模型調整可有效提升文件檢索正確率。 |