中文摘要 |
文字蘊涵(Textual Entailment)的定義是判斷兩個句子能否互相推論。推論可分為五種類型:正向、反向、雙向、矛盾、獨立。這五種類型分別代表著不同的蘊涵關係。文字蘊涵辨識(Textual Entailment Recognition)是相當困難的自然語言處理問題。由於中文文字蘊涵的文獻較缺乏,本篇論文將中文文字蘊涵辨識提出了一個流程,提供給之後想要做這個題目的人的作為一個參考。中文的文字處理相較於英文的文字處理有許多不同的難處,在本篇論文中,我們將介紹處理中文的文字處理遇到的難處以及處理的流程。我們的系統使用支援向量機(Support vector machine, SVM)作為區分類型的演算法。使用的特徵分為兩個方向:1.文字特徵2.語意特徵。 |