中文摘要 |
論文中介紹了由中研院語言所和資訊所從語言工程之角度建置的中央研究院中英雙語知識本體詞網(The Academia Sinica Bilingual Ontological Wordnet, Sinica BOW),希冀能滿足電腦更多需求以處理更多變的問題。它以WordNet為基礎,加上台灣地區所使用的中文,搭配領域以及SUMO(Suggested Upper Merged Ontology,建議上層共用知識本體),並以WordNet1.6版offset為延伸的識別碼作為媒介連結了領域詞彙庫和領域知識本體。該系統為了便於使用者查詢,藉由多元、友善的介面,將功能切割為詞網、知識本體以及索引三個主要單元,提供跨語言資訊轉換、詞義的區分與詞義關係的連結、語言資訊與概念架構(知識本體)的連結以及使用領域等訊息。文中並提到,隨著WordNet版本的變更,為保留語言資訊演變,便以版本的比對,我們以WordNet所提供的1.6版和1.7.1版之名、動詞的單詞義和多詞義對應資料為基礎,輔以Sinica BOW現有資訊,將資料分為單詞義、多詞義對應資料以及1.7.1版新增詞形資料,透過同義詞集、詞形以及詞類訊息,經進一步自動和人工處理後,將Sinica BOW和WordNet1.7.1版結合,並提供版本對應與比對,建立之後Sinica BOW與WordNet各版本結合的處理模式。 |