早在1961年,Green就發展了第一個問答系統(Question Answering System),用來回答單季美國大聯盟相關比賽問題。該系統執行於IBM 7090平台,以今日的觀點來看,其硬體資源相當貧乏,但由於問答的範圍狹小,系統正確率尚能令人滿意。近年來,網際網路成長快速,在資訊、流量、使用人數、以及應用領域上都有驚人的發展。截至目前為止,Google已經索引了超過八十億個網頁資料;MSN BETA、Yahoo也分別有四十億與二十億個網頁資料。整個網際網路總索引量則高達一百一十五億個網頁,頗為驚人。此趨勢帶動了近幾年問答系統的研究風潮,盼能解決網路搜尋如大海撈針的困境。報導指出,從2000年到2005年,網路人口成長了1.7倍,在前十名的語言中,中文人口成長率為284.8%,高達一億兩千萬,遠遠超過英文人口的成長率。此數據顯示了中文處理的重要性,這也是本實驗室致力於相關研究的動機之一。 |