中央研究院利用計算機處理古籍已有十二年,其中以全文資料庫的發展最受矚目,目前上線的全文資料庫文總字數已超過一億一仟萬字,其所用的技術則全由院內同仁自行開發。參與製作資料庫共有五所:史語所、臺史所、資訊所、近史所、文哲所,以及本院計算中心,總統府國史館亦積極參與清史資料庫之開發。1995年開始,有些大學與本院發展合作關係共享古籍資料,包括國內的中山、中正、師大各大學,國外的倫敦大學、史丹佛大學、密西根大學、香港中文大學等。本文首先介紹各全文資料庫的發展現況,其次介紹自行開發的相關技術,包括:全文資料庫的結構、文章的標誌系統、資料登錄之管理、缺字造字之管理以及目前各單位相關的研究發展計劃等。 |