本文從四個方面介紹了我們正在開發中的《現代漢語新詞語資訊電子詞典》:
(1)現代漢語新詞語的界定,(2)新詞語詞典的開發思想,(3)新詞語的
採集與新詞語屬性資訊的描述,(4)近四萬新詞語的歸類實踐。我們認定的
新詞語是指1978 年以來通過各種途徑?生的、具有基本詞彙沒有的新形式、
新意義或新用法的語文詞語。除了詞形、詞義或用法任何一個方面“新?外,
還要求必須是人們日常生活中普遍、廣泛使用的語文詞語,人名、地名以及專
科術語都不屬於我們所說的“新詞語?。我們堅持開放的原則,儘量全面的採
集收錄新詞語,用人機兩用的研究理念,以北京大學計算語言學研究所的《現
代漢語語法資訊詞典》?模型打造一部收詞全面、資訊豐富、資源高度共用的
現代漢語新詞語電子詞典,?新詞語的研究、中文資訊處理的研究提供一個寶
貴的資源。目前已收錄新詞語近4 萬,首先我們按照現代漢語詞類的“優勢語
法?功能,給這四萬新詞語分類並歸類,然後,利用成熟的關聯資料庫(在
ACCESS 環境下實現)詳細地描述了每個詞語的屬性資訊。設立總庫一個,語
法資訊庫三個,包括名詞庫、動詞庫、形容詞庫,另外還設立了構詞法庫,舊
詞庫、外來詞庫、簡略詞庫。總庫和其他各庫通過“詞語、拼音、義項?三個
欄位聯繫起來,構成了一個具有上下位關係的有機系統,便於資訊的提取。這
些庫總共設立屬性欄位200 多個,包括每個詞語的語音資訊、語義資訊、來源資訊、構詞法資訊、句法資訊和部分語用資訊。本詞典是目前國內收詞量最大、
描寫資訊最多的一部新詞語詞典。 |