熱門:
首頁
臺灣期刊
法律
公行政治
醫事相關
財經
社會學
教育
其他
大陸期刊
核心
重要期刊
DOI文章
首頁
臺灣期刊
其他
中文計算語言學期刊
200512 (10:4期)
本站僅提供期刊文獻檢索。
【月旦知識庫】是否收錄該篇全文,敬請
【登入】
查詢為準。
最新
【購點活動】
篇名
《人民日報》語料庫命名實體分類的研究
並列篇名
The Chinese Named Entity Categorization Based on the People’s Daily Corpus
作者
夏迎炬
、
于浩
、
西野文人
中文摘要
在信息檢索、信息抽取等應用中,命名實体的處理十分重要。本文在目前的命 名實体分類体系的基礎上,從信息檢索和抽取的角度對命名實体的細分類進行 了深入的研究。提出了命名實体的多級分類并給出了每一級的詳細分類。為了 檢驗該分類体系的實際效果,我們在人民日報語料上進行了初步的標注。并使 用常用的基于統計模型的命名實体識別算法在人民日報語料上做了一系列的 對比實驗。實驗結果表明:面向機器處理的細分類能有效地提高識別系統的性 能并最終有助于信息檢索和抽取。
起訖頁
533-542
關鍵詞
Named entity
、
Classification
、
Corpus
、
Natural language processing
、
命名實體
、
分類
、
語料庫
、
自然語言處理
刊名
中文計算語言學期刊
期數
200512 (10:4期)
出版單位
中華民國計算語言學學會
該期刊-上一篇
A Synchronous Corpus-Based Study on the Usage and Perception of Judgement Terms in the Pan-Chinese Context
該期刊-下一篇
雙向考察和驗證:並列成分中心語的語義關係和CCD的名詞語義分類體系
新書閱讀
最新影音
優惠活動