月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
中文信息處理中的信息壓縮
並列篇名
Chinese text Compression using Chinese Language Information Processing
作者 高軍陳錫先
中文摘要
在傳送大規模真實中文信息中,特別是在個人通信系統中,準確高效的信息壓縮分法是極為必要的。一個好的信息壓縮方法,可以節約大量的傳輸時間和存儲空間。信息壓縮有兩種基本途徑,第一種是,去處寓于信源的相關性之中冗餘度,另一種是,去處寓于概率的非等分布之中冗餘度,改變信源的概率分布,以期盡可能達到等概率分布的目的。本文提出了一種全新的信息壓縮方法,這種方法在理論中充分利用了信源的相關性,同時又根據中文信息處理中對詞的界定,把握了其不等概分布特性,運用最優雖搜索方法,把信源相關性與信源的不等概分布有機地結合起來,從而達到了高效壓縮信息的目的,在文中,列舉了實例結果。
英文摘要
To transport the large scale authentic Chinese text, especially in the personal telecommunication system, it is necessary to establish a highly efficient coding method. A good coding system can reduce transportation time. There are two basic ways to compress information. One way is to get rid of the perplexity is in the relativity of information source. The other is to remove the perplexity of not equal probabilistic distribution. In this paper, a novel information compressing method is presented. It utilizes the relativity of the information source and catchs the information of different probabilistic distribution according to the definition of Chinese words. The relativity and not equal probabilistic distribution are connected by a optimum searching method. The aim of high compressing ratio is reached. And. Some experimental results are also covered.
起訖頁 368-379
關鍵詞 漢語語料最優搜索Huffman編碼最大似然度相關性冗餘度平均碼長Chinese corpusoptimum searchingHuffman codingDiscrete Stable Information SourceMaximum likelihoodrelativityperplexityentropyaverage code length
刊名 ROCLING論文集  
期數 1997 (1997期)
出版單位 國立高雄師範大學輔導與諮商研究所
該期刊-上一篇 Logical Operators and Quantifiers in Natural Language
該期刊-下一篇 Combining Multiword Units into a Hidden Markov Model for Part-of-Speech Tagging
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄