期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种支持ANSI编码的中文文本压缩算法 被引量:5
1
作者 常为领 方滨兴 +2 位作者 云晓春 王树鹏 余翔湛 《中文信息学报》 CSCD 北大核心 2010年第5期96-105,共10页
该文提出了一种高效的中文文本压缩算法CRecode,算法根据中文文本中字词的概率分布特点,对中文字词根据其使用频率,采用8bit、16bit和24bit三种长度的编码重新编码,克服了Huffman编码在压缩中文数据时打乱数据中蕴含的语义信息,致使其... 该文提出了一种高效的中文文本压缩算法CRecode,算法根据中文文本中字词的概率分布特点,对中文字词根据其使用频率,采用8bit、16bit和24bit三种长度的编码重新编码,克服了Huffman编码在压缩中文数据时打乱数据中蕴含的语义信息,致使其压缩数据再压缩性差的缺点。测试中,CRecode在与现有主流压缩软件联合使用时,可提高压缩率4%到30%,最大平均压缩比可达2.86。CRecode作为独立压缩算法,压缩中文文本时可获得优于Huffman编码、接近于LZ系列算法的性能。 展开更多
关键词 crecode 数据压缩 HUFFMAN 压缩算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部