汉语文本动态字母表0阶模型算术编码被引量：1

Dynamic Alphabet Order 0 Model of Chinese Text for Arithmetic Coding

下载PDF

导出

摘要本文探讨汉语文本的0 阶统计模型的构造方法,提出了一个卓有成效的汉语文本压缩算法。仅仅凭借这一最初级的模型,汉语文本的编码效率已经超过LZ与Huffman 编码的混合算法。由于0 阶统计模型是各种高阶统计模型的基础,所以,本文对汉语以及其他大字符集文种( 如日文、朝鲜文) This paper addressed the construction of a dynamic alphabet order 0 model of Chinese text for arithmetic coding and provided an algorithm of Chinese text compression.The model had shown to be of high performance because the algorithm driven by it could compress Chinese texts more efficiently than those that combined both LZ and Huffman coding.Because order 0 model laid the foundation of order n models,what the paper discussed was important to the text compression of any large alphabet natural language,such as Chinese,Japanese and Korean.

作者王忠效范植华

机构地区中国科学院软件研究所

出处《中文信息学报》 CSCD 北大核心 2000年第1期39-47,共9页 Journal of Chinese Information Processing

关键词汉语文本算术编码统计模型 0阶模型压缩算法 Data compression Chinese text compression Arithmetic coding Statistical model

分类号 H1-39 [语言文字—汉语] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1王忠效,范植华.汉字异或动态散列分组查找算法[J].中文信息学报,1998,12(4):60-64. 被引量：4
2华强.中文文本压缩的 LZSSCH 算法[J].中文信息学报,1998,12(1):50-56. 被引量：13
3王忠效.汉语文本压缩研究及其应用[J].中文信息学报,1997,11(3):57-64. 被引量：9
4王忠效,姜丹.关于Lempel－Ziv　77压缩算法及其实现的研究[J].计算机研究与发展,1996,33(5):329-340. 被引量：19
5贺前华,徐秉铮,彭磊.中文文本压缩的自适应算法[J].中文信息学报,1993,7(3):46-54. 被引量：4

二级参考文献32

1徐秉铮，华南理工大学学报，1989年，17卷，3期
2冯志伟，现代汉字和计算机，1989年
3郭平欣，汉字信息处理技术，1985年
4石贵青，电子学报，1984年，4期
5王世宁，1983年
6团体著者，1981年
7王忠效，计算机应用，1995年，1期
8贺前华，中文信息学报，1993年，7卷，3期
9陈俭，计算机应用，1992年，12卷，5期
10姜丹，信息理论与编码，1992年

共引文献34

1宋军,王谦,蔡之华.一种LZ动态变长码的改进设计与分析[J].计算机应用研究,2004,21(5):23-24.
2王雷,许颖,任光.改进的LZSS算法在电子邮件系统中的应用[J].吉林大学学报（信息科学版）,2005,23(3):331-336. 被引量：4
3颜晓旭.海峡两岸民间审计的差异分析[J].商业会计（下半月）,2006(10):34-35.
4姜楠.乱花渐欲迷人眼——目睹鞋革展会之怪现状[J].中国皮革,2006,35(24):116-117.
5程涛,施水才,王霞,吕学强.基于同义词词林的中文文本主题词提取[J].广西师范大学学报（自然科学版）,2007,25(2):145-148. 被引量：11
6邓军,李钢,李益斌.无损压缩技术在GIS文档管理中的应用[J].山西建筑,2008,34(11):367-368.
7郭欣,李树辉.改进LZSS算法之动态位长度[J].电脑学习,2009(3):151-152.
8赵丹群.数据压缩技术及其在信息检索中的应用[J].情报杂志,1998,17(6):34-35.
9李秉智,杨富良.基于SigComp的会话初始化协议压缩算法[J].计算机应用,2010,30(4):881-883. 被引量：1
10游荣彦.从GB2312-80汉字到整型数的连续可逆映射[J].中文信息学报,1999,13(2):51-55.

同被引文献2

1王忠效,范植华.汉字异或动态散列分组查找算法[J].中文信息学报,1998,12(4):60-64. 被引量：4
2王忠效,范植华.动态字母表算术编码[J].软件学报,2001,12(2):283-292. 被引量：2

引证文献1

1王忠效,范植华.汉字自适应散列分组查找算法[J].中文信息学报,2001,15(2):16-22. 被引量：1

二级引证文献1

1程涛,施水才,王霞,吕学强.基于同义词词林的中文文本主题词提取[J].广西师范大学学报（自然科学版）,2007,25(2):145-148. 被引量：11

1高喜奎.论信息交换用朝鲜文国际标准字符集[J].中文信息,1991,8(4):0007-0010.
2申晓霞,胡运发.基于互关联后继树的文本压缩[J].计算机工程与应用,2007,43(6):168-170. 被引量：2
3秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
4Colt McAnlis.Web开发者需要了解的文本压缩[J].程序员,2014(1):124-126.
5刘连元.国外多语种语词处理研究[J].语文建设,1985(5):9-13.
6王世卿.汉字文本压缩的研究[J].计算机应用与软件,1995,12(5):1-4.
7李彦军,苏红旗,杨峰,李述迪,姚书科.基于BWT的文本压缩算法研究[J].计算机技术与发展,2009,19(5):89-92. 被引量：1
8邹建成,石志鑫.基于Fibonacci编码的英文文本压缩算法[J].中国电子商情（通信市场）,2010(2):143-147.
9蔡茂蓉,姜龙,丁光辉,杨文辉.哈夫曼树的实现及其在文件压缩中的应用[J].现代计算机,2008,14(11):99-102. 被引量：6
10贺前华,徐秉铮,彭磊.中文文本压缩的自适应算法[J].中文信息学报,1993,7(3):46-54. 被引量：4

中文信息学报

2000年第1期

浏览历史

内容加载中请稍等...

汉语文本动态字母表0阶模型算术编码被引量：1

参考文献5

二级参考文献32

共引文献34

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

汉语文本动态字母表0阶模型算术编码 被引量：1

参考文献5

二级参考文献32

共引文献34

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

汉语文本动态字母表0阶模型算术编码被引量：1