双向切割单/双面英文碎纸片拼接复原算法设计

Algorithm Design of Restoring Two-Way Single/Double-Sized Shredded Documents

下载PDF

导出

摘要针对单/双面英文文本文件,经过双向(横向 + 纵向)切割后形成的碎纸片,本文通过设计拼接算法将其还原。首先,利用“英文字母的结构特征”和“空白行间距”这两个几何特征将原图中同行的碎纸片按行聚类。在此基础上,我们利用向量的l1范数差异度模型对每类碎片进行列拼接,以形成一个横切碎片,最后再对所有的横切碎片进行行拼接即可。在算法的数值检验部分,我们以2013年全国大学生数学建模赛题为例,对横纵切后形成的209块单/双面英文碎纸片进行拼接复原。数值复原结果证实了该算法实现简单,且聚类成功率高,其中聚类部分的正确率可以达到93%以上。 This paper designs an algorithm to restore English shredded documents no matter they are single- sized or double-sized text files which are cut both vertically and horizontally. Firstly, we cluster the fragments which were located in the same line in original text files according to the structural features of English letters and the row spacing. Then, using l1 norm difference model, we attach the fragments in the same class. By this way, the scraps of paper in the same line can be restored as a whole crosscutting shredded document. Finally, we should splice the crosscutting shredded doc-uments into a complete image. In the numerical test part, taking the 2013 national mathematics model contest problem as examples, our algorithm restores 209 pieces of English shredded doc-uments. Numerical results show that the correct rate of clustering is over 93% which demonstrates the efficiency of the algorithm.

作者张晨王诗云

机构地区沈阳航空航天大学理学院

出处《应用数学进展》 2016年第2期159-165,共7页 Advances in Applied Mathematics

关键词峰值权数行间距权数聚类可信度 Jffreys & Matusita距离 l<sub>1</sub>范数

分类号 G6 [文化科学—教育学]

引文网络
相关文献

参考文献3

1鲁嘉琪.基于文字信息的碎纸片拼接复原算法[J].现代电子技术,2014,37(4):28-31. 被引量：6
2尹玉萍,刘万军,张冲,刘永超.基于动态聚类的文档碎纸片自动拼接算法[J].计算机工程与应用,2014,50(18):162-166. 被引量：13
3张宇,刘雨东,计钊.向量相似度测度方法[J].声学技术,2009,28(4):532-536. 被引量：136

二级参考文献36

1潘荣江,孟祥旭,屠长河.一种基于LCS的物体碎片自动拼接方法[J].计算机学报,2005,28(3):350-356. 被引量：16
2朱红霞,沈炯,李益国.一种新的动态聚类算法及其在热工过程模糊建模中的应用[J].中国电机工程学报,2005,25(7):34-40. 被引量：29
3姜惠兰,安敏,刘晓津,赵新,张建海.基于动态聚类算法径向基函数网络的配电网线损计算[J].中国电机工程学报,2005,25(10):35-39. 被引量：47
4田润涛,谢培山.色谱指纹图谱相似度评价方法的规范化研究(一)[J].中药新药与临床药理,2006,17(1):40-42. 被引量：47
5王磊,莫玉龙,戚飞虎.基于Canny理论的边缘提取改善方法[J].中国图象图形学报（A辑）,1996,1(3):191-195. 被引量：42
6程勇,黄河,邱莉榕,史忠植.一个基于相似度计算的动态多维概念映射算法[J].小型微型计算机系统,2006,27(6):975-979. 被引量：27
7焦利明,于伟,罗均平,翟永庆.向量相似度在雷达目标识别中的应用[J].火控雷达技术,2006,35(2):78-81. 被引量：12
8郑丽萍,李光耀,梁永全,沙静.本体中概念相似度的计算[J].计算机工程与应用,2006,42(30):25-27. 被引量：22
9贾海燕,朱良家,周宗潭,胡德文.一种碎纸自动拼接中的形状匹配方法[J].计算机仿真,2006,23(11):180-183. 被引量：35
10戚晓明,陆桂华,吴志勇,金君良.水文相似度及其应用[J].水利学报,2007,38(3):355-360. 被引量：30

共引文献151

1罗久飞,郑睿,王鑫宇,陈平,冯松.油液磨粒感应电压特征辨识研究[J].仪器仪表学报,2022,43(8):173-181. 被引量：4
2Ke ZHANG,Yongli ZHU,Xuechun LIU.A fault locating method for multi-branch hybrid transmission lines in wind farm based on redundancy parameter estimation[J].Journal of Modern Power Systems and Clean Energy,2019,7(5):1033-1043. 被引量：12
3林文祥,刘德生.网络信息体系信息流程有效低频路径挖掘方法[J].计算机科学,2022,49(S02):335-340. 被引量：1
4郭桢,凌昳,张继稳,葛卫红,石森林.龙胆泻肝丸物质组释放动力学特征研究[J].中草药,2010,41(11):1806-1808. 被引量：11
5成鹏,汪西莉.基于相似度融合的主动支持向量机算法[J].计算机工程,2011,37(12):166-169. 被引量：2
6陆伟,刘屹,孟睿,陈英杰.基于域加权聚类算法的网络舆情热点话题探测[J].数字图书馆论坛,2011(8):50-56. 被引量：2
7史永刚,王国民,李华峰,刘毅,梅林.激光拉曼光谱相似性测度方法[J].现代科学仪器,2011,28(4):117-120. 被引量：4
8张铭钧,张丽,万媛媛.基于特征融合的水下目标识别方法[J].哈尔滨工程大学学报,2011,32(9):1190-1195. 被引量：7
9葛宝臻,马云峰,魏耀林.求解粒子群粒度分布的改进Projection算法[J].光学精密工程,2012,20(1):197-203. 被引量：2
10李园白,崔蒙,杨阳,朱晓博.证候相似性比较方法研究[J].中华中医药杂志,2012,27(2):468-470. 被引量：6

1我刊对来稿的基本要求[J].眼科研究,2003,21(6):636-636.
2投稿须知[J].中国艾滋病性病,2008,14(5):463-463.
3李博君,朱文一,吴晨.建筑体量与旧城保护——以北京旧城隆福寺片区为例[J].城市设计,2017(4):80-89.
4王班.玉米大垄双行栽培技术探究[J].新农村（黑龙江）,2018,0(21):42-42.
5陈莉.平凡坚守的统计人[J].中国统计,2018,33(7):40-41.
6林炜,李胜宏,陈小航.在4/2随机波动率下正态调和稳态过程模型对期权的定价和对冲[J].中国科学：数学,2018,48(1):201-212. 被引量：2
7宁夏吴忠市:“无人驾驶”推动农业标准化生产[J].蔬菜,2018(6):8-8.
8胡静楠.基于因子分析法的酒店餐饮业上市公司绩效评价[J].河北企业,2018,0(8):76-77. 被引量：2
9杨丹丹.六安瓜片生态治茶从种植到加工都讲究环境友好[J].农产品市场,2018,0(15):31-32.
10刘馨阳.我国高等教育对科技人力资源的贡献[J].今日科苑,2018,0(5):24-36. 被引量：2

应用数学进展

2016年第2期

浏览历史

内容加载中请稍等...

双向切割单/双面英文碎纸片拼接复原算法设计

参考文献3

二级参考文献36

共引文献151

相关作者

相关机构

相关主题

浏览历史