现有的重复数据删除技术大部分是基于变长分块(content defined chunking,CDC)算法的,不考虑不同文件类型的内容特征.这种方法以一种随机的方式确定分块边界并应用于所有文件类型,已经证明其非常适合于文本和简单内容,而不适合非结构化...现有的重复数据删除技术大部分是基于变长分块(content defined chunking,CDC)算法的,不考虑不同文件类型的内容特征.这种方法以一种随机的方式确定分块边界并应用于所有文件类型,已经证明其非常适合于文本和简单内容,而不适合非结构化数据构成的复合文件.分析了OpenXML标准的复合文件属性,给出了对象提取的基本方法,并提出基于对象分布和对象结构的去重粒度确定算法.目的是对于非结构化数据构成的复合文件,有效地检测不同文件中和同一文件不同位置的相同对象,在文件物理布局改变时也能够有效去重.通过对典型的非结构化数据集合的模拟实验表明,在综合情况下,对象重复数据删除比CDC方法提高了10%左右的非结构化数据的去重率.展开更多
DFM-1型电脑复合模具抛光机可使模具光整加工效率提高1~10倍,表面粗糙度改善至 Ra 0.1μm 以下,尤其适用于模具型腔上一般的小孔、窄槽、狭缝及特形表面的光整加工。该机的声学部件设计采用四分之一波长的换能器和三圆锥、圆柱复合聚能...DFM-1型电脑复合模具抛光机可使模具光整加工效率提高1~10倍,表面粗糙度改善至 Ra 0.1μm 以下,尤其适用于模具型腔上一般的小孔、窄槽、狭缝及特形表面的光整加工。该机的声学部件设计采用四分之一波长的换能器和三圆锥、圆柱复合聚能器,设计思想新颖、结构轻便、工作可靠;利用该机开发的电解超声复合锉削工艺,综合地发挥了电解加工的高效率及超声波加工的良好表面质量的特点。展开更多
文摘现有的重复数据删除技术大部分是基于变长分块(content defined chunking,CDC)算法的,不考虑不同文件类型的内容特征.这种方法以一种随机的方式确定分块边界并应用于所有文件类型,已经证明其非常适合于文本和简单内容,而不适合非结构化数据构成的复合文件.分析了OpenXML标准的复合文件属性,给出了对象提取的基本方法,并提出基于对象分布和对象结构的去重粒度确定算法.目的是对于非结构化数据构成的复合文件,有效地检测不同文件中和同一文件不同位置的相同对象,在文件物理布局改变时也能够有效去重.通过对典型的非结构化数据集合的模拟实验表明,在综合情况下,对象重复数据删除比CDC方法提高了10%左右的非结构化数据的去重率.
文摘DFM-1型电脑复合模具抛光机可使模具光整加工效率提高1~10倍,表面粗糙度改善至 Ra 0.1μm 以下,尤其适用于模具型腔上一般的小孔、窄槽、狭缝及特形表面的光整加工。该机的声学部件设计采用四分之一波长的换能器和三圆锥、圆柱复合聚能器,设计思想新颖、结构轻便、工作可靠;利用该机开发的电解超声复合锉削工艺,综合地发挥了电解加工的高效率及超声波加工的良好表面质量的特点。