期刊文献+
共找到71篇文章
< 1 2 4 >
每页显示 20 50 100
PDF文件中关键信息的提取与组织方法研究 被引量:12
1
作者 陈云榕 刘立柱 丁志鸿 《计算机工程与设计》 CSCD 北大核心 2007年第7期1688-1690,共3页
在PDF的各种应用中,对于文档的理解与处理是非常重要的。首先要从文档中提取相关的关键词和短语,以便于在文档内部或外部建立超链接,方便建立电子文档。因此提出了一种新的方法,将关键信息(关键性的单词、词组或区域)从PDF文件中提取出... 在PDF的各种应用中,对于文档的理解与处理是非常重要的。首先要从文档中提取相关的关键词和短语,以便于在文档内部或外部建立超链接,方便建立电子文档。因此提出了一种新的方法,将关键信息(关键性的单词、词组或区域)从PDF文件中提取出来,经过组织后,保存在称为KIU的文件中,这样可以在实际上不接触PDF文件的情况下,自动生成超链接。分区域的方法有利于提取过程,找到文本的位置和范围后,可以借助于光学字符识别(OCR)软件来提取文本中的关键性词语或词组。 展开更多
关键词 pdf文件 关键信息 文本提取 标准通用置标语言 超链接
在线阅读 下载PDF
PDF文件信息的抽取与分析 被引量:21
2
作者 李珍 田学东 《计算机应用》 CSCD 北大核心 2003年第12期145-147,共3页
PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细... PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细的讨论。这将有助于根据需要进一步抽取PDF文件信息。 展开更多
关键词 信息抽取 pdf文件 文本信息分析
在线阅读 下载PDF
方正书版大样转双层PDF文件的实现方法 被引量:7
3
作者 艾红 徐泽智 章丽萍 《武汉理工大学学报(信息与管理工程版)》 CAS 2011年第2期214-216,235,共4页
概述了方正书版大样转PDF文件方法的优缺点。根据科技期刊开放存取以及复制、检索的需要,提出一种用ps22pdf、Foxit PDF Editor等软件实现方正大样转双层PDF文件的新方法,所生成的PDF文件具有精确重现原文、能复制原文本和全文检索等功... 概述了方正书版大样转PDF文件方法的优缺点。根据科技期刊开放存取以及复制、检索的需要,提出一种用ps22pdf、Foxit PDF Editor等软件实现方正大样转双层PDF文件的新方法,所生成的PDF文件具有精确重现原文、能复制原文本和全文检索等功能,为科技期刊的开放存取提供了一种新的实现手段。 展开更多
关键词 方正书版大样 双层pdf文件 文本型pdf 图像型pdf
在线阅读 下载PDF
方正书版文件转换成PDF文件的若干方法比较 被引量:9
4
作者 王影 周菁菁 《出版科学》 CSSCI 北大核心 2012年第5期46-49,共4页
介绍多种方正书版文件转换PDF的方法,从转换条件和适用范围、转换效率、转换后文件尺寸、文件质量等方面对其中四种方法进行对比分析。结果表明:书版2008直接输出法、书版大样—标准PS-PDF法的转换效率高、转换质量好,可实现期刊社与作... 介绍多种方正书版文件转换PDF的方法,从转换条件和适用范围、转换效率、转换后文件尺寸、文件质量等方面对其中四种方法进行对比分析。结果表明:书版2008直接输出法、书版大样—标准PS-PDF法的转换效率高、转换质量好,可实现期刊社与作者的无障碍沟通及数字出版和网络出版的要求。研究结果为期刊社在众多转换方法中选择适合自身需求、软件资源和经济实力的方案提供参考,有助于推动期刊社的数字化和网络化进程。 展开更多
关键词 pdf文件 方正书版 转换 科技期刊
在线阅读 下载PDF
基于期刊在线系统的稿件录用证明PDF文件制作 被引量:2
5
作者 许育彬 席美丽 +1 位作者 华千勇 周桂莲 《编辑学报》 CSSCI 北大核心 2018年第3期271-271,共1页
采用Photoshop等图形处理软件抠出期刊编辑部印章,并保存为无背景的PNG格式文件,并以"衬于文字下方"的版式将其插入到基于期刊在线系统生成的稿件录用证明Word文件中,再将Word文件转换成PDF文件,设置权限后通过E-mail等网络... 采用Photoshop等图形处理软件抠出期刊编辑部印章,并保存为无背景的PNG格式文件,并以"衬于文字下方"的版式将其插入到基于期刊在线系统生成的稿件录用证明Word文件中,再将Word文件转换成PDF文件,设置权限后通过E-mail等网络途径发给作者。此方法具有安全可靠、速度快、成本低等优点。 展开更多
关键词 期刊在线系统 稿件 录用证明 pdf文件
原文传递
中文PDF文档数字水印算法 被引量:8
6
作者 张秋余 余冬梅 管伟 《计算机工程与设计》 CSCD 北大核心 2007年第24期5983-5984,5987,共3页
针对文本文档的真实性、完整性和版权保护问题,通过分析PDF文档和Postscript页面描述文件工作机制原理,提出一种专门针对中文PDF文档的数字水印算法。将根据原始文档字符特征码而生成的水印信息嵌入到文档字符间距中,从而实现了对文档... 针对文本文档的真实性、完整性和版权保护问题,通过分析PDF文档和Postscript页面描述文件工作机制原理,提出一种专门针对中文PDF文档的数字水印算法。将根据原始文档字符特征码而生成的水印信息嵌入到文档字符间距中,从而实现了对文档内容的保护。实验结果表明,利用该算法使得中文PDF文档具有了良好的防篡改性。 展开更多
关键词 数字水印 文本认证 pdf文档 PS文件 哈德码变换
在线阅读 下载PDF
PDF阅读器的设计与实现 被引量:10
7
作者 李强 刘时进 《计算机工程与设计》 CSCD 北大核心 2010年第7期1635-1638,共4页
为有效提取PDF(portable document format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能扩展、显示4个单元的PDF阅读器的实现模型。基于PDF文件结构特点,提出了忽略次要信息定位关键位置的解析思路。在此基础... 为有效提取PDF(portable document format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能扩展、显示4个单元的PDF阅读器的实现模型。基于PDF文件结构特点,提出了忽略次要信息定位关键位置的解析思路。在此基础上,针对FlateDecode、DCTDecode和CCITTFaxDecode这3种过滤器处理的数据流,给出了详细的解决方案,然后对PDF页面内容进行两次解析,设计相应的文字图形等数据结构保存结果,最后对数据利用和功能扩展进行了讨论。通过实验结果表明,该模型能较好地实现PDF信息提取和显示,有利于PDF在中文信息处理领域中的进一步开发利用。 展开更多
关键词 可移植文档格式 阅读器 文件解析 图像提取 信息处理
在线阅读 下载PDF
PDF在编辑工作中的应用 被引量:31
8
作者 张红林 胡昌平 《编辑学报》 CSSCI 北大核心 2001年第5期284-286,共3页
PDF是近年流行于互联网上的文件交换格式 ,它能保持原文件的排版格式和创建风格 ,能高保真压缩 ,可不依赖原创应用程序和操作平台显示和打印。PDF适宜传送编辑校样和广告图文 。
关键词 pdf 审稿 校对 文件传输 应用 编辑工作 学术期刊
在线阅读 下载PDF
一种将数字地图转换成PDF文件的方法 被引量:4
9
作者 邓术军 刘真 王晓理 《测绘科学技术学报》 北大核心 2001年第2期150-153,共4页
介绍了一种将数字地图转化成PDF文件的方法 ,该方法以PostScript语言描述的地图符号库为基础 ,将数字地图用PostScript语言的操作符进行描述 ,生成PS文件 ,再用AcrobatDistiller将其转换成PDF文件。
关键词 pdf文件 POSTSCRIPT语言 PostScript符号库 网络出版
在线阅读 下载PDF
利用方正小样与PDF文件的无缝对接实现远程校对 被引量:11
10
作者 李德华 《编辑学报》 CSSCI 北大核心 2008年第6期545-546,共2页
利用方正书版软件处理方正小样文件,利用方正PSPPRO输出软件的虚拟打印机功能将方正大样文件转换成PDF文件,以及Adobe Acrobat软件对PDF格式文件合并创建和注释等功能,以实现方正小样文件与PDF文件的无缝对接,并实现作者的远程校对,从... 利用方正书版软件处理方正小样文件,利用方正PSPPRO输出软件的虚拟打印机功能将方正大样文件转换成PDF文件,以及Adobe Acrobat软件对PDF格式文件合并创建和注释等功能,以实现方正小样文件与PDF文件的无缝对接,并实现作者的远程校对,从而提高作者校对的质量和效率。 展开更多
关键词 方正小样文件 pdf文件 无缝对接 远程校对
在线阅读 下载PDF
一种基于复合特征的恶意PDF检测方法 被引量:2
11
作者 李国 黄永健 +2 位作者 王静 徐俊洁 王鹏 《现代电子技术》 北大核心 2020年第2期45-48,52,共5页
为了提高特征有效性和扩大检测范围,提出在提取PDF文件的恶意结构特征的基础上再提取JavaScript的恶意特征;为了减少检测时间,提出在特征提取前,增加基于信息熵差异的预检测过程。先利用恶意PDF和良性PDF的信息熵差异筛选出可疑PDF文件... 为了提高特征有效性和扩大检测范围,提出在提取PDF文件的恶意结构特征的基础上再提取JavaScript的恶意特征;为了减少检测时间,提出在特征提取前,增加基于信息熵差异的预检测过程。先利用恶意PDF和良性PDF的信息熵差异筛选出可疑PDF文件和良性PDF文件;然后在检测过程中,提取可疑PDF文件的结构和JavaScript特征;再利用C5.0决策树算法进行分类;最后,通过实验检测,验证了提出的方法对恶意PDF文件检测有效。实验结果表明,与PJScan,PDFMS等模型做对比,该方法检测率比PJScan高27.79%,时间消耗低390 s,误检率比PDFMS低0.7%,时间消耗低473 s,综合性能更优。 展开更多
关键词 恶意pdf文档 文档检测 文件筛选 文件特征提取 信息熵预检 实验验证
在线阅读 下载PDF
利用PDF虚拟打印机快速处理科技期刊插图 被引量:10
12
作者 熊水斌 《编辑学报》 CSSCI 北大核心 2011年第2期166-168,共3页
为高质量地将作者提供的插图转换为科技期刊排版系统(方正书版)支持的格式,利用PDF虚拟打印机,将插图转换为PDF文档,再在Photoshop中读取PDF文档,将插图转换为tif等方正排版系统支持的图形格式,从而实现基于Photo-shop的科技期刊插图处... 为高质量地将作者提供的插图转换为科技期刊排版系统(方正书版)支持的格式,利用PDF虚拟打印机,将插图转换为PDF文档,再在Photoshop中读取PDF文档,将插图转换为tif等方正排版系统支持的图形格式,从而实现基于Photo-shop的科技期刊插图处理,满足科技期刊高质量图文混排的要求。 展开更多
关键词 虚拟打印机 pdf文档 插图 方正书版 科技期刊
原文传递
PDF文件文本内容提取研究 被引量:16
13
作者 张秀秀 张立峰 《科技情报开发与经济》 2008年第36期118-120,共3页
介绍了PDF的文件结构,在此基础上,给出了PDF文件的解析流程,以及从解析后的内容流中提取文本内容的方法。
关键词 pdf 文件解析 文本提取
在线阅读 下载PDF
将方正书版10.0小样文件转换为文本型PDF文件的简易方法 被引量:5
14
作者 李宗红 《渭南师范学院学报》 2010年第5期58-60,共3页
介绍两种将方正书版10.0小样文件转换为文本型PDF文件的具体方法,并对操作实践中遇到的问题以及解决方法予以阐述.通过比较,建议使用方正书版10.0排版的编辑部利用c2pfree 1.6软件,将CEB文件直接转换为文本型PDF文件,该文本型PDF文件尺... 介绍两种将方正书版10.0小样文件转换为文本型PDF文件的具体方法,并对操作实践中遇到的问题以及解决方法予以阐述.通过比较,建议使用方正书版10.0排版的编辑部利用c2pfree 1.6软件,将CEB文件直接转换为文本型PDF文件,该文本型PDF文件尺寸很小,利于网络传送. 展开更多
关键词 方正书版10.0 BookView c2pfree1.6 pdf文件
在线阅读 下载PDF
一种方正PS文件转换为数字化PDF文档的方法 被引量:7
15
作者 朱雪莲 李志伟 《泉州师范学院学报》 2012年第4期13-16,共4页
利用方正书版排版系统和开源应用程序PDF Creator,通过适当的设置,将含有文字、数学公式、表格和各种复杂图片等方正大样PS文件转换成高清晰的PDF文档.该方法具有操作简便、生成的文件小、清晰度高的特点.由于该方法所生成的PDF文件是... 利用方正书版排版系统和开源应用程序PDF Creator,通过适当的设置,将含有文字、数学公式、表格和各种复杂图片等方正大样PS文件转换成高清晰的PDF文档.该方法具有操作简便、生成的文件小、清晰度高的特点.由于该方法所生成的PDF文件是数字化的,因此可以直接在文档上进行复制、编校、修改、审读、打印等编辑工作,适用在线编校、审读和期刊的数字化上网. 展开更多
关键词 pdf格式 PS文件 数字化 方正排版 格式转换
在线阅读 下载PDF
方正书版系统PDF文档转化结果的利弊分析 被引量:2
16
作者 李哲峰 《宝鸡文理学院学报(自然科学版)》 CAS 2014年第1期66-72,共7页
目的研究方正书版系统排版结果转化为PDF文档对编辑出版工作带来的利与弊,充分认识其内在不足,以便合理使用。方法以不同的方正书版系统排版结果转化为PDF文档的方法和途径为例,对其转化结果的利与弊进行总结分析。结果通过不同途径使... 目的研究方正书版系统排版结果转化为PDF文档对编辑出版工作带来的利与弊,充分认识其内在不足,以便合理使用。方法以不同的方正书版系统排版结果转化为PDF文档的方法和途径为例,对其转化结果的利与弊进行总结分析。结果通过不同途径使方正书版系统的排版结果转化为PDF文档,因为转化途径各异,转化结果存在很大差别,但也有一些共性,对于数字化编辑与出版有利也有弊,扬长避短,加以合理利用,会对编辑出版工作带来便捷,但是其功能缺陷的致命弱点却不可忽视。结论充分认识不同途径得到的转化结果自身存在的利与弊,根据其目的与使用场合的不同,扬长避短,选择性区别使用至关重要。 展开更多
关键词 方正书版 pdf文档转化 pdf文档功能
在线阅读 下载PDF
关于利用PDF文档开发网络学习资源的探讨 被引量:2
17
作者 刘帅 柯秀文 《商丘职业技术学院学报》 2008年第5期48-49,共2页
在信息化教育阶段,网络学习资源具有激发学习者的学习兴趣,引发学习者高层次的思考,实现个性化学习的功能.PDF文档作为常见的电子文档格式之一,有着许多其他电子文档格式无法相比的优点.
关键词 pdf文档 WEB数据库 网络学习资源
在线阅读 下载PDF
把PDF文档应用于电子排版领域 被引量:4
18
作者 于晓燕 《自动化技术与应用》 2005年第3期54-55,共2页
本文描述了怎样把PDF文档应用于电子排版系统中 ,然后讨论了把电子排版系统中的文字、图象转化为PDF文档的几种方法 ,同时介绍了其中常用软件的制作方法。
关键词 pdf文档 电子排版系统
在线阅读 下载PDF
面向隐私保护的相似PDF文件外包自动合并方法
19
作者 周勇 翁锟源 +2 位作者 程航 严娜招 黄芹健 《福州大学学报(自然科学版)》 CAS 北大核心 2021年第6期732-738,共7页
传统相似PDF合并方法不仅费时、费力,而且准确性易受限于主观判断,且在线合并方式存在用户PDF文件明文内容泄露风险,易导致数据安全和用户个人隐私问题.为了解决以上问题,提出一种面向隐私保护的相似PDF文件外包自动合并方法.该方法根据... 传统相似PDF合并方法不仅费时、费力,而且准确性易受限于主观判断,且在线合并方式存在用户PDF文件明文内容泄露风险,易导致数据安全和用户个人隐私问题.为了解决以上问题,提出一种面向隐私保护的相似PDF文件外包自动合并方法.该方法根据PDF文件的结构特点并利用相似哈希函数提取文件特征信息,然后通过计算汉明距离来快速判断PDF文件间的相似度,继而引入秘密分享技术实现相似PDF文件的安全外包自动合并.实验结果表明,所提出的方法能够实现相似PDF文件合并,并确保外包待合并数据的安全性. 展开更多
关键词 隐私保护 秘密分享 pdf文件 相似哈希
在线阅读 下载PDF
嵌入式系统中PDF格式的高效压缩算法 被引量:1
20
作者 陶冶 慕春棣 《计算机工程》 EI CAS CSCD 北大核心 2005年第13期72-74,共3页
提出的算法可以解决在嵌入式系统上显示含有文本和图像的PDF文件的要求。该算法先将PDF文件分解成图像和文本两部分,然后依照原文件的显示格式将分解出来的元素合成一种新的格式文件,最终实现将PC机上的PDF格式文件转化为适合在嵌入式... 提出的算法可以解决在嵌入式系统上显示含有文本和图像的PDF文件的要求。该算法先将PDF文件分解成图像和文本两部分,然后依照原文件的显示格式将分解出来的元素合成一种新的格式文件,最终实现将PC机上的PDF格式文件转化为适合在嵌入式系统上正确显示的格式。该算法缩减了文件的大小,使之适应于嵌入式系统有限的硬件资源,也扩大了嵌入式系统的文件来源。 展开更多
关键词 嵌入式系统 文件格式 pdf 压缩算法
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部