期刊文献+
共找到102篇文章
< 1 2 6 >
每页显示 20 50 100
基于大模型的PDF文档转换实践
1
作者 李兴福 《科学与信息化》 2025年第15期35-38,共4页
PDF(便携式文档格式)是由Adobe公司在1993年推出的文件格式,其可以在任意设备或操作系统上都能保持一致的排版和格式,是在诸多领域广泛使用的标准化文档格式。然而,在众多特定应用场景下,用户对PDF文件的处理往往需要进行格式转换。随... PDF(便携式文档格式)是由Adobe公司在1993年推出的文件格式,其可以在任意设备或操作系统上都能保持一致的排版和格式,是在诸多领域广泛使用的标准化文档格式。然而,在众多特定应用场景下,用户对PDF文件的处理往往需要进行格式转换。随着人工智能技术的发展,利用大模型技术提供的先进文本处理能力,能够探求全新的PDF文档转换解决方案,推动相关技术与工具的发展变革,进而提升PDF转换的准确性与效率。 展开更多
关键词 大模型 pdf文档转换 OCR MinerU
在线阅读 下载PDF
基于CNN-BiLSTM-CBAM的多特征融合恶意PDF文档检测方法
2
作者 王友贺 孙奕 《信息网络安全》 北大核心 2025年第10期1579-1588,共10页
为应对现有恶意PDF文档检测方法忽视特征之间语义关系以及局限于单一类型的特征分析等问题,文章提出一种检测方案,将CNN-BiLSTM-CBAM的模型和多特征融合应用于恶意PDF文档检测中。该方法不仅融合了静态分析中提取的常规信息和结构信息,... 为应对现有恶意PDF文档检测方法忽视特征之间语义关系以及局限于单一类型的特征分析等问题,文章提出一种检测方案,将CNN-BiLSTM-CBAM的模型和多特征融合应用于恶意PDF文档检测中。该方法不仅融合了静态分析中提取的常规信息和结构信息,还结合了动态分析捕获的API序列信息,构建了一个全面多维的特征集。首先,该模型利用卷积神经网络提取特征集中的局部特征;然后,利用双向长短时记忆(BiLSTM)网络捕获特征间的依赖性和上下文语义关系特征,通过卷积块注意力模块(CBAM)为不同特征分配不同的权重,筛选出较具区分性的关键特征;最后,利用Softmax分类器计算检测结果。实验结果表明,与现有方法相比,该模型在准确率、召回率和F1分数等关键性能指标上均展现出显著优势,有效提升了恶意PDF文档的检测性能。 展开更多
关键词 恶意pdf文档检测 多特征融合 卷积块注意力模块 双向长短时记忆网络
在线阅读 下载PDF
基于图神经网络与深度学习的PDF文档检测模型 被引量:1
3
作者 雷靖玮 伊鹏 陈祥 《计算机工程与设计》 北大核心 2024年第2期356-366,共11页
针对传统PDF文档检测误报率过高的问题,提出一种基于图神经网络与深度学习的检测模型DGNN。通过收集文档运行时各线程产生的系统调用数据生成相应的系统调用图,运用所提基于H指数的图采样策略缩减数据规模;采样后的子图作为模型DGNN的输... 针对传统PDF文档检测误报率过高的问题,提出一种基于图神经网络与深度学习的检测模型DGNN。通过收集文档运行时各线程产生的系统调用数据生成相应的系统调用图,运用所提基于H指数的图采样策略缩减数据规模;采样后的子图作为模型DGNN的输入,借助图卷积网络提取关联关系的同时,利用深度学习提取系统调用对的属性特征并完成特征融合,通过系统调用图的性质判别完成检测。实验结果表明,与其它方法相比,该模型特征提取与训练时间短,有效提高了PDF文档的检测效果。 展开更多
关键词 pdf文档检测 图神经网络 深度学习 图采样 特征分析 性能评价 系统调用
在线阅读 下载PDF
基于PDF文档结构的数字水印算法 被引量:16
4
作者 钟征燕 郭燕慧 徐国爱 《计算机应用》 CSCD 北大核心 2012年第10期2776-2778,2782,共4页
在数字产品日益普及的今天,PDF文档的版权保护问题已成为信息安全领域研究的热点。通过分析PDF文档的结构及相关数字水印算法,针对当前一些大容量文本水印算法存在增加文档大小的缺陷,提出了一种基于PDF文档结构的数字水印算法。该算法... 在数字产品日益普及的今天,PDF文档的版权保护问题已成为信息安全领域研究的热点。通过分析PDF文档的结构及相关数字水印算法,针对当前一些大容量文本水印算法存在增加文档大小的缺陷,提出了一种基于PDF文档结构的数字水印算法。该算法利用行末标识符不会在文档中显示的特性,通过等量替换PDF文档中具有固定格式的交叉引用表的行末标识符,来实现水印信息的间接嵌入。实验结果表明,该算法水印容量能满足数字版权保护的要求,隐蔽性好,能抵抗统计等攻击。 展开更多
关键词 数字水印 pdf文档 文档结构 数字版权保护 行末标识符 信息隐藏
在线阅读 下载PDF
中文PDF文档数字水印算法 被引量:8
5
作者 张秋余 余冬梅 管伟 《计算机工程与设计》 CSCD 北大核心 2007年第24期5983-5984,5987,共3页
针对文本文档的真实性、完整性和版权保护问题,通过分析PDF文档和Postscript页面描述文件工作机制原理,提出一种专门针对中文PDF文档的数字水印算法。将根据原始文档字符特征码而生成的水印信息嵌入到文档字符间距中,从而实现了对文档... 针对文本文档的真实性、完整性和版权保护问题,通过分析PDF文档和Postscript页面描述文件工作机制原理,提出一种专门针对中文PDF文档的数字水印算法。将根据原始文档字符特征码而生成的水印信息嵌入到文档字符间距中,从而实现了对文档内容的保护。实验结果表明,利用该算法使得中文PDF文档具有了良好的防篡改性。 展开更多
关键词 数字水印 文本认证 pdf文档 PS文件 哈德码变换
在线阅读 下载PDF
一种新的基于PDF文档结构的信息隐藏算法 被引量:10
6
作者 刘友继 孙星明 罗纲 《计算机工程》 EI CAS CSCD 北大核心 2006年第17期230-232,共3页
通过分析格式化文件PDF(PortableDocumentFormat)文档的数据结构,提出了一种新的基于PDF文档结构的大容量信息隐藏算法。将秘密信息预处理后伪装成合法PDF对象的形式,以文件流的操作方式嵌入到载体文件中,并满足嵌入的信息不影响文件在... 通过分析格式化文件PDF(PortableDocumentFormat)文档的数据结构,提出了一种新的基于PDF文档结构的大容量信息隐藏算法。将秘密信息预处理后伪装成合法PDF对象的形式,以文件流的操作方式嵌入到载体文件中,并满足嵌入的信息不影响文件在阅读器、编辑器与打印机中的输出。实验实现了线性化PDF文档的信息隐藏与检测。理论分析与实验结果均表明,该算法具有较大的信息隐藏容量、很快的隐藏与检测速度及依赖于加密算法和密钥的安全性。 展开更多
关键词 信息隐藏 pdf文档 伪装数据
在线阅读 下载PDF
基于混合特征的恶意PDF文档检测 被引量:5
7
作者 杜学绘 林杨东 孙奕 《通信学报》 EI CSCD 北大核心 2019年第2期118-128,共11页
针对现有恶意PDF文档在检测方案存在特征顽健性差、易被逃避检测等问题,提出了一种基于混合特征的恶意PDF文档检测方法,采用动静态混合分析技术从文档中提取出其常规信息、结构信息以及API调用信息,并基于K-means算法设计了特征提取方法... 针对现有恶意PDF文档在检测方案存在特征顽健性差、易被逃避检测等问题,提出了一种基于混合特征的恶意PDF文档检测方法,采用动静态混合分析技术从文档中提取出其常规信息、结构信息以及API调用信息,并基于K-means算法设计了特征提取方法,聚合出表征文档安全性的核心混合特征,从而提高了特征的顽健性。在此基础上,利用随机森林算法构建分类器并设计实验,对所提方案的检测性能以及抵抗模拟攻击的能力进行了探讨。 展开更多
关键词 恶意pdf文档 混合特征 机器学习 检测
在线阅读 下载PDF
恶意PDF文档检测技术研究进展 被引量:6
8
作者 林杨东 杜学绘 孙奕 《计算机应用研究》 CSCD 北大核心 2018年第8期2251-2255,共5页
针对PDF的漏洞及相应攻击手段日新月异,传统的恶意PDF文档检测技术难以应对各种新型威胁。目前针对恶意PDF文档检测的研究已取得一定成果,为了更深入地解决该技术存在的不足,采用文献分析方法,首先讨论了必要性、简述了其相关概念和检... 针对PDF的漏洞及相应攻击手段日新月异,传统的恶意PDF文档检测技术难以应对各种新型威胁。目前针对恶意PDF文档检测的研究已取得一定成果,为了更深入地解决该技术存在的不足,采用文献分析方法,首先讨论了必要性、简述了其相关概念和检测基本框架;其次针对其分析技术的不同将现有方案进行分类,从适用范围、检测效果、检测效率等多个方面进行对比分析。最后归纳了该领域当前的热点和发展前景。 展开更多
关键词 pdf 文档检测 静态分析 动态分析
在线阅读 下载PDF
基于Domino PKI和PDF文档的电子印章系统 被引量:4
9
作者 董相志 柳岸 +1 位作者 陈伟波 李浚 《计算机工程》 CAS CSCD 北大核心 2007年第19期253-255,共3页
电子印章在我国电子政务和电子商务领域正发挥着越来越重要的作用,基于数字签名和数字水印的电子印章解决方案还在发展完善中。该文遵循Domino—PDF—DSA这一技术路线,综合运用Lotus平台的PKI技术和PDF的数字签名技术,借助Notes C API和... 电子印章在我国电子政务和电子商务领域正发挥着越来越重要的作用,基于数字签名和数字水印的电子印章解决方案还在发展完善中。该文遵循Domino—PDF—DSA这一技术路线,综合运用Lotus平台的PKI技术和PDF的数字签名技术,借助Notes C API和PDF API作二次开发,将电子印章图像作为Notes ID文件的扩展部分,在Lotus平台上实现了对PDF文档加盖电子印章的应用系统。 展开更多
关键词 电子印章 DOMINO PKI pdf文档 数字签名算法
在线阅读 下载PDF
基于网络发行的PDF文档版权保护系统的设计与实现 被引量:5
10
作者 张璐 胡凯 胡建平 《微电子学与计算机》 CSCD 北大核心 2008年第7期108-111,共4页
针对目前文档版权管理领域的需求,提出了基于网络发行的PDF文档版权保护整体解决方案.在系统中,采用了一种新的基于机器指纹的版权保护方法,使内容许可证与用户的机器指纹及用户的个人信息绑定.PDF文档内容采用高强度的对称密钥算法加密... 针对目前文档版权管理领域的需求,提出了基于网络发行的PDF文档版权保护整体解决方案.在系统中,采用了一种新的基于机器指纹的版权保护方法,使内容许可证与用户的机器指纹及用户的个人信息绑定.PDF文档内容采用高强度的对称密钥算法加密,客户端采用Acrobat插件开发技术来实现,最终PDF文档得到了内容级的加密保护,并且文档只能在本地按照内容许可证的要求进行解密及可控使用,从而在整个数字内容生命周期实行版权保护. 展开更多
关键词 数字版权管理 pdf文档保护 Acrobat插件开发 机器指纹
在线阅读 下载PDF
基于结构路径的恶意PDF文档检测 被引量:2
11
作者 陈亮 陈性元 +1 位作者 孙奕 杜学绘 《计算机科学》 CSCD 北大核心 2015年第2期90-94,共5页
恶意PDF文档依然是网络安全中的威胁,甚至造成了许多重大的安全事故。现有检测方法主要分析恶意代码提取及仿真执行两个方面,检测效率不高,缺乏对PDF文档的针对性。在分析PDF文档结构特性的基础上,定义文档结构路径,提出了一种基于恶意... 恶意PDF文档依然是网络安全中的威胁,甚至造成了许多重大的安全事故。现有检测方法主要分析恶意代码提取及仿真执行两个方面,检测效率不高,缺乏对PDF文档的针对性。在分析PDF文档结构特性的基础上,定义文档结构路径,提出了一种基于恶意和正常文档之间潜在的结构差异特性的检测方法。大量实验数据结果表明,本方法在检测准确率和检测速率方面都有不错的表现。 展开更多
关键词 恶意软件检测 pdf文档 结构路径 决策树
在线阅读 下载PDF
面向PDF文档的安全电子邮件系统 被引量:2
12
作者 郭文强 赵玉章 韩莉英 《计算机应用研究》 CSCD 北大核心 2007年第2期151-154,共4页
给出一种利用信息安全、信息加密和数字认证等技术的面向PDF文档的安全电子邮件系统,其核心基本思想是通过客户机、服务器之间的请求/应答机制,通过身份认证并在网络上加密传输敏感数据,使得用户通过简单的交互操作就可以达到其所需的... 给出一种利用信息安全、信息加密和数字认证等技术的面向PDF文档的安全电子邮件系统,其核心基本思想是通过客户机、服务器之间的请求/应答机制,通过身份认证并在网络上加密传输敏感数据,使得用户通过简单的交互操作就可以达到其所需的信息保护目的。系统的应用层面包括身份认证、数据加密发布、数据安全传输、安全数据查询检索、信息安全存储服务和Web资源的组织等技术,该系统已在实际项目上获得了应用,产生了较好的实际效果。 展开更多
关键词 安全电子邮件 身份认证 数据加密 安全传输 pdf文档
在线阅读 下载PDF
基于PDF文档作为掩体的信息隐写方法 被引量:2
13
作者 钟尚平 陈铁睿 《计算机工程》 EI CAS CSCD 北大核心 2006年第3期161-163,共3页
目前应用极为广泛的PDF文档,发现了其中存在可以用作信息隐写的隐密信道。通过采用以一定的冗余换取安全性的策略,并使用基于混沌模型的随机选择隐写单元的方法,使隐写系统满足Kerckhoffs原理。分析和实验结果表明,该文隐写方法可嵌入... 目前应用极为广泛的PDF文档,发现了其中存在可以用作信息隐写的隐密信道。通过采用以一定的冗余换取安全性的策略,并使用基于混沌模型的随机选择隐写单元的方法,使隐写系统满足Kerckhoffs原理。分析和实验结果表明,该文隐写方法可嵌入任意大小的信息,并保持在PDF阅读器中显示的透明性,具有较好的简单实用性。 展开更多
关键词 pdf文档 隐写术 隐密信道 Kerckhoffs原理
在线阅读 下载PDF
应用Ghostscript和GSview实现方正书版PS文件向PDF文件的转换 被引量:11
14
作者 周雪莹 《编辑学报》 CSSCI 北大核心 2010年第5期454-456,共3页
为解决编辑工作中远程校对和期刊电子化的问题,对Ghostscript和GSview软件作简要介绍,阐述利用这2种软件将方正书版PS文件转换为PDF文件的方法。所用到的Ghost-Script和GSview均为正版免费软件,获取方便,占硬盘空间小,转换速度快,生成的... 为解决编辑工作中远程校对和期刊电子化的问题,对Ghostscript和GSview软件作简要介绍,阐述利用这2种软件将方正书版PS文件转换为PDF文件的方法。所用到的Ghost-Script和GSview均为正版免费软件,获取方便,占硬盘空间小,转换速度快,生成的PDF文件精度高、容量小,可以很好地满足稿件远程校对和制作光盘型、网络型期刊的需要。 展开更多
关键词 PS文件 pdf文件 方正书版 Ghostscript GSview 转换
原文传递
面向恶意PDF文档分类的对抗样本生成方法研究 被引量:1
15
作者 刘超 娄尘哲 +2 位作者 喻民 姜建国 黄伟庆 《信息安全学报》 CSCD 2023年第5期14-26,共13页
通过恶意文档来传播恶意软件在现代互联网中是非常普遍的,这也是众多机构面临的最高风险之一。PDF文档是全世界应用最广泛的文档类型,因此由其引发的攻击数不胜数。使用机器学习方法对恶意文档进行检测是流行且有效的途径,在面对攻击者... 通过恶意文档来传播恶意软件在现代互联网中是非常普遍的,这也是众多机构面临的最高风险之一。PDF文档是全世界应用最广泛的文档类型,因此由其引发的攻击数不胜数。使用机器学习方法对恶意文档进行检测是流行且有效的途径,在面对攻击者精心设计的样本时,机器学习分类器的鲁棒性有可能暴露一定的问题。在计算机视觉领域中,对抗性学习已经在许多场景下被证明是一种有效的提升分类器鲁棒性的方法。对于恶意文档检测而言,我们仍然缺少一种用于针对各种攻击场景生成对抗样本的综合性方法。在本文中,我们介绍了PDF文件格式的基础知识,以及有效的恶意PDF文档检测器和对抗样本生成技术。我们提出了一种恶意文档检测领域的对抗性学习模型来生成对抗样本,并使用生成的对抗样本研究了多检测器假设场景的检测效果(及逃避有效性)。该模型的关键操作为关联特征提取和特征修改,其中关联特征提取用于找到不同特征空间之间的关联,特征修改用于维持样本的稳定性。最后攻击算法利用基于动量迭代梯度的思想来提高生成对抗样本的成功率和效率。我们结合一些具有信服力的数据集,严格设置了实验环境和指标,之后进行了对抗样本攻击和鲁棒性提升测试。实验结果证明,该模型可以保持较高的对抗样本生成率和攻击成功率。此外,该模型可以应用于其他恶意软件检测器,并有助于检测器鲁棒性的优化。 展开更多
关键词 恶意pdf文档 对抗样本 文档分类 样本生成 鲁棒性
在线阅读 下载PDF
采用双层PDF形式将方正书版文件制作为可检索式PDF文件 被引量:8
16
作者 周雪莹 《编辑学报》 CSSCI 北大核心 2012年第6期592-594,共3页
以方正书版文件转换所得的几类常见的PDF文件为素材,基于OCR技术和PDF文件编辑技术,探索出2类制作可检索式双层PDF文件的方法。用Readiris法制作的Image-Text型双层PDF操作简便、文件很小、可生成索引书签;用FoxitPDF Editor法制作的Gra... 以方正书版文件转换所得的几类常见的PDF文件为素材,基于OCR技术和PDF文件编辑技术,探索出2类制作可检索式双层PDF文件的方法。用Readiris法制作的Image-Text型双层PDF操作简便、文件很小、可生成索引书签;用FoxitPDF Editor法制作的Graphic-Text型双层PDF清晰度高、文本精准。这2种双层PDF文件均可以很好地满足网络期刊文献检索的需要。 展开更多
关键词 双层pdf文件 检索 OCR技术 Readiris FOXIT pdf EDITOR
原文传递
PDF文档中JPEG图像的自动提取技术研究 被引量:2
17
作者 陈云榕 刘立柱 叶晗 《信息工程大学学报》 2007年第2期213-216,共4页
对PDF文档的处理常常要涉及到文本和图像的提取。文章在深入分析PDF格式和其中采用的各种压缩算法的基础上,实现了PDF文档中JPEG图像的自动提取。算法结合PDF文档结构和页面树,按照图像在页面中出现的顺序,对各页面中含有的图像对象进... 对PDF文档的处理常常要涉及到文本和图像的提取。文章在深入分析PDF格式和其中采用的各种压缩算法的基础上,实现了PDF文档中JPEG图像的自动提取。算法结合PDF文档结构和页面树,按照图像在页面中出现的顺序,对各页面中含有的图像对象进行准确定位,依次提取其中的图像压缩数据,并根据采用压缩算法的不同,对压缩数据进行筛选,最后得到保存为JPEG格式的图像。算法可以很好地应用于由任何途径生成的各种类型的PDF文档。 展开更多
关键词 pdf文档 JPEG图像 文档结构 页面树 压缩算法
在线阅读 下载PDF
基于Pdf格式开发多媒体电子地图集技术探讨 被引量:4
18
作者 张东升 欧仁和 +1 位作者 王剑敏 刘越 《测绘与空间地理信息》 2012年第10期61-63,共3页
介绍了电子地图和pdf格式文档的基本概念,并对应用Pdf格式开发电子地图集相关技术问题进行了探讨,对电子地图的功能进行了阐述。
关键词 电子地图集 地理信息系统 pdf文件
在线阅读 下载PDF
基于C# iTextSharp类库PDF文档生成技术的研究与应用 被引量:6
19
作者 李宽 张志红 《昆明学院学报》 2011年第3期68-75,共8页
利用WEB技术可以方便地实现数据共享及跨平台的应用系统.为了能在WEB应用系统中生成跨平台的打印报表,可采用PDF文件格式进行报表打印操作.提出了在ASP.NET 2.0环境下使用iTextSharp类库生成PDF文件的方法,详细介绍了PDF文件中不同文本... 利用WEB技术可以方便地实现数据共享及跨平台的应用系统.为了能在WEB应用系统中生成跨平台的打印报表,可采用PDF文件格式进行报表打印操作.提出了在ASP.NET 2.0环境下使用iTextSharp类库生成PDF文件的方法,详细介绍了PDF文件中不同文本及表格样式的生成步骤.并结合WEB应用系统,对一种通用报表生成类的设计与实现方法进行了研究,证明了PDF文档生成技术在实际系统开发中的应用价值. 展开更多
关键词 C# pdf文档 ITEXTSHARP 自动生成 打印控制
在线阅读 下载PDF
一种基于空格编码的PDF文本数字水印算法 被引量:3
20
作者 顾艳春 冯君婷 《佛山科学技术学院学报(自然科学版)》 CAS 2015年第1期76-80,87,共6页
提出一种基于空格编码和置乱技术的适用于PDF文档的文本数字水印算法。首先,将水印图像进行置乱变换;其次,将原PDF文档转换成PS文件,PS文件中保存有字符和位置信息。利用空格不可见的特点,在PS文件中叠加若干由空格组成的行,并利用空格... 提出一种基于空格编码和置乱技术的适用于PDF文档的文本数字水印算法。首先,将水印图像进行置乱变换;其次,将原PDF文档转换成PS文件,PS文件中保存有字符和位置信息。利用空格不可见的特点,在PS文件中叠加若干由空格组成的行,并利用空格的位置信息来嵌入水印信息值及水印的位置信息值;最后,将PS文件转换为含有水印的PDF文档。实验结果表明,该算法具有较好的可视性和鲁棒性。 展开更多
关键词 信息隐藏 空格编码 置乱技术 文本数字水印 pdf文档
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部