期刊文献+
共找到5,692篇文章
< 1 2 250 >
每页显示 20 50 100
JavaScript混淆恶意代码检测方法 被引量:4
1
作者 王婷 牟永敏 +1 位作者 张志华 崔展齐 《计算机仿真》 北大核心 2021年第2期432-437,共6页
随着Web前端代码压缩与混淆工具的快速发展,浏览器需要执行的代码的体积减小,可读性大幅下降,同时也为恶意代码的隐藏提供了便利。为了解决混淆JavaScript代码中恶意代码片段的检测问题,以及找到混淆前后代码中函数的对应关系,通过对Jav... 随着Web前端代码压缩与混淆工具的快速发展,浏览器需要执行的代码的体积减小,可读性大幅下降,同时也为恶意代码的隐藏提供了便利。为了解决混淆JavaScript代码中恶意代码片段的检测问题,以及找到混淆前后代码中函数的对应关系,通过对JavaScript代码函数调用序列及函数调用的分析,研究基于函数调用序列和函数调用关系图的代码相似度,以及Google Closure Compiler的代码混淆方法。提出了一种基于函数调用信息的JavaScript混淆恶意代码检测方法。实验结果表明:上述方法可以有效检测出混淆前后JavaScript代码中函数的对应关系,对换名混淆具有鲁棒性,且检测复杂度低于通用的JavaScript反混淆工具。 展开更多
关键词 函数调用 代码混淆 恶意代码检测 代码相似度
在线阅读 下载PDF
JavaScript物联网系统实验设计
2
作者 申赞伟 刘彦博 +3 位作者 周越 阮林涛 张芮 张峰 《实验室研究与探索》 北大核心 2026年第1期110-115,共6页
传统物联网实验普遍存在底层架构复杂、操作流程烦琐的问题。为此,提出一种基于JavaScript编程语言实现物联网系统的动态前端页面,使用JavaScript技术栈的Node.js环境和Express框架在轻量级树莓派宿主机上搭建高可用性的Web服务器,使得... 传统物联网实验普遍存在底层架构复杂、操作流程烦琐的问题。为此,提出一种基于JavaScript编程语言实现物联网系统的动态前端页面,使用JavaScript技术栈的Node.js环境和Express框架在轻量级树莓派宿主机上搭建高可用性的Web服务器,使得前、后端开发都统一于JavaScript技术栈。通过树莓派串口模块与Johnny-Five框架,完成对传感器数据采集与执行器行为的控制。该系统充分发挥Node.js的异步特性,契合物联网数据流处理需求;Express与Johnny-Five等框架有效屏蔽了底层硬件细节,显著降低了实验的门槛,使学生可专注于逻辑功能设计。该系统实验功能丰富,贴近应用,有助于激发学生的学习兴趣、提高其综合实践能力。 展开更多
关键词 物联网 javascript技术栈 传感器 树莓派 实验教学
在线阅读 下载PDF
基于密文混淆的不经意传输协议
3
作者 李晓东 朱晓鹏 +2 位作者 张健毅 吴庸 窦一萌 《计算机工程》 北大核心 2026年第1期293-302,共10页
不经意传输(OT)协议是一种保护隐私的两方通信协议,也是构建安全多方计算的重要模块。该协议通常基于RSA(Rivest—Shamir—Adleman)或DH(Diffie—Hellman)密码系统来交换对称密钥,在消息的加密阶段使用对称密钥进行加密。然而,在现有的O... 不经意传输(OT)协议是一种保护隐私的两方通信协议,也是构建安全多方计算的重要模块。该协议通常基于RSA(Rivest—Shamir—Adleman)或DH(Diffie—Hellman)密码系统来交换对称密钥,在消息的加密阶段使用对称密钥进行加密。然而,在现有的OT协议中,多对公私钥生成以及数据计算非常耗时。在同一密文域中,采用双射函数对密文进行变换,可以确保密文解密后的不可区分性,同时减少计算量。在半诚实模型上,提出一种基于密文混淆的OT协议框架,并在该框架下基于RSA和DH实例化OT协议。相较基于RSA的加密方案,所提协议只需要一对公私钥,同时,当公私钥减少为一对时,接收方可以利用发送方数字证书中的公钥,实现具有身份认证功能的OT协议。对比基于DH密钥交换的OT协议,该协议具有数据传输量小、计算复杂度低的优势。实验结果表明,与现有OT协议相比,实例化的协议在密钥交换阶段的效率至少可提高30%。此外,该协议还可以用于隐私集合求交、混淆电路和OT扩展协议中的基础协议。 展开更多
关键词 不经意传输 双射函数 密文混淆 身份认证 安全多方计算
在线阅读 下载PDF
基于型式语法的外向型汉语学习词典易混淆词辨析模式研究——以“悲伤”“悲哀”“悲痛”为例
4
作者 李芳棋 杨玉玲 《辞书研究》 2026年第1期43-54,I0002,共13页
文章以“悲伤”“悲哀”“悲痛”为例,基于语料库和型式语法,从搭配入手,构建了面向专业型易混淆词辨析词典和通用型外向型汉语学习词典的汉语易混淆词辨析模式。该模式涉及词典释义、型式、例句、辨析专栏四个维度,具体内容有:以搭配... 文章以“悲伤”“悲哀”“悲痛”为例,基于语料库和型式语法,从搭配入手,构建了面向专业型易混淆词辨析词典和通用型外向型汉语学习词典的汉语易混淆词辨析模式。该模式涉及词典释义、型式、例句、辨析专栏四个维度,具体内容有:以搭配为基础的释义,由词类和句法成分构成的类联接,类别丰富的整句例句,“型式+例证”的配例模式,以词义、用法为核心的辨析专栏。四个维度互相印证、互相补充,实现了从传统静态化、去语境化的消极型辨析模式到动态化、富语境化的积极型辨析模式的转变。 展开更多
关键词 型式语法 外向型汉语学习词典 混淆词辨析 搭配
在线阅读 下载PDF
混淆恶意JavaScript代码的检测与反混淆方法研究 被引量:19
5
作者 马洪亮 王伟 韩臻 《计算机学报》 EI CSCD 北大核心 2017年第7期1699-1713,共15页
针对混淆恶意JavaScript代码很难被检测以及很难被反混淆的问题,深入分析了混淆JavaScript代码的外部静态行为特征和内部动态运行特征.提出一种检测混淆与反混淆方法,设计并实现了一个原型系统.系统通过静态分析检测混淆,通过动态分析... 针对混淆恶意JavaScript代码很难被检测以及很难被反混淆的问题,深入分析了混淆JavaScript代码的外部静态行为特征和内部动态运行特征.提出一种检测混淆与反混淆方法,设计并实现了一个原型系统.系统通过静态分析检测混淆,通过动态分析进行反混淆.静态分析只使用正常行为数据进行训练,采用主成分分析(PCA)、单分类支持向量机(One Class SVM)和最近邻(K-NN)算法检测混淆.动态分析分为两个步骤:首先遍历混淆代码抽象语法树(Abstract Syntax Tree)的节点;其次根据节点类型跟踪并分析节点上的相关变量,利用相关的变量终值进行反混淆.从真实环境中收集了总数为80 574条JavaScript正常与混淆恶意代码用于测试.大量的实验结果表明,在选用主成分分析算法时,在误报率为0.1%时,系统对混淆恶意JavaScript代码的检测率能达到99.90%.与此同时,文中提出的反混淆方法对超过80%的混淆代码能进行有效反混淆. 展开更多
关键词 混淆 WEB安全 混淆 恶意网页 异常检测 javascript
在线阅读 下载PDF
基于强度导向的JavaScript代码协同混淆方法 被引量:2
6
作者 李元章 马煜杰 +1 位作者 孙海鹏 张正 《信息网络安全》 CSCD 北大核心 2023年第4期1-9,共9页
代码混淆是一种对软件代码的保护技术,通过提高代码逻辑的分析难度对软件进行加固。目前,针对代码混淆的研究主要集中在单一的新混淆方法的提出及其效果分析,针对多种混淆方法进行协同混淆的研究较少。针对此问题,文章提出一种基于强度... 代码混淆是一种对软件代码的保护技术,通过提高代码逻辑的分析难度对软件进行加固。目前,针对代码混淆的研究主要集中在单一的新混淆方法的提出及其效果分析,针对多种混淆方法进行协同混淆的研究较少。针对此问题,文章提出一种基于强度导向的JavaScript代码协同混淆方法,首先对参与混淆的多种独立混淆方法进行强度评估;然后根据评估结果调整混淆方法的执行顺序,获得比单一的多方法叠加更好的混淆效果。实验结果表明,该方法能够以较低的代价获得更好的代码混淆效果。 展开更多
关键词 代码混淆 协同混淆 javascript语言 软件可维护性指数
在线阅读 下载PDF
Javascript代码混淆的检测和反混淆应用研究 被引量:3
7
作者 崔莹 《集宁师范学院学报》 2020年第3期7-11,共5页
随着javascript代码混淆技术的迅速发展,让夹杂在WEB应用中恶意脚本逃避检测的能力变得越来越突出,风险隐患越来越大。本文主要分析了当前常见的javascript代码混淆方式,按它们所采用的技术手段尝试对其做了简单的分类,对混淆检测方法... 随着javascript代码混淆技术的迅速发展,让夹杂在WEB应用中恶意脚本逃避检测的能力变得越来越突出,风险隐患越来越大。本文主要分析了当前常见的javascript代码混淆方式,按它们所采用的技术手段尝试对其做了简单的分类,对混淆检测方法提出一些改进。同时基于编译器实现了一个简易的javascript反混淆算法,从测试结果来看它应该能够为Javascript脚本混淆检测的优化提供一定的帮助。 展开更多
关键词 javascirpt反混淆 deobfuscate esprima
在线阅读 下载PDF
基于DQN生成对抗样本的JavaScript恶意代码检测模型 被引量:1
8
作者 苏庆 温炜亮 +2 位作者 林佳锐 黄剑锋 谢国波 《计算机应用与软件》 北大核心 2025年第3期332-340,共9页
针对基于深度学习的JavaScript恶意代码检测模型抗攻击能力较弱的问题,提出一个基于DQN(Deep Q-Learning Network)生成对抗样本的JavaScript恶意代码检测组合模型DQN-CNN。利用CNN对数据集进行训练,得到初始判别器origin_CNN。将DQN作... 针对基于深度学习的JavaScript恶意代码检测模型抗攻击能力较弱的问题,提出一个基于DQN(Deep Q-Learning Network)生成对抗样本的JavaScript恶意代码检测组合模型DQN-CNN。利用CNN对数据集进行训练,得到初始判别器origin_CNN。将DQN作为生成器,两者组成DQN-origin_CNN对抗模型进行训练。在训练过程中DQN通过代码混淆动作,生成origin_CNN的对抗样本。接着将对抗样本加入数据集,对origin_CNN持续进行迭代训练,获得最终判别器retrain_CNN。实验结果表明,retrain_CNN与DQN组成新的对抗模型DQN-retrain_CNN生成对抗样本成功率显著下降,从45.7%下降为21.5%,证明最终生成的判别器retrain_CNN的抗攻击能力得到了显著提升。 展开更多
关键词 深度强化学习 代码混淆 灰度图 javascript代码 对抗攻击
在线阅读 下载PDF
基于字符熵的JavaScript代码混淆自动检测方法 被引量:5
9
作者 宣以广 周华 《计算机应用与软件》 CSCD 2015年第1期309-312,共4页
首先综述JavaScript代码混淆的各种技术和方法。在分析JavaScript代码混淆特征的基础上,提出一种基于字符熵和Ngram方法相结合的快速自动检测方法。实验表明,N-gram方法取不同N时的字符串熵对代码是否混淆均具有明显的区分能力。通过大... 首先综述JavaScript代码混淆的各种技术和方法。在分析JavaScript代码混淆特征的基础上,提出一种基于字符熵和Ngram方法相结合的快速自动检测方法。实验表明,N-gram方法取不同N时的字符串熵对代码是否混淆均具有明显的区分能力。通过大量随机爬取的JS代码分析测试,该方法可快速完成JavaScript代码混淆的自动检测,有助于更深入分析Java Script恶意代码。 展开更多
关键词 javascript 代码混淆 字符熵 N-GRAM
在线阅读 下载PDF
1+X证书制度下高职“JavaScript程序设计”课程标准的制定
10
作者 邱尚明 李冬睿 +1 位作者 李蓉 黄锵 《信息系统工程》 2025年第1期153-156,共4页
为深化职业教育培训体系,加强产学合作、校企合作,加快推进教育培训、实践认证等多种方式相结合的优质职业教育人才培养体系建设,高职软件技术专业的核心课程“JavaScript程序设计”,要与1+X证书体系相适应。课程标准从课程信息、课程... 为深化职业教育培训体系,加强产学合作、校企合作,加快推进教育培训、实践认证等多种方式相结合的优质职业教育人才培养体系建设,高职软件技术专业的核心课程“JavaScript程序设计”,要与1+X证书体系相适应。课程标准从课程信息、课程性质与任务、课程目标与要求、课程教学模块与合格标准、学生考核评价、教学实施与保障、教学单元与学时分配、1+X证书标准等方面进行了详细的阐述。 展开更多
关键词 高职 1+X证书 javascript程序设计 课程标准
在线阅读 下载PDF
多示例学习的Shapley值去混淆策略及Fisher编码嵌入
11
作者 杨梅 高中杰 +2 位作者 陈天霖 朱家琳 张靖宇 《兰州大学学报(自然科学版)》 北大核心 2025年第5期643-650,共8页
为减少多示例学习(MIL)中混淆示例对包分类的影响,提出一种MIL的Shapley值去混淆策略及Fisher编码嵌入(SVDE)算法,以提高分类任务的准确性.示例去混淆技术融合了Shapley值优化理论,能够考虑包内示例之间的交互关系,为单个示例生成混淆... 为减少多示例学习(MIL)中混淆示例对包分类的影响,提出一种MIL的Shapley值去混淆策略及Fisher编码嵌入(SVDE)算法,以提高分类任务的准确性.示例去混淆技术融合了Shapley值优化理论,能够考虑包内示例之间的交互关系,为单个示例生成混淆度评分.SVDE算法结合模糊聚类方法,能够有效生成去除了混淆示例的新包,通过结合包嵌入技术引入Fisher向量编码,以增强包的表示能力,提升最终的分类性能.在多个领域共25个数据集上进行实验,并与7种前沿MIL算法进行对比.结果表明,SVDE算法在大部分数据集上的性能优于对比算法,尤其在图像和部分文本数据集上表现优异.在图像数据集Elephant、Fox和Tiger上,SVDE算法的准确率分别为90.85%、75.65%和87.25%,均高于对比算法;在文本数据集News.aa、News.cg和News.csm上,SVDE算法的准确率分别为93.90%、92.30%和92.30%,表现出色. 展开更多
关键词 多示例学习 混淆 嵌入方法 SHAPLEY值 Fisher核
原文传递
基于CB-Attention的JavaScript恶意混淆代码检测方法
12
作者 徐鑫 张志宁 +2 位作者 吕云山 李立 郑玉杰 《计算机工程与设计》 北大核心 2024年第8期2298-2305,共8页
当今JavaScript代码混淆方法日益多样,现有检测方法在对混淆代检测时会出现漏报和误报的情况,为解决该问题,提出一种基于CB-Attention的JavaScript恶意代码检测方法。由SDPCNN模型和BiLSTM+Attention模型构成,SDPCNN对短距离间的语义特... 当今JavaScript代码混淆方法日益多样,现有检测方法在对混淆代检测时会出现漏报和误报的情况,为解决该问题,提出一种基于CB-Attention的JavaScript恶意代码检测方法。由SDPCNN模型和BiLSTM+Attention模型构成,SDPCNN对短距离间的语义特征信息进行提取,BiLSTM+Attention获取JavaScript代码中长距离间的语义信息特征。为验证所提方法的有效性,将该方法与其它方法进行对比,对比结果表明,该方法具有较好的检测效果,F1-Score可达98.78%。 展开更多
关键词 javascript恶意代码 混淆代码 检测模型 增强深度金字塔卷积神经网络 注意力网络 双向长短时记忆网络 长距离特征信息 抽象语法树
在线阅读 下载PDF
混淆恶意JavaScript代码的多特征检测识别与分析 被引量:1
13
作者 曲文鹏 赵连军 邓旭 《智能计算机与应用》 2018年第4期42-47,共6页
JavaScript目前已经成为交互式网页和动态网页中一项广泛采用的技术,恶意的JavaScript代码也变得活跃起来,已经被当作基于网页的一种攻击手段。通过对大量JavaScript恶意代码的研究,对混淆恶意JavaScript代码进行特征提取与归类,从基于... JavaScript目前已经成为交互式网页和动态网页中一项广泛采用的技术,恶意的JavaScript代码也变得活跃起来,已经被当作基于网页的一种攻击手段。通过对大量JavaScript恶意代码的研究,对混淆恶意JavaScript代码进行特征提取与归类,从基于属性特征、基于重定向特征、基于可疑关键词特征、基于混淆特征四大类中总共提取了82个特征,其中47个是四大类中的新特征。从真实环境中收集了总数为5525份JavaScript正常与混淆的恶意代码用于训练与测试,利用多种有监督的机器学习算法通过异常检测模式来评估数据集。实验结果表明,通过引入新的特征,所有分类器的检测率较未引入新特征相比有所提升,并且误检率(FalseNegativeRate)有所下降。 展开更多
关键词 机器学习 恶意代码 异常检测 混淆 javascript
在线阅读 下载PDF
反向混淆情形下注册商标跨类保护的合理边界
14
作者 邓社民 杨祎朋 《贵州师范大学学报(社会科学版)》 2025年第2期51-61,共11页
反向混淆情形下在先商标使用者要求法院在注册商标核定使用的商品范围外,为商标权人预留注册商标专用权的行使空间。法院如果保护其进入新市场的可能性,在商标注册制下实际上赋予了其注册商标获得跨类保护的权利,可能引发其与在后商标... 反向混淆情形下在先商标使用者要求法院在注册商标核定使用的商品范围外,为商标权人预留注册商标专用权的行使空间。法院如果保护其进入新市场的可能性,在商标注册制下实际上赋予了其注册商标获得跨类保护的权利,可能引发其与在后商标使用者之间的利益冲突。支持在先商标使用者的主张符合商标法的规范目的,有利于商标质量的提升和市场竞争,因而具有正当性。为了实现商标注册与商标使用的协调,为在先商标使用者划定合理的权利边界,应当坚持以混淆为核心的判断方式。在综合考量多因素的过程中,强化对商品类似性和商标使用规范性的考察,辅以竞争分析进一步增加权利边界的确定性和合理性,防止损害在后商标使用者的合法权益。 展开更多
关键词 反向混淆 跨类保护 混淆可能性 商标质量 反不正当竞争
在线阅读 下载PDF
红背叶根及其混淆品的鉴别研究
15
作者 陈家仪 叶伟霞 +5 位作者 侯惠婵 洪晓茜 陈奕霖 黄晓丹 黄燕卿 朱焕容 《中南药学》 2025年第12期3685-3689,共5页
目的对红背叶根及其混淆品白背叶根、苎麻根进行鉴别研究,为红背叶根的准确鉴定及质量控制提供研究思路。方法采用药材性状鉴定、组织和粉末显微鉴定、薄层色谱鉴定以及HPLC指纹图谱等方法,在不同层面对红背叶根及其混淆品进行鉴别研究... 目的对红背叶根及其混淆品白背叶根、苎麻根进行鉴别研究,为红背叶根的准确鉴定及质量控制提供研究思路。方法采用药材性状鉴定、组织和粉末显微鉴定、薄层色谱鉴定以及HPLC指纹图谱等方法,在不同层面对红背叶根及其混淆品进行鉴别研究。结果红背叶根与白背叶根及苎麻根在药材性状、组织和粉末显微特征、薄层色谱等方面均存在差异,建立了红背叶根及其混淆品的HPLC指纹图谱,共标定了红背叶根11个共有峰,峰4、5、6、7以及峰11为红背叶根特有峰,其中峰7鞣花酸可作为鉴别红背叶根及其混淆品的指标性成分。结论所建立的鉴定方法能够快速、有效地鉴别红背叶根药材,为完善红背叶根药材质量标准提供依据。 展开更多
关键词 红背叶根 混淆 性状鉴别 显微鉴别 薄层鉴别 指纹图谱
原文传递
浅谈JavaScript语言中随机数函数的教学设计探讨
16
作者 李芙蓉 《微型计算机》 2025年第2期235-237,共3页
“JavaScript程序设计”是计算机应用专业的专业必修课,是一门关于Web前端的专业核心课程,而随机数函数是JavaScript中最重要的函数。本文在随机数函数教学中以“仿体彩6+1”为例,基于学生认知,设置任务驱动,由简单任务入门,任务难度层... “JavaScript程序设计”是计算机应用专业的专业必修课,是一门关于Web前端的专业核心课程,而随机数函数是JavaScript中最重要的函数。本文在随机数函数教学中以“仿体彩6+1”为例,基于学生认知,设置任务驱动,由简单任务入门,任务难度层层递进,使学生在教师的引导下通过实践检验和小组讨论等方式发现问题、解决问题,并能够利用随机数函数解决现实问题,以此完成教学任务、达成教学目标。 展开更多
关键词 javascript Math对象 随机数函数 RANDOM
在线阅读 下载PDF
提升混淆因素的平衡性:倾向值方法的新进展
17
作者 胡安宁 袁野 《浙江社会科学》 北大核心 2025年第6期58-71,85,158,共16页
倾向值方法(加权或者匹配)在社会科学量化研究中得到越来越多的应用,但是经由倾向值方法处理的样本并不必然能够达成理想的混淆因素平衡性。混淆因素的不平衡性问题可以从理论与操作层面进行辨析。从理论上讲,传统倾向值方法依据的是等... 倾向值方法(加权或者匹配)在社会科学量化研究中得到越来越多的应用,但是经由倾向值方法处理的样本并不必然能够达成理想的混淆因素平衡性。混淆因素的不平衡性问题可以从理论与操作层面进行辨析。从理论上讲,传统倾向值方法依据的是等比例误差削减分析框架。这个框架虽然有其吸引力,但背后有一系列难以满足的假设条件。正因如此,倾向值方法有时无法很好地平衡混淆因素。与之相比,一个更加适配社会科学经验研究的倾向值分析框架是单调性不平衡划界框架。在操作层面上,与单调性不平衡划界分析框架一致,有三种新兴的分析方法(粗粒度精确匹配、熵平衡法与混淆因素平衡倾向值法)可以确保混淆因素在实验组与控制组之间的平衡。 展开更多
关键词 倾向值 等比例误差削减 单调性不平衡划界 粗粒度精确匹配 熵平衡 混淆因素平衡倾向值法
在线阅读 下载PDF
基于混淆矩阵的带压开采底板突水危险性评价 被引量:2
18
作者 曹敏 尹尚先 +2 位作者 李书乾 王旭 苗钰龙 《煤炭科学技术》 北大核心 2025年第9期407-417,共11页
煤层底板突水是一种水文地质与采矿复合动态现象,受多因素影响,具有复杂的非线性动力特征。采取合适的危险性评价方法可以全面、准确地预测底板突水。选取郭二庄煤矿100组钻孔数据,以奥灰水压、隔水层厚度、煤层厚度、煤层埋深、顶板火... 煤层底板突水是一种水文地质与采矿复合动态现象,受多因素影响,具有复杂的非线性动力特征。采取合适的危险性评价方法可以全面、准确地预测底板突水。选取郭二庄煤矿100组钻孔数据,以奥灰水压、隔水层厚度、煤层厚度、煤层埋深、顶板火成岩厚度、断层规模指数、构造点与歼灭点和构造分形维数为底板突水影响因素,构建了基于混淆矩阵的底板突水危险性分类模型。运用Matlab软件对数据进行迭代训练,确定64组训练样本和36组检验样本,建立优化后的MAT-RIX模型,模型将郭二庄井田底板突水危险性分为安全、较安全、较危险和危险4个等级,依据井田不同坐标所属的评价等级绘制了9号煤层开采底板突水危险性评价分区图,每个等级对应的位置和面积在图中清晰可见:与传统的基于带压系数和突水系数的底板突水危险性分类方法相比,虽然两种判定标准存在明显差异,但各区域的评价结果没有出现大于1个等级的跳跃。该模型没有某个因素占绝对优势,充分发挥各因素的主控能力,模型准确率、精确率、召回率、F1分数、P-R曲线及ROC曲线等多项指标均高于期待值,预测分区精确度高,解决了“双系数”评价面临数据少和考虑因素不全面的问题,增加了突水评价分区的可信度,证实了混淆矩阵突水危险性分类模型的合理性。 展开更多
关键词 煤层底板突水 机器学习 突水危险性 混淆矩阵 MATLAB
在线阅读 下载PDF
结合标签混淆的中文文本分类数据增强技术 被引量:1
19
作者 孙海涛 林佳瑜 +1 位作者 梁祖红 郭洁 《计算机应用》 北大核心 2025年第4期1113-1119,共7页
传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标... 传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标签混淆的数据增强(LCDA)技术,从文本和标签这2个基本方面入手,为数据提供全面的强化。在文本方面,通过对文本进行标点符号随机插入和替换以及句末标点符号补齐等增强,在保留全部文本信息和顺序的同时增加文本的多样性;在标签方面,采用标签混淆方法生成模拟标签分布替代传统的one-hot标签分布,以更好地反映实例和标签与标签之间的关系。在THUCNews(TsingHua University Chinese News)和Toutiao这2个中文新闻数据集构建的小样本数据集上分别结合TextCNN、TextRNN、BERT(Bidirectional Encoder Representations from Transformers)和RoBERTa-CNN(Robustly optimized BERT approach Convolutional Neural Network)文本分类模型的实验结果表明,与增强前相比,性能均得到显著提升。其中,在由THUCNews数据集构造的50-THU数据集上,4种模型结合LCDA技术后的准确率相较于增强前分别提高了1.19、6.87、3.21和2.89个百分点;相较于softEDA(Easy Data Augmentation with soft labels)方法增强的模型分别提高了0.78、7.62、1.75和1.28个百分点。通过在文本和标签这2个维度的处理结果可知,LCDA技术能显著提升模型的准确率,在数据量较少的应用场景中表现尤为突出。 展开更多
关键词 数据增强 文本分类 标签混淆 中文新闻主题 预训练模型
在线阅读 下载PDF
虚拟化混淆程序的指令提取方法 被引量:1
20
作者 张沈芊芊 董卫宇 林键 《信息工程大学学报》 2025年第1期83-89,共7页
针对现有虚拟指令识别不准确、静态分析无法解析分支跳转、无法跨大版本应用的问题,提出一种基于符号执行的虚拟指令提取方法。该方法通过动态二进制插桩生成指令跟踪,对指令跟踪进行离线分析,根据虚拟机结构及跳转规则划分出Handler集... 针对现有虚拟指令识别不准确、静态分析无法解析分支跳转、无法跨大版本应用的问题,提出一种基于符号执行的虚拟指令提取方法。该方法通过动态二进制插桩生成指令跟踪,对指令跟踪进行离线分析,根据虚拟机结构及跳转规则划分出Handler集合,采用符号执行技术对Handler进行语义分析,得到状态表达,最终利用启发式规则提取出虚拟指令。实验部分在5个测试程序和两种VMProtect版本上对该方法进行验证,相较于VMP分析插件和NoVmpy,虚拟指令识别率提升了26.72个百分点,准确率提升了41.09个百分点,并优化了分支跳转处理。实验结果表明,该方法有效提升了虚拟指令提取的准确性、完整性和稳健性。 展开更多
关键词 代码虚拟化 混淆 虚拟指令 软件安全 逆向分析
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部