期刊文献+
共找到113篇文章
< 1 2 6 >
每页显示 20 50 100
ICA-Net:improving class activation for weakly supervised semantic segmentation via joint contrastive and simulation learning
1
作者 YE Zhuang LIU Ruyu SUN Bo 《Optoelectronics Letters》 2025年第3期188-192,共5页
In the field of optoelectronics,certain types of data may be difficult to accurately annotate,such as high-resolution optoelectronic imaging or imaging in certain special spectral ranges.Weakly supervised learning can... In the field of optoelectronics,certain types of data may be difficult to accurately annotate,such as high-resolution optoelectronic imaging or imaging in certain special spectral ranges.Weakly supervised learning can provide a more reliable approach in these situations.Current popular approaches mainly adopt the classification-based class activation maps(CAM)as initial pseudo labels to solve the task. 展开更多
关键词 high resolution imaging supervised learning class activation maps joint contrastive simulation learning special spectral ranges weakly supervised learning OPTOELECTRONICS
原文传递
Visualization for Explanation of Deep Learning-Based Defect Detection Model Using Class Activation Map 被引量:1
2
作者 Hyunkyu Shin Yonghan Ahn +3 位作者 Mihwa Song Heungbae Gil Jungsik Choi Sanghyo Lee 《Computers, Materials & Continua》 SCIE EI 2023年第6期4753-4766,共14页
Recently,convolutional neural network(CNN)-based visual inspec-tion has been developed to detect defects on building surfaces automatically.The CNN model demonstrates remarkable accuracy in image data analysis;however... Recently,convolutional neural network(CNN)-based visual inspec-tion has been developed to detect defects on building surfaces automatically.The CNN model demonstrates remarkable accuracy in image data analysis;however,the predicted results have uncertainty in providing accurate informa-tion to users because of the“black box”problem in the deep learning model.Therefore,this study proposes a visual explanation method to overcome the uncertainty limitation of CNN-based defect identification.The visual repre-sentative gradient-weights class activation mapping(Grad-CAM)method is adopted to provide visually explainable information.A visualizing evaluation index is proposed to quantitatively analyze visual representations;this index reflects a rough estimate of the concordance rate between the visualized heat map and intended defects.In addition,an ablation study,adopting three-branch combinations with the VGG16,is implemented to identify perfor-mance variations by visualizing predicted results.Experiments reveal that the proposed model,combined with hybrid pooling,batch normalization,and multi-attention modules,achieves the best performance with an accuracy of 97.77%,corresponding to an improvement of 2.49%compared with the baseline model.Consequently,this study demonstrates that reliable results from an automatic defect classification model can be provided to an inspector through the visual representation of the predicted results using CNN models. 展开更多
关键词 Defect detection VISUALIZATION class activation map deep learning EXPLANATION visualizing evaluation index
在线阅读 下载PDF
Continuous gradient fusion class activation mapping: segmentation of laser-induced damage on large-aperture optics in dark-field images 被引量:1
3
作者 Yueyue Han Yingyan Huang +5 位作者 Hangcheng Dong Fengdong Chen Fa Zeng Zhitao Peng Qihua Zhu Guodong Liu 《High Power Laser Science and Engineering》 SCIE CAS CSCD 2024年第1期30-41,共12页
Segmenting dark-field images of laser-induced damage on large-aperture optics in high-power laser facilities is challenged by complicated damage morphology, uneven illumination and stray light interference. Fully supe... Segmenting dark-field images of laser-induced damage on large-aperture optics in high-power laser facilities is challenged by complicated damage morphology, uneven illumination and stray light interference. Fully supervised semantic segmentation algorithms have achieved state-of-the-art performance but rely on a large number of pixel-level labels, which are time-consuming and labor-consuming to produce. LayerCAM, an advanced weakly supervised semantic segmentation algorithm, can generate pixel-accurate results using only image-level labels, but its scattered and partially underactivated class activation regions degrade segmentation performance. In this paper, we propose a weakly supervised semantic segmentation method, continuous gradient class activation mapping(CAM) and its nonlinear multiscale fusion(continuous gradient fusion CAM). The method redesigns backpropagating gradients and nonlinearly activates multiscale fused heatmaps to generate more fine-grained class activation maps with an appropriate activation degree for different damage site sizes. Experiments on our dataset show that the proposed method can achieve segmentation performance comparable to that of fully supervised algorithms. 展开更多
关键词 class activation maps laser-induced damage semantic segmentation weakly supervised learning
原文传递
融合时序与全局上下文特征增强的弱监督动作定位 被引量:1
4
作者 党伟超 范英豪 +1 位作者 高改梅 刘春霞 《计算机应用》 北大核心 2025年第3期963-971,共9页
针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力... 针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力机制捕获视频片段间的时序依赖性;其次,设计基于高斯混合模型(GMM)的期望最大化(EM)算法捕获视频的上下文信息,同时利用二分游走传播进行全局上下文特征增强,生成高质量的时序类激活图(TCAM)作为伪标签在线监督时序特征增强分支;再次,通过动量更新网络得到体现视频间动作特征的跨视频字典;最后,利用跨视频对比学习提高动作分类的准确性。实验结果表明,交并比(IoU)取0.5时,所提方法在THUMOS'14和ActivityNet v1.3数据集上分别取得了42.0%和42.2%的平均精度均值(mAP),相较于CCKEE(Cross-video Contextual Knowledge Exploration and Exploitation)方法,在mAP分别提升了2.6与0.6个百分点,验证了所提方法的有效性。 展开更多
关键词 弱监督动作定位 时序类激活图 动量更新 伪标签监督 特征增强
在线阅读 下载PDF
类感知对比学习的弱监督语义分割
5
作者 白雪飞 许文杰 +1 位作者 王渊辉 王文剑 《电子学报》 北大核心 2025年第6期1741-1754,共14页
图像级弱监督语义分割方法通常采用类激活图定位目标物体,但现有方法生成类激活图时存在目标区域激活不足或背景区域误激活等问题.文章提出了一种类感知对比学习的弱监督语义分割框架,通过融合文本提示与图像类别信息,提升模型对目标区... 图像级弱监督语义分割方法通常采用类激活图定位目标物体,但现有方法生成类激活图时存在目标区域激活不足或背景区域误激活等问题.文章提出了一种类感知对比学习的弱监督语义分割框架,通过融合文本提示与图像类别信息,提升模型对目标区域的精确定位能力.首先,文章分析了不同文本提示模板对各类别类激活图的影响,在此基础上,为了获取更具适应性的类别表示,本文构建了一个上下文提示集,并设计上下文提示动态选择策略,根据图像目标区域与文本提示之间的相似性获取最合适的上下文提示.其次,采用图像-文本对比学习方法,以增强模型在处理图像与文本语义对齐任务中的表现,并设计了对比损失函数监督模型的训练过程.最后,提出一个类别特定的背景抑制模块,抑制与目标类别紧密相关的背景区域的误激活,从而生成更加完整和紧凑的类激活图,实现更精确的语义分割.文章在通用数据集PASCAL VOC 2012和MS COCO 2014中对提出的模型进行实验验证,mIoU值分别达到71.9%和43.9%,性能优于所有对比方法,有效提升了弱监督语义分割精度. 展开更多
关键词 弱监督语义分割 类激活图 类感知 对比学习 文本提示
在线阅读 下载PDF
基于CT影像搏动性耳鸣识别及高致病区域
6
作者 田山 王治文 +2 位作者 曹学鹏 苏磊 刘兆会 《北京航空航天大学学报》 北大核心 2025年第2期625-632,共8页
搏动性耳鸣(PT)的病因诊断依赖于影像学检测,但病因众多,缺乏普适性强、机制明确的诊断标准。基于搏动性耳鸣患者和无耳鸣人群的计算机断层扫描(CT)影像横截面图,提出一种高精度的耳鸣识别神经网络模型,并自动标示高致病区域,辅助临床... 搏动性耳鸣(PT)的病因诊断依赖于影像学检测,但病因众多,缺乏普适性强、机制明确的诊断标准。基于搏动性耳鸣患者和无耳鸣人群的计算机断层扫描(CT)影像横截面图,提出一种高精度的耳鸣识别神经网络模型,并自动标示高致病区域,辅助临床诊断。使用迁移学习Resnet-v1-50模型,取骨窗颞骨中部水平截面样本进行分类学习,并以梯度加权类激活映射(gradCAM)方法对分类高权重区域自动标注;统计CT截面大图(全颅)、中图(双侧颞骨)、小图(右侧颞骨)3种数据集的耳鸣分类高权重区域涉及的解剖结构,逐步细化感兴趣区域,提高分类高权重区域标注分辨率。实验结果显示:包含双侧颞骨的中图数据集分类精度最好,测试集精度达到100%。搏动性耳鸣分类高权重区域集中于双侧或单侧颞骨部位,主要包括颞骨蜂房、鼓窦、乙状窦骨板、上鼓室等部位。搏动性耳鸣与颞骨及附近骨质结构有密切关系;搏动性耳鸣患者在双侧颞骨或耳鸣对侧颞骨均有较大概率存在区别于无耳鸣人群的结构异常;颞骨蜂房、鼓窦、乙状窦骨板、鼓室等结构均有较高概率包含搏动性耳鸣的高致病区域。以上影像分析结论与搏动性耳鸣生物力学研究结论实现了相互佐证。 展开更多
关键词 搏动性耳鸣 机器学习 可视化策略 CT影像 神经网络模型 辅助诊断
原文传递
井下煤炭运输多环节复杂背景下高精度煤矸识别方法
7
作者 栾亨宣 安乐 +7 位作者 田莹 顾颉颖 张强 陈宏伟 付翔 胡成军 崔志芳 陈锐 《煤炭科学技术》 北大核心 2025年第9期459-468,共10页
煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据... 煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据集,包含水渍、煤粉、碎煤与碎矸石及运输设备部件等背景干扰因素。提出了一种融合多种注意力与残差连接的高精度煤矸智能识别方法,高分辨率阶段使用残差卷积块快速生成高质量标记(token),后续阶段使用级联的Channel Spatial Swin Transformer Block(CSSTB)进行深层表征学习。为提升模型对背景噪声的抗干扰能力,网络集成全局、通道、空间多种注意力机制,增强特征表达的鲁棒性。CSSTB中利用基于负斜率特性强化稀疏激活的LeakyReLU线性注意力机制建模全局信息,通过卷积注意力机制模块(CBAM)优化模型注意力分布,提升模型泛化能力。此外,考虑到煤、矸石和输送设备零部件的尺度差异,跨阶段使用残差连接以增强多尺度特征的通信和信息流通。结果表明:所提模型在单一、二混合和三混合背景上的平均准确度达到95.06%、97.77%、95.65%,相较于基线网络Swin Transformer-Tiny分别提高7.01%、4.83%、1.03%。可视化试验表明,对比模型在水渍、暗光和反光等复杂背景干扰下难以准确区分煤和矸石,而所提出模型能够精准聚焦于煤和矸石的关键特征区域,抗干扰能力强。研究结果为井下原煤运输中的煤矸高效分选提供了理论参考。 展开更多
关键词 深度学习 煤矸识别 井下环境 注意力机制 梯度加权类激活热图
在线阅读 下载PDF
可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用
8
作者 王璐 刘东 刘卫光 《计算机应用》 北大核心 2025年第1期261-274,共14页
近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNe... 近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNet50和DenseNet121(Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad(Full Gradient-weighted)解释模型识别的判断依据。实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点。可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率。 展开更多
关键词 可变形卷积网络 可解释性 蝴蝶物种识别 类激活映射 显著性移除
在线阅读 下载PDF
多层混合注意力机制的类激活图可解释性方法
9
作者 张剑 张一然 王梓聪 《中国图象图形学报》 北大核心 2025年第7期2468-2483,共16页
目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊... 目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊、范围过大和细粒度不足的问题。为此,提出一种多层混合注意力机制的类激活图方法(spatial attention-based multi-layer fusion for high-quality class activation maps,SAMLCAM),以优化这些局限性。方法在以往的类激活图方法忽略了空间位置信息只关注通道级权重,降低了目标物体的定位性能,SAMLCAM方法提出一种结合了通道注意力机制和空间注意力机制的混合注意力机制,实现增强目标物体定位减少无效位置信息的效果。在得到有效物体定位结果后,根据神经网络多层卷积层的特点,改进多层特征图融合的方式提出多层加权融合机制,改善类激活图的边界效果范围过大和细粒度不足的问题,从而增强类激活图的视觉解释性。结果引用广泛用于计算机视觉模型的基准测试ILSVRC 2012(ImageNet Large-scale Visual Recognition Challenge 2012)数据集和MS COCO2017(Microsoft common objects in context 2017)数据集,对提出方法在多种待解释卷积网络模型下进行评估,包括消融实验、定性评估和定量评估。消融实验证明了各模块的有效性;定性评估对其可解释性效果进行视觉直观展示,验证效果的提升;定量评估中数据表明,SAMLCAM在Loc1和Loc5指标性能相较于最低数据均有大于8%的提升,在能量定位决策指标相较于最低数据均有大于7%的提升。由于改进方法减少了目标样本区域的上下文背景区域,使其对结果置信度存在负影响,但在可信度指标中,与其他方法比较仍可以保持比较小的差距并维持较高性能。结论本文方法在多种卷积神经网络架构上均展现出优异的解释性能,通过扩大目标样本区域的响应覆盖度并有效抑制背景或无关区域的响应,提升了可解释性结果的精确性与可靠性。 展开更多
关键词 类激活图(CAM) 可解释性 注意力机制 图像分类 卷积神经网络(CNN)
原文传递
基于图像特定分类器的弱监督语义分割
10
作者 郭子麟 吴东岳 +1 位作者 高常鑫 桑农 《自动化学报》 北大核心 2025年第6期1191-1204,共14页
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注.该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化.然而类激活图往往只关注于图像中最显著的区域,致使基于类激活图产生的伪标签与真... 基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注.该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化.然而类激活图往往只关注于图像中最显著的区域,致使基于类激活图产生的伪标签与真实标注存在较大差距,主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题.欠激活源于数据集类内差异过大,致使单一分类器不足以准确识别同一类别的所有像素;错误激活则是数据集类间差异过小,导致分类器不能有效区分不同类别的像素.本文考虑到同一类别像素在图像内的差异小于在数据集中的差异,设计基于类中心的图像特定分类器,以提升对同类像素的识别能力,从而改善欠激活,同时考虑到类中心是类别在特征空间的代表,设计类中心约束函数,通过扩大类中心间的差距从而间接地疏远不同类别的特征分布,以缓解错误激活现象.图像特定分类器可以插入其他弱监督语义分割网络,替代分类网络的分类器,以产生更高质量的类激活图.实验结果表明,本文所提出的方案在两个基准数据集上均具有良好的表现,证实了该方案的有效性. 展开更多
关键词 语义分割 图像级标签 分类器 类激活图 弱监督学习
在线阅读 下载PDF
基于扩展补丁对的弱监督语义分割网络
11
作者 孙铭辰 葛洪伟 李婷 《信息与控制》 北大核心 2025年第4期595-606,共12页
针对弱监督语义分割任务中类激活图(class activation map,CAM)与对象种子相关性低、种子区域覆盖目标不完全的问题,提出基于扩展补丁对的弱监督语义分割网络。首先,提出扩展补丁对,并从信息论角度证明扩展补丁对得到的CAM的自信息总和... 针对弱监督语义分割任务中类激活图(class activation map,CAM)与对象种子相关性低、种子区域覆盖目标不完全的问题,提出基于扩展补丁对的弱监督语义分割网络。首先,提出扩展补丁对,并从信息论角度证明扩展补丁对得到的CAM的自信息总和大于标准CAM的自信息,扩展补丁对的CAM与对象种子相关性更高。其次,提出高低阶特征自注意力聚合模块,将图像低阶特征和CAM分别通过自注意力机制增强后聚合,逐像素细化CAM。最后,设计三重网络,将原始图片以及图片的扩展补丁对作为网络输入,通过缩小原始图像CAM与扩展补丁对的CAM之间的差距,训练得到分割精度更高的弱监督语义分割网络。在Pascal VOC 2012验证集和测试集上进行实验评估,平均交并比(mean Intersection over Union,mIoU)分别为72.1%和73.0%。实验结果表明,该网络性能优于当前主流图像级标签弱监督语义分割方法。 展开更多
关键词 弱监督学习 图像语义分割 类激活图 图像级标签 自注意力
原文传递
类激活图回放和最小熵采样的多标签类增量学习
12
作者 周怡凡 杜凯乐 +2 位作者 吕凡 胡伏原 刘光灿 《中国图象图形学报》 北大核心 2025年第8期2633-2644,共12页
目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使... 目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使得跨任务之间的关联被完全阻断,模型无法区别新类与旧类,导致相似类别的混淆。方法为了解决类别混淆问题,提出一种类激活图回放和最小熵采样的多标签类增量学习,以实现跨任务的监督信息传递。具体地,首先在传统经验回放策略的基础上,开辟一块新的存储区用于存储样本正类的类激活图。其次,基于交叉熵的数值对当前任务样本进行采样,以挑选那些拥有精确类激活图的样本放入存储区作为回放样本。最后,在后续任务中回放样本,对当前模型的正类激活图输出进行正向监督,并将存储的正类的激活图作为其他类别激活图的反向监督,使其显著区域不重合。结果在PASCAL VOC(pattern analysis,statistical modeling and computational learning visual object classes)数据集上进行广泛实验,验证了所提出方法的有效性和鲁棒性。对比实验结果表明,类激活图监督回放方法显著提升了模型在多标签连续学习中的性能。结论本文所提出的类激活图监督回放法为跨任务类别补充了监督信息,缓解了多标签类增量学习中的标签缺失问题。 展开更多
关键词 类增量学习(CIL) 多标签分类 多标签类增量学习(MLCIL) 类激活图 最小化熵
原文传递
基于语义调制的弱监督语义分割
13
作者 李军侠 苏京峰 +1 位作者 崔滢 刘青山 《软件学报》 北大核心 2025年第9期4373-4387,共15页
图像级标注下的弱监督语义分割方法通常采用卷积神经网络(CNN)生成类激活图以精确定位目标位置,其面临的主要挑战在于CNN对全局信息感知能力的不足导致前景区域过小的问题.近年来,基于Transformer的弱监督语义分割方法利用自注意力机制... 图像级标注下的弱监督语义分割方法通常采用卷积神经网络(CNN)生成类激活图以精确定位目标位置,其面临的主要挑战在于CNN对全局信息感知能力的不足导致前景区域过小的问题.近年来,基于Transformer的弱监督语义分割方法利用自注意力机制捕捉全局依赖关系,解决了CNN的固有缺陷.然而,Transformer生成的初始类激活图会在目标区域周围引入大量背景噪声,此时直接对初始类激活图进行使用并不能取得令人满意的效果.通过综合利用Transformer生成的类与块间注意力(class-to-patch attention)以及区域块间注意力(patch-to-patch attention)对初始类激活图进行联合优化,同时,由于原始的类与块间注意力存在误差,对此设计一种语义调制策略,利用区域块间注意力的语义上下文信息对类与块间注意力进行调制,修正其误差,最终得到能够准确覆盖较多目标区域的类激活图.在此基础上,构建一种新颖的基于Transformer的弱监督语义分割模型.所提方法在PASCAL VOC 2012验证集和测试集上mIoU值分别达到72.7%和71.9%,MS COCO 2014验证集上mIoU为42.3%,取得了目前较为先进的弱监督语义分割结果. 展开更多
关键词 语义分割 弱监督学习 语义上下文 TRANSFORMER 类激活图
在线阅读 下载PDF
基于生成对抗网络的舌象图像特征提取方法
14
作者 阮群生 王硕诚 吴清锋 《计算机科学与探索》 北大核心 2025年第11期3007-3022,共16页
舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图... 舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图像特征提取新方法(TongueIFE-GAN)。该方法通过对抗思想构建一种面向舌象图像潜在特征的提取网络,它包括判别器和生成器两个重要组成部分,藉此建立图像重构质量与舌象图像的特征提取效果映射关系。为增强深度算法的可解释性,在网络判别器中融入类激活映射机制,进一步优化编码器的特征处理性能,并对TongueIFE-GAN模型在提取特征时关注的图像敏感区域作出可视化解释。同时,在舌象图像分割、分类任务驱动下,新模型可自优化舌象特征提取的能力。通过多组实验,结果表明,基于TongueIFE-GAN模型的舌象分割和分类任务,其分割性能IoU与Dice指标值,以及分类准确率均优于基准模型和对比方法。TongueIFE-GAN利用对抗思想构建新型的特征提取以及注意力可视化机制的研究方法,可为舌象图像特征研究提供一种新的思路。 展开更多
关键词 生成对抗网络 舌象图像 类激活映射 舌象图像分割 舌象分类
在线阅读 下载PDF
基于可解释深度学习及表面增强拉曼光谱的微塑料高效识别方法
15
作者 张艺严 马静 +1 位作者 孙振丽 杜晶晶 《分析测试学报》 北大核心 2025年第8期1557-1567,共11页
微塑料(MPs)污染已成为全球环境的重大挑战。传统检测方法在MPs检测中存在诸多局限,迫切需要开发无需复杂前处理的高灵敏检测技术。为解决MPs检测难题,该研究构建了一种“表面增强拉曼散射基底捕获-深度学习识别-梯度加权类激活映射(Gra... 微塑料(MPs)污染已成为全球环境的重大挑战。传统检测方法在MPs检测中存在诸多局限,迫切需要开发无需复杂前处理的高灵敏检测技术。为解决MPs检测难题,该研究构建了一种“表面增强拉曼散射基底捕获-深度学习识别-梯度加权类激活映射(Grad-CAM)解释”的MPs新型检测方法。研究结果表明,金纳米海绵基底可有效捕获MPs,数据增强与预处理技术可有效提高模型的预测精度。基于一维卷积神经网络(1D-CNN)的多分支二分类深度学习网络对MPs的分类准确率可达85%,显著高于机器学习模型与常规1DCNN模型。Grad-CAM分析可清晰展示模型决策依据及误判原因。该方法在实际环境水样及混合样本中验证有效,具有较强抗干扰性能与实用性;所用基底材料来源广泛、制备工艺简便,具有成本优势与良好的应用潜力。 展开更多
关键词 表面增强拉曼光谱 微塑料 卷积神经网络 深度学习 梯度加权类激活映射
在线阅读 下载PDF
用于植物病虫害图像识别的数据增强方法
16
作者 肖宇 吴杰 马驰 《计算机技术与发展》 2025年第3期210-214,共5页
在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的Saliency... 在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的SaliencyBatchMix数据增强方法利用类激活映射(CAM)计算语义百分比图(SPM)后,按Batch的维度选择具有代表性的图像区域,并将图像区域作为指示性补丁与目标图像混合,以引导模型学习更恰当的特征表示。该方法可减少训练中裁剪区域的无意义像素,并且减少了标签噪声。在GhostNet架构下的实验中,SaliencyBatchMix分别在IP102和Embrapa数据集上实现了72.05%和96.86%的准确率。对比于使用CutMix方法分别提升了0.62百分点和1百分点。通过对结果的对比和消融实验分析,验证了SaliencyBatchMix在提高模型泛化能力和准确率的有效性。 展开更多
关键词 数据增强 类激活映射 深度学习 植物病虫害识别 GhostNet
在线阅读 下载PDF
基于改进SDP和FasterNet-GCAM的滚动轴承故障诊断
17
作者 陈家芳 唐湛恒 周健 《现代制造工程》 北大核心 2025年第7期129-138,41,共11页
对滚动轴承进行故障诊断关乎设备运行安全及稳定可靠性。使用传统卷积神经网络进行故障诊断,模型运算量过大,且易出现过拟合现象从而导致诊断精度不高,端到端模型存在可信度不高等问题。鉴于此,提出一种基于改进对称极坐标(Symmetrized ... 对滚动轴承进行故障诊断关乎设备运行安全及稳定可靠性。使用传统卷积神经网络进行故障诊断,模型运算量过大,且易出现过拟合现象从而导致诊断精度不高,端到端模型存在可信度不高等问题。鉴于此,提出一种基于改进对称极坐标(Symmetrized Dot Pattern,SDP)法和FasterNet-GCAM网络的滚动轴承故障诊断方法。首先,将一维振动信号经过小波阈值降噪处理,再输入经皮尔逊图像相关系数法优化的SDP法生成SDP图像,并通过在FasterNet网络中加入部分卷积(partial convolution)思想,构建成改进的SDP-FasterNet模型进行进一步的特征提取,并完成滚动轴承不同故障的分类诊断。为了验证模型在图像识别过程中决策的可信度,将梯度加权类激活映射(Gradient-weighted Class Activation Mapping,Grad-CAM)与FasterNet网络相结合,突出SDP图像与决策相关的重要部分。试验结果表明,所提方法相比于其他方法具有更快的收敛速度和更强的鲁棒性,且诊断识别精度达到了99.20%,并提高了诊断过程中的可解释性及可信度,为故障诊断领域提供了具备良好可行性和鲁棒性的轻量化诊断模型。 展开更多
关键词 滚动轴承 故障诊断 FasterNet网络 部分卷积 梯度加权类激活映射 对称极坐标法
在线阅读 下载PDF
基于局部风格融合的对抗补丁隐蔽性增强方法
18
作者 谢喜龙 郭桐 +4 位作者 肖利民 韩萌 徐向荣 董进 王良 《信息安全学报》 2025年第5期64-76,共13页
自从对抗样本这一概念被提出以来,各种针对深度学习模型的对抗攻击方法引发了一系列安全性问题。其中,对抗补丁通过在输入样本中引入特定的补丁,使深度学习模型产生误导性的结果,给当前的深度学习系统带来了巨大的安全隐患。然而,目前... 自从对抗样本这一概念被提出以来,各种针对深度学习模型的对抗攻击方法引发了一系列安全性问题。其中,对抗补丁通过在输入样本中引入特定的补丁,使深度学习模型产生误导性的结果,给当前的深度学习系统带来了巨大的安全隐患。然而,目前的对抗补丁生成方法在提升对抗补丁的隐蔽性方面仍存在一定的局限性,存在与周围环境差异较大容易被人类察觉的问题。针对这一问题,本文提出了一种基于局部风格融合的对抗补丁隐蔽性增强方法。该方法首先基于多模型加权类激活映射寻找图像的脆弱区域,精准定位对抗补丁的安放位置,提高对抗补丁的攻击性。然后利用风格迁移技术,计算目标图像与对抗补丁的风格矩阵与内容矩阵。在对抗补丁生成过程中,综合考虑分类损失、风格损失、内容损失与边界损失,通过余弦距离函数调整对抗补丁的生成风格与生成内容,使对抗补丁与其覆盖的局部图像的风格与内容相融合,从而融入周边环境,在色彩、风格上协调统一,降低对抗补丁在人类视觉上的可察觉性,达到增强对抗补丁隐蔽性的目的。本文分别从攻击性和隐蔽性对生成的补丁进行实验评估,实验结果表明,此方法可生成兼具隐蔽性与攻击性的对抗补丁,在人类无法察觉的同时实现攻击。 展开更多
关键词 对抗补丁 风格融合 生成模型 类激活映射
在线阅读 下载PDF
基于类激活映射的红外与可见光图像融合方法
19
作者 完琦 秦品乐 曾建潮 《中北大学学报(自然科学版)》 2025年第5期584-591,610,共9页
针对当前图像融合算法信息选择策略较为固定单一导致源图像重要信息丢失且无效信息干扰融合图像质量等问题,本文提出了一种基于类激活映射的可解释红外与可见光图像融合方法。根据类激活映射机制获取不同源图像的类激活权值(反映了网络... 针对当前图像融合算法信息选择策略较为固定单一导致源图像重要信息丢失且无效信息干扰融合图像质量等问题,本文提出了一种基于类激活映射的可解释红外与可见光图像融合方法。根据类激活映射机制获取不同源图像的类激活权值(反映了网络对于源图像不同特征的重要性的关注程度),利用类激活权值分配不同通道的特征权重,根据特征权重对提取到的深度特征进行加权融合,以保留源图像更丰富的显著目标和纹理细节等重要信息并抑制噪声信息。实验结果表明,本文所提出的方法在TNO和Road Scene数据集上的表现优于现有的大多数先进算法,其中,TNO数据集上信息熵和视觉保真度分别达到7.3272和0.6927,远高于其他方法,这表明本文方法能够在充分保留源图像关键特征信息的同时兼具优秀的视觉感知性能。 展开更多
关键词 图像融合 信息选择 类激活映射 权重分配 深度学习
在线阅读 下载PDF
基于类激活多尺度注意力的红外图像和可见光图像融合的生成对抗网络
20
作者 高祺明 姚斌 王梅嘉 《软件工程》 2025年第7期57-63,共7页
针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合... 针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合和可见与红外特征融合双通道,使融合图像中红外源图像和可见光源图像的特征更加平衡。模型在TNO数据集上进行大量的对比实验,相较于同类算法,互信息提升了11.28%,标准差提升了4.18%,峰值信噪比提升了2.00%。 展开更多
关键词 注意力机制 生成对抗网络 类激活图
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部