期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
井下煤炭运输多环节复杂背景下高精度煤矸识别方法
1
作者 栾亨宣 安乐 +7 位作者 田莹 顾颉颖 张强 陈宏伟 付翔 胡成军 崔志芳 陈锐 《煤炭科学技术》 北大核心 2025年第9期459-468,共10页
煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据... 煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据集,包含水渍、煤粉、碎煤与碎矸石及运输设备部件等背景干扰因素。提出了一种融合多种注意力与残差连接的高精度煤矸智能识别方法,高分辨率阶段使用残差卷积块快速生成高质量标记(token),后续阶段使用级联的Channel Spatial Swin Transformer Block(CSSTB)进行深层表征学习。为提升模型对背景噪声的抗干扰能力,网络集成全局、通道、空间多种注意力机制,增强特征表达的鲁棒性。CSSTB中利用基于负斜率特性强化稀疏激活的LeakyReLU线性注意力机制建模全局信息,通过卷积注意力机制模块(CBAM)优化模型注意力分布,提升模型泛化能力。此外,考虑到煤、矸石和输送设备零部件的尺度差异,跨阶段使用残差连接以增强多尺度特征的通信和信息流通。结果表明:所提模型在单一、二混合和三混合背景上的平均准确度达到95.06%、97.77%、95.65%,相较于基线网络Swin Transformer-Tiny分别提高7.01%、4.83%、1.03%。可视化试验表明,对比模型在水渍、暗光和反光等复杂背景干扰下难以准确区分煤和矸石,而所提出模型能够精准聚焦于煤和矸石的关键特征区域,抗干扰能力强。研究结果为井下原煤运输中的煤矸高效分选提供了理论参考。 展开更多
关键词 深度学习 煤矸识别 井下环境 注意力机制 梯度加权类激活热图
在线阅读 下载PDF
多层混合注意力机制的类激活图可解释性方法
2
作者 张剑 张一然 王梓聪 《中国图象图形学报》 北大核心 2025年第7期2468-2483,共16页
目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊... 目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊、范围过大和细粒度不足的问题。为此,提出一种多层混合注意力机制的类激活图方法(spatial attention-based multi-layer fusion for high-quality class activation maps,SAMLCAM),以优化这些局限性。方法在以往的类激活图方法忽略了空间位置信息只关注通道级权重,降低了目标物体的定位性能,SAMLCAM方法提出一种结合了通道注意力机制和空间注意力机制的混合注意力机制,实现增强目标物体定位减少无效位置信息的效果。在得到有效物体定位结果后,根据神经网络多层卷积层的特点,改进多层特征图融合的方式提出多层加权融合机制,改善类激活图的边界效果范围过大和细粒度不足的问题,从而增强类激活图的视觉解释性。结果引用广泛用于计算机视觉模型的基准测试ILSVRC 2012(ImageNet Large-scale Visual Recognition Challenge 2012)数据集和MS COCO2017(Microsoft common objects in context 2017)数据集,对提出方法在多种待解释卷积网络模型下进行评估,包括消融实验、定性评估和定量评估。消融实验证明了各模块的有效性;定性评估对其可解释性效果进行视觉直观展示,验证效果的提升;定量评估中数据表明,SAMLCAM在Loc1和Loc5指标性能相较于最低数据均有大于8%的提升,在能量定位决策指标相较于最低数据均有大于7%的提升。由于改进方法减少了目标样本区域的上下文背景区域,使其对结果置信度存在负影响,但在可信度指标中,与其他方法比较仍可以保持比较小的差距并维持较高性能。结论本文方法在多种卷积神经网络架构上均展现出优异的解释性能,通过扩大目标样本区域的响应覆盖度并有效抑制背景或无关区域的响应,提升了可解释性结果的精确性与可靠性。 展开更多
关键词 类激活图(cam) 可解释性 注意力机制 图像分类 卷积神经网络(CNN)
原文传递
可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用
3
作者 王璐 刘东 刘卫光 《计算机应用》 北大核心 2025年第1期261-274,共14页
近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNe... 近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNet50和DenseNet121(Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad(Full Gradient-weighted)解释模型识别的判断依据。实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点。可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率。 展开更多
关键词 可变形卷积网络 可解释性 蝴蝶物种识别 类激活映射 显著性移除
在线阅读 下载PDF
基于生成对抗网络的舌象图像特征提取方法
4
作者 阮群生 王硕诚 吴清锋 《计算机科学与探索》 北大核心 2025年第11期3007-3022,共16页
舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图... 舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图像特征提取新方法(TongueIFE-GAN)。该方法通过对抗思想构建一种面向舌象图像潜在特征的提取网络,它包括判别器和生成器两个重要组成部分,藉此建立图像重构质量与舌象图像的特征提取效果映射关系。为增强深度算法的可解释性,在网络判别器中融入类激活映射机制,进一步优化编码器的特征处理性能,并对TongueIFE-GAN模型在提取特征时关注的图像敏感区域作出可视化解释。同时,在舌象图像分割、分类任务驱动下,新模型可自优化舌象特征提取的能力。通过多组实验,结果表明,基于TongueIFE-GAN模型的舌象分割和分类任务,其分割性能IoU与Dice指标值,以及分类准确率均优于基准模型和对比方法。TongueIFE-GAN利用对抗思想构建新型的特征提取以及注意力可视化机制的研究方法,可为舌象图像特征研究提供一种新的思路。 展开更多
关键词 生成对抗网络 舌象图像 类激活映射 舌象图像分割 舌象分类
在线阅读 下载PDF
类激活图回放和最小熵采样的多标签类增量学习
5
作者 周怡凡 杜凯乐 +2 位作者 吕凡 胡伏原 刘光灿 《中国图象图形学报》 北大核心 2025年第8期2633-2644,共12页
目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使... 目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使得跨任务之间的关联被完全阻断,模型无法区别新类与旧类,导致相似类别的混淆。方法为了解决类别混淆问题,提出一种类激活图回放和最小熵采样的多标签类增量学习,以实现跨任务的监督信息传递。具体地,首先在传统经验回放策略的基础上,开辟一块新的存储区用于存储样本正类的类激活图。其次,基于交叉熵的数值对当前任务样本进行采样,以挑选那些拥有精确类激活图的样本放入存储区作为回放样本。最后,在后续任务中回放样本,对当前模型的正类激活图输出进行正向监督,并将存储的正类的激活图作为其他类别激活图的反向监督,使其显著区域不重合。结果在PASCAL VOC(pattern analysis,statistical modeling and computational learning visual object classes)数据集上进行广泛实验,验证了所提出方法的有效性和鲁棒性。对比实验结果表明,类激活图监督回放方法显著提升了模型在多标签连续学习中的性能。结论本文所提出的类激活图监督回放法为跨任务类别补充了监督信息,缓解了多标签类增量学习中的标签缺失问题。 展开更多
关键词 类增量学习(CIL) 多标签分类 多标签类增量学习(MLCIL) 类激活图 最小化熵
原文传递
基于类激活多尺度注意力的红外图像和可见光图像融合的生成对抗网络
6
作者 高祺明 姚斌 王梅嘉 《软件工程》 2025年第7期57-63,共7页
针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合... 针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合和可见与红外特征融合双通道,使融合图像中红外源图像和可见光源图像的特征更加平衡。模型在TNO数据集上进行大量的对比实验,相较于同类算法,互信息提升了11.28%,标准差提升了4.18%,峰值信噪比提升了2.00%。 展开更多
关键词 注意力机制 生成对抗网络 类激活图
在线阅读 下载PDF
基于合作博弈Shapley值法的类激活映射算法
7
作者 许莉 常雨晴 +2 位作者 柴霁轩 宛旭 范纯龙 《计算机工程与设计》 北大核心 2025年第3期795-803,共9页
为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权... 为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权重对特征图进行加权求和,得到类激活图,对神经网络模型的决策机制进行解释。重点考虑网络最后一层中每个特征图对结果的影响,可视化输入图像中对模型输出造成正向影响的区域。实验结果表明,该方法能够更准确地解释深度神经网络的决策依据,在定位能力和算法忠诚度等方面的性能得到了显著提升。 展开更多
关键词 深度神经网络 特征重要性 类激活映射 可解释性 合作博弈 沙普利值 特征图
在线阅读 下载PDF
利用多种子信息聚合和正负混合学习的弱监督图像语义分割
8
作者 桑雨 刘通 +3 位作者 马天娇 李乐 李思漫 刘宇男 《电子与信息学报》 北大核心 2025年第10期3993-4004,共12页
基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理... 基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理手段进一步提升种子的质量,但其得到的种子仍存在不等程度的噪声。为了减少噪声标签对分割网络造成的影响,考虑多个不同种子更能有效提取出正确信息,该文从多种子信息互补的角度,提出一种基于多种子信息聚合和正负混合学习的弱监督图像语义分割方法,通过在分类网络中改变输入图像尺度以及调整Dropout层随机隐藏神经元的概率,获取多个优良种子;依据它们对每个像素分配的类别标签情况进行优选获得聚合种子,并进一步区分该像素标签为干净标签还是噪声标签;利用正负混合学习训练语义分割网络,引入预测约束损失以避免网络对噪声标签给予过高的预测值,进而对干净标签应用正学习发挥正确信息的准确性,对噪声标签应用负学习抑制错误信息的影响,从而有效提升分割网络的性能。在PASCAL VOC 2012和MS COCO 2014验证集上实验结果表明,该文方法在基于卷积神经网络框架的分割网络中,mIoU分别达到了72.5%和40.8%,与RCA及URN方法相比分别提升了0.3%与0.1%;在基于Transformer框架的分割网络中,mIoU则提升至76.8%和46.7%,与CoBra及ECA方法相比分别提升了2.5%与1.6%,验证了方法的有效性。 展开更多
关键词 弱监督语义分割 类激活映射 多种子 交叉熵 正负学习
在线阅读 下载PDF
可解释性模型在溃疡性结肠炎Mayo内镜评分中的应用
9
作者 李裕 徐晓丹 朱锦舟 《中国医疗设备》 2025年第9期20-25,共6页
目的建立基于临床知识的可解释性计算机模型,与传统黑盒模型进行比较,进一步提高模型在溃疡性结肠炎(Ulcerative Colitis,UC)Mayo内镜评分中的效果。方法收集苏州大学附属第一医院内镜中心的内镜图片共2251张作为训练集和内部验证集。根... 目的建立基于临床知识的可解释性计算机模型,与传统黑盒模型进行比较,进一步提高模型在溃疡性结肠炎(Ulcerative Colitis,UC)Mayo内镜评分中的效果。方法收集苏州大学附属第一医院内镜中心的内镜图片共2251张作为训练集和内部验证集。根据Mayo内镜评分系统将图片分为0组、1组、2组、3组,构建黑盒模型。同时,根据溃疡(有、无)、自发性出血(有、无)、红斑(无、可见、明显)、血管纹理(正常、模糊、消失)及黏膜脆性(正常、轻度、易脆)共5个特征对所有图片进行标记,建立亚特征模型,融合后构建可解释化模型。此外,利用苏州大学附属常熟医院内镜中心的内镜图片进行外部验证。在外部验证集中,计算准确度、马修相关系数(MCC)、卡帕系数等指标对比可解释化模型与黑盒模型的表现,并与2位不同年资内镜医师的分级指标结果进行比较。最后,采用Grad-CAM法突出模型推理依据的区域。结果基于MobileNet、ResNet、Xception及EfficientNet的4种可解释化模型在外部验证集中的准确度分别为0.765、0.800、0.830、0.885,均优于对应传统黑盒模型的0.665、0.705、0.775、0.815,其中基于EfficientNet的可解释性模型表现最优,同时优于低年资医师(0.805)及高年资医师(0.870)。结论在内镜下UC Mayo内镜分级诊断中,可解释化模型较传统深度学习黑盒模型表现更优异。可解释化模型在未来溃疡性结肠炎内镜下诊断中具有良好的应用价值。 展开更多
关键词 可解释性 深度学习 溃疡性结肠炎 消化内镜 Mayo内镜评分 梯度加权分类激活映射
暂未订购
基于Grad-CAM与KL损失的SSD目标检测算法 被引量:10
10
作者 侯庆山 邢进生 《电子学报》 EI CAS CSCD 北大核心 2020年第12期2409-2416,共8页
鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细... 鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细节作可视化处理,并以类激活图的形式呈现各检测层细节,分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此,采用Kullback-Leibler(KL)边框回归损失策略,利用Non Maximum Suppression(NMS)算法输出最终预测框.实验结果表明,改进算法相较于已有检测算法具有更高的准确率以及稳定性. 展开更多
关键词 目标检测 可视化 类激活图 Grad-cam SSD KL损失
在线阅读 下载PDF
Deep Stacked Ensemble Learning Model for COVID-19 Classification
11
作者 G.Madhu B.Lalith Bharadwaj +5 位作者 Rohit Boddeda Sai Vardhan K.Sandeep Kautish Khalid Alnowibet Adel F.Alrasheedi Ali Wagdy Mohamed 《Computers, Materials & Continua》 SCIE EI 2022年第3期5467-5486,共20页
COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is requ... COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is required.A reverse transcript polymerase chain reaction(RT-PCR)test is often used to detect the disease.However,since this test is time-consuming,a chest computed tomography(CT)or plain chest X-ray(CXR)is sometimes indicated.The value of automated diagnosis is that it saves time and money by minimizing human effort.Three significant contributions are made by our research.Its initial purpose is to use the essential finetuning methodology to test the action and efficiency of a variety of vision models,ranging from Inception to Neural Architecture Search(NAS)networks.Second,by plotting class activationmaps(CAMs)for individual networks and assessing classification efficiency with AUC-ROC curves,the behavior of these models is visually analyzed.Finally,stacked ensembles techniques were used to provide greater generalization by combining finetuned models with six ensemble neural networks.Using stacked ensembles,the generalization of the models improved.Furthermore,the ensemble model created by combining all of the finetuned networks obtained a state-of-the-art COVID-19 accuracy detection score of 99.17%.The precision and recall rates were 99.99%and 89.79%,respectively,highlighting the robustness of stacked ensembles.The proposed ensemble approach performed well in the classification of the COVID-19 lesions on CXR according to the experimental results. 展开更多
关键词 COVID-19 classification class activation maps(cams)visualization finetuning stacked ensembles automated diagnosis deep learning
在线阅读 下载PDF
显著性引导的目标互补隐藏弱监督语义分割 被引量:2
12
作者 白雪飞 卢立彬 王文剑 《中国图象图形学报》 CSCD 北大核心 2024年第4期1041-1055,共15页
目的 图像级弱监督语义分割方法利用类别标签训练分割网络,可显著降低标注成本。现有方法大多采用类激活图定位目标物体,然而传统类激活图只能挖掘出物体中最具辨识性的区域,直接将其作为伪标签训练的分割网络精度较差。本文提出一种显... 目的 图像级弱监督语义分割方法利用类别标签训练分割网络,可显著降低标注成本。现有方法大多采用类激活图定位目标物体,然而传统类激活图只能挖掘出物体中最具辨识性的区域,直接将其作为伪标签训练的分割网络精度较差。本文提出一种显著性引导的弱监督语义分割算法,可在获取更完整类激活图的基础上提高分割模型的性能。方法 首先通过显著图对目标进行互补随机隐藏,以获得互补图像对,然后融合互补图像对的类激活图作为监督,提高网络获取完整类激活图的能力。其次引入双重注意力修正模块,利用全局信息修正类激活图并生成伪标签训练分割网络。最后使用标签迭代精调策略,结合分割网络的初始预测、类激活图以及显著图生成更精确的伪标签,迭代训练分割网络。结果 在PASCAL VOC 2012(pattern analysis,statistical modeling and computational learning visual object classes 2012)数据集上进行类激活图生成实验与语义分割实验,所生成的类激活图更加完整,平均交并比有10.21%的提升。语义分割结果均优于对比方法,平均交并比提升6.9%。此外在COCO 2014(common object in context 2014)数据集上进行了多目标的语义分割实验,平均交并比提升0.5%。结论 该算法可获得更完整的类激活图,缓解了弱监督语义分割中监督信息不足的问题,提升了弱监督语义分割模型的精度。 展开更多
关键词 深度学习 弱监督语义分割 显著性引导 类激活图(cam) 注意力机制
原文传递
面向SAR图像目标分类的CNN模型可视化方法 被引量:5
13
作者 李妙歌 陈渤 +1 位作者 王东升 刘宏伟 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期359-373,共15页
卷积神经网络(CNN)在合成孔径雷达(SAR)图像目标分类任务中应用广泛。由于网络工作机理不透明,CNN模型难以满足高可靠性实际应用的要求。类激活映射方法常用于可视化CNN模型的决策区域,但现有方法主要基于通道级或空间级类激活权重,且在... 卷积神经网络(CNN)在合成孔径雷达(SAR)图像目标分类任务中应用广泛。由于网络工作机理不透明,CNN模型难以满足高可靠性实际应用的要求。类激活映射方法常用于可视化CNN模型的决策区域,但现有方法主要基于通道级或空间级类激活权重,且在SAR图像数据集上的应用仍处于起步阶段。基于此,该文从神经元特征提取能力和网络决策依据两个层面出发,提出了一种面向SAR图像的CNN模型可视化方法。首先,基于神经元的激活值,对神经元在其感受野范围内的目标结构学习能力进行可视化,然后提出一种通道-空间混合的类激活映射方法,通过对SAR图像中的重要区域进行定位,为模型的决策过程提供依据。实验结果表明,该方法给出了模型在不同设置下的可解释性分析,有效拓展了卷积神经网络在SAR图像上的可视化应用。 展开更多
关键词 合成孔径雷达 可视化分析 卷积神经网络 类激活映射 神经元
在线阅读 下载PDF
基于深度学习的DRFM信号识别 被引量:1
14
作者 房津辉 宋宝军 朱明哲 《现代雷达》 CSCD 北大核心 2024年第3期54-58,共5页
针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处... 针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处理中无法有效区分回波信号和DRFM欺骗信号以及在雷达干扰识别中基于DRFM的欺骗干扰难以识别的问题。为了验证深度学习过程的可靠性,通过神经网络可解释性算法对训练结果进行了验证和分析。实验结果表明,相比于识别原始信号,识别DRFM信号神经网络需要用到更多的特征,神经网络判断准确率达到了96.33%,识别精度良好。 展开更多
关键词 干扰识别 时频变换 梯度加权类激活映射 导向反向传播 深度学习
原文传递
融合多层次决策信息的视觉解释方法 被引量:1
15
作者 杨传栋 钱立志 +2 位作者 孙子文 陈栋 凌冲 《计算机工程与应用》 CSCD 北大核心 2024年第3期246-254,共9页
视觉解释方法是深度神经网络可解释领域的热门研究课题,但现有方法未能有效利用多层次决策信息导致视觉解释效果差。针对此问题,提出一种融合多层次决策信息的视觉解释方法。挖掘特征图中高细粒度局部层次的决策信息生成一组与决策结果... 视觉解释方法是深度神经网络可解释领域的热门研究课题,但现有方法未能有效利用多层次决策信息导致视觉解释效果差。针对此问题,提出一种融合多层次决策信息的视觉解释方法。挖掘特征图中高细粒度局部层次的决策信息生成一组与决策结果相关性强的加权特征图,采用定序分组方式对其合并,获取一组低冗余度掩码;采取模糊边界和积分方法对掩码进行处理,基于全局层次的决策贡献并行计算分组掩码重要度分数,提高了算法对全局决策信息的敏感性和算法速度。通过消融实验确定了算法的最优参数组合,并在ImageNet数据集上与现有的先进视觉解释方法进行了定性和定量比较。实验结果表明:该方法通过结合多层次决策信息,在置信度测试和定位测试中取得了更好的视觉解释结果,且耗时达到68 ms。 展开更多
关键词 视觉解释 多层次信息 全局决策贡献 类激活映射(cam) 积分方法
在线阅读 下载PDF
面向SAR目标识别深度网络可理解的类激活映射方法 被引量:1
16
作者 崔宗勇 杨致远 +2 位作者 蒋阳 曹宗杰 杨建宇 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期428-442,共15页
随着深度学习方法在合成孔径雷达(SAR)图像解译领域的广泛应用,SAR目标识别深度网络可理解性问题逐渐受到学者的关注。类激活映射(CAM)作为常用的可理解性算法,能够通过热力图的方式,直观展示对识别任务起作用的显著性区域。然而作为一... 随着深度学习方法在合成孔径雷达(SAR)图像解译领域的广泛应用,SAR目标识别深度网络可理解性问题逐渐受到学者的关注。类激活映射(CAM)作为常用的可理解性算法,能够通过热力图的方式,直观展示对识别任务起作用的显著性区域。然而作为一种事后解释的方法,其只能静态展示当次识别过程中的显著性区域,无法动态展示当输入发生变化时显著性区域的变化规律。该文将扰动的思想引入类激活映射,提出了一种基于SAR背景杂波特性类激活映射方法(SCC-CAM),通过对输入图像引入同分布的全局扰动,逐步向SAR识别深度网络施加干扰,使得网络判决发生翻转,并在此刻计算网络神经元输出激活值的变化程度。该方法既能解决添加扰动可能带来的扰动传染问题,又能够动态观察和度量目标识别网络在识别过程中显著性区域的变化规律,从而增强深度网络的可理解性。在MSTAR数据集和OpenSARShip-1.0数据集上的试验表明,该文提出的算法具有更加精确的定位显著性区域的能力,相比于传统方法,在平均置信度下降率、置信度上升比例、信息量等评估指标上,所提算法具有更强的可理解性,能够作为通用的增强网络可理解性的方法。 展开更多
关键词 SAR目标识别 网络可理解性 SAR杂波特性 类激活映射 面积约束置信度下降率
在线阅读 下载PDF
DRSTN:深度残差软阈值化网络
17
作者 曹岩 朱真峰 《计算机科学》 CSCD 北大核心 2024年第S01期81-87,共7页
在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能。神经网络“端到端”的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展。另外,神经网络模型往往需要较长的训练时间... 在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能。神经网络“端到端”的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展。另外,神经网络模型往往需要较长的训练时间。为了提高深度残差网络模型的分类效果和训练效率,引入了模型迁移方法和软阈值化方法,提出了DRSTN(Deep Residual Soft Thresholding Network)网络,并对此网络结构进行微调,生成了不同版本的DRSTN网络。DRSTN网络的性能得益于3个方面的有机整合:1)通过梯度加权类激活映射(Gradients-weighted Class Activation Mapping,Grad-CAM)方法对网络的特征提取进行可视化,根据可视化结果挑选进一步优化的模型;2)基于模型迁移,研究人员不必全新地搭建模型,可以直接在已有的模型上进行优化,能够节省大量训练时间;3)软阈值化作为非线性变换层嵌入到深度残差网络体系结构中,以消除样本中不相关的特征。实验结果表明,在相同训练条件下,DRSTN_KS(3*3)_RB(2:2:2)网络在CIFAR-10数据集上的分类精度相比SKNet-18,ResNet18和ConvNeXt_tiny网络分别提高了15.5%,8.8%和10.9%;该网络也具有一定的泛化性,在MNIST和Fashion MNIST数据集上能够达到快速的迁移效果,分类精度分别达到99.06%和93.15%。 展开更多
关键词 迁移学习 残差网络 梯度加权类激活映射 软阈值化方法 图像分类
在线阅读 下载PDF
基于高光谱成像技术的陈皮年份快速鉴别
18
作者 刘诚 赵路路 +2 位作者 周松斌 刘忆森 王庭有 《食品工业科技》 CAS 北大核心 2024年第24期243-251,共9页
陈皮具有较好的经济价值与药用价值,但目前市场上假冒伪劣、以次充好的现象严重。尤其是陈皮陈化年份作为衡量陈皮品质的重要指标,采用人工检测方法准确率与效率较低。为此,本文采用高光谱成像技术结合深度学习方法,建立陈皮陈化年份的... 陈皮具有较好的经济价值与药用价值,但目前市场上假冒伪劣、以次充好的现象严重。尤其是陈皮陈化年份作为衡量陈皮品质的重要指标,采用人工检测方法准确率与效率较低。为此,本文采用高光谱成像技术结合深度学习方法,建立陈皮陈化年份的快速无损鉴别方法。采集4类不同陈化年份的480个陈皮样本的近红外高光谱数据(波长范围为935.61~1720.23 nm),并采用轻量化卷积网络1D-Rep网络建立分类模型。在此网络基础上,提出基于多层梯度加权类激活映射(M-Grad-CAM)的特征波段选择方法,并建立特征波段分类模型。该方法综合加权多个Rep-block层的梯度生成波段重要性曲线,从而实现融合波段领域相关性与远程相关性的波段重要性指示。为验证方法有效性,采用基于偏最小二乘判别分析(PLS-DA)、随机森林(RF)、支持向量机(SVM)等机器学习方法获得的特征波段作为对比方法。结果表明,1D-Rep全波段光谱模型准确率达到98.55%。在特征波段建模的情况下,采用M-Grad-CAM选取特征波长,基于前9个特征波段建立分类模型准确率可超过90%,在20个特征波段时达到96.82%,准确率显著优于其他对比模型。本研究采用高光谱成像技术,可有效对不同年份的陈皮进行无损鉴别,并为开发便携检测仪器提供方法和理论依据。 展开更多
关键词 高光谱成像 陈皮 陈化年份 多层梯度加权类激活映射 特征波段
在线阅读 下载PDF
图片分类的卷积神经网络可解释性分析 被引量:1
19
作者 方浩澎 《电脑与信息技术》 2024年第1期4-6,36,共4页
为了理解卷积神经网络在图片分类任务中做出决策的依据,进而优化模型,降低调参成本,对卷积神经网络进行可解释性分析是十分有必要的。为此,文章以水果图片分类任务为切入点,使用了多种类激活图,从多个角度分析模型所给出结果的原因。文... 为了理解卷积神经网络在图片分类任务中做出决策的依据,进而优化模型,降低调参成本,对卷积神经网络进行可解释性分析是十分有必要的。为此,文章以水果图片分类任务为切入点,使用了多种类激活图,从多个角度分析模型所给出结果的原因。文章采用Res Net模型先进行微调,在取得较好的分类性能后,进行了语义特征的基础分析、遮挡性分析,以及基于CAM的可解释性分析和LIME可解释性分析,为卷积神经网络提供一定的可解释性。实验结果表明,卷积神经网络做出决策的依据与人类理解的语义是一致的。 展开更多
关键词 图片分类 卷积神经网络 可解释性 类激活图
在线阅读 下载PDF
基于高分辨率类激活映射算法的弱监督目标实时检测
20
作者 孙辉 史玉龙 +2 位作者 张健一 王蕊 王羽玥 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1051-1059,共9页
受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映... 受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映射算法的弱监督目标实时检测方法,降低网络对目标实例标注的依赖。该方法将目标检测细划分为弱监督目标定位和目标实时检测两个子任务。在弱监督定位任务中,该文利用对比层级相关性传播理论设计了一种新颖的高分辨率类激活映射算法(HR-CAM),用于获取高质量目标类激活图,生成目标伪检测标注框。在实时检测任务中,该文选取单镜头多盒检测器(SSD)作为目标检测网络,并基于类激活图设计目标感知损失函数(OA-Loss),与目标伪检测标注框共同监督SSD网络的训练过程,提高网络对目标的检测性能。实验结果表明,该文方法在CUB200和TJAB52数据集上实现了对目标准确高效的检测,验证了该文方法的有效性和优越性。 展开更多
关键词 弱监督定位 目标检测 对比层级相关性传播理论 类激活映射算法 目标感知损失函数
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部