期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
井下煤炭运输多环节复杂背景下高精度煤矸识别方法
1
作者 栾亨宣 安乐 +7 位作者 田莹 顾颉颖 张强 陈宏伟 付翔 胡成军 崔志芳 陈锐 《煤炭科学技术》 北大核心 2025年第9期459-468,共10页
煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据... 煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据集,包含水渍、煤粉、碎煤与碎矸石及运输设备部件等背景干扰因素。提出了一种融合多种注意力与残差连接的高精度煤矸智能识别方法,高分辨率阶段使用残差卷积块快速生成高质量标记(token),后续阶段使用级联的Channel Spatial Swin Transformer Block(CSSTB)进行深层表征学习。为提升模型对背景噪声的抗干扰能力,网络集成全局、通道、空间多种注意力机制,增强特征表达的鲁棒性。CSSTB中利用基于负斜率特性强化稀疏激活的LeakyReLU线性注意力机制建模全局信息,通过卷积注意力机制模块(CBAM)优化模型注意力分布,提升模型泛化能力。此外,考虑到煤、矸石和输送设备零部件的尺度差异,跨阶段使用残差连接以增强多尺度特征的通信和信息流通。结果表明:所提模型在单一、二混合和三混合背景上的平均准确度达到95.06%、97.77%、95.65%,相较于基线网络Swin Transformer-Tiny分别提高7.01%、4.83%、1.03%。可视化试验表明,对比模型在水渍、暗光和反光等复杂背景干扰下难以准确区分煤和矸石,而所提出模型能够精准聚焦于煤和矸石的关键特征区域,抗干扰能力强。研究结果为井下原煤运输中的煤矸高效分选提供了理论参考。 展开更多
关键词 深度学习 煤矸识别 井下环境 注意力机制 梯度加权类激活热图
在线阅读 下载PDF
可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用
2
作者 王璐 刘东 刘卫光 《计算机应用》 北大核心 2025年第1期261-274,共14页
近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNe... 近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNet50和DenseNet121(Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad(Full Gradient-weighted)解释模型识别的判断依据。实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点。可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率。 展开更多
关键词 可变形卷积网络 可解释性 蝴蝶物种识别 类激活映射 显著性移除
在线阅读 下载PDF
多层混合注意力机制的类激活图可解释性方法
3
作者 张剑 张一然 王梓聪 《中国图象图形学报》 北大核心 2025年第7期2468-2483,共16页
目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊... 目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊、范围过大和细粒度不足的问题。为此,提出一种多层混合注意力机制的类激活图方法(spatial attention-based multi-layer fusion for high-quality class activation maps,SAMLCAM),以优化这些局限性。方法在以往的类激活图方法忽略了空间位置信息只关注通道级权重,降低了目标物体的定位性能,SAMLCAM方法提出一种结合了通道注意力机制和空间注意力机制的混合注意力机制,实现增强目标物体定位减少无效位置信息的效果。在得到有效物体定位结果后,根据神经网络多层卷积层的特点,改进多层特征图融合的方式提出多层加权融合机制,改善类激活图的边界效果范围过大和细粒度不足的问题,从而增强类激活图的视觉解释性。结果引用广泛用于计算机视觉模型的基准测试ILSVRC 2012(ImageNet Large-scale Visual Recognition Challenge 2012)数据集和MS COCO2017(Microsoft common objects in context 2017)数据集,对提出方法在多种待解释卷积网络模型下进行评估,包括消融实验、定性评估和定量评估。消融实验证明了各模块的有效性;定性评估对其可解释性效果进行视觉直观展示,验证效果的提升;定量评估中数据表明,SAMLCAM在Loc1和Loc5指标性能相较于最低数据均有大于8%的提升,在能量定位决策指标相较于最低数据均有大于7%的提升。由于改进方法减少了目标样本区域的上下文背景区域,使其对结果置信度存在负影响,但在可信度指标中,与其他方法比较仍可以保持比较小的差距并维持较高性能。结论本文方法在多种卷积神经网络架构上均展现出优异的解释性能,通过扩大目标样本区域的响应覆盖度并有效抑制背景或无关区域的响应,提升了可解释性结果的精确性与可靠性。 展开更多
关键词 类激活图(cam) 可解释性 注意力机制 图像分类 卷积神经网络(CNN)
原文传递
基于类激活多尺度注意力的红外图像和可见光图像融合的生成对抗网络
4
作者 高祺明 姚斌 王梅嘉 《软件工程》 2025年第7期57-63,共7页
针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合... 针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合和可见与红外特征融合双通道,使融合图像中红外源图像和可见光源图像的特征更加平衡。模型在TNO数据集上进行大量的对比实验,相较于同类算法,互信息提升了11.28%,标准差提升了4.18%,峰值信噪比提升了2.00%。 展开更多
关键词 注意力机制 生成对抗网络 类激活图
在线阅读 下载PDF
基于合作博弈Shapley值法的类激活映射算法
5
作者 许莉 常雨晴 +2 位作者 柴霁轩 宛旭 范纯龙 《计算机工程与设计》 北大核心 2025年第3期795-803,共9页
为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权... 为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权重对特征图进行加权求和,得到类激活图,对神经网络模型的决策机制进行解释。重点考虑网络最后一层中每个特征图对结果的影响,可视化输入图像中对模型输出造成正向影响的区域。实验结果表明,该方法能够更准确地解释深度神经网络的决策依据,在定位能力和算法忠诚度等方面的性能得到了显著提升。 展开更多
关键词 深度神经网络 特征重要性 类激活映射 可解释性 合作博弈 沙普利值 特征图
在线阅读 下载PDF
利用多种子信息聚合和正负混合学习的弱监督图像语义分割
6
作者 桑雨 刘通 +3 位作者 马天娇 李乐 李思漫 刘宇男 《电子与信息学报》 北大核心 2025年第10期3993-4004,共12页
基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理... 基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理手段进一步提升种子的质量,但其得到的种子仍存在不等程度的噪声。为了减少噪声标签对分割网络造成的影响,考虑多个不同种子更能有效提取出正确信息,该文从多种子信息互补的角度,提出一种基于多种子信息聚合和正负混合学习的弱监督图像语义分割方法,通过在分类网络中改变输入图像尺度以及调整Dropout层随机隐藏神经元的概率,获取多个优良种子;依据它们对每个像素分配的类别标签情况进行优选获得聚合种子,并进一步区分该像素标签为干净标签还是噪声标签;利用正负混合学习训练语义分割网络,引入预测约束损失以避免网络对噪声标签给予过高的预测值,进而对干净标签应用正学习发挥正确信息的准确性,对噪声标签应用负学习抑制错误信息的影响,从而有效提升分割网络的性能。在PASCAL VOC 2012和MS COCO 2014验证集上实验结果表明,该文方法在基于卷积神经网络框架的分割网络中,mIoU分别达到了72.5%和40.8%,与RCA及URN方法相比分别提升了0.3%与0.1%;在基于Transformer框架的分割网络中,mIoU则提升至76.8%和46.7%,与CoBra及ECA方法相比分别提升了2.5%与1.6%,验证了方法的有效性。 展开更多
关键词 弱监督语义分割 类激活映射 多种子 交叉熵 正负学习
在线阅读 下载PDF
基于空间权重和层间相关性的可解释浅层类激活映射算法研究
7
作者 程艳 何慧娟 +2 位作者 陈彦滢 姚楠楠 林国波 《计算机科学》 北大核心 2025年第S1期498-504,共7页
卷积神经网络在计算机视觉领域具有重要作用,然而其黑盒特性使人们理解其决策理由变得困难,严重阻碍了其在某些安全领域的应用。传统的类激活映射(Class Activation Mapping,CAM)算法通常受限于深层神经元的可解释性,对浅层神经元的解... 卷积神经网络在计算机视觉领域具有重要作用,然而其黑盒特性使人们理解其决策理由变得困难,严重阻碍了其在某些安全领域的应用。传统的类激活映射(Class Activation Mapping,CAM)算法通常受限于深层神经元的可解释性,对浅层神经元的解释能力较弱且存在较多噪声。为了应对这一挑战,提出一种可解释浅层的类激活映射算法,并生成细粒度的解释。该算法基于相关性传播理论,考虑相邻层之间的相关性,得到层间相关性权重,并将应用了空间权重的特征图作为掩码,与层间相关性权重相乘,从而实现浅层解释。实验结果表明,所提算法与解释浅层最优的LayerCAM相比,卷积神经网络每层生成的类激活图的删除插入测试综合评分在ILSVRC2012 val数据集上最高提高了2.73,最低提高了0.24,在CUB-200-2011数据集上最高提高了1.31,最低提高了0.38。 展开更多
关键词 类激活映射算法 卷积神经网络 浅层神经元 空间权重 层间相关性
在线阅读 下载PDF
基于Grad-CAM与KL损失的SSD目标检测算法 被引量:10
8
作者 侯庆山 邢进生 《电子学报》 EI CAS CSCD 北大核心 2020年第12期2409-2416,共8页
鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细... 鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细节作可视化处理,并以类激活图的形式呈现各检测层细节,分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此,采用Kullback-Leibler(KL)边框回归损失策略,利用Non Maximum Suppression(NMS)算法输出最终预测框.实验结果表明,改进算法相较于已有检测算法具有更高的准确率以及稳定性. 展开更多
关键词 目标检测 可视化 类激活图 Grad-cam SSD KL损失
在线阅读 下载PDF
Deep Stacked Ensemble Learning Model for COVID-19 Classification
9
作者 G.Madhu B.Lalith Bharadwaj +5 位作者 Rohit Boddeda Sai Vardhan K.Sandeep Kautish Khalid Alnowibet Adel F.Alrasheedi Ali Wagdy Mohamed 《Computers, Materials & Continua》 SCIE EI 2022年第3期5467-5486,共20页
COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is requ... COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is required.A reverse transcript polymerase chain reaction(RT-PCR)test is often used to detect the disease.However,since this test is time-consuming,a chest computed tomography(CT)or plain chest X-ray(CXR)is sometimes indicated.The value of automated diagnosis is that it saves time and money by minimizing human effort.Three significant contributions are made by our research.Its initial purpose is to use the essential finetuning methodology to test the action and efficiency of a variety of vision models,ranging from Inception to Neural Architecture Search(NAS)networks.Second,by plotting class activationmaps(CAMs)for individual networks and assessing classification efficiency with AUC-ROC curves,the behavior of these models is visually analyzed.Finally,stacked ensembles techniques were used to provide greater generalization by combining finetuned models with six ensemble neural networks.Using stacked ensembles,the generalization of the models improved.Furthermore,the ensemble model created by combining all of the finetuned networks obtained a state-of-the-art COVID-19 accuracy detection score of 99.17%.The precision and recall rates were 99.99%and 89.79%,respectively,highlighting the robustness of stacked ensembles.The proposed ensemble approach performed well in the classification of the COVID-19 lesions on CXR according to the experimental results. 展开更多
关键词 COVID-19 classification class activation maps(cams)visualization finetuning stacked ensembles automated diagnosis deep learning
在线阅读 下载PDF
显著性引导的目标互补隐藏弱监督语义分割 被引量:2
10
作者 白雪飞 卢立彬 王文剑 《中国图象图形学报》 CSCD 北大核心 2024年第4期1041-1055,共15页
目的 图像级弱监督语义分割方法利用类别标签训练分割网络,可显著降低标注成本。现有方法大多采用类激活图定位目标物体,然而传统类激活图只能挖掘出物体中最具辨识性的区域,直接将其作为伪标签训练的分割网络精度较差。本文提出一种显... 目的 图像级弱监督语义分割方法利用类别标签训练分割网络,可显著降低标注成本。现有方法大多采用类激活图定位目标物体,然而传统类激活图只能挖掘出物体中最具辨识性的区域,直接将其作为伪标签训练的分割网络精度较差。本文提出一种显著性引导的弱监督语义分割算法,可在获取更完整类激活图的基础上提高分割模型的性能。方法 首先通过显著图对目标进行互补随机隐藏,以获得互补图像对,然后融合互补图像对的类激活图作为监督,提高网络获取完整类激活图的能力。其次引入双重注意力修正模块,利用全局信息修正类激活图并生成伪标签训练分割网络。最后使用标签迭代精调策略,结合分割网络的初始预测、类激活图以及显著图生成更精确的伪标签,迭代训练分割网络。结果 在PASCAL VOC 2012(pattern analysis,statistical modeling and computational learning visual object classes 2012)数据集上进行类激活图生成实验与语义分割实验,所生成的类激活图更加完整,平均交并比有10.21%的提升。语义分割结果均优于对比方法,平均交并比提升6.9%。此外在COCO 2014(common object in context 2014)数据集上进行了多目标的语义分割实验,平均交并比提升0.5%。结论 该算法可获得更完整的类激活图,缓解了弱监督语义分割中监督信息不足的问题,提升了弱监督语义分割模型的精度。 展开更多
关键词 深度学习 弱监督语义分割 显著性引导 类激活图(cam) 注意力机制
原文传递
面向SAR图像目标分类的CNN模型可视化方法 被引量:5
11
作者 李妙歌 陈渤 +1 位作者 王东升 刘宏伟 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期359-373,共15页
卷积神经网络(CNN)在合成孔径雷达(SAR)图像目标分类任务中应用广泛。由于网络工作机理不透明,CNN模型难以满足高可靠性实际应用的要求。类激活映射方法常用于可视化CNN模型的决策区域,但现有方法主要基于通道级或空间级类激活权重,且在... 卷积神经网络(CNN)在合成孔径雷达(SAR)图像目标分类任务中应用广泛。由于网络工作机理不透明,CNN模型难以满足高可靠性实际应用的要求。类激活映射方法常用于可视化CNN模型的决策区域,但现有方法主要基于通道级或空间级类激活权重,且在SAR图像数据集上的应用仍处于起步阶段。基于此,该文从神经元特征提取能力和网络决策依据两个层面出发,提出了一种面向SAR图像的CNN模型可视化方法。首先,基于神经元的激活值,对神经元在其感受野范围内的目标结构学习能力进行可视化,然后提出一种通道-空间混合的类激活映射方法,通过对SAR图像中的重要区域进行定位,为模型的决策过程提供依据。实验结果表明,该方法给出了模型在不同设置下的可解释性分析,有效拓展了卷积神经网络在SAR图像上的可视化应用。 展开更多
关键词 合成孔径雷达 可视化分析 卷积神经网络 类激活映射 神经元
在线阅读 下载PDF
基于深度学习的DRFM信号识别 被引量:1
12
作者 房津辉 宋宝军 朱明哲 《现代雷达》 CSCD 北大核心 2024年第3期54-58,共5页
针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处... 针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处理中无法有效区分回波信号和DRFM欺骗信号以及在雷达干扰识别中基于DRFM的欺骗干扰难以识别的问题。为了验证深度学习过程的可靠性,通过神经网络可解释性算法对训练结果进行了验证和分析。实验结果表明,相比于识别原始信号,识别DRFM信号神经网络需要用到更多的特征,神经网络判断准确率达到了96.33%,识别精度良好。 展开更多
关键词 干扰识别 时频变换 梯度加权类激活映射 导向反向传播 深度学习
原文传递
融合多层次决策信息的视觉解释方法 被引量:1
13
作者 杨传栋 钱立志 +2 位作者 孙子文 陈栋 凌冲 《计算机工程与应用》 CSCD 北大核心 2024年第3期246-254,共9页
视觉解释方法是深度神经网络可解释领域的热门研究课题,但现有方法未能有效利用多层次决策信息导致视觉解释效果差。针对此问题,提出一种融合多层次决策信息的视觉解释方法。挖掘特征图中高细粒度局部层次的决策信息生成一组与决策结果... 视觉解释方法是深度神经网络可解释领域的热门研究课题,但现有方法未能有效利用多层次决策信息导致视觉解释效果差。针对此问题,提出一种融合多层次决策信息的视觉解释方法。挖掘特征图中高细粒度局部层次的决策信息生成一组与决策结果相关性强的加权特征图,采用定序分组方式对其合并,获取一组低冗余度掩码;采取模糊边界和积分方法对掩码进行处理,基于全局层次的决策贡献并行计算分组掩码重要度分数,提高了算法对全局决策信息的敏感性和算法速度。通过消融实验确定了算法的最优参数组合,并在ImageNet数据集上与现有的先进视觉解释方法进行了定性和定量比较。实验结果表明:该方法通过结合多层次决策信息,在置信度测试和定位测试中取得了更好的视觉解释结果,且耗时达到68 ms。 展开更多
关键词 视觉解释 多层次信息 全局决策贡献 类激活映射(cam) 积分方法
在线阅读 下载PDF
面向SAR目标识别深度网络可理解的类激活映射方法 被引量:1
14
作者 崔宗勇 杨致远 +2 位作者 蒋阳 曹宗杰 杨建宇 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期428-442,共15页
随着深度学习方法在合成孔径雷达(SAR)图像解译领域的广泛应用,SAR目标识别深度网络可理解性问题逐渐受到学者的关注。类激活映射(CAM)作为常用的可理解性算法,能够通过热力图的方式,直观展示对识别任务起作用的显著性区域。然而作为一... 随着深度学习方法在合成孔径雷达(SAR)图像解译领域的广泛应用,SAR目标识别深度网络可理解性问题逐渐受到学者的关注。类激活映射(CAM)作为常用的可理解性算法,能够通过热力图的方式,直观展示对识别任务起作用的显著性区域。然而作为一种事后解释的方法,其只能静态展示当次识别过程中的显著性区域,无法动态展示当输入发生变化时显著性区域的变化规律。该文将扰动的思想引入类激活映射,提出了一种基于SAR背景杂波特性类激活映射方法(SCC-CAM),通过对输入图像引入同分布的全局扰动,逐步向SAR识别深度网络施加干扰,使得网络判决发生翻转,并在此刻计算网络神经元输出激活值的变化程度。该方法既能解决添加扰动可能带来的扰动传染问题,又能够动态观察和度量目标识别网络在识别过程中显著性区域的变化规律,从而增强深度网络的可理解性。在MSTAR数据集和OpenSARShip-1.0数据集上的试验表明,该文提出的算法具有更加精确的定位显著性区域的能力,相比于传统方法,在平均置信度下降率、置信度上升比例、信息量等评估指标上,所提算法具有更强的可理解性,能够作为通用的增强网络可理解性的方法。 展开更多
关键词 SAR目标识别 网络可理解性 SAR杂波特性 类激活映射 面积约束置信度下降率
在线阅读 下载PDF
基于高光谱成像技术的陈皮年份快速鉴别
15
作者 刘诚 赵路路 +2 位作者 周松斌 刘忆森 王庭有 《食品工业科技》 CAS 北大核心 2024年第24期243-251,共9页
陈皮具有较好的经济价值与药用价值,但目前市场上假冒伪劣、以次充好的现象严重。尤其是陈皮陈化年份作为衡量陈皮品质的重要指标,采用人工检测方法准确率与效率较低。为此,本文采用高光谱成像技术结合深度学习方法,建立陈皮陈化年份的... 陈皮具有较好的经济价值与药用价值,但目前市场上假冒伪劣、以次充好的现象严重。尤其是陈皮陈化年份作为衡量陈皮品质的重要指标,采用人工检测方法准确率与效率较低。为此,本文采用高光谱成像技术结合深度学习方法,建立陈皮陈化年份的快速无损鉴别方法。采集4类不同陈化年份的480个陈皮样本的近红外高光谱数据(波长范围为935.61~1720.23 nm),并采用轻量化卷积网络1D-Rep网络建立分类模型。在此网络基础上,提出基于多层梯度加权类激活映射(M-Grad-CAM)的特征波段选择方法,并建立特征波段分类模型。该方法综合加权多个Rep-block层的梯度生成波段重要性曲线,从而实现融合波段领域相关性与远程相关性的波段重要性指示。为验证方法有效性,采用基于偏最小二乘判别分析(PLS-DA)、随机森林(RF)、支持向量机(SVM)等机器学习方法获得的特征波段作为对比方法。结果表明,1D-Rep全波段光谱模型准确率达到98.55%。在特征波段建模的情况下,采用M-Grad-CAM选取特征波长,基于前9个特征波段建立分类模型准确率可超过90%,在20个特征波段时达到96.82%,准确率显著优于其他对比模型。本研究采用高光谱成像技术,可有效对不同年份的陈皮进行无损鉴别,并为开发便携检测仪器提供方法和理论依据。 展开更多
关键词 高光谱成像 陈皮 陈化年份 多层梯度加权类激活映射 特征波段
在线阅读 下载PDF
基于高分辨率类激活映射算法的弱监督目标实时检测
16
作者 孙辉 史玉龙 +2 位作者 张健一 王蕊 王羽玥 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1051-1059,共9页
受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映... 受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映射算法的弱监督目标实时检测方法,降低网络对目标实例标注的依赖。该方法将目标检测细划分为弱监督目标定位和目标实时检测两个子任务。在弱监督定位任务中,该文利用对比层级相关性传播理论设计了一种新颖的高分辨率类激活映射算法(HR-CAM),用于获取高质量目标类激活图,生成目标伪检测标注框。在实时检测任务中,该文选取单镜头多盒检测器(SSD)作为目标检测网络,并基于类激活图设计目标感知损失函数(OA-Loss),与目标伪检测标注框共同监督SSD网络的训练过程,提高网络对目标的检测性能。实验结果表明,该文方法在CUB200和TJAB52数据集上实现了对目标准确高效的检测,验证了该文方法的有效性和优越性。 展开更多
关键词 弱监督定位 目标检测 对比层级相关性传播理论 类激活映射算法 目标感知损失函数
在线阅读 下载PDF
基于多分支神经网络模型的弱监督细粒度图像分类方法 被引量:7
17
作者 边小勇 江沛龄 +2 位作者 赵敏 丁胜 张晓龙 《计算机应用》 CSCD 北大核心 2020年第5期1295-1300,共6页
针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络Res... 针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络ResNet-50和旋转不变编码的方向响应网络(ORN);其次,利用预训练模型分别初始化特征网络,并输入原图和以上局部区域分别对模型进行微调;最后,组合三个分支内损失和分支间损失优化整个网络,对测试集进行分类预测。所提方法在CUB-200-2011和FGVC_Aircraft数据集上的分类准确率分别达到87.7%和90.8%,与多注意力卷积神经网络(MA-CNN)方法相比,分别提高了1.2个百分点和0.9个百分点;在Aircraft_2数据集上的分类准确率达到91.8%,比ResNet-50网络提高了4.1个百分点。实验结果表明,所提方法有效提高了弱监督细粒度图像分类的准确率。 展开更多
关键词 细粒度图像分类 深度学习 弱监督 可变形卷积 类激活图 方向响应网络
在线阅读 下载PDF
基于改进YOLOv3算法的水面漂浮物检测方法 被引量:15
18
作者 李国进 姚冬宜 +3 位作者 艾矫燕 易泽仁 雷李义 王旺易 《广西大学学报(自然科学版)》 CAS 北大核心 2021年第6期1569-1578,共10页
针对人工湖中的水面漂浮物检测问题,提出了一种基于改进YOLOv3的水面漂浮物目标检测算法,目标检测包括目标识别与目标定位。首先通过改进的k-means聚类算法获取先验框,以提高定位框与数据集标注框的匹配度,其次在YOLOv3算法框架的3个预... 针对人工湖中的水面漂浮物检测问题,提出了一种基于改进YOLOv3的水面漂浮物目标检测算法,目标检测包括目标识别与目标定位。首先通过改进的k-means聚类算法获取先验框,以提高定位框与数据集标注框的匹配度,其次在YOLOv3算法框架的3个预测支路中添加类别激活映射(CAM),将原基于边界框的定位方式替换成基于像素点进行定位。实验结果表明:改进的YOLOv3算法提高了识别精度,降低了定位误差。识别精度为97.49%,比YOLOv3算法提高5.14%,平均定位误差为2.60个像素点,比YOLOv3算法减小了1.36。 展开更多
关键词 水面漂浮物 目标检测 YOLOv3算法 K-MEANS聚类算法 类别激活映射
在线阅读 下载PDF
深度学习在内镜下内痔诊断及危险分级中的应用 被引量:3
19
作者 陆建英 沈文娟 +6 位作者 顾莹 沈琳霞 张叶群 袁金丹 张芝芝 许春芳 朱锦舟 《中国内镜杂志》 2023年第2期1-7,共7页
目的建立内镜下内痔诊断及危险分级的深度学习模型,探讨人工智能辅助内镜下内痔诊疗的可行性。方法收集该院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组(A任务);根据LDRf分级标准,将内痔组进一步分为Rf0组、Rf1组和Rf2组(B任务)... 目的建立内镜下内痔诊断及危险分级的深度学习模型,探讨人工智能辅助内镜下内痔诊疗的可行性。方法收集该院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组(A任务);根据LDRf分级标准,将内痔组进一步分为Rf0组、Rf1组和Rf2组(B任务)。选取基于卷积神经网络(CNN)框架的Xception、ResNet和EfficientNet,以及基于Transformer框架的ViT和ConvMixer等5个神经网络,建立针对A、B两项计算机视觉任务的深度学习模型。模型评价指标包括准确率、召回率、精确度、F1值和读片时间。将深度学习模型的读片表现与两位不同年资内镜医生进行比较。结果5种深度学习模型在A与B任务测试集中皆展现出较好的准确性。其中,最优模型为ConvMixer,准确性最高(0.961和0.911),其次为EfficientNet(0.956和0.901),均优于高年资内镜医生(0.952和0.881)和低年资内镜医生(0.913和0.832)。同时,所有深度学习模型在验证集中读片用时均<10 s,速度快于内镜医生(均>300 s)。此外,笔者采用梯度加权分类激活映射(Grad-CAM)方法突出图像中对模型判断较重要的区域。结论建立的内痔诊断及危险分级的深度学习模型,其表现优于内镜医生。基于深度学习的计算机视觉模型可辅助内镜医师进行内痔诊断和分级,展现出潜在的临床应用前景。 展开更多
关键词 深度学习 内痔 消化内镜 LDRf分级 梯度加权分类激活映射
暂未订购
基于ResNet的可解释性计算机视觉模型在内镜下内痔评估中的应用 被引量:2
20
作者 刘璐 林嘉希 +4 位作者 朱世祺 高静雯 刘晓琳 许春芳 朱锦舟 《现代消化及介入诊疗》 2023年第8期972-975,980,共5页
目的为克服深度学习模型黑盒不可解释的缺点,本研究旨在探讨可解释性计算机视觉模型在内镜下内痔诊断及危险分级中的应用。方法收集苏州大学附属第一医院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组;根据LDRf分级标准,对内痔组进... 目的为克服深度学习模型黑盒不可解释的缺点,本研究旨在探讨可解释性计算机视觉模型在内镜下内痔诊断及危险分级中的应用。方法收集苏州大学附属第一医院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组;根据LDRf分级标准,对内痔组进一步分级为Rf0、Rf1及Rf2三组。针对有无内痔、红色征、糜烂、血栓及活动性出血,构建基于ResNet50V2的可解释化模型,并利用江苏大学附属金坛医院内镜中心的内镜图片进行外部验证。使用准确性、敏感性、特异性以及F1值等指标对比可解释化模型与传统深度学习黑盒模型的表现,并与两位不同年资内镜医生进行比较。结果ResNet可解释化模型的准确性为0.957、敏感性为0.978、特异性为0.974,F1值为0.958,其准确性高于黑盒模型的0.938,高年资内镜医生的0.933及低年资医生的0.907。此外,模型采用Grad-CAM方法突出图像中对模型推理依据的区域。结论本研究通过收集内镜下肛齿状线上倒镜图像,构建可解释化计算机视觉模型并进行外部验证,提示该模型在内镜下内痔诊断与评级中表现优于传统深度学习黑盒模型。该模型在未来临床内镜诊疗中具有良好应用前景。 展开更多
关键词 可解释性 深度学习 内痔 消化内镜 LDRf分级 梯度加权分类激活映射
暂未订购
上一页 1 2 下一页 到第
使用帮助 返回顶部