期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于Grad-CAM与KL损失的SSD目标检测算法 被引量:10
1
作者 侯庆山 邢进生 《电子学报》 EI CAS CSCD 北大核心 2020年第12期2409-2416,共8页
鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细... 鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细节作可视化处理,并以类激活图的形式呈现各检测层细节,分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此,采用Kullback-Leibler(KL)边框回归损失策略,利用Non Maximum Suppression(NMS)算法输出最终预测框.实验结果表明,改进算法相较于已有检测算法具有更高的准确率以及稳定性. 展开更多
关键词 目标检测 可视化 类激活图 Grad-cam SSD KL损失
在线阅读 下载PDF
Deep Stacked Ensemble Learning Model for COVID-19 Classification
2
作者 G.Madhu B.Lalith Bharadwaj +5 位作者 Rohit Boddeda Sai Vardhan K.Sandeep Kautish Khalid Alnowibet Adel F.Alrasheedi Ali Wagdy Mohamed 《Computers, Materials & Continua》 SCIE EI 2022年第3期5467-5486,共20页
COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is requ... COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is required.A reverse transcript polymerase chain reaction(RT-PCR)test is often used to detect the disease.However,since this test is time-consuming,a chest computed tomography(CT)or plain chest X-ray(CXR)is sometimes indicated.The value of automated diagnosis is that it saves time and money by minimizing human effort.Three significant contributions are made by our research.Its initial purpose is to use the essential finetuning methodology to test the action and efficiency of a variety of vision models,ranging from Inception to Neural Architecture Search(NAS)networks.Second,by plotting class activationmaps(CAMs)for individual networks and assessing classification efficiency with AUC-ROC curves,the behavior of these models is visually analyzed.Finally,stacked ensembles techniques were used to provide greater generalization by combining finetuned models with six ensemble neural networks.Using stacked ensembles,the generalization of the models improved.Furthermore,the ensemble model created by combining all of the finetuned networks obtained a state-of-the-art COVID-19 accuracy detection score of 99.17%.The precision and recall rates were 99.99%and 89.79%,respectively,highlighting the robustness of stacked ensembles.The proposed ensemble approach performed well in the classification of the COVID-19 lesions on CXR according to the experimental results. 展开更多
关键词 COVID-19 classification class activation maps(cams)visualization finetuning stacked ensembles automated diagnosis deep learning
在线阅读 下载PDF
融合高斯修正的双阶段指导弱监督语义分割
3
作者 白雪飞 王渊辉 +2 位作者 许文杰 姜高霞 王文剑 《中国图象图形学报》 北大核心 2025年第12期3855-3869,共15页
目的端到端的弱监督语义分割模型因其高效的训练效率备受关注,然而现有研究还存在语义信息提取不充分、生成的伪标签质量较低等不足。针对上述问题,本文提出一种基于知识蒸馏的端到端弱监督语义分割框架,通过双阶段知识交互模块增强学... 目的端到端的弱监督语义分割模型因其高效的训练效率备受关注,然而现有研究还存在语义信息提取不充分、生成的伪标签质量较低等不足。针对上述问题,本文提出一种基于知识蒸馏的端到端弱监督语义分割框架,通过双阶段知识交互模块增强学生网络和教师网络之间的知识传递,同时借助高斯修正模块对伪标签进行修正。方法首先,设计双阶段知识交互模块强化教师网络和学生网络的特征学习过程,有效降低训练过程中的噪声干扰。其次,为了生成高质量的伪标签,设计了高斯修正模块,通过拟合类激活图的分布,利用EM(expectation maximization)算法估算每个像素点的噪声概率,并依据与邻域像素的相似度关系修正伪标签,进而提升弱监督语义分割网络的性能。结果本文方法在PASCAL VOC 2012(pattern analysis,statical modeling and computational learning visual object classes 2012)和MS COCO 2014(Microsoft common objects in context 2014)数据集上的mIoU(mean intersection over union)值分别达到74.8%和42.3%,优于其他对比方法。结论通过双阶段知识交互模块以及高斯修正模块,有效降低了图像内部噪声以及潜在的标签噪声对训练过程的影响,并且改善了伪标签生成不完整的问题,与现有方法相比取得了显著的性能提升,在端到端的弱监督语义分割方法中展现出明显的优越性,具有一定的研究价值。 展开更多
关键词 深度学习 端到端弱监督语义分割 高斯混合模型(GMM) 知识蒸馏 类激活图(cam)
原文传递
井下煤炭运输多环节复杂背景下高精度煤矸识别方法
4
作者 栾亨宣 安乐 +7 位作者 田莹 顾颉颖 张强 陈宏伟 付翔 胡成军 崔志芳 陈锐 《煤炭科学技术》 北大核心 2025年第9期459-468,共10页
煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据... 煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据集,包含水渍、煤粉、碎煤与碎矸石及运输设备部件等背景干扰因素。提出了一种融合多种注意力与残差连接的高精度煤矸智能识别方法,高分辨率阶段使用残差卷积块快速生成高质量标记(token),后续阶段使用级联的Channel Spatial Swin Transformer Block(CSSTB)进行深层表征学习。为提升模型对背景噪声的抗干扰能力,网络集成全局、通道、空间多种注意力机制,增强特征表达的鲁棒性。CSSTB中利用基于负斜率特性强化稀疏激活的LeakyReLU线性注意力机制建模全局信息,通过卷积注意力机制模块(CBAM)优化模型注意力分布,提升模型泛化能力。此外,考虑到煤、矸石和输送设备零部件的尺度差异,跨阶段使用残差连接以增强多尺度特征的通信和信息流通。结果表明:所提模型在单一、二混合和三混合背景上的平均准确度达到95.06%、97.77%、95.65%,相较于基线网络Swin Transformer-Tiny分别提高7.01%、4.83%、1.03%。可视化试验表明,对比模型在水渍、暗光和反光等复杂背景干扰下难以准确区分煤和矸石,而所提出模型能够精准聚焦于煤和矸石的关键特征区域,抗干扰能力强。研究结果为井下原煤运输中的煤矸高效分选提供了理论参考。 展开更多
关键词 深度学习 煤矸识别 井下环境 注意力机制 梯度加权类激活热图
在线阅读 下载PDF
多层混合注意力机制的类激活图可解释性方法
5
作者 张剑 张一然 王梓聪 《中国图象图形学报》 北大核心 2025年第7期2468-2483,共16页
目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊... 目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊、范围过大和细粒度不足的问题。为此,提出一种多层混合注意力机制的类激活图方法(spatial attention-based multi-layer fusion for high-quality class activation maps,SAMLCAM),以优化这些局限性。方法在以往的类激活图方法忽略了空间位置信息只关注通道级权重,降低了目标物体的定位性能,SAMLCAM方法提出一种结合了通道注意力机制和空间注意力机制的混合注意力机制,实现增强目标物体定位减少无效位置信息的效果。在得到有效物体定位结果后,根据神经网络多层卷积层的特点,改进多层特征图融合的方式提出多层加权融合机制,改善类激活图的边界效果范围过大和细粒度不足的问题,从而增强类激活图的视觉解释性。结果引用广泛用于计算机视觉模型的基准测试ILSVRC 2012(ImageNet Large-scale Visual Recognition Challenge 2012)数据集和MS COCO2017(Microsoft common objects in context 2017)数据集,对提出方法在多种待解释卷积网络模型下进行评估,包括消融实验、定性评估和定量评估。消融实验证明了各模块的有效性;定性评估对其可解释性效果进行视觉直观展示,验证效果的提升;定量评估中数据表明,SAMLCAM在Loc1和Loc5指标性能相较于最低数据均有大于8%的提升,在能量定位决策指标相较于最低数据均有大于7%的提升。由于改进方法减少了目标样本区域的上下文背景区域,使其对结果置信度存在负影响,但在可信度指标中,与其他方法比较仍可以保持比较小的差距并维持较高性能。结论本文方法在多种卷积神经网络架构上均展现出优异的解释性能,通过扩大目标样本区域的响应覆盖度并有效抑制背景或无关区域的响应,提升了可解释性结果的精确性与可靠性。 展开更多
关键词 类激活图(cam) 可解释性 注意力机制 图像分类 卷积神经网络(CNN)
原文传递
可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用
6
作者 王璐 刘东 刘卫光 《计算机应用》 北大核心 2025年第1期261-274,共14页
近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNe... 近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNet50和DenseNet121(Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad(Full Gradient-weighted)解释模型识别的判断依据。实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点。可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率。 展开更多
关键词 可变形卷积网络 可解释性 蝴蝶物种识别 类激活映射 显著性移除
在线阅读 下载PDF
基于生成对抗网络的舌象图像特征提取方法
7
作者 阮群生 王硕诚 吴清锋 《计算机科学与探索》 北大核心 2025年第11期3007-3022,共16页
舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图... 舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图像特征提取新方法(TongueIFE-GAN)。该方法通过对抗思想构建一种面向舌象图像潜在特征的提取网络,它包括判别器和生成器两个重要组成部分,藉此建立图像重构质量与舌象图像的特征提取效果映射关系。为增强深度算法的可解释性,在网络判别器中融入类激活映射机制,进一步优化编码器的特征处理性能,并对TongueIFE-GAN模型在提取特征时关注的图像敏感区域作出可视化解释。同时,在舌象图像分割、分类任务驱动下,新模型可自优化舌象特征提取的能力。通过多组实验,结果表明,基于TongueIFE-GAN模型的舌象分割和分类任务,其分割性能IoU与Dice指标值,以及分类准确率均优于基准模型和对比方法。TongueIFE-GAN利用对抗思想构建新型的特征提取以及注意力可视化机制的研究方法,可为舌象图像特征研究提供一种新的思路。 展开更多
关键词 生成对抗网络 舌象图像 类激活映射 舌象图像分割 舌象分类
在线阅读 下载PDF
类激活图回放和最小熵采样的多标签类增量学习
8
作者 周怡凡 杜凯乐 +2 位作者 吕凡 胡伏原 刘光灿 《中国图象图形学报》 北大核心 2025年第8期2633-2644,共12页
目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使... 目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使得跨任务之间的关联被完全阻断,模型无法区别新类与旧类,导致相似类别的混淆。方法为了解决类别混淆问题,提出一种类激活图回放和最小熵采样的多标签类增量学习,以实现跨任务的监督信息传递。具体地,首先在传统经验回放策略的基础上,开辟一块新的存储区用于存储样本正类的类激活图。其次,基于交叉熵的数值对当前任务样本进行采样,以挑选那些拥有精确类激活图的样本放入存储区作为回放样本。最后,在后续任务中回放样本,对当前模型的正类激活图输出进行正向监督,并将存储的正类的激活图作为其他类别激活图的反向监督,使其显著区域不重合。结果在PASCAL VOC(pattern analysis,statistical modeling and computational learning visual object classes)数据集上进行广泛实验,验证了所提出方法的有效性和鲁棒性。对比实验结果表明,类激活图监督回放方法显著提升了模型在多标签连续学习中的性能。结论本文所提出的类激活图监督回放法为跨任务类别补充了监督信息,缓解了多标签类增量学习中的标签缺失问题。 展开更多
关键词 类增量学习(CIL) 多标签分类 多标签类增量学习(MLCIL) 类激活图 最小化熵
原文传递
基于类激活多尺度注意力的红外图像和可见光图像融合的生成对抗网络
9
作者 高祺明 姚斌 王梅嘉 《软件工程》 2025年第7期57-63,共7页
针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合... 针对生成对抗网络的图像融合任务中,因为只关注了一种图像特征,而导致信息缺失的问题。提出了一种基于类激活多尺度注意力的生成对抗网络融合算法。首先,使用类激活注意力特征机制进行特征提取;其次,在融合时使用了红外与可见特征融合和可见与红外特征融合双通道,使融合图像中红外源图像和可见光源图像的特征更加平衡。模型在TNO数据集上进行大量的对比实验,相较于同类算法,互信息提升了11.28%,标准差提升了4.18%,峰值信噪比提升了2.00%。 展开更多
关键词 注意力机制 生成对抗网络 类激活图
在线阅读 下载PDF
基于合作博弈Shapley值法的类激活映射算法
10
作者 许莉 常雨晴 +2 位作者 柴霁轩 宛旭 范纯龙 《计算机工程与设计》 北大核心 2025年第3期795-803,共9页
为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权... 为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权重对特征图进行加权求和,得到类激活图,对神经网络模型的决策机制进行解释。重点考虑网络最后一层中每个特征图对结果的影响,可视化输入图像中对模型输出造成正向影响的区域。实验结果表明,该方法能够更准确地解释深度神经网络的决策依据,在定位能力和算法忠诚度等方面的性能得到了显著提升。 展开更多
关键词 深度神经网络 特征重要性 类激活映射 可解释性 合作博弈 沙普利值 特征图
在线阅读 下载PDF
利用多种子信息聚合和正负混合学习的弱监督图像语义分割
11
作者 桑雨 刘通 +3 位作者 马天娇 李乐 李思漫 刘宇男 《电子与信息学报》 北大核心 2025年第10期3993-4004,共12页
基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理... 基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理手段进一步提升种子的质量,但其得到的种子仍存在不等程度的噪声。为了减少噪声标签对分割网络造成的影响,考虑多个不同种子更能有效提取出正确信息,该文从多种子信息互补的角度,提出一种基于多种子信息聚合和正负混合学习的弱监督图像语义分割方法,通过在分类网络中改变输入图像尺度以及调整Dropout层随机隐藏神经元的概率,获取多个优良种子;依据它们对每个像素分配的类别标签情况进行优选获得聚合种子,并进一步区分该像素标签为干净标签还是噪声标签;利用正负混合学习训练语义分割网络,引入预测约束损失以避免网络对噪声标签给予过高的预测值,进而对干净标签应用正学习发挥正确信息的准确性,对噪声标签应用负学习抑制错误信息的影响,从而有效提升分割网络的性能。在PASCAL VOC 2012和MS COCO 2014验证集上实验结果表明,该文方法在基于卷积神经网络框架的分割网络中,mIoU分别达到了72.5%和40.8%,与RCA及URN方法相比分别提升了0.3%与0.1%;在基于Transformer框架的分割网络中,mIoU则提升至76.8%和46.7%,与CoBra及ECA方法相比分别提升了2.5%与1.6%,验证了方法的有效性。 展开更多
关键词 弱监督语义分割 类激活映射 多种子 交叉熵 正负学习
在线阅读 下载PDF
可解释性模型在溃疡性结肠炎Mayo内镜评分中的应用
12
作者 李裕 徐晓丹 朱锦舟 《中国医疗设备》 2025年第9期20-25,共6页
目的建立基于临床知识的可解释性计算机模型,与传统黑盒模型进行比较,进一步提高模型在溃疡性结肠炎(Ulcerative Colitis,UC)Mayo内镜评分中的效果。方法收集苏州大学附属第一医院内镜中心的内镜图片共2251张作为训练集和内部验证集。根... 目的建立基于临床知识的可解释性计算机模型,与传统黑盒模型进行比较,进一步提高模型在溃疡性结肠炎(Ulcerative Colitis,UC)Mayo内镜评分中的效果。方法收集苏州大学附属第一医院内镜中心的内镜图片共2251张作为训练集和内部验证集。根据Mayo内镜评分系统将图片分为0组、1组、2组、3组,构建黑盒模型。同时,根据溃疡(有、无)、自发性出血(有、无)、红斑(无、可见、明显)、血管纹理(正常、模糊、消失)及黏膜脆性(正常、轻度、易脆)共5个特征对所有图片进行标记,建立亚特征模型,融合后构建可解释化模型。此外,利用苏州大学附属常熟医院内镜中心的内镜图片进行外部验证。在外部验证集中,计算准确度、马修相关系数(MCC)、卡帕系数等指标对比可解释化模型与黑盒模型的表现,并与2位不同年资内镜医师的分级指标结果进行比较。最后,采用Grad-CAM法突出模型推理依据的区域。结果基于MobileNet、ResNet、Xception及EfficientNet的4种可解释化模型在外部验证集中的准确度分别为0.765、0.800、0.830、0.885,均优于对应传统黑盒模型的0.665、0.705、0.775、0.815,其中基于EfficientNet的可解释性模型表现最优,同时优于低年资医师(0.805)及高年资医师(0.870)。结论在内镜下UC Mayo内镜分级诊断中,可解释化模型较传统深度学习黑盒模型表现更优异。可解释化模型在未来溃疡性结肠炎内镜下诊断中具有良好的应用价值。 展开更多
关键词 可解释性 深度学习 溃疡性结肠炎 消化内镜 Mayo内镜评分 梯度加权分类激活映射
暂未订购
基于多分支神经网络模型的弱监督细粒度图像分类方法 被引量:7
13
作者 边小勇 江沛龄 +2 位作者 赵敏 丁胜 张晓龙 《计算机应用》 CSCD 北大核心 2020年第5期1295-1300,共6页
针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络Res... 针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络ResNet-50和旋转不变编码的方向响应网络(ORN);其次,利用预训练模型分别初始化特征网络,并输入原图和以上局部区域分别对模型进行微调;最后,组合三个分支内损失和分支间损失优化整个网络,对测试集进行分类预测。所提方法在CUB-200-2011和FGVC_Aircraft数据集上的分类准确率分别达到87.7%和90.8%,与多注意力卷积神经网络(MA-CNN)方法相比,分别提高了1.2个百分点和0.9个百分点;在Aircraft_2数据集上的分类准确率达到91.8%,比ResNet-50网络提高了4.1个百分点。实验结果表明,所提方法有效提高了弱监督细粒度图像分类的准确率。 展开更多
关键词 细粒度图像分类 深度学习 弱监督 可变形卷积 类激活图 方向响应网络
在线阅读 下载PDF
深度学习在内镜下内痔诊断及危险分级中的应用 被引量:3
14
作者 陆建英 沈文娟 +6 位作者 顾莹 沈琳霞 张叶群 袁金丹 张芝芝 许春芳 朱锦舟 《中国内镜杂志》 2023年第2期1-7,共7页
目的建立内镜下内痔诊断及危险分级的深度学习模型,探讨人工智能辅助内镜下内痔诊疗的可行性。方法收集该院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组(A任务);根据LDRf分级标准,将内痔组进一步分为Rf0组、Rf1组和Rf2组(B任务)... 目的建立内镜下内痔诊断及危险分级的深度学习模型,探讨人工智能辅助内镜下内痔诊疗的可行性。方法收集该院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组(A任务);根据LDRf分级标准,将内痔组进一步分为Rf0组、Rf1组和Rf2组(B任务)。选取基于卷积神经网络(CNN)框架的Xception、ResNet和EfficientNet,以及基于Transformer框架的ViT和ConvMixer等5个神经网络,建立针对A、B两项计算机视觉任务的深度学习模型。模型评价指标包括准确率、召回率、精确度、F1值和读片时间。将深度学习模型的读片表现与两位不同年资内镜医生进行比较。结果5种深度学习模型在A与B任务测试集中皆展现出较好的准确性。其中,最优模型为ConvMixer,准确性最高(0.961和0.911),其次为EfficientNet(0.956和0.901),均优于高年资内镜医生(0.952和0.881)和低年资内镜医生(0.913和0.832)。同时,所有深度学习模型在验证集中读片用时均<10 s,速度快于内镜医生(均>300 s)。此外,笔者采用梯度加权分类激活映射(Grad-CAM)方法突出图像中对模型判断较重要的区域。结论建立的内痔诊断及危险分级的深度学习模型,其表现优于内镜医生。基于深度学习的计算机视觉模型可辅助内镜医师进行内痔诊断和分级,展现出潜在的临床应用前景。 展开更多
关键词 深度学习 内痔 消化内镜 LDRf分级 梯度加权分类激活映射
暂未订购
位置地图情境分类分级与切换研究 被引量:5
15
作者 齐晓飞 王光霞 +1 位作者 薛志伟 袁田 《地理信息世界》 2013年第6期13-18,共6页
情境建模是拓展移动地图应用,提供个性化位置服务的有效工具。本文鉴于目前的情境模型存在情境类型区分不清晰、不同情境之间难以切换的问题。首先,剖析了活动与情境分类分级的联系,提出了一种基于活动分层的位置地图情境分类分级方法;... 情境建模是拓展移动地图应用,提供个性化位置服务的有效工具。本文鉴于目前的情境模型存在情境类型区分不清晰、不同情境之间难以切换的问题。首先,剖析了活动与情境分类分级的联系,提出了一种基于活动分层的位置地图情境分类分级方法;然后,在此基础上,研究了情境切换的方式与方法,建立了位置地图情境切换方式与方法之间的对应关系;最后,以用户去机场登机为例,进行了实际验证。 展开更多
关键词 活动 情境 位置地图 情境分类分级 情境切换
在线阅读 下载PDF
深度学习结构优化的图像情感分类 被引量:4
16
作者 盛家川 陈雅琦 +1 位作者 王君 韩亚洪 《红外与激光工程》 EI CSCD 北大核心 2020年第11期256-265,共10页
自然图像情感分类在分析用户需求、监控网络舆情等方面具有重要意义。然而基于深度学习的分类算法存在训练过程难以控制、分类结果缺乏解释的问题。为此提出一种人类知识驱动的深度学习结构优化算法。首先通过特征可视化显示卷积神经网... 自然图像情感分类在分析用户需求、监控网络舆情等方面具有重要意义。然而基于深度学习的分类算法存在训练过程难以控制、分类结果缺乏解释的问题。为此提出一种人类知识驱动的深度学习结构优化算法。首先通过特征可视化显示卷积神经网络提取的情感特征;其次结合人类对图像情感可视化结果的感知来优化网络结构,利用人类知识驱动网络,重点学习情感信息更明显的特征;最后对所构建网络的参数进行微调,使其更适用于自然图像情感分类任务。在Twitter情感图像数据集上与其他分类方法的对比实验表明,所提出的算法获得了88.1%的分类准确率,优于其他方法。消融实验证明网络优化结果比未优化提高了8.1%。类激活图、空间位置和神经元组特征可视化直观解释了模型运作的过程与原因,进一步证实算法识别自然图像情感的能力。 展开更多
关键词 图像情感 图像分类 卷积神经网络 可视化 类激活图
原文传递
一种结合类激活映射的半监督图像分类方法 被引量:4
17
作者 王宪保 肖本督 姚明海 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1204-1209,共6页
半监督学习要求无标记数据集远大于标记数据集,然而无标记数据集中包含的复杂无关信息又会对模型训练造成负面影响.针对此问题,本文提出了一种基于增强的均值教师模型的半监督图像分类方法.首先根据类激活映射的工作机制,构建一个具有... 半监督学习要求无标记数据集远大于标记数据集,然而无标记数据集中包含的复杂无关信息又会对模型训练造成负面影响.针对此问题,本文提出了一种基于增强的均值教师模型的半监督图像分类方法.首先根据类激活映射的工作机制,构建一个具有类激活映射功能的网络;然后将无标记数据集输入结合类激活映射的目标初定位网络,得到目标初定位图;最后将标记图像和目标初定位图像组成训练数据集,训练得到半监督图像分类器.本文设置了标记数据占比、骨干网络、数据集的对比实验,结果表明,本文算法在Top1和Top5上的表现优于现有算法,说明了本文算法的可行性和有效性. 展开更多
关键词 半监督学习 图像分类 卷积神经网络 类激活映射
在线阅读 下载PDF
显著性引导的目标互补隐藏弱监督语义分割 被引量:3
18
作者 白雪飞 卢立彬 王文剑 《中国图象图形学报》 CSCD 北大核心 2024年第4期1041-1055,共15页
目的 图像级弱监督语义分割方法利用类别标签训练分割网络,可显著降低标注成本。现有方法大多采用类激活图定位目标物体,然而传统类激活图只能挖掘出物体中最具辨识性的区域,直接将其作为伪标签训练的分割网络精度较差。本文提出一种显... 目的 图像级弱监督语义分割方法利用类别标签训练分割网络,可显著降低标注成本。现有方法大多采用类激活图定位目标物体,然而传统类激活图只能挖掘出物体中最具辨识性的区域,直接将其作为伪标签训练的分割网络精度较差。本文提出一种显著性引导的弱监督语义分割算法,可在获取更完整类激活图的基础上提高分割模型的性能。方法 首先通过显著图对目标进行互补随机隐藏,以获得互补图像对,然后融合互补图像对的类激活图作为监督,提高网络获取完整类激活图的能力。其次引入双重注意力修正模块,利用全局信息修正类激活图并生成伪标签训练分割网络。最后使用标签迭代精调策略,结合分割网络的初始预测、类激活图以及显著图生成更精确的伪标签,迭代训练分割网络。结果 在PASCAL VOC 2012(pattern analysis,statistical modeling and computational learning visual object classes 2012)数据集上进行类激活图生成实验与语义分割实验,所生成的类激活图更加完整,平均交并比有10.21%的提升。语义分割结果均优于对比方法,平均交并比提升6.9%。此外在COCO 2014(common object in context 2014)数据集上进行了多目标的语义分割实验,平均交并比提升0.5%。结论 该算法可获得更完整的类激活图,缓解了弱监督语义分割中监督信息不足的问题,提升了弱监督语义分割模型的精度。 展开更多
关键词 深度学习 弱监督语义分割 显著性引导 类激活图(cam) 注意力机制
原文传递
基于改进VGG-19卷积神经网络的冰鲜鲳鱼新鲜度评估方法 被引量:17
19
作者 李振波 李萌 +2 位作者 赵远洋 郭若皓 陈雅茹 《农业工程学报》 EI CAS CSCD 北大核心 2021年第22期286-294,共9页
保障冰鲜水产品的质量安全是提升水产行业供求效益的关键环节之一。传统的水产品新鲜度检测方法存在破坏样本、操作复杂、检测效率低等问题,冷链储运的发展急需一种快速、准确的鱼肉新鲜度检测技术。该研究以冰鲜鲳鱼为研究对象,提出基... 保障冰鲜水产品的质量安全是提升水产行业供求效益的关键环节之一。传统的水产品新鲜度检测方法存在破坏样本、操作复杂、检测效率低等问题,冷链储运的发展急需一种快速、准确的鱼肉新鲜度检测技术。该研究以冰鲜鲳鱼为研究对象,提出基于计算机视觉的鲳鱼新鲜度评估方法,为鱼肉冷链储运系统智能化发展提供技术支持。首先,建立冰鲜鲳鱼新鲜度等级图像数据集。其次,针对数据集规模小的问题,结合迁移学习方法训练卷积神经网络CNN(Convolutional Neural Network)提高模型的泛化能力,并选择试验效果较优的VGG-19(Visual Geometry Group 19)为分类算法主模型。最后,针对VGG-19分类网络结构复杂的问题,优化全连接层数量及结构,该优化模型的鲳鱼新鲜度识别准确率可达99.79%,与优化全连接层前相比准确率提升了1.05个百分点,全连接层参数量降低了97%,占空间降低了443.9 MB,时间效率、空间效率也均有提升。此外,为进一步说明模型对鲳鱼新鲜度等级的判定依据,该研究利用类激活映射方法对鲳鱼新鲜度分级结果进行可视化,试验表明鲳鱼腹部特征是对新鲜度分级最有效的信息,研究结果为构建基于深度卷积神经网络的鱼肉新鲜度分级模型提供参考。 展开更多
关键词 计算机视觉 卷积神经网络 冰鲜鲳鱼 新鲜度 分类网络 迁移学习 类激活映射
在线阅读 下载PDF
基于集成迁移学习的细粒度图像分类算法 被引量:18
20
作者 吴建 许镜 丁韬 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2020年第3期452-458,共7页
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(cla... 针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。 展开更多
关键词 细粒度图像分类 集成迁移学习 类别激活映射 随机加权平均
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部