期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
Deep Stacked Ensemble Learning Model for COVID-19 Classification
1
作者 G.Madhu B.Lalith Bharadwaj +5 位作者 Rohit Boddeda Sai Vardhan K.Sandeep Kautish Khalid Alnowibet Adel F.Alrasheedi Ali Wagdy Mohamed 《Computers, Materials & Continua》 SCIE EI 2022年第3期5467-5486,共20页
COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is requ... COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is required.A reverse transcript polymerase chain reaction(RT-PCR)test is often used to detect the disease.However,since this test is time-consuming,a chest computed tomography(CT)or plain chest X-ray(CXR)is sometimes indicated.The value of automated diagnosis is that it saves time and money by minimizing human effort.Three significant contributions are made by our research.Its initial purpose is to use the essential finetuning methodology to test the action and efficiency of a variety of vision models,ranging from Inception to Neural Architecture Search(NAS)networks.Second,by plotting class activationmaps(CAMs)for individual networks and assessing classification efficiency with AUC-ROC curves,the behavior of these models is visually analyzed.Finally,stacked ensembles techniques were used to provide greater generalization by combining finetuned models with six ensemble neural networks.Using stacked ensembles,the generalization of the models improved.Furthermore,the ensemble model created by combining all of the finetuned networks obtained a state-of-the-art COVID-19 accuracy detection score of 99.17%.The precision and recall rates were 99.99%and 89.79%,respectively,highlighting the robustness of stacked ensembles.The proposed ensemble approach performed well in the classification of the COVID-19 lesions on CXR according to the experimental results. 展开更多
关键词 COVID-19 classification class activation maps(CAMs)visualization finetuning stacked ensembles automated diagnosis deep learning
在线阅读 下载PDF
多层混合注意力机制的类激活图可解释性方法
2
作者 张剑 张一然 王梓聪 《中国图象图形学报》 北大核心 2025年第7期2468-2483,共16页
目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊... 目的深度卷积神经网络在视觉任务中的广泛应用,使得其作为黑盒模型的复杂性和不透明性引发了对决策机制的关注。类激活图已被证明能有效提升图像分类的可解释性从而提高决策机制的理解程度,但现有方法在高亮目标区域时,常存在边界模糊、范围过大和细粒度不足的问题。为此,提出一种多层混合注意力机制的类激活图方法(spatial attention-based multi-layer fusion for high-quality class activation maps,SAMLCAM),以优化这些局限性。方法在以往的类激活图方法忽略了空间位置信息只关注通道级权重,降低了目标物体的定位性能,SAMLCAM方法提出一种结合了通道注意力机制和空间注意力机制的混合注意力机制,实现增强目标物体定位减少无效位置信息的效果。在得到有效物体定位结果后,根据神经网络多层卷积层的特点,改进多层特征图融合的方式提出多层加权融合机制,改善类激活图的边界效果范围过大和细粒度不足的问题,从而增强类激活图的视觉解释性。结果引用广泛用于计算机视觉模型的基准测试ILSVRC 2012(ImageNet Large-scale Visual Recognition Challenge 2012)数据集和MS COCO2017(Microsoft common objects in context 2017)数据集,对提出方法在多种待解释卷积网络模型下进行评估,包括消融实验、定性评估和定量评估。消融实验证明了各模块的有效性;定性评估对其可解释性效果进行视觉直观展示,验证效果的提升;定量评估中数据表明,SAMLCAM在Loc1和Loc5指标性能相较于最低数据均有大于8%的提升,在能量定位决策指标相较于最低数据均有大于7%的提升。由于改进方法减少了目标样本区域的上下文背景区域,使其对结果置信度存在负影响,但在可信度指标中,与其他方法比较仍可以保持比较小的差距并维持较高性能。结论本文方法在多种卷积神经网络架构上均展现出优异的解释性能,通过扩大目标样本区域的响应覆盖度并有效抑制背景或无关区域的响应,提升了可解释性结果的精确性与可靠性。 展开更多
关键词 类激活图(CAM) 可解释性 注意力机制 图像分类 卷积神经网络(CNN)
原文传递
基于生成对抗网络的舌象图像特征提取方法
3
作者 阮群生 王硕诚 吴清锋 《计算机科学与探索》 北大核心 2025年第11期3007-3022,共16页
舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图... 舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图像特征提取新方法(TongueIFE-GAN)。该方法通过对抗思想构建一种面向舌象图像潜在特征的提取网络,它包括判别器和生成器两个重要组成部分,藉此建立图像重构质量与舌象图像的特征提取效果映射关系。为增强深度算法的可解释性,在网络判别器中融入类激活映射机制,进一步优化编码器的特征处理性能,并对TongueIFE-GAN模型在提取特征时关注的图像敏感区域作出可视化解释。同时,在舌象图像分割、分类任务驱动下,新模型可自优化舌象特征提取的能力。通过多组实验,结果表明,基于TongueIFE-GAN模型的舌象分割和分类任务,其分割性能IoU与Dice指标值,以及分类准确率均优于基准模型和对比方法。TongueIFE-GAN利用对抗思想构建新型的特征提取以及注意力可视化机制的研究方法,可为舌象图像特征研究提供一种新的思路。 展开更多
关键词 生成对抗网络 舌象图像 类激活映射 舌象图像分割 舌象分类
在线阅读 下载PDF
类激活图回放和最小熵采样的多标签类增量学习
4
作者 周怡凡 杜凯乐 +2 位作者 吕凡 胡伏原 刘光灿 《中国图象图形学报》 北大核心 2025年第8期2633-2644,共12页
目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使... 目的多标签类增量学习旨在学习多标签分类任务时,能够持续学习新任务中的新标签信息,同时保持对之前学习任务的良好性能。不同于单标签连续学习中的标签互斥性假设,多标签连续学习中的跨任务标签无法被补全。因此,样本的大量标签缺失使得跨任务之间的关联被完全阻断,模型无法区别新类与旧类,导致相似类别的混淆。方法为了解决类别混淆问题,提出一种类激活图回放和最小熵采样的多标签类增量学习,以实现跨任务的监督信息传递。具体地,首先在传统经验回放策略的基础上,开辟一块新的存储区用于存储样本正类的类激活图。其次,基于交叉熵的数值对当前任务样本进行采样,以挑选那些拥有精确类激活图的样本放入存储区作为回放样本。最后,在后续任务中回放样本,对当前模型的正类激活图输出进行正向监督,并将存储的正类的激活图作为其他类别激活图的反向监督,使其显著区域不重合。结果在PASCAL VOC(pattern analysis,statistical modeling and computational learning visual object classes)数据集上进行广泛实验,验证了所提出方法的有效性和鲁棒性。对比实验结果表明,类激活图监督回放方法显著提升了模型在多标签连续学习中的性能。结论本文所提出的类激活图监督回放法为跨任务类别补充了监督信息,缓解了多标签类增量学习中的标签缺失问题。 展开更多
关键词 类增量学习(CIL) 多标签分类 多标签类增量学习(MLCIL) 类激活图 最小化熵
原文传递
可解释性模型在溃疡性结肠炎Mayo内镜评分中的应用
5
作者 李裕 徐晓丹 朱锦舟 《中国医疗设备》 2025年第9期20-25,共6页
目的建立基于临床知识的可解释性计算机模型,与传统黑盒模型进行比较,进一步提高模型在溃疡性结肠炎(Ulcerative Colitis,UC)Mayo内镜评分中的效果。方法收集苏州大学附属第一医院内镜中心的内镜图片共2251张作为训练集和内部验证集。根... 目的建立基于临床知识的可解释性计算机模型,与传统黑盒模型进行比较,进一步提高模型在溃疡性结肠炎(Ulcerative Colitis,UC)Mayo内镜评分中的效果。方法收集苏州大学附属第一医院内镜中心的内镜图片共2251张作为训练集和内部验证集。根据Mayo内镜评分系统将图片分为0组、1组、2组、3组,构建黑盒模型。同时,根据溃疡(有、无)、自发性出血(有、无)、红斑(无、可见、明显)、血管纹理(正常、模糊、消失)及黏膜脆性(正常、轻度、易脆)共5个特征对所有图片进行标记,建立亚特征模型,融合后构建可解释化模型。此外,利用苏州大学附属常熟医院内镜中心的内镜图片进行外部验证。在外部验证集中,计算准确度、马修相关系数(MCC)、卡帕系数等指标对比可解释化模型与黑盒模型的表现,并与2位不同年资内镜医师的分级指标结果进行比较。最后,采用Grad-CAM法突出模型推理依据的区域。结果基于MobileNet、ResNet、Xception及EfficientNet的4种可解释化模型在外部验证集中的准确度分别为0.765、0.800、0.830、0.885,均优于对应传统黑盒模型的0.665、0.705、0.775、0.815,其中基于EfficientNet的可解释性模型表现最优,同时优于低年资医师(0.805)及高年资医师(0.870)。结论在内镜下UC Mayo内镜分级诊断中,可解释化模型较传统深度学习黑盒模型表现更优异。可解释化模型在未来溃疡性结肠炎内镜下诊断中具有良好的应用价值。 展开更多
关键词 可解释性 深度学习 溃疡性结肠炎 消化内镜 Mayo内镜评分 梯度加权分类激活映射
暂未订购
DRSTN:深度残差软阈值化网络
6
作者 曹岩 朱真峰 《计算机科学》 CSCD 北大核心 2024年第S01期81-87,共7页
在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能。神经网络“端到端”的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展。另外,神经网络模型往往需要较长的训练时间... 在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能。神经网络“端到端”的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展。另外,神经网络模型往往需要较长的训练时间。为了提高深度残差网络模型的分类效果和训练效率,引入了模型迁移方法和软阈值化方法,提出了DRSTN(Deep Residual Soft Thresholding Network)网络,并对此网络结构进行微调,生成了不同版本的DRSTN网络。DRSTN网络的性能得益于3个方面的有机整合:1)通过梯度加权类激活映射(Gradients-weighted Class Activation Mapping,Grad-CAM)方法对网络的特征提取进行可视化,根据可视化结果挑选进一步优化的模型;2)基于模型迁移,研究人员不必全新地搭建模型,可以直接在已有的模型上进行优化,能够节省大量训练时间;3)软阈值化作为非线性变换层嵌入到深度残差网络体系结构中,以消除样本中不相关的特征。实验结果表明,在相同训练条件下,DRSTN_KS(3*3)_RB(2:2:2)网络在CIFAR-10数据集上的分类精度相比SKNet-18,ResNet18和ConvNeXt_tiny网络分别提高了15.5%,8.8%和10.9%;该网络也具有一定的泛化性,在MNIST和Fashion MNIST数据集上能够达到快速的迁移效果,分类精度分别达到99.06%和93.15%。 展开更多
关键词 迁移学习 残差网络 梯度加权类激活映射 软阈值化方法 图像分类
在线阅读 下载PDF
Surrounding rock classification from onsite images with deep transfer learning based on EfficientNet
7
作者 Xiaoying ZHUANG Wenjie FAN +2 位作者 Hongwei GUO Xuefeng CHEN Qimin WANG 《Frontiers of Structural and Civil Engineering》 SCIE EI CSCD 2024年第9期1311-1320,共10页
This paper proposes an accurate,efficient and explainable method for the classification of the surrounding rock based on a convolutional neural network(CNN).The state-of-the-art robust CNN model(EfficientNet)is applie... This paper proposes an accurate,efficient and explainable method for the classification of the surrounding rock based on a convolutional neural network(CNN).The state-of-the-art robust CNN model(EfficientNet)is applied to tunnel wall image recognition.Gaussian filtering,data augmentation and other data pre-processing techniques are used to improve the data quality and quantity.Combined with transfer learning,the generality,accuracy and efficiency of the deep learning(DL)model are further improved,and finally we achieve 89.96%accuracy.Compared with other state-of-the-art CNN architectures,such as ResNet and Inception-ResNet-V2(IRV2),the presented deep transfer learning model is more stable,accurate and efficient.To reveal the rock classification mechanism of the proposed model,Gradient-weight Class Activation Map(Grad-CAM)visualizations are integrated into the model to enable its explainability and accountability.The developed deep transfer learning model has been applied to support the tunneling of the Xingyi City Bypass in the high mountain area of Guizhou,China,with great results. 展开更多
关键词 surrounding rock classification convolutional neural network EfficientNet gradient-weight Class activation map
原文传递
图片分类的卷积神经网络可解释性分析 被引量:1
8
作者 方浩澎 《电脑与信息技术》 2024年第1期4-6,36,共4页
为了理解卷积神经网络在图片分类任务中做出决策的依据,进而优化模型,降低调参成本,对卷积神经网络进行可解释性分析是十分有必要的。为此,文章以水果图片分类任务为切入点,使用了多种类激活图,从多个角度分析模型所给出结果的原因。文... 为了理解卷积神经网络在图片分类任务中做出决策的依据,进而优化模型,降低调参成本,对卷积神经网络进行可解释性分析是十分有必要的。为此,文章以水果图片分类任务为切入点,使用了多种类激活图,从多个角度分析模型所给出结果的原因。文章采用Res Net模型先进行微调,在取得较好的分类性能后,进行了语义特征的基础分析、遮挡性分析,以及基于CAM的可解释性分析和LIME可解释性分析,为卷积神经网络提供一定的可解释性。实验结果表明,卷积神经网络做出决策的依据与人类理解的语义是一致的。 展开更多
关键词 图片分类 卷积神经网络 可解释性 类激活图
在线阅读 下载PDF
基于多分支神经网络模型的弱监督细粒度图像分类方法 被引量:7
9
作者 边小勇 江沛龄 +2 位作者 赵敏 丁胜 张晓龙 《计算机应用》 CSCD 北大核心 2020年第5期1295-1300,共6页
针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络Res... 针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络ResNet-50和旋转不变编码的方向响应网络(ORN);其次,利用预训练模型分别初始化特征网络,并输入原图和以上局部区域分别对模型进行微调;最后,组合三个分支内损失和分支间损失优化整个网络,对测试集进行分类预测。所提方法在CUB-200-2011和FGVC_Aircraft数据集上的分类准确率分别达到87.7%和90.8%,与多注意力卷积神经网络(MA-CNN)方法相比,分别提高了1.2个百分点和0.9个百分点;在Aircraft_2数据集上的分类准确率达到91.8%,比ResNet-50网络提高了4.1个百分点。实验结果表明,所提方法有效提高了弱监督细粒度图像分类的准确率。 展开更多
关键词 细粒度图像分类 深度学习 弱监督 可变形卷积 类激活图 方向响应网络
在线阅读 下载PDF
位置地图情境分类分级与切换研究 被引量:5
10
作者 齐晓飞 王光霞 +1 位作者 薛志伟 袁田 《地理信息世界》 2013年第6期13-18,共6页
情境建模是拓展移动地图应用,提供个性化位置服务的有效工具。本文鉴于目前的情境模型存在情境类型区分不清晰、不同情境之间难以切换的问题。首先,剖析了活动与情境分类分级的联系,提出了一种基于活动分层的位置地图情境分类分级方法;... 情境建模是拓展移动地图应用,提供个性化位置服务的有效工具。本文鉴于目前的情境模型存在情境类型区分不清晰、不同情境之间难以切换的问题。首先,剖析了活动与情境分类分级的联系,提出了一种基于活动分层的位置地图情境分类分级方法;然后,在此基础上,研究了情境切换的方式与方法,建立了位置地图情境切换方式与方法之间的对应关系;最后,以用户去机场登机为例,进行了实际验证。 展开更多
关键词 活动 情境 位置地图 情境分类分级 情境切换
在线阅读 下载PDF
深度学习结构优化的图像情感分类 被引量:4
11
作者 盛家川 陈雅琦 +1 位作者 王君 韩亚洪 《红外与激光工程》 EI CSCD 北大核心 2020年第11期256-265,共10页
自然图像情感分类在分析用户需求、监控网络舆情等方面具有重要意义。然而基于深度学习的分类算法存在训练过程难以控制、分类结果缺乏解释的问题。为此提出一种人类知识驱动的深度学习结构优化算法。首先通过特征可视化显示卷积神经网... 自然图像情感分类在分析用户需求、监控网络舆情等方面具有重要意义。然而基于深度学习的分类算法存在训练过程难以控制、分类结果缺乏解释的问题。为此提出一种人类知识驱动的深度学习结构优化算法。首先通过特征可视化显示卷积神经网络提取的情感特征;其次结合人类对图像情感可视化结果的感知来优化网络结构,利用人类知识驱动网络,重点学习情感信息更明显的特征;最后对所构建网络的参数进行微调,使其更适用于自然图像情感分类任务。在Twitter情感图像数据集上与其他分类方法的对比实验表明,所提出的算法获得了88.1%的分类准确率,优于其他方法。消融实验证明网络优化结果比未优化提高了8.1%。类激活图、空间位置和神经元组特征可视化直观解释了模型运作的过程与原因,进一步证实算法识别自然图像情感的能力。 展开更多
关键词 图像情感 图像分类 卷积神经网络 可视化 类激活图
原文传递
一种结合类激活映射的半监督图像分类方法 被引量:4
12
作者 王宪保 肖本督 姚明海 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1204-1209,共6页
半监督学习要求无标记数据集远大于标记数据集,然而无标记数据集中包含的复杂无关信息又会对模型训练造成负面影响.针对此问题,本文提出了一种基于增强的均值教师模型的半监督图像分类方法.首先根据类激活映射的工作机制,构建一个具有... 半监督学习要求无标记数据集远大于标记数据集,然而无标记数据集中包含的复杂无关信息又会对模型训练造成负面影响.针对此问题,本文提出了一种基于增强的均值教师模型的半监督图像分类方法.首先根据类激活映射的工作机制,构建一个具有类激活映射功能的网络;然后将无标记数据集输入结合类激活映射的目标初定位网络,得到目标初定位图;最后将标记图像和目标初定位图像组成训练数据集,训练得到半监督图像分类器.本文设置了标记数据占比、骨干网络、数据集的对比实验,结果表明,本文算法在Top1和Top5上的表现优于现有算法,说明了本文算法的可行性和有效性. 展开更多
关键词 半监督学习 图像分类 卷积神经网络 类激活映射
在线阅读 下载PDF
基于改进VGG-19卷积神经网络的冰鲜鲳鱼新鲜度评估方法 被引量:17
13
作者 李振波 李萌 +2 位作者 赵远洋 郭若皓 陈雅茹 《农业工程学报》 EI CAS CSCD 北大核心 2021年第22期286-294,共9页
保障冰鲜水产品的质量安全是提升水产行业供求效益的关键环节之一。传统的水产品新鲜度检测方法存在破坏样本、操作复杂、检测效率低等问题,冷链储运的发展急需一种快速、准确的鱼肉新鲜度检测技术。该研究以冰鲜鲳鱼为研究对象,提出基... 保障冰鲜水产品的质量安全是提升水产行业供求效益的关键环节之一。传统的水产品新鲜度检测方法存在破坏样本、操作复杂、检测效率低等问题,冷链储运的发展急需一种快速、准确的鱼肉新鲜度检测技术。该研究以冰鲜鲳鱼为研究对象,提出基于计算机视觉的鲳鱼新鲜度评估方法,为鱼肉冷链储运系统智能化发展提供技术支持。首先,建立冰鲜鲳鱼新鲜度等级图像数据集。其次,针对数据集规模小的问题,结合迁移学习方法训练卷积神经网络CNN(Convolutional Neural Network)提高模型的泛化能力,并选择试验效果较优的VGG-19(Visual Geometry Group 19)为分类算法主模型。最后,针对VGG-19分类网络结构复杂的问题,优化全连接层数量及结构,该优化模型的鲳鱼新鲜度识别准确率可达99.79%,与优化全连接层前相比准确率提升了1.05个百分点,全连接层参数量降低了97%,占空间降低了443.9 MB,时间效率、空间效率也均有提升。此外,为进一步说明模型对鲳鱼新鲜度等级的判定依据,该研究利用类激活映射方法对鲳鱼新鲜度分级结果进行可视化,试验表明鲳鱼腹部特征是对新鲜度分级最有效的信息,研究结果为构建基于深度卷积神经网络的鱼肉新鲜度分级模型提供参考。 展开更多
关键词 计算机视觉 卷积神经网络 冰鲜鲳鱼 新鲜度 分类网络 迁移学习 类激活映射
在线阅读 下载PDF
基于集成迁移学习的细粒度图像分类算法 被引量:18
14
作者 吴建 许镜 丁韬 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2020年第3期452-458,共7页
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(cla... 针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。 展开更多
关键词 细粒度图像分类 集成迁移学习 类别激活映射 随机加权平均
在线阅读 下载PDF
面向分类网络的视觉语义解释模型
15
作者 吕学强 赵兴强 +1 位作者 贾智彬 韩晶 《计算机工程》 CAS CSCD 北大核心 2023年第11期220-230,共11页
深度学习的可解释性对推动其在军事场景中应用至关重要。当前主流方法使用类激活图的方式可视化最后一层卷积特征,然而对于网络根据该特征进行分类解释比较模糊。针对此问题,设计一种面向分类网络的视觉语义解释模型。综合考虑前向传播... 深度学习的可解释性对推动其在军事场景中应用至关重要。当前主流方法使用类激活图的方式可视化最后一层卷积特征,然而对于网络根据该特征进行分类解释比较模糊。针对此问题,设计一种面向分类网络的视觉语义解释模型。综合考虑前向传播与反向传播,提出CGNIS算法获取对分类结果起重要作用的神经元,并将其映射到原图,得到更加细化的视觉特征。提出分类网络IRENet,在VGG16中间层添加SIRM和ECA对视觉特征进行识别,更加客观地提取视觉特征中包含的语义特征,并结合视觉特征、语义特征、重要神经元分数信息生成描述模型分类过程的解释性语句。在ImageNet2012数据集上提取10类图像进行实验,结果表明,删除CGNIS算法得到的某一类重要神经元后,对应类的分类准确率下降3%以上,在语义特征提取任务上,IRENet的F1值、准确率、精确率和召回率4项指标较ResNet101等分类网络提升2%以上。此外,利用CGNIS、IRENet对飞机类别进行实验,可生成模型对其分类过程的解释性语句。 展开更多
关键词 分类网络 可解释性 类激活图 重要神经元 语义信息
在线阅读 下载PDF
分类激活图增强的图像分类算法 被引量:9
16
作者 杨萌林 张文生 《计算机科学与探索》 CSCD 北大核心 2020年第1期149-158,共10页
分类激活图(CAM)具有稀疏、不连续、不完整等问题,并且目前大部分研究仅将其用于可视化分析。基于此,首先利用扩张卷积设计了自动加权的多尺度特征学习来弥补分类激活图存在的问题,并将该多尺度特征与分类激活图生成方法结合,设计了多... 分类激活图(CAM)具有稀疏、不连续、不完整等问题,并且目前大部分研究仅将其用于可视化分析。基于此,首先利用扩张卷积设计了自动加权的多尺度特征学习来弥补分类激活图存在的问题,并将该多尺度特征与分类激活图生成方法结合,设计了多尺度分类激活图生成方法。进一步,将该多尺度的分类激活图嵌入到网络中构成了端到端的结构,实现分类性能增强的目的。以残差网络ResNet为骨干网络,提出了分类增强模型ResNet-CE。在三个公开数据集CIFAR10、CIFAR100和STL10上,对该模型进行了大量的实验。实验表明:ResNet-CE在这三个数据集上的分类性能与参数量相当的ResNet相比有明显的提升,识别的错误率分别降低了0.23%、3.56%和7.96%,并且分类性能优于当前大部分的分类网络。提出的算法能够简单地迁移到已有的分类模型中,提高原有模型的分类性能。同时,该算法保留了对模型判断依据可视化和解释的功能,这在医疗影像中的疾病识别、无人驾驶的场景识别等场景中具有一定的应用价值和意义。 展开更多
关键词 图像分类 分类激活图(CAM) 多尺度 可视化 可解释性
在线阅读 下载PDF
特征图自适应知识蒸馏模型 被引量:1
17
作者 吴致远 齐红 +3 位作者 姜宇 崔楚朋 杨宗敏 薛欣慧 《吉林大学学报(理学版)》 CAS 北大核心 2022年第4期881-888,共8页
针对嵌入式和移动设备的计算和存储资源受限,紧凑型网络优化易收敛至较差局部最优解的问题,提出一个特征图自适应知识蒸馏模型,其由特征图适配器和特征图自适应知识蒸馏策略构成.首先,特征图适配器通过异构卷积与视觉特征表达模块的堆... 针对嵌入式和移动设备的计算和存储资源受限,紧凑型网络优化易收敛至较差局部最优解的问题,提出一个特征图自适应知识蒸馏模型,其由特征图适配器和特征图自适应知识蒸馏策略构成.首先,特征图适配器通过异构卷积与视觉特征表达模块的堆叠实现特征图尺寸匹配、教师学生网络特征同步变换及自适应语义信息匹配.其次,特征图自适应知识蒸馏策略将适配器嵌入教师网络对其进行重构,并在训练过程中实现适合用于学生网络隐藏层监督特征的自适应搜索;利用适配器前部输出提示学生网络前部训练,实现教师到学生网络的知识迁移,并在学习率约束条件下进一步优化.最后,在图像分类任务数据集cifar-10上进行实验验证,结果表明,特征图自适应知识蒸馏模型分类正确率提高0.6%,推断损失降低6.5%,并将收敛至78.2%正确率的时间减少至未迁移时的5.6%. 展开更多
关键词 人工智能 知识蒸馏 特征图自适应 模型迁移 图像分类
在线阅读 下载PDF
一种基于区域权重平滑的弱监督目标定位方法
18
作者 刘富 罗冰 裴峥 《西华大学学报(自然科学版)》 CAS 2022年第3期1-7,共7页
由于图像类别标签的弱监督目标定位方法存在定位区域仅覆盖目标最具有显著性类别信息部位的问题,同时,区域的类别信息响应受到关键权重的影响,且关键权重的不均衡导致了定位区域响应的稀疏性,因此,提出一种基于区域权重平滑的弱监督目... 由于图像类别标签的弱监督目标定位方法存在定位区域仅覆盖目标最具有显著性类别信息部位的问题,同时,区域的类别信息响应受到关键权重的影响,且关键权重的不均衡导致了定位区域响应的稀疏性,因此,提出一种基于区域权重平滑的弱监督目标定位方法。文章设计了自适应标准差正则项,以缩小关键权重差异,从而在保留网络分类能力的同时平滑定位区域。在多个数据集上实验的结果表明,采用该方法所得的定位区域覆盖面更广,定位精度更高。 展开更多
关键词 弱监督目标定位 正则化 类别激活谱 图像分类
在线阅读 下载PDF
Deep learning and machine learning neural network approaches for multi class leather texture defect classification and segmentation 被引量:1
19
作者 Praveen Kumar Moganam Denis Ashok Sathia Seelan 《Journal of Leather Science and Engineering》 2022年第1期90-110,共21页
Modern leather industries are focused on producing high quality leather products for sustaining the market com-petitiveness. However, various leather defects are introduced during various stages of manufacturing proce... Modern leather industries are focused on producing high quality leather products for sustaining the market com-petitiveness. However, various leather defects are introduced during various stages of manufacturing process such as material handling, tanning and dyeing. Manual inspection of leather surfaces is subjective and inconsistent in nature;hence machine vision systems have been widely adopted for the automated inspection of leather defects. It is neces-sary develop suitable image processing algorithms for localize leather defects such as folding marks, growth marks, grain off, loose grain, and pinhole due to the ambiguous texture pattern and tiny nature in the localized regions of the leather. This paper presents deep learning neural network-based approach for automatic localization and classifica-tion of leather defects using a machine vision system. In this work, popular convolutional neural networks are trained using leather images of different leather defects and a class activation mapping technique is followed to locate the region of interest for the class of leather defect. Convolution neural networks such as Google net, Squeeze-net, RestNet are found to provide better accuracy of classification as compared with the state-of-the-art neural network architectures and the results are presented. 展开更多
关键词 Convolution neural networks Machine learning classifier Leather defects Multi class classification Class activation map SEGMENTATION
原文传递
基于对比层级相关性传播的由粗到细的类激活映射算法研究 被引量:3
20
作者 孙辉 史玉龙 王蕊 《电子与信息学报》 EI CSCD 北大核心 2023年第4期1454-1463,共10页
以卷积神经网络为代表的深度学习算法高度依赖于模型的非线性和调试技术,在实际应用过程中普遍存在黑箱属性,严重限制了其在安全敏感领域的进一步发展。为此,该文提出一种由粗到细的类激活映射算法(CF-CAM),用于对深度神经网络的决策行... 以卷积神经网络为代表的深度学习算法高度依赖于模型的非线性和调试技术,在实际应用过程中普遍存在黑箱属性,严重限制了其在安全敏感领域的进一步发展。为此,该文提出一种由粗到细的类激活映射算法(CF-CAM),用于对深度神经网络的决策行为进行诊断。该算法重新建立了特征图和模型决策之间的关系,利用对比层级相关性传播理论获取特征图中每个位置对网络决策的贡献生成空间级的相关性掩码,找到影响模型决策的重要性区域,再与经过模糊化操作的输入图像进行线性加权重新输入到网络中得到特征图的目标分数,从空间域和通道域实现对深度神经网络进行由粗到细的解释。实验结果表明,相较于其他方法该文提出的CF-CAM在忠实度和定位性能上具有显著提升。此外,该文将CF-CAM作为一种数据增强策略应用于鸟类细粒度分类任务,对困难样本进行学习,可以有效提高网络识别的准确率,进一步验证了CF-CAM算法的有效性和优越性。 展开更多
关键词 卷积神经网络 类激活映射 对比层级相关性传播 鸟类细粒度分类 数据增强
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部