期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
Automatic identifi cation of GPR targets on roads based on CNN and Grad-CAM
1
作者 Dou Yi-Tao Dong Guo-Qi Li Xin 《Applied Geophysics》 2025年第2期488-498,560,共12页
This study combines ground penetrating radar(GPR)and convolutional neural networks for the intelligent detection of underground road targets.The target location was realized using a gradient-class activation map(Grad-... This study combines ground penetrating radar(GPR)and convolutional neural networks for the intelligent detection of underground road targets.The target location was realized using a gradient-class activation map(Grad-CAM).First,GPR technology was used to detect roads and obtain radar images.This study constructs a radar image dataset containing 3000 underground road radar targets,such as underground pipelines and holes.Based on the dataset,a ResNet50 network was used to classify and train different underground targets.During training,the accuracy of the training set gradually increases and finally fluctuates approximately 85%.The loss function gradually decreases and falls between 0.2 and 0.3.Finally,targets were located using Grad-CAM.The positioning results of single and multiple targets are consistent with the actual position,indicating that the method can eff ectively realize the intelligent detection of underground targets in GPR. 展开更多
关键词 GPR Deep learning Targets detection CNN grad-cam
在线阅读 下载PDF
基于ResNet50和Grad-CAM的卵巢病变分类模型:深度学习在医学影像诊断中的应用
2
作者 杨瑾 邹丹 +4 位作者 刘荣荣 周雪 刘君艳 张焕灵 梁蕾 《临床医学进展》 2025年第7期1538-1545,共8页
卵巢病变的早期诊断对治疗和预后至关重要,但传统诊断方法存在解读差异。本研究提出了一种基于ResNet50深度学习网络的卵巢病变分类模型,结合Grad-CAM技术生成热力图,以增强模型的可解释性。通过对930张超声图像进行五折交叉验证,模型... 卵巢病变的早期诊断对治疗和预后至关重要,但传统诊断方法存在解读差异。本研究提出了一种基于ResNet50深度学习网络的卵巢病变分类模型,结合Grad-CAM技术生成热力图,以增强模型的可解释性。通过对930张超声图像进行五折交叉验证,模型在区分正常、恶性、畸胎瘤、良性肿瘤交界性和巧克力囊肿等病理类型方面表现出较高的准确性(平均AUC为88.16)。热力图可视化显示,模型能够有效识别病变区域,特别是在恶性肿瘤和畸胎瘤的分类中表现出色。研究表明,该模型在卵巢病变的早期筛查和辅助诊断中具有重要应用价值,未来可进一步优化以应对复杂病例。 展开更多
关键词 卵巢肿瘤 AI诊断 ResNet50 grad-cam 深度学习
在线阅读 下载PDF
基于Mask-Grad-CAM的遥感电力目标表征方法
3
作者 杨劲松 《物联网技术》 2025年第6期10-16,共7页
基于可视化框架Grad-CAM设计了一种遥感电力目标识别模型,旨在提升针对遥感电力目标的辅助决策准确性和深度神经网络的视觉可解释性。模型首先对现有的Grad-CAM框架进行改进,引入了掩膜机制以揭示和挖掘图像中被遮挡或去除关键决策信息... 基于可视化框架Grad-CAM设计了一种遥感电力目标识别模型,旨在提升针对遥感电力目标的辅助决策准确性和深度神经网络的视觉可解释性。模型首先对现有的Grad-CAM框架进行改进,引入了掩膜机制以揭示和挖掘图像中被遮挡或去除关键决策信息后的剩余有价值语义信息;之后构建了一个弱监督分割和反事实解释的网络结构,旨在通过最大化后验概率找到最优特征,并确保模型的解释性。最终,基于电力遥感图像的可视化与评估实验,验证了改进模型的有效性。 展开更多
关键词 遥感电力图像 可解释性 类激活 grad-cam 语义信息 弱监督分割
在线阅读 下载PDF
基于时频Grad-CAM的调制识别网络可解释分析 被引量:1
4
作者 梁先明 倪帆 +1 位作者 陈文洁 张家树 《西南交通大学学报》 EI CSCD 北大核心 2024年第5期1215-1224,共10页
针对时频深度学习调制识别方法存在可解释性差的问题,提出一种基于时频梯度加权类激活映射(GradCAM)的调制识别网络可解释框架.该框架通过时频Grad-CAM可视化深度模型中隐含层的关键特征,从视觉上解释网络隐含层提取的时频深度特征对于... 针对时频深度学习调制识别方法存在可解释性差的问题,提出一种基于时频梯度加权类激活映射(GradCAM)的调制识别网络可解释框架.该框架通过时频Grad-CAM可视化深度模型中隐含层的关键特征,从视觉上解释网络隐含层提取的时频深度特征对于正确与错误识别中的作用,揭示低信噪比环境下网络性能下降的内在机理,并通过量化和排序网络中每层不同卷积核的贡献值来判断网络的冗余程度.仿真实验结果验证了基于时频Grad-CAM的调制识别网络可解释性框架的有效性;可解释分析结果表明,在低信噪比环境下,网络特征提取区域有大量噪声存在,且本文所测试的调制识别网络冗余程度较为严重. 展开更多
关键词 可解释深度学习 梯度类加权激活映射 调制识别 时频分析
在线阅读 下载PDF
基于Grad-CAM可视化与特征识别率结合的草地贪夜蛾及近缘种成虫识别模型评估
5
作者 魏靖 季英超 《现代农业科技》 2024年第8期163-169,共7页
为提升草地贪夜蛾及其近缘种成虫识别模型的泛化能力,除识别准确率外,额外引入特征识别率对模型的泛化能力进行评估。将VGG-16-bn模型的全连接层以全局平均值池化层取代,并在模型训练阶段引入了Grad-CAM可视化结果进行训练指导,共构建了... 为提升草地贪夜蛾及其近缘种成虫识别模型的泛化能力,除识别准确率外,额外引入特征识别率对模型的泛化能力进行评估。将VGG-16-bn模型的全连接层以全局平均值池化层取代,并在模型训练阶段引入了Grad-CAM可视化结果进行训练指导,共构建了4种改进模型识别草地贪夜蛾及其近缘种成虫。结果表明,改进后的模型的识别准确率均在99.22%以上,VGG-16-bn-GAP模型参数内存需求仅为原始模型的10.98%。为评估模型的泛化能力,利用导向反向传播梯度值、Grad-CAM及Grad-CAM++对模型习得的特征进行可视化,并与专家进行人工识别的关键视觉特征进行比较。结果表明,改进的VGG-16-bn-GAP模型和VGG-16-bn-GAIN模型获得的草地贪夜蛾平均特征识别率比原始模型分别提高12.25%和13.42%。本文提出的以特征识别率评估模型泛化能力的方法,可为特征识别率和识别准确率的提升提供参考。 展开更多
关键词 草地贪夜蛾 grad-cam 全局平均值池化 泛化能力 特征识别率
在线阅读 下载PDF
融合Grad-CAM和卷积神经网络的COVID-19检测算法 被引量:19
6
作者 朱炳宇 刘朕 张景祥 《计算机科学与探索》 CSCD 北大核心 2022年第9期2108-2120,共13页
新型冠状病毒肺炎(COVID-19)检测中胸部X射线(CXR图像)和电子计算机断层扫描(CT)图像是两种主要技术手段,为医生诊断提供了重要依据。针对当前卷积神经网络(CNN)在医学放射性图像中检测COVID-19的准确率不高、算法复杂、无法标记特征区... 新型冠状病毒肺炎(COVID-19)检测中胸部X射线(CXR图像)和电子计算机断层扫描(CT)图像是两种主要技术手段,为医生诊断提供了重要依据。针对当前卷积神经网络(CNN)在医学放射性图像中检测COVID-19的准确率不高、算法复杂、无法标记特征区域的问题,提出了一种融合梯度加权类激活映射(GradCAM)颜色可视化和卷积神经网络的算法(GCCV-CNN),对COVID-19阳性患者、COVID-19阴性患者、普通肺炎患者以及正常人的肺部CXR图像和CT扫描图像进行快速分类。通过定位到CXR图像和CT扫描图像中CNN进行分类的关键区域,再综合深度学习算法得到更准确的检测结果。为验证GCCV-CNN算法的有效性,分别在3个COVID-19阳性患者数据集上进行实验,并与已有算法进行比较。结果表明该算法对COVID-19阳性患者的CXR图像和CT扫描图像分类性能优于“新冠网络”(COVID-Net)算法及迁移学习新冠网络(DeTraCNet)算法,准确率最高达98.06%,速度更快的同时还具有较好的鲁棒性。 展开更多
关键词 CXR图像 CT扫描图像 COVID-19 grad-cam 融合grad-cam颜色可视化和CNN的算法(GCCV-CNN)
在线阅读 下载PDF
基于Grad-CAM与KL损失的SSD目标检测算法 被引量:10
7
作者 侯庆山 邢进生 《电子学报》 EI CAS CSCD 北大核心 2020年第12期2409-2416,共8页
鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细... 鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细节作可视化处理,并以类激活图的形式呈现各检测层细节,分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此,采用Kullback-Leibler(KL)边框回归损失策略,利用Non Maximum Suppression(NMS)算法输出最终预测框.实验结果表明,改进算法相较于已有检测算法具有更高的准确率以及稳定性. 展开更多
关键词 目标检测 可视化 类激活图 grad-cam SSD KL损失
在线阅读 下载PDF
基于Grad-CAM与B-CNN的细粒度图像分类方法研究 被引量:2
8
作者 邓绍伟 张伯泉 《计算机科学与应用》 2020年第5期841-850,共10页
细粒度图像具有类间差异小,类内差异大的特点。图像之间的差异主要存在于细微的局部区域,局部区域定位及其代表性特征提取成为细粒度图像分类的主要研究问题之一。本文基于Grad-CAM和双线性卷积神经网络B-CNN模型对细粒度图像分类方法... 细粒度图像具有类间差异小,类内差异大的特点。图像之间的差异主要存在于细微的局部区域,局部区域定位及其代表性特征提取成为细粒度图像分类的主要研究问题之一。本文基于Grad-CAM和双线性卷积神经网络B-CNN模型对细粒度图像分类方法进行研究,它利用Grad-CAM模型定位原图像中的显著区域,并裁剪出显著性区域图像作为双线性CNN的输入,融合全局和局部的特征,从而完成分类。在CUB-200-2011、Stanford Dogs和Stanford Cars三个数据集上的实验表明,相较于传统模型,该方法能够更加准确定位图像特征显著区域,具有更好的分类效果。 展开更多
关键词 细粒度图像分类 双线性卷积神经网络 grad-cam 显著性区域
在线阅读 下载PDF
基于Grad-CAM的Mask-FGSM对抗样本攻击 被引量:4
9
作者 余莉萍 《计算机应用与软件》 北大核心 2022年第7期195-200,共6页
深度学习缺乏可解释性,其容易受到对抗性样本的攻击。对此引入一种深度学习可解释性模型Grad-CAM(Gradient-weighted Class Activation Mapping),通过神经网络输入和输出之间的映射关系得到输入的热力图,结合FGSM(Fast Gradient Sign Me... 深度学习缺乏可解释性,其容易受到对抗性样本的攻击。对此引入一种深度学习可解释性模型Grad-CAM(Gradient-weighted Class Activation Mapping),通过神经网络输入和输出之间的映射关系得到输入的热力图,结合FGSM(Fast Gradient Sign Method)引入一种高效的算法来生成对抗样本。实验证明,该算法能够挖掘潜在的最佳攻击位置,仅需要修改3.821%的输入特征,就能有效生成使得神经网络错误分类的对抗样本,充分验证了该算法的高效性。 展开更多
关键词 深度学习 grad-cam FGSM 可解释性 对抗样本
在线阅读 下载PDF
Cavitation recognition of axial piston pumps in noisy environment based on Grad-CAM visualization technique 被引量:2
10
作者 Qun Chao Xiaoliang Wei +2 位作者 Jianfeng Tao Chengliang Liu Yuanhang Wang 《CAAI Transactions on Intelligence Technology》 SCIE EI 2023年第1期206-218,共13页
The cavitation in axial piston pumps threatens the reliability and safety of the overall hydraulic system.Vibration signal can reflect the cavitation conditions in axial piston pumps and it has been combined with mach... The cavitation in axial piston pumps threatens the reliability and safety of the overall hydraulic system.Vibration signal can reflect the cavitation conditions in axial piston pumps and it has been combined with machine learning to detect the pump cavitation.However,the vibration signal usually contains noise in real working conditions,which raises concerns about accurate recognition of cavitation in noisy environment.This paper presents an intelligent method to recognise the cavitation in axial piston pumps in noisy environment.First,we train a convolutional neural network(CNN)using the spectrogram images transformed from raw vibration data under different cavitation conditions.Second,we employ the technique of gradient-weighted class activation mapping(Grad-CAM)to visualise class-discriminative regions in the spectrogram image.Finally,we propose a novel image processing method based on Grad-CAM heatmap to automatically remove entrained noise and enhance class features in the spectrogram image.The experimental results show that the proposed method greatly improves the diagnostic performance of the CNN model in noisy environments.The classification accuracy of cavitation conditions increases from 0.50 to 0.89 and from 0.80 to 0.92 at signal-to-noise ratios of 4 and 6 dB,respectively. 展开更多
关键词 axial piston pump cavitation recognition CNN grad-cam spectrogram image
在线阅读 下载PDF
Grad-CAM:Understanding AI Models 被引量:1
11
作者 Shuihua Wang Yudong Zhang 《Computers, Materials & Continua》 SCIE EI 2023年第8期1321-1324,共4页
Artificial intelligence(AI)[1,2]allows computers to think and behave like humans,so it is now becoming more and more influential in almost every field[3].Hence,users in businesses,industries,hospitals[4],etc.,need to ... Artificial intelligence(AI)[1,2]allows computers to think and behave like humans,so it is now becoming more and more influential in almost every field[3].Hence,users in businesses,industries,hospitals[4],etc.,need to understand how these AI models work[5]and the potential impact of using them. 展开更多
关键词 Artificial intelligence grad-cam deep learning convolutional neural networks CLASSIFICATION LOCATION explainable
在线阅读 下载PDF
基于EfficientNet和Grad-CAM++的冠状动脉造影体位识别方法的研究
12
作者 李劼慧 吴悔 +1 位作者 曾研 吴水才 《生命科学仪器》 2023年第6期82-88,共7页
目的:目前较少有研究采用人工智能的方法分析冠状动脉造影(CAG),本文拟通过深度学习EfficientNet和Grad-CAM++可视化技术,实现冠状动脉造影体位的自动识别。方法:将86639张造影图片划分为训练集、验证集和测试集,均包括8个临床常用的造... 目的:目前较少有研究采用人工智能的方法分析冠状动脉造影(CAG),本文拟通过深度学习EfficientNet和Grad-CAM++可视化技术,实现冠状动脉造影体位的自动识别。方法:将86639张造影图片划分为训练集、验证集和测试集,均包括8个临床常用的造影体位。以准确率作为主要观察指标,评价EfficientNet-B1在各个投照体位上的分类效果,并解释模型的学习过程。结果:EfficientNet-B1在验证集和测试集上8个造影体位的平均准确率分别为:90.73%,89.40%,均高于传统的VGG-16和ResNet-18。且Grad-CAM++显示,EfficientNet-B1能学习到最为全面的冠状动脉。结论:EfficientNet-B1可以有效分辨临床常用的造影体位,学习效果要好于其他网络模型。 展开更多
关键词 EfficientNet grad-cam++ 冠状动脉造影 体位识别
暂未订购
Efficient Grad-Cam-Based Model for COVID-19 Classification and Detection
13
作者 Saleh Albahli Ghulam Nabi Ahmad Hassan Yar 《Computer Systems Science & Engineering》 SCIE EI 2023年第3期2743-2757,共15页
Corona Virus(COVID-19)is a novel virus that crossed an animal-human barrier and emerged in Wuhan,China.Until now it has affected more than 119 million people.Detection of COVID-19 is a critical task and due to a large... Corona Virus(COVID-19)is a novel virus that crossed an animal-human barrier and emerged in Wuhan,China.Until now it has affected more than 119 million people.Detection of COVID-19 is a critical task and due to a large number of patients,a shortage of doctors has occurred for its detection.In this paper,a model has been suggested that not only detects the COVID-19 using X-ray and CT-Scan images but also shows the affected areas.Three classes have been defined;COVID-19,normal,and Pneumonia for X-ray images.For CT-Scan images,2 classes have been defined COVID-19 and non-COVID-19.For classi-fication purposes,pretrained models like ResNet50,VGG-16,and VGG19 have been used with some tuning.For detecting the affected areas Gradient-weighted Class Activation Mapping(GradCam)has been used.As the X-rays and ct images are taken at different intensities,so the contrast limited adaptive histogram equalization(CLAHE)has been applied to see the effect on the training of the models.As a result of these experiments,we achieved a maximum validation accuracy of 88.10%with a training accuracy of 88.48%for CT-Scan images using the ResNet50 model.While for X-ray images we achieved a maximum validation accuracy of 97.31%with a training accuracy of 95.64%using the VGG16 model. 展开更多
关键词 Convolutional neural networks(CNN) COVID-19 pre-trained models CLAHE grad-cam X-RAY data augmentation
暂未订购
基于Grad-CAM的探地雷达公路地下目标检测算法 被引量:18
14
作者 赵迪 叶盛波 周斌 《电子测量技术》 2020年第10期113-118,共6页
提出了一种基于卷积神经网络(convolutional neural networks, CNN)与梯度类激活热力图(gradient class activation map, Grad-CAM)的探地雷达公路地下目标检测方法。首先使用标记好的探地雷达图像数据集训练一个用于图像分类的CNN,然... 提出了一种基于卷积神经网络(convolutional neural networks, CNN)与梯度类激活热力图(gradient class activation map, Grad-CAM)的探地雷达公路地下目标检测方法。首先使用标记好的探地雷达图像数据集训练一个用于图像分类的CNN,然后基于训练完成的CNN对图像计算Grad-CAM激活图,将获得的激活图进行二值化,定位目标位置。构建了一个包括了5 000张探地雷达图像的数据集,并使用该数据集进行实验,其中4 000张图像用来训练模型,1 000张用来测试。在1 000张测试数据中,各个类别的召回率分别为:管线目标99.2%,地下空洞98.5%,无目标图像98.8%。目标定位结果与实际位置非常吻合。这些结果表明该方法能够有效的检测探地雷达图像中的目标。 展开更多
关键词 探地雷达 深度学习 目标检测 梯度类激活热力图
原文传递
A Grad-CAM and capsule network hybrid method for remote sensing image scene classification
15
作者 Zhan HE Chunju ZHANG +5 位作者 Shu WANG Jianwei HUANG Xiaoyun ZHENG Weijie JIANG Jiachen BO Yucheng YANG 《Frontiers of Earth Science》 SCIE CSCD 2024年第3期538-553,共16页
Remote sensing image scene classification and remote sensing technology applications are hot research topics.Although CNN-based models have reached high average accuracy,some classes are still misclassified,such as“f... Remote sensing image scene classification and remote sensing technology applications are hot research topics.Although CNN-based models have reached high average accuracy,some classes are still misclassified,such as“freeway,”“spare residential,”and“commercial_area.”These classes contain typical decisive features,spatial-relation features,and mixed decisive and spatial-relation features,which limit high-quality image scene classification.To address this issue,this paper proposes a Grad-CAM and capsule network hybrid method for image scene classification.The Grad-CAM and capsule network structures have the potential to recognize decisive features and spatial-relation features,respectively.By using a pre-trained model,hybrid structure,and structure adjustment,the proposed model can recognize both decisive and spatial-relation features.A group of experiments is designed on three popular data sets with increasing classification difficulties.In the most advanced experiment,92.67%average accuracy is achieved.Specifically,83%,75%,and 86%accuracies are obtained in the classes of“church,”“palace,”and“commercial_area,”respectively.This research demonstrates that the hybrid structure can effectively improve performance by considering both decisive and spatial-relation features.Therefore,Grad-CAM-CapsNet is a promising and powerful structure for image scene classification. 展开更多
关键词 image scene classification CNN grad-cam CapsNet DenseNet
原文传递
基于CA-YOLOv8的输变电设备红外图像检测算法
16
作者 吴春燕 张传海 +3 位作者 孔德骏 竺德 卢一相 彭思远 《红外技术》 北大核心 2025年第9期1128-1134,共7页
在变电站的实际工作环境当中,输变电设备的红外图像会由于不同的拍摄场景和光照强度等问题影响最终的数据质量,对红外图像中输变电设备的定位及识别造成很大的影响。为了解决这个问题,提出一种基于CA-YOLOv8的目标检测算法,它通过在YOL... 在变电站的实际工作环境当中,输变电设备的红外图像会由于不同的拍摄场景和光照强度等问题影响最终的数据质量,对红外图像中输变电设备的定位及识别造成很大的影响。为了解决这个问题,提出一种基于CA-YOLOv8的目标检测算法,它通过在YOLOv8的网络结构中添加经过改进的CA模块以提高骨干网路的特征提取能力;同时,模型采用SIoU作为回归损失,既解决CIoU的梯度消失问题,又减小自由度的总数,提高模型的收敛速度。在实测数据集上采用Grad-CAM++对模型进行视觉可解释性展示和实验验证,本文算法比目前主流的YOLO系列算法具有更高的准确率,并通过损失训练过程和实际预测结果验证了本文算法能够快速准确地实现输变电设备的识别和定位。 展开更多
关键词 输变电设备 目标检测 YOLOv8 注意力机制 SIoU grad-cam++
在线阅读 下载PDF
基于可视化SE-MobileNetV2的设备零部件识别方法
17
作者 陈明 胡耀垓 颜昕 《武汉理工大学学报(信息与管理工程版)》 2025年第4期518-525,共8页
在设备维修中,规范获取并上传设备零部件信息给厂商,对后期维保理赔意义重大。针对设备零部件图片样本数量有限及人工无法快速准确地识别零部件的问题,构建包含6种设备零部件的数据集,提出一种嵌入SE注意力机制的MobileNetV2识别模型SE-... 在设备维修中,规范获取并上传设备零部件信息给厂商,对后期维保理赔意义重大。针对设备零部件图片样本数量有限及人工无法快速准确地识别零部件的问题,构建包含6种设备零部件的数据集,提出一种嵌入SE注意力机制的MobileNetV2识别模型SE-MobileNetV2,并与ResNet18、EfficientB0Net、DenseNet121三种轻量化模型的识别效果进行对比;实现了融合Grad-CAM可视化技术和SE-MobileNetV2的深度模型的算法,通过混淆矩阵分析模型识别效果。结果显示,SE-MobileNetV2网络能提升模型识别速度和准确率,分类识别性能最优;Grad-CAM能可视化解释识别决策过程;嵌入Grad-CAM后的SE-MobileNetV2可部署在低配置的非联网移动设备,用于识别各种设备零部件。 展开更多
关键词 维保理赔 零部件识别 grad-cam 迁移学习 SE-MobileNetV2
在线阅读 下载PDF
井下煤炭运输多环节复杂背景下高精度煤矸识别方法
18
作者 栾亨宣 安乐 +7 位作者 田莹 顾颉颖 张强 陈宏伟 付翔 胡成军 崔志芳 陈锐 《煤炭科学技术》 北大核心 2025年第9期459-468,共10页
煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据... 煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据集,包含水渍、煤粉、碎煤与碎矸石及运输设备部件等背景干扰因素。提出了一种融合多种注意力与残差连接的高精度煤矸智能识别方法,高分辨率阶段使用残差卷积块快速生成高质量标记(token),后续阶段使用级联的Channel Spatial Swin Transformer Block(CSSTB)进行深层表征学习。为提升模型对背景噪声的抗干扰能力,网络集成全局、通道、空间多种注意力机制,增强特征表达的鲁棒性。CSSTB中利用基于负斜率特性强化稀疏激活的LeakyReLU线性注意力机制建模全局信息,通过卷积注意力机制模块(CBAM)优化模型注意力分布,提升模型泛化能力。此外,考虑到煤、矸石和输送设备零部件的尺度差异,跨阶段使用残差连接以增强多尺度特征的通信和信息流通。结果表明:所提模型在单一、二混合和三混合背景上的平均准确度达到95.06%、97.77%、95.65%,相较于基线网络Swin Transformer-Tiny分别提高7.01%、4.83%、1.03%。可视化试验表明,对比模型在水渍、暗光和反光等复杂背景干扰下难以准确区分煤和矸石,而所提出模型能够精准聚焦于煤和矸石的关键特征区域,抗干扰能力强。研究结果为井下原煤运输中的煤矸高效分选提供了理论参考。 展开更多
关键词 深度学习 煤矸识别 井下环境 注意力机制 梯度加权类激活热图
在线阅读 下载PDF
评估可解释的人工智能技术在多种成像方式下解释乳腺癌诊断的有效性
19
作者 李禄 罗浩军 《临床医学进展》 2025年第2期1503-1512,共10页
乳腺癌持续位居全球女性癌症发病与致死的主要原因之列。早期且精确的诊断对于优化患者预后具有举足轻重的地位。乳房X线摄影、超声检查及磁共振成像(Magnetic Resonance Imaging, MRI)等影像学技术在乳腺癌的诊断中扮演着至关重要的角... 乳腺癌持续位居全球女性癌症发病与致死的主要原因之列。早期且精确的诊断对于优化患者预后具有举足轻重的地位。乳房X线摄影、超声检查及磁共振成像(Magnetic Resonance Imaging, MRI)等影像学技术在乳腺癌的诊断中扮演着至关重要的角色。然而,这些技术手段面临着准确性波动、操作员依赖性显著及结果阐释困难等多重挑战。在此背景下,人工智能(Artificial Intelligence, AI),尤其是可解释人工智能(Explainable Artificial Intelligence, XAI)的融入,已成为提升诊断精确度及增强信任度的革命性途径。本综述聚焦于XAI技术在乳腺癌诊断领域内,于不同成像模式中的应用效果比较。深入探讨了核心的XAI方法,诸如Shapley加性解释(SHAP)、局部可解释模型无关解释(LIME)以及基于梯度的类激活映射(Grad-CAM),着重阐述了它们在增进模型可解释性及提升临床实用性方面的具体成效。综述不仅分析了XAI技术在乳房X线摄影、超声及MRI应用中的优势与局限,还特别强调了其在提高AI辅助预测透明度方面的贡献。此外,本文亦评估了XAI在应对假阳性、假阴性问题以及多模态成像数据整合挑战中的效能。该评论的核心价值在于,它全面剖析了XAI在缩小AI技术进展与临床实际应用之间鸿沟的潜力。通过提升透明度,XAI技术能够增强临床医生对AI的信任度,促进其更顺畅地融入诊断工作流程,从而助力个性化医疗实践的推进及患者治疗成效的改善。综上所述,尽管XAI在提升AI模型可解释性与准确性方面取得了显著进展,但在计算复杂度控制、普遍适用性拓展及临床接纳度提升等方面仍面临诸多挑战。未来研究应着重于优化XAI方法、促进跨学科间的深度合作,并开发标准化的框架体系,以确保XAI技术能在多样化的临床环境中实现可扩展性与可靠性的双重提升。Breast cancer remains one of the leading causes of cancer incidence and mortality among women worldwide. Early and accurate diagnosis plays a pivotal role in optimizing patient prognosis. Imaging techniques such as mammography, ultrasound, and magnetic resonance imaging (MRI) play crucial roles in the diagnosis of breast cancer. However, these techniques face multiple challenges, including accuracy fluctuations, significant operator dependency, and difficulties in result interpretation. In this context, the integration of Artificial Intelligence (AI), especially Explainable Artificial Intelligence (XAI), has become a revolutionary approach to improving diagnostic accuracy and enhancing trust. This review focuses on the comparative application of XAI technologies across different imaging modalities in breast cancer diagnosis. It delves into core XAI methods such as Shapley Additive Explanations (SHAP), Local Interpretable Model-Agnostic Explanations (LIME), and Gradient-weighted Class Activation Mapping (Grad-CAM), with an emphasis on their effectiveness in enhancing model interpretability and improving clinical utility. The review analyzes not only the advantages and limitations of XAI in mammography, ultrasound, and MRI applications but also highlights its contribution to increasing the transparency of AI-assisted predictions. Additionally, the review evaluates the performance of XAI in addressing issues related to false positives, false negatives, and the challenges of multimodal imaging data integration. The core value of this review lies in its comprehensive analysis of the potential of XAI in bridging the gap between advancements in AI technology and clinical application. By enhancing transparency, XAI can boost clinicians’ trust in AI, facilitating its smoother integration into diagnostic workflows, thereby promoting personalized medical practices and improving patient treatment outcomes. In conclusion, despite significant progress made by XAI in improving AI model interpretability and accuracy, challenges remain in terms of computational complexity, general applicability, and clinical acceptance. Future research should focus on optimizing XAI methods, fostering interdisciplinary collaboration, and developing standardized frameworks to ensure the scalability and reliability of XAI technologies in diverse clinical environments. 展开更多
关键词 乳腺癌诊断 可解释人工智能(XAI) SHAP LIME grad-cam 影像学技术 个性化医疗 人工智能
暂未订购
基于改进MobileNetV3的可解释性小麦叶片病虫害识别
20
作者 曾金宇 贾丙静 +2 位作者 张永琪 陈俊杰 苏煜 《黑龙江工业学院学报(综合版)》 2025年第6期108-114,共7页
针对传统小麦叶片病虫害识别模型准确率低、可解释性差等问题。提出了一种基于改进MobileNetV3的可解释性小麦叶片病虫害识别算法。首先,用CA注意力机制代替原网络的SE注意力机制,区分目标和背景。其次,引入对比学习,在归一化的嵌入空... 针对传统小麦叶片病虫害识别模型准确率低、可解释性差等问题。提出了一种基于改进MobileNetV3的可解释性小麦叶片病虫害识别算法。首先,用CA注意力机制代替原网络的SE注意力机制,区分目标和背景。其次,引入对比学习,在归一化的嵌入空间中拉近同类样本并推开异类样本,实现样本特征的有效区分,提高模型的识别准确率;最后,将激活热力图(Grad-CAM)技术融入MobileNetV3识别模型中,可以准确识别输入图像中对模型预测结果影响最大的受害区域,从而提高检测过程的透明度和可解释性。实验结果表明,所提出的CL-MobileNet网络模型在小麦叶片病虫害数据集中的平均识别准确率达到了95.25%,相比原模型高出了3.62%。与其他模型相比,该模型具有较好的效果,并且能够提供分类结果的解释。 展开更多
关键词 小麦叶片病虫害分类与识别 MobileNetV3 CA注意力机制 对比学习 grad-cam 可解释性
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部