期刊文献+
共找到171篇文章
< 1 2 9 >
每页显示 20 50 100
一种基于ASPPUnet的道路裂缝检测模型 被引量:1
1
作者 曹一冰 张江水 +1 位作者 张政 赵鑫科 《测绘科学技术学报》 2025年第1期49-56,共8页
为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深... 为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深度可分离卷积模块,用以实现模型的轻量化;采用融合Dice和交叉熵的损失函数,均衡模型的查全率和查准率;采用动态数据集增广方法,使得模型在小数据集上也能实现良好的检测效果。通过与Unet等模型的实验对比可以看出,ASPPUnet拥有更好的检测效果和可塑性,具有较好的应用价值。 展开更多
关键词 裂缝检测 图像分割 深度可分离卷积 损失函数 aspp模块 Unet模型
在线阅读 下载PDF
基于改进ICP算法和级联ASPP算法的异形建筑表面重建 被引量:1
2
作者 史振玮 《北京测绘》 2025年第4期462-467,共6页
由于异形建筑独特的几何形态和复杂的表面结构,在对建筑表面进行重建时,表面识别结果容易出现偏差,影响重建模型的精度。对此,设计基于改进迭代最近点(ICP)算法和级联检测分割(ASPP)算法的异形建筑表面重建方法。改进ICP算法实施点云配... 由于异形建筑独特的几何形态和复杂的表面结构,在对建筑表面进行重建时,表面识别结果容易出现偏差,影响重建模型的精度。对此,设计基于改进迭代最近点(ICP)算法和级联检测分割(ASPP)算法的异形建筑表面重建方法。改进ICP算法实施点云配准,将从不同位置采集到的点云数据统一到同一个坐标系下,消除位置偏差,提高点云数据的配准精度。通过级联ASPP算法设计轻量级语义分割模型,聚合多尺度信息,确保算法的识别范围能全面覆盖视野范围。利用随机抽样一致性(RANSAC)算法自动化处理异形建筑的识别数据,结合最小二乘法原理进行墙面立体拟合,得到高精度的表面重建参数,实现异形建筑表面重建。测试结果表明,设计方法的重建结果接近真实世界的几何形态,在异形建筑表面各墙面上重建偏差值均低于1.5。 展开更多
关键词 点云配准 迭代最近点(ICP)算法 级联检测分割(aspp)算法 随机抽样一致性(RANSAC)算法 异形建筑表面
在线阅读 下载PDF
基于MobileViT-PC-ASPP和迁移学习的果树害虫识别方法 被引量:1
3
作者 张欢 周毅 +2 位作者 王克俭 王超 李会平 《农业机械学报》 EI CAS CSCD 北大核心 2024年第11期57-67,共11页
为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别... 为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别模型。该模型用PConv(Partial convolution)模块代替原模型MobileViT模块中部分标准卷积模块,其次修改MobileViT模块的特征融合策略,将输入特征、局部表达特征、全局表达特征进行拼接融合;删除网络第10层MV2模块和第11层MobileViT模块,使用改进空洞空间池化金字塔(Atrous spatial pyramid pooling,ASPP)模块进行代替,形成多尺度融合特征;此外,模型用SiLU激活函数代替ReLU6激活函数进行计算,最后基于ImageNet数据集进行迁移学习。实验结果表明,6类果树害虫图像识别准确率达93.77%,参数量为8.40×10^(5),与改进前相比,识别准确率提高7.5个百分点,参数量降低33.86%;与常用害虫CNN识别模型AlexNet、ResNet50、MobileNetV2、ShuffleNetV2相比识别准确率分别提高8.25、4.78、7.27、7.41个百分点,参数量分别减少6.03×10^(7)、2.48×10^(7)、2.66×10^(6)、5.30×10^(5);与Transformer识别模型ViT、Swin Transfomer相比识别准确率分别提高19.03、9.8个百分点,参数量分别减少8.56×10^(7)、2.75×10^(7)。本研究适合部署在移动终端等有限资源环境,并且有助于实现对复杂背景下小目标果树害虫进行识别检测。 展开更多
关键词 果树害虫 识别模型 PConv模块 融合策略 SiLU激活函数 空洞空间池化金字塔
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法
4
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
增强人体关键点特征的姿态估计算法
5
作者 刘赏 代娆 +1 位作者 周煜炜 董林芳 《计算机辅助设计与图形学学报》 北大核心 2025年第9期1607-1618,共12页
二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进... 二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进,提出一种增强人体关键点特征的算法.首先基于MixFormer思想给出多头自注意力机制和深度卷积并行的策略,以增强人体姿态的局部和全局特征,在获取高质量视觉表征的同时学习更多的人体关节结构信息;然后给出坐标注意力机制和空洞空间卷积池化金字塔串行融合策略,先将人体姿态特征进行拆分来捕获跨通道信息,再采用空洞卷积扩大感受野,减少小目标信息的丢失,提高多尺度特征融合能力;最后结合YOLO-Pose算法进行姿态估计.在2个数据集上进行实验的结果表明, COCO2017数据集上,所提算法的AP值提高0.9个百分点, AR值提高1.2个百分点;OC_Human遮挡数据集上, AP值提高2.3个百分点;该算法可以在保证运行速度的同时增强人体关键点特征,提高整体性能. 展开更多
关键词 多人姿态估计 多头自注意力机制 坐标注意力机制 空洞空间卷积池化金字塔
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
6
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
原文传递
RAUGAN:基于循环生成对抗网络的红外图像彩色化方法
7
作者 朴燕 康继元 《吉林大学学报(工学版)》 北大核心 2025年第8期2722-2731,共10页
针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的S... 针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的Skip connection结构处连接,使解码分支中的不同尺度输出特征图都能与编码器中对应的输出特征图相结合;其次,设计了由残差块与通道和空间注意力模块(CBAM)构成的深度瓶颈层块替换UNet网络中的瓶颈层,用于增强局部区域特征,提高其识别能力;最后,在判别网络中引用感知损失函数从而解决色彩恢复失真的问题。实验结果表明:该方法彩色化效果明显优于其他方法。 展开更多
关键词 计算机应用 红外图像彩色化 循环生成对抗网络 空洞空间金字塔池化 注意力模块
原文传递
基于大模型的钻井现场人体姿态估计方法研究 被引量:1
8
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
基于MobileNet的轻量化云检测模型
9
作者 叶武剑 谢林峰 +2 位作者 刘怡俊 温晓卓 李扬 《自然资源遥感》 北大核心 2025年第3期95-103,共9页
针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制... 针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制和挤压激励(squeeze-and-excitation,SE)注意力模块来增强通道间的信息交流。通过这种方式,既减少了参数量和计算复杂度,又保持了对重要特征的提取能力。在上采样阶段,使用了RepConv模块和改进的空洞空间金字塔池化模块(atrous spatial pyramid pooling,ASPP),以提高网络的学习能力和捕捉图像细节与空间信息的能力。实验结果证明,该文模型在参数量和模型复杂度降低的情况下,能够实现较高精度的云检测,具备实用性和可行性。 展开更多
关键词 云检测 MobileNet网络 注意力机制 多尺度特征 空洞空间金字塔池化模块
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
10
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
复杂场景下基于深度学习与多传感器融合的无人机配网巡检智能避障技术 被引量:4
11
作者 廖红兵 况松陵 +3 位作者 李扬帆 黄晓露 王刚 魏洪 《测绘通报》 北大核心 2025年第1期22-28,共7页
在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融... 在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融合激光雷达和机器视觉的环境感知系统,通过利用空洞空间金字塔池化结构增大卷积核的感受野,捕获多尺度信息对障碍物进行实时识别,并利用先进的路径规划算法动态调整无人机的飞行路径,以避开障碍物。仿真测试验证表明,该系统在复杂环境中的避障能力得到显著提高,巡检效率提升了20%以上,且有效降低了事故风险。本文所提出的智能避障技术为电力配网的无人机巡检提供了一种高效、安全的解决方案,具备广泛的应用价值和推广前景。 展开更多
关键词 无人机 空洞空间金字塔池化 避障能力 路径规划
原文传递
基于Python和DCNN的仪表智能识别研究 被引量:1
12
作者 谷力 《自动化与仪器仪表》 2025年第1期103-106,111,共5页
针对传统的仪表识别主要依靠人力,导致效率和准确率较低的问题,研究提出了一种基于Python和深度卷积神经网络的仪表智能识别模型。该模型首先基于Python设计和图像二值化对仪表图像进行预处理。然后,采用MobileNet V2作为DCNN的主干特... 针对传统的仪表识别主要依靠人力,导致效率和准确率较低的问题,研究提出了一种基于Python和深度卷积神经网络的仪表智能识别模型。该模型首先基于Python设计和图像二值化对仪表图像进行预处理。然后,采用MobileNet V2作为DCNN的主干特征提取网络,结合深度卷积神经网络和注意机制来对仪表图像进行识别。最后,通过实验验证模型的识别性能。结果表明,所提模型的识别准确率和F1值较高,分别为98.63%和94.32%。在视图变化和光照变化的情况下,研究所提模型的查准率和召回率均高于另外三种模型,在视图变化时分别为0.71和0.75,在光照变化时分别为0.78和0.90。研究能够为工业生产中的仪表自动识别提供一定的技术支持,促进工业生产的自动化和智能化发展。 展开更多
关键词 仪表识别 PYTHON 深度卷积神经网络 卷积块注意力模块 空间金字塔池化
原文传递
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法 被引量:3
13
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
PRANet:轻量高效的高分辨率遥感影像分割模型
14
作者 徐海彪 普运伟 +1 位作者 邓荣 王栋 《遥感信息》 北大核心 2025年第4期67-75,共9页
为了解决传统语义分割网络在复杂遥感影像中面临的边缘分割模糊和小目标检测不佳的问题,提出了一种基于改进金字塔残差注意力网络(PRANet)的语义分割方法。该方法采用MobileNetV2作为骨干网络,结合残差扩张卷积模块(residual ASPP)、EC... 为了解决传统语义分割网络在复杂遥感影像中面临的边缘分割模糊和小目标检测不佳的问题,提出了一种基于改进金字塔残差注意力网络(PRANet)的语义分割方法。该方法采用MobileNetV2作为骨干网络,结合残差扩张卷积模块(residual ASPP)、ECA注意力机制和金字塔池化模块(pyramid pooling module,PPM),显著提升特征提取能力和全局特征表达效果。实验结果显示,PRANet在Potsdam和GID15数据集上的多项精度指标上均优于对比模型。在Potsdam数据集上,PRANet的整体mIoU达到74.58%,比其他模型高出2.14~4.31个百分点;在GID15数据集上,PRANet的平均交并比提升至63.70%,领先1.42~5.38个百分点。此外,PRANet通过优化训练时间和参数量,在保持高精度的同时,每轮训练时间减少53 s,缩短23.45个百分点的训练时间。实验验证了PRANet在复杂遥感影像处理中的高效性与实用性。 展开更多
关键词 语义分割 MobileNetV2 金字塔池化 残差扩张卷积 注意力机制 边缘分割
在线阅读 下载PDF
面向芯片表面缺陷分割的轻量级多尺度网络结构DSDLF-UNet
15
作者 朱永民 顾寄南 +4 位作者 单韵竹 姜宝康 夏子林 高艳 向泓宇 《半导体技术》 北大核心 2025年第11期1174-1182,共9页
针对芯片表面缺陷图像的语义分割,现有模型存在特征提取能力不足、参数量(Params)过大等问题,提出一种面向芯片表面缺陷分割的轻量级多尺度网络结构——DSDLF-UNet。编码器部分设计了双分支深度可分离空洞卷积(DSDConv)模块,该模块融合... 针对芯片表面缺陷图像的语义分割,现有模型存在特征提取能力不足、参数量(Params)过大等问题,提出一种面向芯片表面缺陷分割的轻量级多尺度网络结构——DSDLF-UNet。编码器部分设计了双分支深度可分离空洞卷积(DSDConv)模块,该模块融合深度可分离卷积(DSC)与空洞卷积(DC)的优势,以增强局部细节特征表达和全局感受野的建模能力。主干部分设计了轻量级局部-全局空洞空间金字塔池化(LG-ASPP)模块,以提升多尺度上下文建模能力。整体结构压缩至4层,以降低模型复杂度,在跳跃连接中引入融合通道与空间注意力的全注意力(FA)机制,以提高微小裂纹等细粒度缺陷识别效果。构建了芯片缺陷分割数据集,并设计对比实验和消融实验对所提网络进行验证。实验结果显示,该网络在数据集上平均交并比(mIoU)为84.96%,平均像素准确率(mPA)为87.97%,F1分数(F1-score)为87.72%,性能显著优于其他经典分割网络,能够更精准地实现芯片表面缺陷的分割。 展开更多
关键词 深度学习 U型网络(U-Net)分割 缺陷分割 轻量级局部-全局空洞空间金字塔池化(LG-aspp) 全注意力(FA)机制
原文传递
基于改进Unet模型的农作物病害语义分割研究
16
作者 刘伟立 孙公凌云 +2 位作者 连俊博 李响陈 惠国华 《传感技术学报》 北大核心 2025年第10期1818-1826,共9页
针对农作物病害类内差异性大、类间相似性高等特点导致的分割困难问题,提出了一种改进的Unet模型VGSA-Unet,用于提高农作物叶片病害图像的分割准确性。将VGG16作为Unet模型的编码器,在编码器与解码器之间集成了多尺度上下文模块GC_ASPP... 针对农作物病害类内差异性大、类间相似性高等特点导致的分割困难问题,提出了一种改进的Unet模型VGSA-Unet,用于提高农作物叶片病害图像的分割准确性。将VGG16作为Unet模型的编码器,在编码器与解码器之间集成了多尺度上下文模块GC_ASPP,在获取图像多尺度信息的同时提升对图像全局特征的提取能力,使模型理解不同形态的病害图像细节,提高模型在处理尺度变化较大的图像时的性能;在解码器中,使用双线性插值代替转置卷积,减少边缘信息的损失,提高模型计算效率;使用混合损失函数,提高模型对细小病斑的分割能力。与其他网络模型相比,改进的VGSA-Unet模型在mPA(92.04%)和mIoU(84.61%)两项指标上均达到了最高值。改进后的模型克服了病害特点造成的分割困难,对细小病斑的提取更为精确,能有效地对农作物叶片病害进行准确分割。 展开更多
关键词 语义分割 农作物病害 深度学习 Unet GCblock 空洞空间金字塔池化
在线阅读 下载PDF
融合改进ASPP和极化自注意力的自底向上全景分割 被引量:3
17
作者 李新叶 陈丁 《中国图象图形学报》 CSCD 北大核心 2023年第8期2410-2419,共10页
目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注... 目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注意力的自底向上全景分割方法。方法重新设计ASPP模块,将小空洞率卷积的输出与原始输入进行拼接(concat),将得到的结果作为新的输入传递给大空洞率卷积,然后将不同空洞率卷积的输出结果拼接,并将得到的结果与ASPP中的其他模块进行最后拼接,从而改善ASPP中因空洞率变大导致的空洞卷积效果变差的问题,达到既获得足够感受野的同时又能编码多尺度信息的目的;在主干网络的输出后引入改进的极化自注意力模块,实现对图像像素级的自我注意强化,使其得到的特征能直接适用于细粒度像素分割任务。结果本文在Cityscapes数据集的验证集上进行测试,与复现的基线网络Panoptic-DeepLab(58.26%)相比,改进ASPP模块后分割精度PQ(panoptic quality)(58.61%)提高了0.35%,运行时间从103 ms增加到124 ms,运行速度没有明显变化;通过进一步引入极化自注意力,PQ指标(58.86%)提高了0.25%,运行时间增加到187 ms;通过对该注意力模块进一步改进,PQ指标(59.36%)在58.86%基础上又提高了0.50%,运行时间增加到192 ms,速度略有下降,但实时性仍好于大多数方法。结论本文采用改进ASPP和极化自注意力模块,能够更有效地提取适合细粒度像素分割的特征,且在保证足够感受野的同时能编码多尺度信息,从而提升全景分割性能。 展开更多
关键词 全景分割 语义分割 实例分割 极化自注意力 aspp
原文传递
融合HRNet模块和可变形注意力机制的乳腺癌图像分类技术研究
18
作者 田兄玲 宋丽俊 +1 位作者 郭辉 王贝 《机器人外科学杂志(中英文)》 2025年第9期1454-1460,共7页
目的:通过融合高分辨率网络(HRNet)模块和动态可变形注意力机制改进U-Net模型实现对乳腺癌图像的高精度分类与诊断。方法:研究提出的模型以U-Net为基础,引入了高分辨率网络强大、空洞空间金字塔池化模块以捕获多尺度信息,并融合了全局... 目的:通过融合高分辨率网络(HRNet)模块和动态可变形注意力机制改进U-Net模型实现对乳腺癌图像的高精度分类与诊断。方法:研究提出的模型以U-Net为基础,引入了高分辨率网络强大、空洞空间金字塔池化模块以捕获多尺度信息,并融合了全局多尺度注意力机制、多尺度残差卷积模块和动态可变形注意力机制,从而提升模型对关键特征的关注能力。结果:改进U-Net-HRNet模型在分类准确率、召回率、精确率、F1-measure、Jaccard指数和Dice相似度系数等关键性能指标上均优于现有的乳腺癌图像分类方法。此外,消融实验结果显示,在去除各模块后,模型的性能显著降低,其中高分辨率网络模块对模型性能的影响最为显著。在去除高分辨率网络模块后,模型的准确率、F1-measure、Jaccard指数及Dice相似度系数分别降低了6.9%、7.8%、11.7%和14.1%。结论:改进U-Net-HRNet模型在乳腺癌图像分类任务中具备显著的优越性,能为乳腺癌的临床诊断提供有效辅助。 展开更多
关键词 乳腺癌 图像分类 HRNet 空洞空间金字塔池化 动态可变形注意力
在线阅读 下载PDF
DCA-YOLO:Detection Algorithm for YOLOv8 Pulmonary Nodules Based on Attention Mechanism Optimization 被引量:1
19
作者 SONG Yongsheng LIU Guohua 《Journal of Donghua University(English Edition)》 2025年第1期78-87,共10页
Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially... Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially leading to false positives or missed detections.To solve these problems,the YOLOv8 network is enhanced by adding deformable convolution and atrous spatial pyramid pooling(ASPP),along with the integration of a coordinate attention(CA)mechanism.This allows the network to focus on small targets while expanding the receptive field without losing resolution.At the same time,context information on the target is gathered and feature expression is enhanced by attention modules in different directions.It effectively improves the positioning accuracy and achieves good results on the LUNA16 dataset.Compared with other detection algorithms,it improves the accuracy of pulmonary nodule detection to a certain extent. 展开更多
关键词 pulmonary nodule YOLOv8 network object detection deformable convolution atrous spatial pyramid pooling(aspp) coordinate attention(CA)mechanism
在线阅读 下载PDF
基于双极化SAR影像的冰川识别方法 被引量:2
20
作者 李辰德 雷赛月 杨铭 《光电子技术》 2025年第2期164-171,共8页
极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)因其成像不受环境、时间和气候影响的优势而备受冰川识别领域研究人员的关注。然而,现有的研究并不能充分挖掘双极化SAR影像中的冰川散射特征。针对这一问题,提出了一... 极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)因其成像不受环境、时间和气候影响的优势而备受冰川识别领域研究人员的关注。然而,现有的研究并不能充分挖掘双极化SAR影像中的冰川散射特征。针对这一问题,提出了一个基于双极化Sentinel‑1 A数据的冰川分类网络S1‑UNet,利用双极化SAR数据中的散射特性,实现了对冰川区域的自动提取。引入了注意力特征融合模块增强图像的低级特征与高级特征之间的关联性;采用了改进的空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块获取图像不同尺度的散射特征信息;实验结果表明,与其他语义分割和冰川识别网络相比,S1‑UNet模型的性能最好,交并比、精确率分别为94.57%、97.82%,召回率达到96.79%。 展开更多
关键词 极化合成孔径雷达 冰川识别 散射特征 空洞空间金字塔池化
原文传递
上一页 1 2 9 下一页 到第
使用帮助 返回顶部