期刊文献+
共找到155篇文章
< 1 2 8 >
每页显示 20 50 100
一种基于ASPPUnet的道路裂缝检测模型 被引量:1
1
作者 曹一冰 张江水 +1 位作者 张政 赵鑫科 《测绘科学技术学报》 2025年第1期49-56,共8页
为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深... 为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深度可分离卷积模块,用以实现模型的轻量化;采用融合Dice和交叉熵的损失函数,均衡模型的查全率和查准率;采用动态数据集增广方法,使得模型在小数据集上也能实现良好的检测效果。通过与Unet等模型的实验对比可以看出,ASPPUnet拥有更好的检测效果和可塑性,具有较好的应用价值。 展开更多
关键词 裂缝检测 图像分割 深度可分离卷积 损失函数 aspp模块 Unet模型
在线阅读 下载PDF
DCA-YOLO:Detection Algorithm for YOLOv8 Pulmonary Nodules Based on Attention Mechanism Optimization 被引量:1
2
作者 SONG Yongsheng LIU Guohua 《Journal of Donghua University(English Edition)》 2025年第1期78-87,共10页
Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially... Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially leading to false positives or missed detections.To solve these problems,the YOLOv8 network is enhanced by adding deformable convolution and atrous spatial pyramid pooling(ASPP),along with the integration of a coordinate attention(CA)mechanism.This allows the network to focus on small targets while expanding the receptive field without losing resolution.At the same time,context information on the target is gathered and feature expression is enhanced by attention modules in different directions.It effectively improves the positioning accuracy and achieves good results on the LUNA16 dataset.Compared with other detection algorithms,it improves the accuracy of pulmonary nodule detection to a certain extent. 展开更多
关键词 pulmonary nodule YOLOv8 network object detection deformable convolution atrous spatial pyramid pooling(aspp) coordinate attention(CA)mechanism
在线阅读 下载PDF
基于改进ICP算法和级联ASPP算法的异形建筑表面重建 被引量:1
3
作者 史振玮 《北京测绘》 2025年第4期462-467,共6页
由于异形建筑独特的几何形态和复杂的表面结构,在对建筑表面进行重建时,表面识别结果容易出现偏差,影响重建模型的精度。对此,设计基于改进迭代最近点(ICP)算法和级联检测分割(ASPP)算法的异形建筑表面重建方法。改进ICP算法实施点云配... 由于异形建筑独特的几何形态和复杂的表面结构,在对建筑表面进行重建时,表面识别结果容易出现偏差,影响重建模型的精度。对此,设计基于改进迭代最近点(ICP)算法和级联检测分割(ASPP)算法的异形建筑表面重建方法。改进ICP算法实施点云配准,将从不同位置采集到的点云数据统一到同一个坐标系下,消除位置偏差,提高点云数据的配准精度。通过级联ASPP算法设计轻量级语义分割模型,聚合多尺度信息,确保算法的识别范围能全面覆盖视野范围。利用随机抽样一致性(RANSAC)算法自动化处理异形建筑的识别数据,结合最小二乘法原理进行墙面立体拟合,得到高精度的表面重建参数,实现异形建筑表面重建。测试结果表明,设计方法的重建结果接近真实世界的几何形态,在异形建筑表面各墙面上重建偏差值均低于1.5。 展开更多
关键词 点云配准 迭代最近点(ICP)算法 级联检测分割(aspp)算法 随机抽样一致性(RANSAC)算法 异形建筑表面
在线阅读 下载PDF
基于MobileViT-PC-ASPP和迁移学习的果树害虫识别方法 被引量:1
4
作者 张欢 周毅 +2 位作者 王克俭 王超 李会平 《农业机械学报》 EI CAS CSCD 北大核心 2024年第11期57-67,共11页
为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别... 为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别模型。该模型用PConv(Partial convolution)模块代替原模型MobileViT模块中部分标准卷积模块,其次修改MobileViT模块的特征融合策略,将输入特征、局部表达特征、全局表达特征进行拼接融合;删除网络第10层MV2模块和第11层MobileViT模块,使用改进空洞空间池化金字塔(Atrous spatial pyramid pooling,ASPP)模块进行代替,形成多尺度融合特征;此外,模型用SiLU激活函数代替ReLU6激活函数进行计算,最后基于ImageNet数据集进行迁移学习。实验结果表明,6类果树害虫图像识别准确率达93.77%,参数量为8.40×10^(5),与改进前相比,识别准确率提高7.5个百分点,参数量降低33.86%;与常用害虫CNN识别模型AlexNet、ResNet50、MobileNetV2、ShuffleNetV2相比识别准确率分别提高8.25、4.78、7.27、7.41个百分点,参数量分别减少6.03×10^(7)、2.48×10^(7)、2.66×10^(6)、5.30×10^(5);与Transformer识别模型ViT、Swin Transfomer相比识别准确率分别提高19.03、9.8个百分点,参数量分别减少8.56×10^(7)、2.75×10^(7)。本研究适合部署在移动终端等有限资源环境,并且有助于实现对复杂背景下小目标果树害虫进行识别检测。 展开更多
关键词 果树害虫 识别模型 PConv模块 融合策略 SiLU激活函数 空洞空间池化金字塔
在线阅读 下载PDF
基于大模型的钻井现场人体姿态估计方法研究 被引量:1
5
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
基于MobileNet的轻量化云检测模型
6
作者 叶武剑 谢林峰 +2 位作者 刘怡俊 温晓卓 李扬 《自然资源遥感》 北大核心 2025年第3期95-103,共9页
针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制... 针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制和挤压激励(squeeze-and-excitation,SE)注意力模块来增强通道间的信息交流。通过这种方式,既减少了参数量和计算复杂度,又保持了对重要特征的提取能力。在上采样阶段,使用了RepConv模块和改进的空洞空间金字塔池化模块(atrous spatial pyramid pooling,ASPP),以提高网络的学习能力和捕捉图像细节与空间信息的能力。实验结果证明,该文模型在参数量和模型复杂度降低的情况下,能够实现较高精度的云检测,具备实用性和可行性。 展开更多
关键词 云检测 MobileNet网络 注意力机制 多尺度特征 空洞空间金字塔池化模块
在线阅读 下载PDF
复杂场景下基于深度学习与多传感器融合的无人机配网巡检智能避障技术 被引量:4
7
作者 廖红兵 况松陵 +3 位作者 李扬帆 黄晓露 王刚 魏洪 《测绘通报》 北大核心 2025年第1期22-28,共7页
在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融... 在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融合激光雷达和机器视觉的环境感知系统,通过利用空洞空间金字塔池化结构增大卷积核的感受野,捕获多尺度信息对障碍物进行实时识别,并利用先进的路径规划算法动态调整无人机的飞行路径,以避开障碍物。仿真测试验证表明,该系统在复杂环境中的避障能力得到显著提高,巡检效率提升了20%以上,且有效降低了事故风险。本文所提出的智能避障技术为电力配网的无人机巡检提供了一种高效、安全的解决方案,具备广泛的应用价值和推广前景。 展开更多
关键词 无人机 空洞空间金字塔池化 避障能力 路径规划
原文传递
时空网络特征融合的病理步态识别方法
8
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
PRANet:轻量高效的高分辨率遥感影像分割模型
9
作者 徐海彪 普运伟 +1 位作者 邓荣 王栋 《遥感信息》 北大核心 2025年第4期67-75,共9页
为了解决传统语义分割网络在复杂遥感影像中面临的边缘分割模糊和小目标检测不佳的问题,提出了一种基于改进金字塔残差注意力网络(PRANet)的语义分割方法。该方法采用MobileNetV2作为骨干网络,结合残差扩张卷积模块(residual ASPP)、EC... 为了解决传统语义分割网络在复杂遥感影像中面临的边缘分割模糊和小目标检测不佳的问题,提出了一种基于改进金字塔残差注意力网络(PRANet)的语义分割方法。该方法采用MobileNetV2作为骨干网络,结合残差扩张卷积模块(residual ASPP)、ECA注意力机制和金字塔池化模块(pyramid pooling module,PPM),显著提升特征提取能力和全局特征表达效果。实验结果显示,PRANet在Potsdam和GID15数据集上的多项精度指标上均优于对比模型。在Potsdam数据集上,PRANet的整体mIoU达到74.58%,比其他模型高出2.14~4.31个百分点;在GID15数据集上,PRANet的平均交并比提升至63.70%,领先1.42~5.38个百分点。此外,PRANet通过优化训练时间和参数量,在保持高精度的同时,每轮训练时间减少53 s,缩短23.45个百分点的训练时间。实验验证了PRANet在复杂遥感影像处理中的高效性与实用性。 展开更多
关键词 语义分割 MobileNetV2 金字塔池化 残差扩张卷积 注意力机制 边缘分割
在线阅读 下载PDF
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法 被引量:2
10
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
面向芯片表面缺陷分割的轻量级多尺度网络结构DSDLF-UNet
11
作者 朱永民 顾寄南 +4 位作者 单韵竹 姜宝康 夏子林 高艳 向泓宇 《半导体技术》 北大核心 2025年第11期1174-1182,共9页
针对芯片表面缺陷图像的语义分割,现有模型存在特征提取能力不足、参数量(Params)过大等问题,提出一种面向芯片表面缺陷分割的轻量级多尺度网络结构——DSDLF-UNet。编码器部分设计了双分支深度可分离空洞卷积(DSDConv)模块,该模块融合... 针对芯片表面缺陷图像的语义分割,现有模型存在特征提取能力不足、参数量(Params)过大等问题,提出一种面向芯片表面缺陷分割的轻量级多尺度网络结构——DSDLF-UNet。编码器部分设计了双分支深度可分离空洞卷积(DSDConv)模块,该模块融合深度可分离卷积(DSC)与空洞卷积(DC)的优势,以增强局部细节特征表达和全局感受野的建模能力。主干部分设计了轻量级局部-全局空洞空间金字塔池化(LG-ASPP)模块,以提升多尺度上下文建模能力。整体结构压缩至4层,以降低模型复杂度,在跳跃连接中引入融合通道与空间注意力的全注意力(FA)机制,以提高微小裂纹等细粒度缺陷识别效果。构建了芯片缺陷分割数据集,并设计对比实验和消融实验对所提网络进行验证。实验结果显示,该网络在数据集上平均交并比(mIoU)为84.96%,平均像素准确率(mPA)为87.97%,F1分数(F1-score)为87.72%,性能显著优于其他经典分割网络,能够更精准地实现芯片表面缺陷的分割。 展开更多
关键词 深度学习 U型网络(U-Net)分割 缺陷分割 轻量级局部-全局空洞空间金字塔池化(LG-aspp) 全注意力(FA)机制
原文传递
基于改进Unet模型的农作物病害语义分割研究
12
作者 刘伟立 孙公凌云 +2 位作者 连俊博 李响陈 惠国华 《传感技术学报》 北大核心 2025年第10期1818-1826,共9页
针对农作物病害类内差异性大、类间相似性高等特点导致的分割困难问题,提出了一种改进的Unet模型VGSA-Unet,用于提高农作物叶片病害图像的分割准确性。将VGG16作为Unet模型的编码器,在编码器与解码器之间集成了多尺度上下文模块GC_ASPP... 针对农作物病害类内差异性大、类间相似性高等特点导致的分割困难问题,提出了一种改进的Unet模型VGSA-Unet,用于提高农作物叶片病害图像的分割准确性。将VGG16作为Unet模型的编码器,在编码器与解码器之间集成了多尺度上下文模块GC_ASPP,在获取图像多尺度信息的同时提升对图像全局特征的提取能力,使模型理解不同形态的病害图像细节,提高模型在处理尺度变化较大的图像时的性能;在解码器中,使用双线性插值代替转置卷积,减少边缘信息的损失,提高模型计算效率;使用混合损失函数,提高模型对细小病斑的分割能力。与其他网络模型相比,改进的VGSA-Unet模型在mPA(92.04%)和mIoU(84.61%)两项指标上均达到了最高值。改进后的模型克服了病害特点造成的分割困难,对细小病斑的提取更为精确,能有效地对农作物叶片病害进行准确分割。 展开更多
关键词 语义分割 农作物病害 深度学习 Unet GCblock 空洞空间金字塔池化
在线阅读 下载PDF
融合改进ASPP和极化自注意力的自底向上全景分割 被引量:3
13
作者 李新叶 陈丁 《中国图象图形学报》 CSCD 北大核心 2023年第8期2410-2419,共10页
目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注... 目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注意力的自底向上全景分割方法。方法重新设计ASPP模块,将小空洞率卷积的输出与原始输入进行拼接(concat),将得到的结果作为新的输入传递给大空洞率卷积,然后将不同空洞率卷积的输出结果拼接,并将得到的结果与ASPP中的其他模块进行最后拼接,从而改善ASPP中因空洞率变大导致的空洞卷积效果变差的问题,达到既获得足够感受野的同时又能编码多尺度信息的目的;在主干网络的输出后引入改进的极化自注意力模块,实现对图像像素级的自我注意强化,使其得到的特征能直接适用于细粒度像素分割任务。结果本文在Cityscapes数据集的验证集上进行测试,与复现的基线网络Panoptic-DeepLab(58.26%)相比,改进ASPP模块后分割精度PQ(panoptic quality)(58.61%)提高了0.35%,运行时间从103 ms增加到124 ms,运行速度没有明显变化;通过进一步引入极化自注意力,PQ指标(58.86%)提高了0.25%,运行时间增加到187 ms;通过对该注意力模块进一步改进,PQ指标(59.36%)在58.86%基础上又提高了0.50%,运行时间增加到192 ms,速度略有下降,但实时性仍好于大多数方法。结论本文采用改进ASPP和极化自注意力模块,能够更有效地提取适合细粒度像素分割的特征,且在保证足够感受野的同时能编码多尺度信息,从而提升全景分割性能。 展开更多
关键词 全景分割 语义分割 实例分割 极化自注意力 aspp
原文传递
融合HRNet模块和可变形注意力机制的乳腺癌图像分类技术研究
14
作者 田兄玲 宋丽俊 +1 位作者 郭辉 王贝 《机器人外科学杂志(中英文)》 2025年第9期1454-1460,共7页
目的:通过融合高分辨率网络(HRNet)模块和动态可变形注意力机制改进U-Net模型实现对乳腺癌图像的高精度分类与诊断。方法:研究提出的模型以U-Net为基础,引入了高分辨率网络强大、空洞空间金字塔池化模块以捕获多尺度信息,并融合了全局... 目的:通过融合高分辨率网络(HRNet)模块和动态可变形注意力机制改进U-Net模型实现对乳腺癌图像的高精度分类与诊断。方法:研究提出的模型以U-Net为基础,引入了高分辨率网络强大、空洞空间金字塔池化模块以捕获多尺度信息,并融合了全局多尺度注意力机制、多尺度残差卷积模块和动态可变形注意力机制,从而提升模型对关键特征的关注能力。结果:改进U-Net-HRNet模型在分类准确率、召回率、精确率、F1-measure、Jaccard指数和Dice相似度系数等关键性能指标上均优于现有的乳腺癌图像分类方法。此外,消融实验结果显示,在去除各模块后,模型的性能显著降低,其中高分辨率网络模块对模型性能的影响最为显著。在去除高分辨率网络模块后,模型的准确率、F1-measure、Jaccard指数及Dice相似度系数分别降低了6.9%、7.8%、11.7%和14.1%。结论:改进U-Net-HRNet模型在乳腺癌图像分类任务中具备显著的优越性,能为乳腺癌的临床诊断提供有效辅助。 展开更多
关键词 乳腺癌 图像分类 HRNet 空洞空间金字塔池化 动态可变形注意力
在线阅读 下载PDF
基于双极化SAR影像的冰川识别方法 被引量:2
15
作者 李辰德 雷赛月 杨铭 《光电子技术》 2025年第2期164-171,共8页
极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)因其成像不受环境、时间和气候影响的优势而备受冰川识别领域研究人员的关注。然而,现有的研究并不能充分挖掘双极化SAR影像中的冰川散射特征。针对这一问题,提出了一... 极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)因其成像不受环境、时间和气候影响的优势而备受冰川识别领域研究人员的关注。然而,现有的研究并不能充分挖掘双极化SAR影像中的冰川散射特征。针对这一问题,提出了一个基于双极化Sentinel‑1 A数据的冰川分类网络S1‑UNet,利用双极化SAR数据中的散射特性,实现了对冰川区域的自动提取。引入了注意力特征融合模块增强图像的低级特征与高级特征之间的关联性;采用了改进的空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块获取图像不同尺度的散射特征信息;实验结果表明,与其他语义分割和冰川识别网络相比,S1‑UNet模型的性能最好,交并比、精确率分别为94.57%、97.82%,召回率达到96.79%。 展开更多
关键词 极化合成孔径雷达 冰川识别 散射特征 空洞空间金字塔池化
原文传递
基于多层级特征融合的堆叠场景抓取位姿检测
16
作者 马乾坤 王文龙 +1 位作者 王玮 郭志文 《计算机仿真》 2025年第10期500-505,共6页
针对机器人面对尺寸、形状、位姿未知的多物体堆叠场景时存在抓取位姿检测准确率低、适应性差的问题,提出一种基于多层级特征融合的抓取位姿检测算法。首先,在CSPDarknet中引入空洞空间卷积池化金字塔模块构建主干特征提取网络,避免了... 针对机器人面对尺寸、形状、位姿未知的多物体堆叠场景时存在抓取位姿检测准确率低、适应性差的问题,提出一种基于多层级特征融合的抓取位姿检测算法。首先,在CSPDarknet中引入空洞空间卷积池化金字塔模块构建主干特征提取网络,避免了下采样导致的空间信息丢失问题,同时并行不同空洞率的卷积核使网络获得多感受野信息,增强对小目标的检测能力;其次,搭建基于多层级特征融合的特征金字塔结构,综合利用网络中的各层级特征提高模型对尺度多变物体的适应能力;设计使用Focal Loss损失函数,缓解了数据集中正负样本不均衡对网络的影响;最后,输出置信度最高的检测结果作为最优抓取位姿。在自制多物体堆叠场景数据集上,算法检测准确率为91.2%,相比于现有方法,在精度和速度上均有提升,满足抓取位姿检测指标要求。 展开更多
关键词 抓取位姿检测 多物体堆叠场景 空洞空间卷积池化 特征融合
在线阅读 下载PDF
基于改进UNet++的洪水区域图像分割算法
17
作者 姬正杰 魏霖静 《软件导刊》 2025年第6期168-174,共7页
精准识别与划定可能受到洪水影响的地区对于规划与实施防洪措施十分重要。针对洪水区域识别过程中易受到地形、气候、光照以及数据不平衡等因素影响的问题,提出一种基于改进UNet++的洪水区域图像分割算法。该算法以UNet++分割网络为基... 精准识别与划定可能受到洪水影响的地区对于规划与实施防洪措施十分重要。针对洪水区域识别过程中易受到地形、气候、光照以及数据不平衡等因素影响的问题,提出一种基于改进UNet++的洪水区域图像分割算法。该算法以UNet++分割网络为基础框架,在每层解码器的第一个卷积单元后嵌入空洞空间金字塔池化以得到新的解码特征;同时通过密集连接和跳跃连接将不同解码路径的特征融合,采用Lovasz Hinge Loss损失函数来获取全局最优并采用数据增强的方式对原有数据进行扩充。实验结果表明,该算法在Flood Area Segmentation数据集上的IOU值达到80.53%,与目前流行的图像分割算法DeepLabv3、UNet、FCN(Res18)、PspNet、FCN(Res50)、UNet++相比,依次高出7.41、6.21、3.81、3.70、1.92、1.82个百分点。该算法具有较高的分割精度和良好的稳定性,整体性能优异,为实际防洪监测提供了技术支撑。 展开更多
关键词 洪水 图像分割 卷积神经网络 UNet++ 空洞空间金字塔池化
在线阅读 下载PDF
基于改进的U-Net模型的遥感影像植被提取研究
18
作者 郭宏飞 张永忠 +2 位作者 闫浩文 杨树文 别强 《兰州交通大学学报》 2025年第3期139-146,共8页
城市复杂环境中地物类型的多样性增加了城市植被遥感影像高精度提取的难度,但是深度学习理论的提出和方法的应用,给遥感影像植被信息提取带来了全新的视野。针对传统的U-Net神经网络模型对空间上下文信息利用不充分的问题,对其进行了改... 城市复杂环境中地物类型的多样性增加了城市植被遥感影像高精度提取的难度,但是深度学习理论的提出和方法的应用,给遥感影像植被信息提取带来了全新的视野。针对传统的U-Net神经网络模型对空间上下文信息利用不充分的问题,对其进行了改进,在模型中加入注意力机制以减少复杂背景的干扰,同时加入多尺度空洞空间金字塔池化结构(ASPP),以更好地结合上下文信息,在卷积模块加入残差连接有效缓解了多次卷积带来的梯度消失、信息损失等问题。基于ISPRS(Potsdam)数据集,进行实验以及精度评估,结果表明,改进后U-Net模型相比传统U-Net模型的准确率、交并比、F1分数、Kappa系数分别得到提升,改进后的U-Net模型能够以更高的精度从高分辨率遥感影像中进行像素级城市植被分割。 展开更多
关键词 植被提取 U-Net模型 残差结构 注意力机制 空洞空间金字塔池化
在线阅读 下载PDF
DrownACB-YOLO:an Improved YOLO for Drowning Detection in Swimming Pools
19
作者 ZENG Xiaoya XU Wujun ZHANG Xiunian 《Journal of Donghua University(English Edition)》 2025年第4期417-424,共8页
With the rise in drowning accidents in swimming pools,the demand for the precision and speed in artificial intelligence(AI)drowning detection methods has become increasingly crucial.Here,an improved YOLO-based method,... With the rise in drowning accidents in swimming pools,the demand for the precision and speed in artificial intelligence(AI)drowning detection methods has become increasingly crucial.Here,an improved YOLO-based method,named DrownACB-YOLO,for drowning detection in swimming pools is proposed.Since existing methods focus on the drowned state,a transition label is added to the original dataset to provide timely alerts.Following this expanded dataset,two improvements are implemented in the original YOLOv5.Firstly,the spatial pyramid pooling(SPP)module and the default upsampling operator are replaced by the atrous spatial pyramid pooling(ASPP)module and the content-aware reassembly of feature(CARAFE)module,respectively.Secondly,the cross stage partial bottleneck with three convolutions(C3)module at the end of the backbone is replaced with the bottleneck transformer(BotNet)module.The results of comparison experiments demonstrate that DrownACB-YOLO performs better than other models. 展开更多
关键词 drowning detection YOLO atrous spatial pyramid pooling(aspp) content-aware reassembly of feature(CARAFE)
在线阅读 下载PDF
结合多尺度特征和细节感知策略的遥感图像场景分类模型
20
作者 马惠 霍然 《计算机系统应用》 2025年第8期252-263,共12页
针对遥感图像场景分类中存在的场景尺度多变性、类内多样性和类间相似性,以及有标签训练样本稀缺的问题,本文提出了一种结合多尺度特征和细节感知策略的Vision Transformer(ViT)模型用于遥感图像场景分类.该模型通过引入空洞空间金字塔... 针对遥感图像场景分类中存在的场景尺度多变性、类内多样性和类间相似性,以及有标签训练样本稀缺的问题,本文提出了一种结合多尺度特征和细节感知策略的Vision Transformer(ViT)模型用于遥感图像场景分类.该模型通过引入空洞空间金字塔池化模块,有效捕捉并融合了遥感图像中的多尺度特征,同时增强了对局部特征信息的利用,从而进一步提升了特征判别能力.另外,采用创新的细节感知掩码策略,使得模型能够有效利用无标签遥感图像数据,促进模型学习到更为精细的特征表示,以实现更高效、更准确的遥感图像场景分类.在实验部分,本文首先在大规模无标签遥感图像数据集上进行预训练,随后将预训练模型迁移至下游场景分类任务中进行微调.在多个公开遥感图像数据集上的实验结果表明,所提模型在自监督预训练阶段能够有效提取图像特征,并在下游场景分类任务中实现较高的准确率,展现出良好的鲁棒性和有效性. 展开更多
关键词 多尺度特征 细节感知策略 遥感图像场景分类 空洞空间金字塔池化 Vision Transformer(ViT)
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部