期刊文献+
共找到157篇文章
< 1 2 8 >
每页显示 20 50 100
一种基于ASPPUnet的道路裂缝检测模型 被引量:1
1
作者 曹一冰 张江水 +1 位作者 张政 赵鑫科 《测绘科学技术学报》 2025年第1期49-56,共8页
为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深... 为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深度可分离卷积模块,用以实现模型的轻量化;采用融合Dice和交叉熵的损失函数,均衡模型的查全率和查准率;采用动态数据集增广方法,使得模型在小数据集上也能实现良好的检测效果。通过与Unet等模型的实验对比可以看出,ASPPUnet拥有更好的检测效果和可塑性,具有较好的应用价值。 展开更多
关键词 裂缝检测 图像分割 深度可分离卷积 损失函数 aspp模块 Unet模型
在线阅读 下载PDF
DCA-YOLO:Detection Algorithm for YOLOv8 Pulmonary Nodules Based on Attention Mechanism Optimization 被引量:1
2
作者 SONG Yongsheng LIU Guohua 《Journal of Donghua University(English Edition)》 2025年第1期78-87,共10页
Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially... Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially leading to false positives or missed detections.To solve these problems,the YOLOv8 network is enhanced by adding deformable convolution and atrous spatial pyramid pooling(ASPP),along with the integration of a coordinate attention(CA)mechanism.This allows the network to focus on small targets while expanding the receptive field without losing resolution.At the same time,context information on the target is gathered and feature expression is enhanced by attention modules in different directions.It effectively improves the positioning accuracy and achieves good results on the LUNA16 dataset.Compared with other detection algorithms,it improves the accuracy of pulmonary nodule detection to a certain extent. 展开更多
关键词 pulmonary nodule YOLOv8 network object detection deformable convolution atrous spatial pyramid pooling(aspp) coordinate attention(CA)mechanism
在线阅读 下载PDF
基于改进ICP算法和级联ASPP算法的异形建筑表面重建 被引量:1
3
作者 史振玮 《北京测绘》 2025年第4期462-467,共6页
由于异形建筑独特的几何形态和复杂的表面结构,在对建筑表面进行重建时,表面识别结果容易出现偏差,影响重建模型的精度。对此,设计基于改进迭代最近点(ICP)算法和级联检测分割(ASPP)算法的异形建筑表面重建方法。改进ICP算法实施点云配... 由于异形建筑独特的几何形态和复杂的表面结构,在对建筑表面进行重建时,表面识别结果容易出现偏差,影响重建模型的精度。对此,设计基于改进迭代最近点(ICP)算法和级联检测分割(ASPP)算法的异形建筑表面重建方法。改进ICP算法实施点云配准,将从不同位置采集到的点云数据统一到同一个坐标系下,消除位置偏差,提高点云数据的配准精度。通过级联ASPP算法设计轻量级语义分割模型,聚合多尺度信息,确保算法的识别范围能全面覆盖视野范围。利用随机抽样一致性(RANSAC)算法自动化处理异形建筑的识别数据,结合最小二乘法原理进行墙面立体拟合,得到高精度的表面重建参数,实现异形建筑表面重建。测试结果表明,设计方法的重建结果接近真实世界的几何形态,在异形建筑表面各墙面上重建偏差值均低于1.5。 展开更多
关键词 点云配准 迭代最近点(ICP)算法 级联检测分割(aspp)算法 随机抽样一致性(RANSAC)算法 异形建筑表面
在线阅读 下载PDF
融合改进ASPP和极化自注意力的自底向上全景分割 被引量:3
4
作者 李新叶 陈丁 《中国图象图形学报》 CSCD 北大核心 2023年第8期2410-2419,共10页
目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注... 目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注意力的自底向上全景分割方法。方法重新设计ASPP模块,将小空洞率卷积的输出与原始输入进行拼接(concat),将得到的结果作为新的输入传递给大空洞率卷积,然后将不同空洞率卷积的输出结果拼接,并将得到的结果与ASPP中的其他模块进行最后拼接,从而改善ASPP中因空洞率变大导致的空洞卷积效果变差的问题,达到既获得足够感受野的同时又能编码多尺度信息的目的;在主干网络的输出后引入改进的极化自注意力模块,实现对图像像素级的自我注意强化,使其得到的特征能直接适用于细粒度像素分割任务。结果本文在Cityscapes数据集的验证集上进行测试,与复现的基线网络Panoptic-DeepLab(58.26%)相比,改进ASPP模块后分割精度PQ(panoptic quality)(58.61%)提高了0.35%,运行时间从103 ms增加到124 ms,运行速度没有明显变化;通过进一步引入极化自注意力,PQ指标(58.86%)提高了0.25%,运行时间增加到187 ms;通过对该注意力模块进一步改进,PQ指标(59.36%)在58.86%基础上又提高了0.50%,运行时间增加到192 ms,速度略有下降,但实时性仍好于大多数方法。结论本文采用改进ASPP和极化自注意力模块,能够更有效地提取适合细粒度像素分割的特征,且在保证足够感受野的同时能编码多尺度信息,从而提升全景分割性能。 展开更多
关键词 全景分割 语义分割 实例分割 极化自注意力 aspp
原文传递
Res_ASPP_UNet++:结合分离卷积与空洞金字塔的遥感影像建筑物提取网络 被引量:22
5
作者 吕少云 李佳田 +3 位作者 阿晓荟 杨超 杨汝春 尚晓梅 《遥感学报》 EI CSCD 北大核心 2023年第2期502-519,共18页
针对连续池化操作丢失低层语义信息而导致建筑物提取精度低的问题,尝试以UNet++网络为基础,通过将编码器的标准卷积及最大池化替换成深度可分离卷积,以及在编码器末端利用不同采样率的空洞卷积构建多尺度空洞空间金字塔池化结构ASPP(Atr... 针对连续池化操作丢失低层语义信息而导致建筑物提取精度低的问题,尝试以UNet++网络为基础,通过将编码器的标准卷积及最大池化替换成深度可分离卷积,以及在编码器末端利用不同采样率的空洞卷积构建多尺度空洞空间金字塔池化结构ASPP(Atrous Spatial Pyramid Pooling)来提升网络性能,并将改进后的建筑物提取网络称为残差空洞空间金字塔网络(Res_ASPP_UNet++)。为验证Res_ASPP_UNet++网络结构的有效性和适用性,以经过数据增强预处理的WHU和Massachusetts数据集作为数据源,对Res_ASPP_UNet++网络与目前常用的语义分割网络进行了试验和精度评估,并将Res_ASPP_UNet++网络与文献中的研究成果进行了对比。结果表明Res_ASPP_UNet++在模型参数量与精度两个方面均表现出优势,能够在大幅压缩模型参数量的前提下,显著提升建筑物提取精度,提取建筑物的边界更加平滑和精确,对不同尺度的建筑物表现出较强的泛化能力。 展开更多
关键词 遥感影像 建筑物提取 UNet++ 深度可分离卷积 深度残差结构 空洞空间金字塔池化
原文传递
基于MobileViT-PC-ASPP和迁移学习的果树害虫识别方法 被引量:2
6
作者 张欢 周毅 +2 位作者 王克俭 王超 李会平 《农业机械学报》 EI CAS CSCD 北大核心 2024年第11期57-67,共11页
为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别... 为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别模型。该模型用PConv(Partial convolution)模块代替原模型MobileViT模块中部分标准卷积模块,其次修改MobileViT模块的特征融合策略,将输入特征、局部表达特征、全局表达特征进行拼接融合;删除网络第10层MV2模块和第11层MobileViT模块,使用改进空洞空间池化金字塔(Atrous spatial pyramid pooling,ASPP)模块进行代替,形成多尺度融合特征;此外,模型用SiLU激活函数代替ReLU6激活函数进行计算,最后基于ImageNet数据集进行迁移学习。实验结果表明,6类果树害虫图像识别准确率达93.77%,参数量为8.40×10^(5),与改进前相比,识别准确率提高7.5个百分点,参数量降低33.86%;与常用害虫CNN识别模型AlexNet、ResNet50、MobileNetV2、ShuffleNetV2相比识别准确率分别提高8.25、4.78、7.27、7.41个百分点,参数量分别减少6.03×10^(7)、2.48×10^(7)、2.66×10^(6)、5.30×10^(5);与Transformer识别模型ViT、Swin Transfomer相比识别准确率分别提高19.03、9.8个百分点,参数量分别减少8.56×10^(7)、2.75×10^(7)。本研究适合部署在移动终端等有限资源环境,并且有助于实现对复杂背景下小目标果树害虫进行识别检测。 展开更多
关键词 果树害虫 识别模型 PConv模块 融合策略 SiLU激活函数 空洞空间池化金字塔
在线阅读 下载PDF
衔接注意力机制与残差ASPP的W-Net工业烟尘图像分割 被引量:1
7
作者 詹光莉 刘辉 +1 位作者 陈甫刚 杨路 《控制理论与应用》 EI CAS CSCD 北大核心 2023年第1期160-171,共12页
工业烟尘图像分割是基于烟尘图像监测污染等级判定的重要环节.针对工业烟尘分割时存在的小目标烟尘漏检、大目标烟尘误检以及分割结果精度低等问题,提出了一种结合衔接注意力机制和残差空洞空间金字塔池化(ASPP)的W-Net网络.使用衔接注... 工业烟尘图像分割是基于烟尘图像监测污染等级判定的重要环节.针对工业烟尘分割时存在的小目标烟尘漏检、大目标烟尘误检以及分割结果精度低等问题,提出了一种结合衔接注意力机制和残差空洞空间金字塔池化(ASPP)的W-Net网络.使用衔接注意力机制将两个U-Net网络组合成W-Net,W-Net能充分利用烟尘的轮廓、位置信息进行烟尘粗分割和细分割操作,两次分割能达到更精细的分割效果;此外,针对W-Net中的普通卷积功能过于简单而不能更好地提取烟尘特征的问题,提出一种兼具残差块和ASPP功能的残差ASPP结构,同时还能根据大小目标烟尘的特点进行针对性分割,分割结果更全面完整.实验结果表明,结合衔接注意力机制与残差ASPP的W-Net以较小的分割效率损失为代价获得了较高的分割精度,Recall,IoU与F-score指标提高了4%~5%,解决了大小目标烟尘存在的分割问题,烟尘的分割效果也优于其他语义分割网络. 展开更多
关键词 工业烟尘 图像分割 注意力机制 空洞空间金字塔池化 W-Net
在线阅读 下载PDF
基于分层压缩激励的ASPP网络单目深度估计 被引量:5
8
作者 廖志伟 金兢 +1 位作者 张超凡 杨学志 《图学学报》 CSCD 北大核心 2022年第2期214-222,共9页
场景深度估计是场景理解的一项基本任务,其准确率反映了计算机对场景的理解程度。传统的深度估计利用金字塔池化(ASPP)模块可以在不改变图像分辨率的情况下处理不同像素特征,但该模块未考虑不同像素特征之间的关系,导致场景特征提取不... 场景深度估计是场景理解的一项基本任务,其准确率反映了计算机对场景的理解程度。传统的深度估计利用金字塔池化(ASPP)模块可以在不改变图像分辨率的情况下处理不同像素特征,但该模块未考虑不同像素特征之间的关系,导致场景特征提取不准确。针对 ASPP 模块在深度估计中出现的弊端,提出了一种改进型的 ASPP 模块,解决了该模块在图像处理中存在的失真问题。首先在卷积核后添加基于分层压缩激励的ASPP 结构块,结合各像素特征之间的关系,让网络自适应学习感兴趣部分;再通过构造差值矩阵解决网络层次优化问题;最后在室内公共数据集 NYU-Depthv2 上进行深度估计网络模型的搭建。与当前主流算法相比,文中算法在定性、定量指标上均有良好表现。在相同的评估指标下,δ;阈值精度提升近 3%,均方误差(RMSE)、绝对误差(Abs Rel)下降 1.7%,对数域误差(lg)下降约 0.3%。该方法所训练的网络模型,解决了传统 ASPP 模块未考虑不同像素特征之间关系的问题,特征提取能力增强,场景深度估计的结果更加准确。 展开更多
关键词 深度学习 卷积神经网络 深度估计 空洞空间金字塔池化 分层设计
在线阅读 下载PDF
基于ASPP-SOLOv2的复杂场景下透明玻璃仪器实例分割 被引量:1
9
作者 葛建统 杨鑫 +3 位作者 祝模芮 冉进业 翟持 张浩 《高校化学工程学报》 EI CAS CSCD 北大核心 2023年第6期962-970,共9页
针对深度学习方法对复杂背景下实验室透明玻璃仪器识别效果不佳的问题,建立包含1548张含常用玻璃化学仪器图像的实验室复杂场景实例分割数据集,提出基于动态快速实例分割算法2.0版(SOLOv2)的透明仪器实例分割算法,利用空洞空间金字塔池... 针对深度学习方法对复杂背景下实验室透明玻璃仪器识别效果不佳的问题,建立包含1548张含常用玻璃化学仪器图像的实验室复杂场景实例分割数据集,提出基于动态快速实例分割算法2.0版(SOLOv2)的透明仪器实例分割算法,利用空洞空间金字塔池化(ASPP)融合多尺度信息,通过自下而上增强方式提高底层信息利用率,交并比阈值大于50%的精确率最终达到90.50%,类平均精度(APav)达到76.00%,比原始方法平均精度提高8.7%。消融实验表明ASPP的引入增强透明仪器的几何、边缘等特征的表示能力,提高对密集重叠目标的分割精度。该方法使APav提高22.58%,在骨干网络特征分辨率为原图1/16的阶段,加入该模块可实现浅层信息和高阶语义信息的最佳平衡。 展开更多
关键词 实例分割 透明玻璃仪器数据集 动态快速实例分割 空洞空间金字塔池化
在线阅读 下载PDF
改进ASPP及多层次特征语义融合分割方法 被引量:3
10
作者 王银宇 孟凡云 +1 位作者 王金鹤 刘志浩 《计算机工程与应用》 CSCD 北大核心 2023年第13期220-228,共9页
为解决图像语义分割中多尺度目标分割困难、类别边界预测不准确等问题,提出一种基于改进空洞空间金字塔池化的多层次特征语义融合分割方法。将深层次网络特征按通道分组,利用分组空洞空间金字塔池化模块捕获每个分组多尺度特征上下文信... 为解决图像语义分割中多尺度目标分割困难、类别边界预测不准确等问题,提出一种基于改进空洞空间金字塔池化的多层次特征语义融合分割方法。将深层次网络特征按通道分组,利用分组空洞空间金字塔池化模块捕获每个分组多尺度特征上下文信息;引入条状池化模块对上下文信息补充和完善,增强全局语义信息表达;根据语义引导融合模块建立不同层次特征像素间对应关系,将深层次语义信息以自底向上方式逐步融入到低层次高分辨率图像中。实验结果表明,该方法在PASCAL VOC 2012和Cityscapes公开数据集上分别获得73.1%、71.8%的平均交并比,且在相同精度下,该方法减少了39%的参数量。 展开更多
关键词 语义分割 空洞空间金字塔池化 特征融合 上下文信息
在线阅读 下载PDF
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet 被引量:2
11
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
在线阅读 下载PDF
基于FCN-AC-ASPP的手写体去除方法
12
作者 方海泉 邓明明 冶运涛 《高技术通讯》 CAS 2022年第9期972-979,共8页
针对印刷体和手写体分类准确率不够高的问题,本文首先提出了一种印刷体与手写体像素级样本制作方法,并制作了印刷体和手写体数据集。其次提出了一种基于带空洞卷积和空洞空间金字塔池化的全卷积神经网络(FCN-AC-ASPP)模型。经过对FCNAC-... 针对印刷体和手写体分类准确率不够高的问题,本文首先提出了一种印刷体与手写体像素级样本制作方法,并制作了印刷体和手写体数据集。其次提出了一种基于带空洞卷积和空洞空间金字塔池化的全卷积神经网络(FCN-AC-ASPP)模型。经过对FCNAC-ASPP模型的训练和检测,该模型的分类准确率平均交并比(IoU)达到96.10%,优于全卷积神经网络(FCN)、DeeplabV3+、带空洞卷积的全卷积神经网络(FCN-AC)模型。最后对于同时含有印刷体和手写体的新图片,用训练好的FCN-AC-ASPP模型对印刷体和手写体分类,从而把手写体去除。 展开更多
关键词 手写体 印刷体 分类 全卷积神经网络(FCN) 空洞卷积(AC) 空洞空间金字塔池化(aspp)
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法
13
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
增强人体关键点特征的姿态估计算法
14
作者 刘赏 代娆 +1 位作者 周煜炜 董林芳 《计算机辅助设计与图形学学报》 北大核心 2025年第9期1607-1618,共12页
二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进... 二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进,提出一种增强人体关键点特征的算法.首先基于MixFormer思想给出多头自注意力机制和深度卷积并行的策略,以增强人体姿态的局部和全局特征,在获取高质量视觉表征的同时学习更多的人体关节结构信息;然后给出坐标注意力机制和空洞空间卷积池化金字塔串行融合策略,先将人体姿态特征进行拆分来捕获跨通道信息,再采用空洞卷积扩大感受野,减少小目标信息的丢失,提高多尺度特征融合能力;最后结合YOLO-Pose算法进行姿态估计.在2个数据集上进行实验的结果表明, COCO2017数据集上,所提算法的AP值提高0.9个百分点, AR值提高1.2个百分点;OC_Human遮挡数据集上, AP值提高2.3个百分点;该算法可以在保证运行速度的同时增强人体关键点特征,提高整体性能. 展开更多
关键词 多人姿态估计 多头自注意力机制 坐标注意力机制 空洞空间卷积池化金字塔
在线阅读 下载PDF
RAUGAN:基于循环生成对抗网络的红外图像彩色化方法
15
作者 朴燕 康继元 《吉林大学学报(工学版)》 北大核心 2025年第8期2722-2731,共10页
针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的S... 针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的Skip connection结构处连接,使解码分支中的不同尺度输出特征图都能与编码器中对应的输出特征图相结合;其次,设计了由残差块与通道和空间注意力模块(CBAM)构成的深度瓶颈层块替换UNet网络中的瓶颈层,用于增强局部区域特征,提高其识别能力;最后,在判别网络中引用感知损失函数从而解决色彩恢复失真的问题。实验结果表明:该方法彩色化效果明显优于其他方法。 展开更多
关键词 计算机应用 红外图像彩色化 循环生成对抗网络 空洞空间金字塔池化 注意力模块
原文传递
基于大模型的钻井现场人体姿态估计方法研究 被引量:1
16
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
复杂场景下基于深度学习与多传感器融合的无人机配网巡检智能避障技术 被引量:7
17
作者 廖红兵 况松陵 +3 位作者 李扬帆 黄晓露 王刚 魏洪 《测绘通报》 北大核心 2025年第1期22-28,共7页
在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融... 在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融合激光雷达和机器视觉的环境感知系统,通过利用空洞空间金字塔池化结构增大卷积核的感受野,捕获多尺度信息对障碍物进行实时识别,并利用先进的路径规划算法动态调整无人机的飞行路径,以避开障碍物。仿真测试验证表明,该系统在复杂环境中的避障能力得到显著提高,巡检效率提升了20%以上,且有效降低了事故风险。本文所提出的智能避障技术为电力配网的无人机巡检提供了一种高效、安全的解决方案,具备广泛的应用价值和推广前景。 展开更多
关键词 无人机 空洞空间金字塔池化 避障能力 路径规划
原文传递
基于MobileNet的轻量化云检测模型
18
作者 叶武剑 谢林峰 +2 位作者 刘怡俊 温晓卓 李扬 《自然资源遥感》 北大核心 2025年第3期95-103,共9页
针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制... 针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制和挤压激励(squeeze-and-excitation,SE)注意力模块来增强通道间的信息交流。通过这种方式,既减少了参数量和计算复杂度,又保持了对重要特征的提取能力。在上采样阶段,使用了RepConv模块和改进的空洞空间金字塔池化模块(atrous spatial pyramid pooling,ASPP),以提高网络的学习能力和捕捉图像细节与空间信息的能力。实验结果证明,该文模型在参数量和模型复杂度降低的情况下,能够实现较高精度的云检测,具备实用性和可行性。 展开更多
关键词 云检测 MobileNet网络 注意力机制 多尺度特征 空洞空间金字塔池化模块
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
19
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法 被引量:3
20
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部