期刊文献+
共找到578篇文章
< 1 2 29 >
每页显示 20 50 100
EHDC-YOLO: Enhancing Object Detection for UAV Imagery via Multi-Scale Edge and Detail Capture
1
作者 Zhiyong Deng Yanchen Ye Jiangling Guo 《Computers, Materials & Continua》 2026年第1期1665-1682,共18页
With the rapid expansion of drone applications,accurate detection of objects in aerial imagery has become crucial for intelligent transportation,urban management,and emergency rescue missions.However,existing methods ... With the rapid expansion of drone applications,accurate detection of objects in aerial imagery has become crucial for intelligent transportation,urban management,and emergency rescue missions.However,existing methods face numerous challenges in practical deployment,including scale variation handling,feature degradation,and complex backgrounds.To address these issues,we propose Edge-enhanced and Detail-Capturing You Only Look Once(EHDC-YOLO),a novel framework for object detection in Unmanned Aerial Vehicle(UAV)imagery.Based on the You Only Look Once version 11 nano(YOLOv11n)baseline,EHDC-YOLO systematically introduces several architectural enhancements:(1)a Multi-Scale Edge Enhancement(MSEE)module that leverages multi-scale pooling and edge information to enhance boundary feature extraction;(2)an Enhanced Feature Pyramid Network(EFPN)that integrates P2-level features with Cross Stage Partial(CSP)structures and OmniKernel convolutions for better fine-grained representation;and(3)Dynamic Head(DyHead)with multi-dimensional attention mechanisms for enhanced cross-scale modeling and perspective adaptability.Comprehensive experiments on the Vision meets Drones for Detection(VisDrone-DET)2019 dataset demonstrate that EHDC-YOLO achieves significant improvements,increasing mean Average Precision(mAP)@0.5 from 33.2%to 46.1%(an absolute improvement of 12.9 percentage points)and mAP@0.5:0.95 from 19.5%to 28.0%(an absolute improvement of 8.5 percentage points)compared with the YOLOv11n baseline,while maintaining a reasonable parameter count(2.81 M vs the baseline’s 2.58 M).Further ablation studies confirm the effectiveness of each proposed component,while visualization results highlight EHDC-YOLO’s superior performance in detecting objects and handling occlusions in complex drone scenarios. 展开更多
关键词 UAV imagery object detection multi-scale feature fusion edge enhancement detail preservation YOLO feature pyramid network attention mechanism
在线阅读 下载PDF
Pyramid Pooling-Based Vision Transformer for Tool Condition Recognition
2
作者 ZHENG Kun LI Yonglin +2 位作者 GU Xinyan DING Zhiying ZHU Haihua 《Transactions of Nanjing University of Aeronautics and Astronautics》 2025年第3期322-336,共15页
This study focuses on tool condition recognition through data-driven approaches to enhance the intelligence level of computerized numerical control(CNC)machining processes and improve tool utilization efficiency.Tradi... This study focuses on tool condition recognition through data-driven approaches to enhance the intelligence level of computerized numerical control(CNC)machining processes and improve tool utilization efficiency.Traditional tool monitoring methods that rely on empirical knowledge or limited mathematical models struggle to adapt to complex and dynamic machining environments.To address this,we implement real-time tool condition recognition by introducing deep learning technology.Aiming to the insufficient recognition accuracy,we propose a pyramid pooling-based vision Transformer network(P2ViT-Net)method for tool condition recognition.Using images as input effectively mitigates the issue of low-dimensional signal features.We enhance the vision Transformer(ViT)framework for image classification by developing the P2ViT model and adapt it to tool condition recognition.Experimental results demonstrate that our improved P2ViT model achieves 94.4%recognition accuracy,showing a 10%improvement over conventional ViT and outperforming all comparative convolutional neural network models. 展开更多
关键词 tool condition recognition TRANSFORMER pyramid pooling deep convolutional neural network
在线阅读 下载PDF
Optimized Convolutional Neural Networks with Multi-Scale Pyramid Feature Integration for Efficient Traffic Light Detection in Intelligent Transportation Systems
3
作者 Yahia Said Yahya Alassaf +2 位作者 Refka Ghodhbani Taoufik Saidani Olfa Ben Rhaiem 《Computers, Materials & Continua》 2025年第2期3005-3018,共14页
Transportation systems are experiencing a significant transformation due to the integration of advanced technologies, including artificial intelligence and machine learning. In the context of intelligent transportatio... Transportation systems are experiencing a significant transformation due to the integration of advanced technologies, including artificial intelligence and machine learning. In the context of intelligent transportation systems (ITS) and Advanced Driver Assistance Systems (ADAS), the development of efficient and reliable traffic light detection mechanisms is crucial for enhancing road safety and traffic management. This paper presents an optimized convolutional neural network (CNN) framework designed to detect traffic lights in real-time within complex urban environments. Leveraging multi-scale pyramid feature maps, the proposed model addresses key challenges such as the detection of small, occluded, and low-resolution traffic lights amidst complex backgrounds. The integration of dilated convolutions, Region of Interest (ROI) alignment, and Soft Non-Maximum Suppression (Soft-NMS) further improves detection accuracy and reduces false positives. By optimizing computational efficiency and parameter complexity, the framework is designed to operate seamlessly on embedded systems, ensuring robust performance in real-world applications. Extensive experiments using real-world datasets demonstrate that our model significantly outperforms existing methods, providing a scalable solution for ITS and ADAS applications. This research contributes to the advancement of Artificial Intelligence-driven (AI-driven) pattern recognition in transportation systems and offers a mathematical approach to improving efficiency and safety in logistics and transportation networks. 展开更多
关键词 Intelligent transportation systems(ITS) traffic light detection multi-scale pyramid feature maps advanced driver assistance systems(ADAS) real-time detection AI in transportation
在线阅读 下载PDF
A multivariate grey incidence model for different scale data based on spatial pyramid pooling 被引量:7
4
作者 ZHANG Ke CUI Le YIN Yao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期770-779,共10页
In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of ... In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of multivariate time series on different scales are pooled and aggregated by spatial pyramid pooling to construct n levels feature pooling matrices on the same scale. Secondly,Deng's multivariate grey incidence model is introduced to measure the degree of incidence between feature pooling matrices at each level. Thirdly, grey incidence degrees at each level are integrated into a global incidence degree. Finally, the performance of the proposed model is verified on two data sets compared with a variety of algorithms. The results illustrate that the proposed model is more effective and efficient than other similarity measure algorithms. 展开更多
关键词 grey system spatial pyramid pooling grey incidence multivariate time series
在线阅读 下载PDF
DrownACB-YOLO:an Improved YOLO for Drowning Detection in Swimming Pools
5
作者 ZENG Xiaoya XU Wujun ZHANG Xiunian 《Journal of Donghua University(English Edition)》 2025年第4期417-424,共8页
With the rise in drowning accidents in swimming pools,the demand for the precision and speed in artificial intelligence(AI)drowning detection methods has become increasingly crucial.Here,an improved YOLO-based method,... With the rise in drowning accidents in swimming pools,the demand for the precision and speed in artificial intelligence(AI)drowning detection methods has become increasingly crucial.Here,an improved YOLO-based method,named DrownACB-YOLO,for drowning detection in swimming pools is proposed.Since existing methods focus on the drowned state,a transition label is added to the original dataset to provide timely alerts.Following this expanded dataset,two improvements are implemented in the original YOLOv5.Firstly,the spatial pyramid pooling(SPP)module and the default upsampling operator are replaced by the atrous spatial pyramid pooling(ASPP)module and the content-aware reassembly of feature(CARAFE)module,respectively.Secondly,the cross stage partial bottleneck with three convolutions(C3)module at the end of the backbone is replaced with the bottleneck transformer(BotNet)module.The results of comparison experiments demonstrate that DrownACB-YOLO performs better than other models. 展开更多
关键词 drowning detection YOLO atrous spatial pyramid pooling(ASPP) content-aware reassembly of feature(CARAFE)
在线阅读 下载PDF
基于空间通道自适应特征的肝脏病理图像分割网络
6
作者 王建宇 王朝立 +1 位作者 孙占全 刘晓虹 《电子科技》 2026年第1期9-17,共9页
针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与... 针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与肝脏病灶相关的重要特征,并在编码器最深层引入空洞空间金字塔池化模块来弥补高级特征所缺失的多尺度信息,提高模型的分割精度。在私有肝脏数据集、公开肝脏数据集以及其他两种公开病理数据集对所提网络进行对比实验和消融实验。实验结果表明,相较于其他方法,所提网络的分割结果较佳,且有效解决了肝细胞癌分割问题。 展开更多
关键词 肝细胞癌 病理图像 编解码架构 混合校准注意力模块 空间注意力 通道注意力 空洞空间金字塔池化模块 多尺度信息
在线阅读 下载PDF
基于跨尺度特征融合的内窥镜图像增强算法
7
作者 刘旭阳 蔡芸 蒋林 《现代电子技术》 北大核心 2026年第1期34-40,共7页
临床医学的内窥镜图像由于在成像过程中存在补充光源不均匀和人体组织粘液反光的问题,出现大量曝光过度等图像质量较低的现象。现有基于深度学习的图像增强算法由于仅采用固定尺寸的特征融合方式,导致特征提取能力较低、增强效果较差。... 临床医学的内窥镜图像由于在成像过程中存在补充光源不均匀和人体组织粘液反光的问题,出现大量曝光过度等图像质量较低的现象。现有基于深度学习的图像增强算法由于仅采用固定尺寸的特征融合方式,导致特征提取能力较低、增强效果较差。为改善这一问题,文中构建了基于跨尺度特征融合的内窥镜图像增强算法,通过构建CM卷积模块实现高性能特征提取,同时采用SPPF金字塔池化模块实现对特征图不同尺度的池化操作,并且在网络不同尺度的网络层之间引入跨尺度特征融合(CFF)模块,实现多尺度特征融合和上下文信息传播,从而大幅提高图像细节捕捉能力和图像质量。实验结果表明,文中算法在PSNR、SSIM指标均高于现有算法,其中PSNR指标提高了9.9%,SSIM指标提高了15.4%,可以实现高质量内窥镜图像增强任务。 展开更多
关键词 内窥镜图像 深度特征融合 CFF 曝光异常 图像增强算法 金字塔池化模块
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
8
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection Feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
Neighborhood fusion-based hierarchical parallel feature pyramid network for object detection 被引量:3
9
作者 Mo Lingfei Hu Shuming 《Journal of Southeast University(English Edition)》 EI CAS 2020年第3期252-263,共12页
In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid... In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid network(FPN)and deconvolutional single shot detector(DSSD),where the bottom layer of the feature pyramid network relies on the top layer,NFPN builds the feature pyramid network with no connections between the upper and lower layers.That is,it only fuses shallow features on similar scales.NFPN is highly portable and can be embedded in many models to further boost performance.Extensive experiments on PASCAL VOC 2007,2012,and COCO datasets demonstrate that the NFPN-based SSD without intricate tricks can exceed the DSSD model in terms of detection accuracy and inference speed,especially for small objects,e.g.,4%to 5%higher mAP(mean average precision)than SSD,and 2%to 3%higher mAP than DSSD.On VOC 2007 test set,the NFPN-based SSD with 300×300 input reaches 79.4%mAP at 34.6 frame/s,and the mAP can raise to 82.9%after using the multi-scale testing strategy. 展开更多
关键词 computer vision deep convolutional neural network object detection hierarchical parallel feature pyramid network multi-scale feature fusion
在线阅读 下载PDF
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet 被引量:2
10
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
在线阅读 下载PDF
IMTNet:Improved Multi-Task Copy-Move Forgery Detection Network with Feature Decoupling and Multi-Feature Pyramid
11
作者 Huan Wang Hong Wang +2 位作者 Zhongyuan Jiang Qing Qian Yong Long 《Computers, Materials & Continua》 SCIE EI 2024年第9期4603-4620,共18页
Copy-Move Forgery Detection(CMFD)is a technique that is designed to identify image tampering and locate suspicious areas.However,the practicality of the CMFD is impeded by the scarcity of datasets,inadequate quality a... Copy-Move Forgery Detection(CMFD)is a technique that is designed to identify image tampering and locate suspicious areas.However,the practicality of the CMFD is impeded by the scarcity of datasets,inadequate quality and quantity,and a narrow range of applicable tasks.These limitations significantly restrict the capacity and applicability of CMFD.To overcome the limitations of existing methods,a novel solution called IMTNet is proposed for CMFD by employing a feature decoupling approach.Firstly,this study formulates the objective task and network relationship as an optimization problem using transfer learning.Furthermore,it thoroughly discusses and analyzes the relationship between CMFD and deep network architecture by employing ResNet-50 during the optimization solving phase.Secondly,a quantitative comparison between fine-tuning and feature decoupling is conducted to evaluate the degree of similarity between the image classification and CMFD domains by the enhanced ResNet-50.Finally,suspicious regions are localized using a feature pyramid network with bottom-up path augmentation.Experimental results demonstrate that IMTNet achieves faster convergence,shorter training times,and favorable generalization performance compared to existingmethods.Moreover,it is shown that IMTNet significantly outperforms fine-tuning based approaches in terms of accuracy and F_(1). 展开更多
关键词 Image copy-move detection feature decoupling multi-scale feature pyramids passive forensics
在线阅读 下载PDF
基于多尺度融合金字塔焦点网络的接触网零部件检测 被引量:2
12
作者 朱新宇 崔浩锐 宋洋 《工程科学学报》 EI 北大核心 2025年第2期315-327,共13页
作为高铁牵引供电系统的重要组成部分,接触网系统承担着向动车组传输电能的重要功能.实际工程运营表明,受弓网交互产生的持续冲击以及外部环境的影响,接触网支撑部件可能会出现“松、脱、断、裂”等缺陷,导致接触网结构可靠性下降,严重... 作为高铁牵引供电系统的重要组成部分,接触网系统承担着向动车组传输电能的重要功能.实际工程运营表明,受弓网交互产生的持续冲击以及外部环境的影响,接触网支撑部件可能会出现“松、脱、断、裂”等缺陷,导致接触网结构可靠性下降,严重影响接触网系统稳定运行.因此,及时精确定位接触网支撑部件(CSCs),对保障高铁安全运行和完善接触网检修维护策略具有重大意义.然而,CSCs的检测通常面临着零部件种类多、尺度差异大、部分零部件微小的问题.针对以上问题,本文提出一种基于多尺度融合金字塔焦点网络的接触网零部件检测算法,将平衡模块和特征金字塔模块相结合,提高对小目标的检测性能.首先,设计了可分离残差金字塔聚合模块(SRPAM),用于优化模型多尺度特征提取能力、扩大感受野,缓解CSCs检测的多尺度问题;其次,设计了一种基于平衡特征金字塔的路径聚合网络(PA-BFPN),用于提升跨层特征融合效率和小目标检测性能.最后,通过对比试验、可视化实验和消融实验证明了所提方法的有效性和优越性.其中,所提的MFPFCOS在CSCs数据集上的检测精度(mAP)能够在达到48.6%的同时,实现30的FLOPs(Floating point operations per second),表明所提方法能够在检测精度和检测速度之间保持良好的平衡. 展开更多
关键词 深度学习 目标检测 接触网支撑组件(CSCs) 路径聚合特征金字塔(PA-FPN) 空洞空间卷积池化金字塔(ASPP)
在线阅读 下载PDF
增强人体关键点特征的姿态估计算法 被引量:1
13
作者 刘赏 代娆 +1 位作者 周煜炜 董林芳 《计算机辅助设计与图形学学报》 北大核心 2025年第9期1607-1618,共12页
二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进... 二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进,提出一种增强人体关键点特征的算法.首先基于MixFormer思想给出多头自注意力机制和深度卷积并行的策略,以增强人体姿态的局部和全局特征,在获取高质量视觉表征的同时学习更多的人体关节结构信息;然后给出坐标注意力机制和空洞空间卷积池化金字塔串行融合策略,先将人体姿态特征进行拆分来捕获跨通道信息,再采用空洞卷积扩大感受野,减少小目标信息的丢失,提高多尺度特征融合能力;最后结合YOLO-Pose算法进行姿态估计.在2个数据集上进行实验的结果表明, COCO2017数据集上,所提算法的AP值提高0.9个百分点, AR值提高1.2个百分点;OC_Human遮挡数据集上, AP值提高2.3个百分点;该算法可以在保证运行速度的同时增强人体关键点特征,提高整体性能. 展开更多
关键词 多人姿态估计 多头自注意力机制 坐标注意力机制 空洞空间卷积池化金字塔
在线阅读 下载PDF
基于多尺度特征融合与重构卷积的肝肿瘤图像分割方法
14
作者 马金林 酒志青 +4 位作者 马自萍 夏明格 张凯 程叶霞 马瑞士 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期94-108,共15页
针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核... 针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核重构模块,使编码器保留更多的细节信息,并使解码器能更有效地恢复信息,以提升肝肿瘤图像特征的表达能力。然后,为丰富全局上下文信息的传递,设计了三分支空间金字塔池化模块来优化瓶颈结构的信息传递,打破单一路径的限制。接着,设计了多尺度特征融合模块来优化编码器信息的复用机制,增强模型对全局上下文信息的建模能力,并提升其在提取不同尺度肝肿瘤图像特征时的效能。最后,在LiTS2017和3DIRCADb数据集上对该文方法的性能进行了测试。实验结果表明:在LiTS2017数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.56%和95.25%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.71%和81.58%;在3DIRCADb数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.63%和95.39%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.62%和81.63%。 展开更多
关键词 肝肿瘤图像分割 卷积核重构 空间金字塔池化 多尺度特征融合
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
15
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
原文传递
多尺度金字塔注意力的葡萄果梗分割模型
16
作者 张丽英 贺静宇 赵建辉 《计算机工程与设计》 北大核心 2025年第5期1445-1450,共6页
为降低葡萄图像中目标尺寸差异大、光照等复杂环境的影响,提出一种多尺度金字塔注意力网络MPANet(multiscale pyramid attention network)。网络包括特征提取模块、多尺度特征的注意力池化金字塔模块和特征增强模块。在采集的葡萄图像... 为降低葡萄图像中目标尺寸差异大、光照等复杂环境的影响,提出一种多尺度金字塔注意力网络MPANet(multiscale pyramid attention network)。网络包括特征提取模块、多尺度特征的注意力池化金字塔模块和特征增强模块。在采集的葡萄图像数据集上进行实验,提出方法的交并比(IoU)和Dice系数分别为85.3%、97.98%,均优于对比模型,使用几何学方法对分割的果梗进行采摘点定位,准确率为98.26%,验证了模型在果梗分割任务上的有效性。 展开更多
关键词 果梗识别 语义分割 注意力机制 多尺度特征提取 池化金字塔 残差连接 采摘点定位
在线阅读 下载PDF
基于改进DeepLabV3+的城市列车轨道区域分割方法
17
作者 胡波 刘培文 刘瑞琪 《菏泽学院学报》 2025年第5期76-82,共7页
针对城市列车轨道区域与路面背景相似度较高而导致的轨道区域提取效果较差的问题,提出一种基于改进DeeplabV3+模型的轨道区域的分割算法.首先,针对列车轨道区域长宽比例较大的特点,使用条形池化卷积层代替ASPP结构中的全局池化层,以提... 针对城市列车轨道区域与路面背景相似度较高而导致的轨道区域提取效果较差的问题,提出一种基于改进DeeplabV3+模型的轨道区域的分割算法.首先,针对列车轨道区域长宽比例较大的特点,使用条形池化卷积层代替ASPP结构中的全局池化层,以提升算法对条形轨道区域的提取能力;其次设计使用特征分组注意力(FGA)机制,提升模型对细节的关注度;最后改变上采样频率,降低因快速上采样而造成边界信息的模糊化影响.将3192张城市轨道图像作为数据集,经验证与原网络相比,改进网络在数据集中的平均交并比以及召回率分别提高了3.65%、3.83%,达到93.88%以及97.35%,有效提升了轨道区域提取效果. 展开更多
关键词 区域提取 Deeplabv3+ 条形池化 注意力 空间金字塔
在线阅读 下载PDF
基于Res-PGAUnet的沿海养殖池塘遥感提取研究
18
作者 陈红梅 彭俊 +4 位作者 陈芸芝 罗冬莲 陈钰玫 刘国昕 王婉萍 《渔业研究》 2025年第6期793-802,共10页
[背景]沿海养殖池塘常与盐田、河道等地物混杂,加之池塘形态多样、尺度不一,采用传统遥感提取方法面临提取精度不足、抗干扰能力弱、自动化程度低等技术瓶颈。深度学习方法能通过卷积层自动从影像中学到丰富的光谱与空间特征,从而实现... [背景]沿海养殖池塘常与盐田、河道等地物混杂,加之池塘形态多样、尺度不一,采用传统遥感提取方法面临提取精度不足、抗干扰能力弱、自动化程度低等技术瓶颈。深度学习方法能通过卷积层自动从影像中学到丰富的光谱与空间特征,从而实现大范围精准分类,提高提取任务的自动化程度。[目的]实现面向复杂干扰地物场景养殖池塘的精准、高效自动化提取。[方法]本研究基于高分二号(GF-2)卫星影像数据,以福建省漳州市旧镇湾以南沿海池塘养殖区为研究区域,在U-Net模型基础上,融合残差结构、金字塔池化、引导分支与双注意力机制,构建Res-PGAUnet模型,并进行精度分析与大范围应用测试。[结果]旧镇湾以南模型的核心改进模块(残差结构、金字塔池化、引导分支和双注意力机制)均对性能提升有显著贡献,使得Res-PGAUnet模型在面对河道、盐田、海水等多种干扰地物时,表现出更强的抗干扰能力和鲁棒性,IoU与F1-score分别达到0.8540与0.9213,能有效减少误提和漏提,改善了小目标高位池漏提和边界粘连。[结论]大范围泛化测试进一步证实了Res-PGAUnet模型在实际应用中的潜力,该模型可为池塘养殖空间信息的精准监测与渔业可持续发展提供技术支撑。 展开更多
关键词 养殖池塘 高分二号(GF-2)影像 深度学习 Res-PGAUnet 金字塔池化 引导分支 双注意力机制
在线阅读 下载PDF
RAUGAN:基于循环生成对抗网络的红外图像彩色化方法
19
作者 朴燕 康继元 《吉林大学学报(工学版)》 北大核心 2025年第8期2722-2731,共10页
针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的S... 针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的Skip connection结构处连接,使解码分支中的不同尺度输出特征图都能与编码器中对应的输出特征图相结合;其次,设计了由残差块与通道和空间注意力模块(CBAM)构成的深度瓶颈层块替换UNet网络中的瓶颈层,用于增强局部区域特征,提高其识别能力;最后,在判别网络中引用感知损失函数从而解决色彩恢复失真的问题。实验结果表明:该方法彩色化效果明显优于其他方法。 展开更多
关键词 计算机应用 红外图像彩色化 循环生成对抗网络 空洞空间金字塔池化 注意力模块
原文传递
基于多模态融合的抗噪声故障诊断方法
20
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部