期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
Disease Recognition of Apple Leaf Using Lightweight Multi-Scale Network with ECANet 被引量:4
1
作者 Helong Yu Xianhe Cheng +2 位作者 Ziqing Li Qi Cai Chunguang Bi 《Computer Modeling in Engineering & Sciences》 SCIE EI 2022年第9期711-738,共28页
To solve the problem of difficulty in identifying apple diseases in the natural environment and the low application rate of deep learning recognition networks,a lightweight ResNet(LW-ResNet)model for apple disease rec... To solve the problem of difficulty in identifying apple diseases in the natural environment and the low application rate of deep learning recognition networks,a lightweight ResNet(LW-ResNet)model for apple disease recognition is proposed.Based on the deep residual network(ResNet18),the multi-scale feature extraction layer is constructed by group convolution to realize the compression model and improve the extraction ability of different sizes of lesion features.By improving the identity mapping structure to reduce information loss.By introducing the efficient channel attention module(ECANet)to suppress noise from a complex background.The experimental results show that the average precision,recall and F1-score of the LW-ResNet on the test set are 97.80%,97.92%and 97.85%,respectively.The parameter memory is 2.32 MB,which is 94%less than that of ResNet18.Compared with the classic lightweight networks SqueezeNet and MobileNetV2,LW-ResNet has obvious advantages in recognition performance,speed,parameter memory requirement and time complexity.The proposed model has the advantages of low computational cost,low storage cost,strong real-time performance,high identification accuracy,and strong practicability,which can meet the needs of real-time identification task of apple leaf disease on resource-constrained devices. 展开更多
关键词 Apple disease recognition deep residual network multi-scale feature efficient channel attention module lightweight network
在线阅读 下载PDF
A High Resolution Convolutional Neural Network with Squeeze and Excitation Module for Automatic Modulation Classification 被引量:1
2
作者 Duan Ruifeng Zhao Yuanlin +3 位作者 Zhang Haiyan Li Xinze Cheng Peng Li Yonghui 《China Communications》 SCIE CSCD 2024年第10期132-147,共16页
Automatic modulation classification(AMC) technology is one of the cutting-edge technologies in cognitive radio communications. AMC based on deep learning has recently attracted much attention due to its superior perfo... Automatic modulation classification(AMC) technology is one of the cutting-edge technologies in cognitive radio communications. AMC based on deep learning has recently attracted much attention due to its superior performances in classification accuracy and robustness. In this paper, we propose a novel, high resolution and multi-scale feature fusion convolutional neural network model with a squeeze-excitation block, referred to as HRSENet,to classify different kinds of modulation signals.The proposed model establishes a parallel computing mechanism of multi-resolution feature maps through the multi-layer convolution operation, which effectively reduces the information loss caused by downsampling convolution. Moreover, through dense skipconnecting at the same resolution and up-sampling or down-sampling connection at different resolutions, the low resolution representation of the deep feature maps and the high resolution representation of the shallow feature maps are simultaneously extracted and fully integrated, which is benificial to mine signal multilevel features. Finally, the feature squeeze and excitation module embedded in the decoder is used to adjust the response weights between channels, further improving classification accuracy of proposed model.The proposed HRSENet significantly outperforms existing methods in terms of classification accuracy on the public dataset “Over the Air” in signal-to-noise(SNR) ranging from-2dB to 20dB. The classification accuracy in the proposed model achieves 85.36% and97.30% at 4dB and 10dB, respectively, with the improvement by 9.71% and 5.82% compared to LWNet.Furthermore, the model also has a moderate computation complexity compared with several state-of-the-art methods. 展开更多
关键词 automatic modulation classification deep learning feature squeeze-and-excitation HIGH-RESOLUTION multi-scale
在线阅读 下载PDF
Full Perception Head:Bridging the Gap Between Local and Global Features
3
作者 Jie Hua Zhongyuan Wang +3 位作者 Xin Tian Qin Zou Jinsheng Xiao Jiayi Ma 《IEEE/CAA Journal of Automatica Sinica》 2025年第7期1391-1406,共16页
Object detection is a fundamental task in computer vision that involves identifying and localizing objects within an image.Local features extracted by convolutions,etc.,capture finegrained details such as edges and te... Object detection is a fundamental task in computer vision that involves identifying and localizing objects within an image.Local features extracted by convolutions,etc.,capture finegrained details such as edges and textures,while global features extracted by full connection layers,etc.,represent the overall structure and long-range relationships within the image.These features are crucial for accurate object detection,yet most existing methods focus on aggregating local and global features,often overlooking the importance of medium-range dependencies.To address this gap,we propose a novel full perception module(FPModule),a simple yet effective feature extraction module designed to simultaneously capture local details,medium-range dependencies,and long-range dependencies.Building on this,we construct a full perception head(FP-Head)by cascading multiple FP-Modules,enabling the prediction layer to leverage the most informative features.Experimental results in the MS COCO dataset demonstrate that our approach significantly enhances object recognition and localization,achieving 2.7−5.7 APval gains when integrated into standard object detectors.Notably,the FP-Module is a universal solution that can be seamlessly incorporated into existing detectors to boost performance.The code will be released at https://github.com/Idcogroup/FP-Head. 展开更多
关键词 feature aggregation full perception module medium-range dependencies object detection
在线阅读 下载PDF
自适应卷积约束与全局上下文推理的墓室壁画修复
4
作者 吴萌 郭歌 +2 位作者 孙增国 路智勇 张倩文 《中国图象图形学报》 北大核心 2025年第3期737-754,共18页
目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复... 目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复杂病害,修复时会出现内容缺失、结构错乱等问题。对此,提出一种自适应卷积约束与全局上下文推理的墓室壁画修复。方法基于端到端的编码器—解码器架构,首先设计多尺度增强卷积模块,从频域和空域联合分析图像特性来充分捕获全局结构和局部纹理;同时在修复路径中加入融合差分卷积的增强激活单元来引入边缘先验信息,提高模型的绘制精度。其次,考虑到纹理和结构在绘制过程中的模式差异,在编码器—解码器间设计基于注意力交互引导的多尺度特征聚合模块,来加强全局稀疏信息的表征能力和相关性,并自适应选择增强有效特征。此外,为了获得真实准确的结果,在特征传递过程中利用自动掩码更新迭代来预测复杂缺失信息,引导解码器精确绘制多样化的损伤区域。结果本文采用客观评价指标峰值信噪比(peak signal-to-noise ratio,PSNR)、结构相似性(structural similarity index,SSIM)和学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)在章怀太子墓“马球图”数据集上进行3类模拟病害和真实病害修复实验,并与6种主流方法进行比较。实验结果表明,本文方法修复的壁画图像在主观视觉和客观评价上均有明显提升。相较于指标排名第2的模型,对于随机缺失区域的壁画修复,峰值信噪比和结构相似性的均值分别达到31.7602dB和0.9577,各指标的样本均值分别提升了2.3653 dB、0.0128和12.75%。结论本文提出的图像修复模型可以有效修复多种复杂病害,可为手工绘制专家的物理修复提供参考,进一步促进了数字文化遗产的可持续研究与保护。 展开更多
关键词 壁画修复 多尺度增强卷积模块 多尺度特征聚合模块 增强激活单元 差分卷积 病害修复
原文传递
基于改进TransUNet的肺部图像分割
5
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
基于CABFAM-Transformer的输电线路在线测距实测行波预分类方法 被引量:2
6
作者 唐玉涛 束洪春 +3 位作者 刘皓铭 苏萱 韩一鸣 代月 《电工技术学报》 北大核心 2025年第5期1455-1470,共16页
行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Tr... 行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Transformer模型的输电线路实测故障性质识别方法。首先,通过CBAM机制增强卷积层提取特征信息的表达与理解能力;然后,构建自适应编码层级调整机制的Transformer模型库,以获取多层次差异化特征信息;最后,利用云南电网110~220 kV输电线路的5076条实测数据及220 kV DL站H-P线的15924条伪实测数据进行训练与测试,针对16种典型行波数据进行分类。测试结果表明,该方法降低了模型参数量,提高了准确度,算法的多个关键指标均有不同幅度的提升,表现出优异的检测精度与识别效率。 展开更多
关键词 行波采集装置 基于卷积注意力机制的特征聚合模块 CABFAM 自适应Transformer 实测数据故障辨识
在线阅读 下载PDF
基于退钻过程检测的矿井下钻杆计数方法研究
7
作者 胡玮 王满利 +2 位作者 张长森 田子建 张善文 《煤炭学报》 北大核心 2025年第S1期697-707,共11页
针对现有的矿井下钻杆计数方法存在误检率较高、效率较低的问题,设计一种特征编码式计数方法,其主要通过对钻机退钻过程检测结果的分析处理,统计实际打入的钻杆数量,可以有效提高计数的准确性及工作效率。由于矿井下的环境十分复杂,由... 针对现有的矿井下钻杆计数方法存在误检率较高、效率较低的问题,设计一种特征编码式计数方法,其主要通过对钻机退钻过程检测结果的分析处理,统计实际打入的钻杆数量,可以有效提高计数的准确性及工作效率。由于矿井下的环境十分复杂,由视频监控获取到的图像易受噪声、灯光等因素的影响,造成现有的目标检测算法存在特征提取困难和识别率低等问题。并且,这些算法模型复杂度高且计算量大,不利于在边缘端进行部署。针对这些问题,提出一种基于YOLOv8n改进的钻机退钻过程检测算法,称为YOLOv8n–SDM。首先,设计新的空间金字塔池化模块来增强模型的特征提取能力,同时降低矿井下复杂背景对退钻检测的干扰;然后,提出具有2种变换结构的特征聚合模块,替换原模型中的C2f模块,其在获取丰富的特征信息的同时有效降低模型的复杂度与计算量;最后,为进一步提升模型对不规则特征的辨识能力,设计了一种多尺度融合探测头来提高模型对钻机等目标的识别率。实验结果表明:改进后的YOLOv8n–SDM算法和原YOLOv8n算法相比,精度、召回率、mAP@0.5以及mAP@0.5–0.95值分别提升了2.7%、2.6%、2.2%以及1%,模型参数量、占用存储空间和GFLOPs值分别降低了32.2%、30.2%和31.7%。相较主流算法能够在复杂的矿井场景下实现更精准的钻机退钻过程检测,满足实际部署和应用的需求。 展开更多
关键词 钻杆计数 钻机退钻过程检测 YOLOv8n 特征聚合模块 多尺度融合探测头
在线阅读 下载PDF
基于改进CenterNet的海洋垃圾无锚检测算法
8
作者 田春燕 张静 邱文俊 《上海海事大学学报》 北大核心 2025年第4期142-152,共11页
针对复杂海洋环境中存在背景噪声、海洋垃圾特征模糊和目标尺度小的检测挑战,本文提出一种基于改进CenterNet的海洋垃圾无锚检测算法——MG-CenterNet。引入GB(green-blue)注意力机制,通过关注海洋图像绿色、蓝色通道来增强特征提取;利... 针对复杂海洋环境中存在背景噪声、海洋垃圾特征模糊和目标尺度小的检测挑战,本文提出一种基于改进CenterNet的海洋垃圾无锚检测算法——MG-CenterNet。引入GB(green-blue)注意力机制,通过关注海洋图像绿色、蓝色通道来增强特征提取;利用跨层特征聚合(cross-layer feature aggregation,CFA)模块丰富关键特征反馈,使模型获取更多像素级语义信息从而精准分类图像;构造完全交并比(complete intersection over union,CIoU)损失函数优化边界框匹配度,进一步提高目标定位精度。MG-CenterNet在TrashCan数据集和自建数据集上分别取得了77.98%和76.92%的平均精确率均值(mean average precision,m AP),推理速度分别达到27.18帧/s和26.98帧/s。研究结果证明MG-CenterNet在检测精度上显著优于其他算法,满足实时检测的要求。低对比度及遮挡条件下的验证实验进一步证明了所提出算法的鲁棒性和可靠性,为复杂环境中的海洋垃圾检测提供了科学参考。 展开更多
关键词 海洋垃圾检测 CenterNet 注意力机制 跨层特征聚合模块 完全交并比(CIoU)损失函数
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
9
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
基于细化聚合多频特征的图像超分辨率研究
10
作者 吴大荣 胡仕刚 《湖南工业大学学报》 2025年第6期37-43,共7页
基于Transformer的方法在提取全局上下文方面表现优异,且在单图像超分辨率(SISR)方面拥有显著效果,但因其主要功能是捕获全局特征,这使得它更注重于捕获低频信息,从而忽略了对于高频特征的提取。为解决这一问题,提出了一种集成卷积和Tra... 基于Transformer的方法在提取全局上下文方面表现优异,且在单图像超分辨率(SISR)方面拥有显著效果,但因其主要功能是捕获全局特征,这使得它更注重于捕获低频信息,从而忽略了对于高频特征的提取。为解决这一问题,提出了一种集成卷积和Transformer结构优势的多频特征聚合网络(MFAN)。该网络由3个重要模块组成:用于提取全局上下文的耦合自注意Transformer(CSAT)、用于提取并增强高频信息的高频增强模块(HFEM),以及用于细化全局特征的细化融合模块(RFM)。通过实验得知,与其他SR方法相比,所提出的MFAN显著提高了分辨的视觉效果和图像质量。 展开更多
关键词 超分辨率 耦合自注意力机制 高频增强 细化融合模块 多频特征聚合网络(MFAN)
在线阅读 下载PDF
多频Transformer引导图聚合视网膜图像质量分级算法
11
作者 梁礼明 钟奕 +1 位作者 王成斌 康婷 《光电工程》 北大核心 2025年第6期109-124,共16页
针对视网膜图像质量分级任务中各等级样本数量差异大和分级效率不高的问题,提出一种多频Transformer引导图聚合视网膜图像质量分级算法。该算法首先对图像采取对比度受限直方图均衡化操作,突出关键细节特征,并采取Res Net50网络进行多... 针对视网膜图像质量分级任务中各等级样本数量差异大和分级效率不高的问题,提出一种多频Transformer引导图聚合视网膜图像质量分级算法。该算法首先对图像采取对比度受限直方图均衡化操作,突出关键细节特征,并采取Res Net50网络进行多级特征提取。然后设计频率通道重组Transformer模块,引入频域信息辅助建模全局特征,以优化全局与局部特征。随后构建图交叉特征聚合模块,采用跨尺度交叉注意力机制引导图聚合,实现不同源特征对齐,进而增强模型对多层次特征敏感性。最后搭建加权损失函数,聚焦模型对少数类样本关注度。在Eye-Quality和RIQA-RFMiD数据集上进行实验验证,其准确率分别为88.71%和84.95%,精确率分别为87.78%和74.22%。实验结果表明,所提算法在视网膜图像质量评估领域具有一定应用价值。 展开更多
关键词 视网膜图像质量分级 频率通道重组Transformer模块 图交叉特征聚合模块 加权损失
在线阅读 下载PDF
改进YOLO11的高精度课堂行为检测算法
12
作者 曹燚 曹倩 +1 位作者 钱承山 袁程胜 《计算机科学与探索》 北大核心 2025年第8期2135-2148,共14页
针对课堂场景中学生目标小、分布密集且易被遮挡,导致检测精度低、识别效果不佳的问题,提出了一种基于YOLO11改进的课堂行为检测算法MFD-YOLO。该算法通过一系列创新设计,显著提升了课堂行为检测的精度和识别效果。设计了多维度特征流... 针对课堂场景中学生目标小、分布密集且易被遮挡,导致检测精度低、识别效果不佳的问题,提出了一种基于YOLO11改进的课堂行为检测算法MFD-YOLO。该算法通过一系列创新设计,显著提升了课堂行为检测的精度和识别效果。设计了多维度特征流动网络(MFFN),通过结合维度感知选择性融合模块和多维特征扩散机制,增强了小目标的特征表示能力,显著提高了检测精度。在主干网络中构建了特征增强聚合模块(FEAM),通过整合不同尺度感受野的信息来优化特征提取过程,增强了网络对多尺度特征的增强与聚合能力,从而提高了对密集学生群体的检测能力。将传统检测头改进为动态检测头(DyHead),通过增强多尺度感知能力,有效提升了对被遮挡学生的识别能力,减少了误检和漏检现象。实验结果表明,与基础模型YOLO11n相比,MFD-YOLO在POCO数据集上的mAP0.50和mAP0.50:0.95分别提高了4.2和6.0个百分点,显著提升了检测精度,并有效降低了误检和漏检率;在SCB-Dataset3数据集上,mAP0.50和mAP0.50:0.95分别提高了3.4和4.4个百分点,进一步验证了改进算法的适用性和鲁棒性,证明了其在课堂行为检测中的应用潜力。 展开更多
关键词 课堂行为检测 高精度 YOLO11 多维度特征流动网络(MFFN) 特征增强聚合模块(FEAM)
在线阅读 下载PDF
Modulation recognition network of multi-scale analysis with deep threshold noise elimination
13
作者 Xiang LI Yibing LI +1 位作者 Chunrui TANG Yingsong LI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第5期742-758,共17页
To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning... To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning techniques to replace traditional modulated signal processing techniques.To address the problem of low recognition accuracy of the modulated signal at low signal-to-noise ratios,we have designed a novel modulation recognition network of multi-scale analysis with deep threshold noise elimination to recognize the actually collected modulated signals under a symmetric cross-entropy function of label smoothing.The network consists of a denoising encoder with deep adaptive threshold learning and a decoder with multi-scale feature fusion.The two modules are skip-connected to work together to improve the robustness of the overall network.Experimental results show that this method has better recognition accuracy at low signal-to-noise ratios than previous methods.The network demonstrates a flexible self-learning capability for different noise thresholds and the effectiveness of the designed feature fusion module in multi-scale feature acquisition for various modulation types. 展开更多
关键词 Signal noise elimination Deep adaptive threshold learning network multi-scale feature fusion modulation ecognition
原文传递
基于光场EPI图像栈的6D位姿估计方法 被引量:3
14
作者 李扬 张旭东 +1 位作者 孙锐 范之国 《电子测量与仪器学报》 CSCD 北大核心 2023年第4期122-130,共9页
光场相机单次拍摄可以同时记录光线的强度与方向信息,相较于RGB相机能够更好地揭示场景的三维结构和几何特征,在目标6D位姿估计领域具有独特优势。针对现有RGB位姿估计方法存在复杂场景下检测精度低、鲁棒性差的问题,本文首次提出了一... 光场相机单次拍摄可以同时记录光线的强度与方向信息,相较于RGB相机能够更好地揭示场景的三维结构和几何特征,在目标6D位姿估计领域具有独特优势。针对现有RGB位姿估计方法存在复杂场景下检测精度低、鲁棒性差的问题,本文首次提出了一种基于光场图像的端到端卷积神经网络目标位姿估计方法。该方法首先利用双路EPI编码模块实现高维光场数据的处理,通过重构出光场EPI图像栈和引入水平和垂直EPI卷积算子,提高对光场空间角度信息关联的建模能力,并由双分支孪生网络进行光场图像的浅层特征提取。其次,设计了带跳跃连接的特征聚合模块,对串联后的水平和垂直方向光场EPI浅层特征进行全局上下文聚合,使网络在逐像素关键点位置预测时有效结合全局和局部特征线索。针对光场数据不足问题,本文使用Lytro Illum光场相机采集真实场景,构建了一个丰富且场景复杂的光场位姿数据集——LF-6Dpose。在光场位姿数据集LF-6Dpose上的实验结果表明,该方法在ADD-S和2D Projection指标下平均位姿检测精度分别为57.61%和91.97%,超越了其他基于RGB的先进方法,能够更好地解决复杂场景下的目标6D位姿估计问题。 展开更多
关键词 光场 6D位姿估计 光场位姿数据集 EPI图像栈 特征聚合模块 关键点
原文传递
高阶特征聚合与卷积调制的SAR图像舰船检测 被引量:3
15
作者 郭伟 王江达 +1 位作者 王欣哲 王春艳 《测绘科学》 CSCD 北大核心 2023年第8期81-93,共13页
针对合成孔径雷达(SAR)舰船图像在目标长宽比失衡和小目标聚集等复杂场景中检测困难的问题,该文提出了一种关于海洋舰船检测的目标检测算法,以YOLOv7-Tiny算法为基础采用高阶特征聚合的方法来保留更多小尺度舰船的特征信息,引入卷积调... 针对合成孔径雷达(SAR)舰船图像在目标长宽比失衡和小目标聚集等复杂场景中检测困难的问题,该文提出了一种关于海洋舰船检测的目标检测算法,以YOLOv7-Tiny算法为基础采用高阶特征聚合的方法来保留更多小尺度舰船的特征信息,引入卷积调制机制加强颈部网络的特征增强能力,动态非单调聚焦机制边界框损失函数与自适应锚框的有效结合,降低了低质量舰船的检测难度。在遥感舰船高分辨率SAR图像数据集上的实验结果表明,该算法的检测精度和模型参数量分别为90.5%和6.12MB,在SAR舰船检测数据集上进行泛化测试,检测精度能达到97.2%。该文的算法模型提升了小尺度样本的检测能力,相比基准模型具有更高的检测精度和更好的鲁棒性,与其他目标检测算法相比拥有更好的检测效果。 展开更多
关键词 目标检测 合成孔径雷达 高阶特征聚合 卷积调制
原文传递
基于新型特征融合的安全帽佩戴检测方法 被引量:7
16
作者 周敏新 张方舟 龚声蓉 《计算机工程与设计》 北大核心 2021年第11期3181-3187,共7页
针对在遮挡、光照和其它因素的影响下,检测小尺度工人佩戴安全帽情况时存在漏检、误检的问题,提出以高精度、高速的CenterNet目标检测算法为基础,引入新型特征融合方式用于安全帽佩戴检测的方法。采用U型结构的特征金字塔融合多层特征... 针对在遮挡、光照和其它因素的影响下,检测小尺度工人佩戴安全帽情况时存在漏检、误检的问题,提出以高精度、高速的CenterNet目标检测算法为基础,引入新型特征融合方式用于安全帽佩戴检测的方法。采用U型结构的特征金字塔融合多层特征提高对小尺度目标的敏感性,此外受PoolNet启发,在特征金字塔结构基础上添加全局引导模块和特征整合模块,进一步细化显著目标的细节。在Safety-Helmet-Wearing-Dataset(SHWD)公开数据集上的实验结果表明,整体检测平均精度提高了2.0%,对小尺度工人的检测平均精度提高了3.0%。检测速度达到21 fps,可以满足实时检测的需求。 展开更多
关键词 安全帽 目标检测 特征金字塔 全局引导模块 特征整合模块
在线阅读 下载PDF
基于特征聚合与多元协同特征交互的航拍图像小目标检测 被引量:17
17
作者 陈朋磊 王江涛 +1 位作者 张志伟 何程 《电子测量与仪器学报》 CSCD 北大核心 2023年第10期183-192,共10页
针对无人机航拍图像目标尺寸太小、包含的特征信息较少,导致现有的检测算法对小目标检测效果不理想的问题,提出一种基于特征聚合与多元协同特征交互的无人机航拍图像小目标检测算法。首先,针对主干网对特征提取不足的问题,采用Swin Tran... 针对无人机航拍图像目标尺寸太小、包含的特征信息较少,导致现有的检测算法对小目标检测效果不理想的问题,提出一种基于特征聚合与多元协同特征交互的无人机航拍图像小目标检测算法。首先,针对主干网对特征提取不足的问题,采用Swin Transformer作为RetinaNet主干网络,以增强算法对全局信息的提取能力。其次,为提高网络对远处目标即小目标的检测能力,设计出一种高效的小目标特征聚合网络(SFANet),实现对浅层特征图小目标细节信息的充分整合。最后,为进一步提高网络对多尺度目标的检测性能,使低层特征信息流向高层,提出全新的多元协同特征交互模板(MCFIM)。在公开无人机航拍数据集VisDrone2019-DET上的实验结果表明,所提算法相较于原RetinaNet基线网络检测精度提高7.6%,对于小目标具有更好的检测效果。 展开更多
关键词 小目标检测 航拍图像 小目标特征聚合网络 多元协同特征交互模块
原文传递
基于改进YOLOv3的装甲车辆检测方法 被引量:8
18
作者 丛眸 张平 王宁 《兵器装备工程学报》 CAS CSCD 北大核心 2021年第4期258-262,共5页
为了准确检测出装甲车辆目标,提出了一种基于改进YOLOv3的装甲车辆检测方法。收集不同目标类型、尺度、遮挡等条件下的装甲车辆图像并对其进行标注,得到装甲车辆目标检测数据集;利用k-means++算法计算出适用于数据集的锚框;在YOLOv3的... 为了准确检测出装甲车辆目标,提出了一种基于改进YOLOv3的装甲车辆检测方法。收集不同目标类型、尺度、遮挡等条件下的装甲车辆图像并对其进行标注,得到装甲车辆目标检测数据集;利用k-means++算法计算出适用于数据集的锚框;在YOLOv3的特征提取网络中集成空间金字塔池化模块来丰富卷积特征的表达能力;通过卷积特征聚合机制并对多层级的卷积特征进行融合,从而得到改进的YOLOv3模型。在装甲车辆目标检测数据集上进行了训练与测试,结果表明:改进后的YOLOv3方法能够有效提高目标检测的性能,与原YOLOv3方法相比,本文方法在查准率和查全率上分别提升了14.5%和4.2%,平均精确度提升了5.3%,同时还能满足实时性需求。 展开更多
关键词 目标检测 YOLOv3模型 空间金字塔池化 特征聚合 装甲车辆
在线阅读 下载PDF
基于递进式特征增强聚合的伪装目标检测 被引量:6
19
作者 谭湘粤 胡晓 +1 位作者 杨佳信 向俊将 《计算机应用》 CSCD 北大核心 2022年第7期2192-2200,共9页
伪装目标检测(COD)旨在检测隐藏在复杂环境中的目标。现有COD算法在结合多层次特征时,忽略了特征的表达和融合方式对检测性能的影响。为此,提出一种基于递进式特征增强聚合的COD算法。首先,通过主干网络提取多级特征;然后,为了提高特征... 伪装目标检测(COD)旨在检测隐藏在复杂环境中的目标。现有COD算法在结合多层次特征时,忽略了特征的表达和融合方式对检测性能的影响。为此,提出一种基于递进式特征增强聚合的COD算法。首先,通过主干网络提取多级特征;然后,为了提高特征的表达能力,使用由特征增强模块(FEM)构成的增强网络对多层次特征进行增强;最后,在聚合网络中设计邻近聚合模块(AAM)实现相邻特征之间的信息融合,以突显伪装目标区域的特征,并提出新的递进式聚合策略(PAS)通过渐进的方式聚合邻近特征,从而在实现多层特征有效融合的同时抑制噪声。在3个公开数据集上的实验表明,所提算法相较于12种最先进的算法在4个客观评价指标上均取得最优表现,尤其是在COD10K数据集上所提算法的加权的F测评法和平均绝对误差(MAE)分别达到了0.809和0.037。由此可见,所提算法在COD任务上拥有较优的性能。 展开更多
关键词 卷积神经网络 伪装目标检测 特征增强 邻近聚合模块 递进式聚合策略
在线阅读 下载PDF
基于跨模态特征融合的RGB-D显著性目标检测 被引量:3
20
作者 李可新 何丽 +1 位作者 刘哲凝 钟润豪 《国外电子测量技术》 2024年第6期59-67,共9页
RGB-D显著性目标检测因其有效性和易于捕捉深度线索而受到越来越多的关注。现有的工作通常侧重于通过各种融合策略学习共享表示,少有方法明确考虑如何维持RGB和深度的模态特征。提出了一种跨模态特征融合网络,该网络维持RGB-D显著目标... RGB-D显著性目标检测因其有效性和易于捕捉深度线索而受到越来越多的关注。现有的工作通常侧重于通过各种融合策略学习共享表示,少有方法明确考虑如何维持RGB和深度的模态特征。提出了一种跨模态特征融合网络,该网络维持RGB-D显著目标检测的RGB和深度的模态,通过探索共享信息以及RGB和深度模态的特性来提高显著检测性能。具体来说,采用RGB模态、深度模态网络和一个共享学习网络来生成RGB和深度模态显著性预测图以及共享显著性预测图。提出了一种跨模态特征融合模块,用于融合共享学习网络中的跨模态特征,然后将这些特征传播到下一层以整合跨层次信息。此外,提出了一种多模态特征聚合模块,将每个单独解码器的模态特定特征整合到共享解码器中,这可以提供丰富的互补多模态信息来提高显著性检测性能。最后,使用跳转连接来组合编码器和解码器层之间的分层特征。通过在4个基准数据集上与7种先进方法进行的实验表明,方法优于其他最先进的方法。 展开更多
关键词 RGB-D显著性目标检测 跨模态融合网络 跨模态特征融合 多模态聚合
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部