期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
A High Resolution Convolutional Neural Network with Squeeze and Excitation Module for Automatic Modulation Classification 被引量:1
1
作者 Duan Ruifeng Zhao Yuanlin +3 位作者 Zhang Haiyan Li Xinze Cheng Peng Li Yonghui 《China Communications》 SCIE CSCD 2024年第10期132-147,共16页
Automatic modulation classification(AMC) technology is one of the cutting-edge technologies in cognitive radio communications. AMC based on deep learning has recently attracted much attention due to its superior perfo... Automatic modulation classification(AMC) technology is one of the cutting-edge technologies in cognitive radio communications. AMC based on deep learning has recently attracted much attention due to its superior performances in classification accuracy and robustness. In this paper, we propose a novel, high resolution and multi-scale feature fusion convolutional neural network model with a squeeze-excitation block, referred to as HRSENet,to classify different kinds of modulation signals.The proposed model establishes a parallel computing mechanism of multi-resolution feature maps through the multi-layer convolution operation, which effectively reduces the information loss caused by downsampling convolution. Moreover, through dense skipconnecting at the same resolution and up-sampling or down-sampling connection at different resolutions, the low resolution representation of the deep feature maps and the high resolution representation of the shallow feature maps are simultaneously extracted and fully integrated, which is benificial to mine signal multilevel features. Finally, the feature squeeze and excitation module embedded in the decoder is used to adjust the response weights between channels, further improving classification accuracy of proposed model.The proposed HRSENet significantly outperforms existing methods in terms of classification accuracy on the public dataset “Over the Air” in signal-to-noise(SNR) ranging from-2dB to 20dB. The classification accuracy in the proposed model achieves 85.36% and97.30% at 4dB and 10dB, respectively, with the improvement by 9.71% and 5.82% compared to LWNet.Furthermore, the model also has a moderate computation complexity compared with several state-of-the-art methods. 展开更多
关键词 automatic modulation classification deep learning feature squeeze-and-excitation HIGH-RESOLUTION multi-scale
在线阅读 下载PDF
Disease Recognition of Apple Leaf Using Lightweight Multi-Scale Network with ECANet 被引量:4
2
作者 Helong Yu Xianhe Cheng +2 位作者 Ziqing Li Qi Cai Chunguang Bi 《Computer Modeling in Engineering & Sciences》 SCIE EI 2022年第9期711-738,共28页
To solve the problem of difficulty in identifying apple diseases in the natural environment and the low application rate of deep learning recognition networks,a lightweight ResNet(LW-ResNet)model for apple disease rec... To solve the problem of difficulty in identifying apple diseases in the natural environment and the low application rate of deep learning recognition networks,a lightweight ResNet(LW-ResNet)model for apple disease recognition is proposed.Based on the deep residual network(ResNet18),the multi-scale feature extraction layer is constructed by group convolution to realize the compression model and improve the extraction ability of different sizes of lesion features.By improving the identity mapping structure to reduce information loss.By introducing the efficient channel attention module(ECANet)to suppress noise from a complex background.The experimental results show that the average precision,recall and F1-score of the LW-ResNet on the test set are 97.80%,97.92%and 97.85%,respectively.The parameter memory is 2.32 MB,which is 94%less than that of ResNet18.Compared with the classic lightweight networks SqueezeNet and MobileNetV2,LW-ResNet has obvious advantages in recognition performance,speed,parameter memory requirement and time complexity.The proposed model has the advantages of low computational cost,low storage cost,strong real-time performance,high identification accuracy,and strong practicability,which can meet the needs of real-time identification task of apple leaf disease on resource-constrained devices. 展开更多
关键词 Apple disease recognition deep residual network multi-scale feature efficient channel attention module lightweight network
在线阅读 下载PDF
自适应卷积约束与全局上下文推理的墓室壁画修复
3
作者 吴萌 郭歌 +2 位作者 孙增国 路智勇 张倩文 《中国图象图形学报》 北大核心 2025年第3期737-754,共18页
目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复... 目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复杂病害,修复时会出现内容缺失、结构错乱等问题。对此,提出一种自适应卷积约束与全局上下文推理的墓室壁画修复。方法基于端到端的编码器—解码器架构,首先设计多尺度增强卷积模块,从频域和空域联合分析图像特性来充分捕获全局结构和局部纹理;同时在修复路径中加入融合差分卷积的增强激活单元来引入边缘先验信息,提高模型的绘制精度。其次,考虑到纹理和结构在绘制过程中的模式差异,在编码器—解码器间设计基于注意力交互引导的多尺度特征聚合模块,来加强全局稀疏信息的表征能力和相关性,并自适应选择增强有效特征。此外,为了获得真实准确的结果,在特征传递过程中利用自动掩码更新迭代来预测复杂缺失信息,引导解码器精确绘制多样化的损伤区域。结果本文采用客观评价指标峰值信噪比(peak signal-to-noise ratio,PSNR)、结构相似性(structural similarity index,SSIM)和学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)在章怀太子墓“马球图”数据集上进行3类模拟病害和真实病害修复实验,并与6种主流方法进行比较。实验结果表明,本文方法修复的壁画图像在主观视觉和客观评价上均有明显提升。相较于指标排名第2的模型,对于随机缺失区域的壁画修复,峰值信噪比和结构相似性的均值分别达到31.7602dB和0.9577,各指标的样本均值分别提升了2.3653 dB、0.0128和12.75%。结论本文提出的图像修复模型可以有效修复多种复杂病害,可为手工绘制专家的物理修复提供参考,进一步促进了数字文化遗产的可持续研究与保护。 展开更多
关键词 壁画修复 多尺度增强卷积模块 多尺度特征聚合模块 增强激活单元 差分卷积 病害修复
原文传递
基于改进TransUNet的肺部图像分割
4
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
基于退钻过程检测的矿井下钻杆计数方法研究
5
作者 胡玮 王满利 +2 位作者 张长森 田子建 张善文 《煤炭学报》 北大核心 2025年第S1期697-707,共11页
针对现有的矿井下钻杆计数方法存在误检率较高、效率较低的问题,设计一种特征编码式计数方法,其主要通过对钻机退钻过程检测结果的分析处理,统计实际打入的钻杆数量,可以有效提高计数的准确性及工作效率。由于矿井下的环境十分复杂,由... 针对现有的矿井下钻杆计数方法存在误检率较高、效率较低的问题,设计一种特征编码式计数方法,其主要通过对钻机退钻过程检测结果的分析处理,统计实际打入的钻杆数量,可以有效提高计数的准确性及工作效率。由于矿井下的环境十分复杂,由视频监控获取到的图像易受噪声、灯光等因素的影响,造成现有的目标检测算法存在特征提取困难和识别率低等问题。并且,这些算法模型复杂度高且计算量大,不利于在边缘端进行部署。针对这些问题,提出一种基于YOLOv8n改进的钻机退钻过程检测算法,称为YOLOv8n–SDM。首先,设计新的空间金字塔池化模块来增强模型的特征提取能力,同时降低矿井下复杂背景对退钻检测的干扰;然后,提出具有2种变换结构的特征聚合模块,替换原模型中的C2f模块,其在获取丰富的特征信息的同时有效降低模型的复杂度与计算量;最后,为进一步提升模型对不规则特征的辨识能力,设计了一种多尺度融合探测头来提高模型对钻机等目标的识别率。实验结果表明:改进后的YOLOv8n–SDM算法和原YOLOv8n算法相比,精度、召回率、mAP@0.5以及mAP@0.5–0.95值分别提升了2.7%、2.6%、2.2%以及1%,模型参数量、占用存储空间和GFLOPs值分别降低了32.2%、30.2%和31.7%。相较主流算法能够在复杂的矿井场景下实现更精准的钻机退钻过程检测,满足实际部署和应用的需求。 展开更多
关键词 钻杆计数 钻机退钻过程检测 YOLOv8n 特征聚合模块 多尺度融合探测头
在线阅读 下载PDF
基于CABFAM-Transformer的输电线路在线测距实测行波预分类方法
6
作者 唐玉涛 束洪春 +3 位作者 刘皓铭 苏萱 韩一鸣 代月 《电工技术学报》 北大核心 2025年第5期1455-1470,共16页
行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Tr... 行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Transformer模型的输电线路实测故障性质识别方法。首先,通过CBAM机制增强卷积层提取特征信息的表达与理解能力;然后,构建自适应编码层级调整机制的Transformer模型库,以获取多层次差异化特征信息;最后,利用云南电网110~220 kV输电线路的5076条实测数据及220 kV DL站H-P线的15924条伪实测数据进行训练与测试,针对16种典型行波数据进行分类。测试结果表明,该方法降低了模型参数量,提高了准确度,算法的多个关键指标均有不同幅度的提升,表现出优异的检测精度与识别效率。 展开更多
关键词 行波采集装置 基于卷积注意力机制的特征聚合模块 CABFAM 自适应Transformer 实测数据故障辨识
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
7
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
基于细化聚合多频特征的图像超分辨率研究
8
作者 吴大荣 胡仕刚 《湖南工业大学学报》 2025年第6期37-43,共7页
基于Transformer的方法在提取全局上下文方面表现优异,且在单图像超分辨率(SISR)方面拥有显著效果,但因其主要功能是捕获全局特征,这使得它更注重于捕获低频信息,从而忽略了对于高频特征的提取。为解决这一问题,提出了一种集成卷积和Tra... 基于Transformer的方法在提取全局上下文方面表现优异,且在单图像超分辨率(SISR)方面拥有显著效果,但因其主要功能是捕获全局特征,这使得它更注重于捕获低频信息,从而忽略了对于高频特征的提取。为解决这一问题,提出了一种集成卷积和Transformer结构优势的多频特征聚合网络(MFAN)。该网络由3个重要模块组成:用于提取全局上下文的耦合自注意Transformer(CSAT)、用于提取并增强高频信息的高频增强模块(HFEM),以及用于细化全局特征的细化融合模块(RFM)。通过实验得知,与其他SR方法相比,所提出的MFAN显著提高了分辨的视觉效果和图像质量。 展开更多
关键词 超分辨率 耦合自注意力机制 高频增强 细化融合模块 多频特征聚合网络(MFAN)
在线阅读 下载PDF
多频Transformer引导图聚合视网膜图像质量分级算法
9
作者 梁礼明 钟奕 +1 位作者 王成斌 康婷 《光电工程》 北大核心 2025年第6期109-124,共16页
针对视网膜图像质量分级任务中各等级样本数量差异大和分级效率不高的问题,提出一种多频Transformer引导图聚合视网膜图像质量分级算法。该算法首先对图像采取对比度受限直方图均衡化操作,突出关键细节特征,并采取Res Net50网络进行多... 针对视网膜图像质量分级任务中各等级样本数量差异大和分级效率不高的问题,提出一种多频Transformer引导图聚合视网膜图像质量分级算法。该算法首先对图像采取对比度受限直方图均衡化操作,突出关键细节特征,并采取Res Net50网络进行多级特征提取。然后设计频率通道重组Transformer模块,引入频域信息辅助建模全局特征,以优化全局与局部特征。随后构建图交叉特征聚合模块,采用跨尺度交叉注意力机制引导图聚合,实现不同源特征对齐,进而增强模型对多层次特征敏感性。最后搭建加权损失函数,聚焦模型对少数类样本关注度。在Eye-Quality和RIQA-RFMiD数据集上进行实验验证,其准确率分别为88.71%和84.95%,精确率分别为87.78%和74.22%。实验结果表明,所提算法在视网膜图像质量评估领域具有一定应用价值。 展开更多
关键词 视网膜图像质量分级 频率通道重组Transformer模块 图交叉特征聚合模块 加权损失
在线阅读 下载PDF
改进YOLO11的高精度课堂行为检测算法
10
作者 曹燚 曹倩 +1 位作者 钱承山 袁程胜 《计算机科学与探索》 北大核心 2025年第8期2135-2148,共14页
针对课堂场景中学生目标小、分布密集且易被遮挡,导致检测精度低、识别效果不佳的问题,提出了一种基于YOLO11改进的课堂行为检测算法MFD-YOLO。该算法通过一系列创新设计,显著提升了课堂行为检测的精度和识别效果。设计了多维度特征流... 针对课堂场景中学生目标小、分布密集且易被遮挡,导致检测精度低、识别效果不佳的问题,提出了一种基于YOLO11改进的课堂行为检测算法MFD-YOLO。该算法通过一系列创新设计,显著提升了课堂行为检测的精度和识别效果。设计了多维度特征流动网络(MFFN),通过结合维度感知选择性融合模块和多维特征扩散机制,增强了小目标的特征表示能力,显著提高了检测精度。在主干网络中构建了特征增强聚合模块(FEAM),通过整合不同尺度感受野的信息来优化特征提取过程,增强了网络对多尺度特征的增强与聚合能力,从而提高了对密集学生群体的检测能力。将传统检测头改进为动态检测头(DyHead),通过增强多尺度感知能力,有效提升了对被遮挡学生的识别能力,减少了误检和漏检现象。实验结果表明,与基础模型YOLO11n相比,MFD-YOLO在POCO数据集上的mAP0.50和mAP0.50:0.95分别提高了4.2和6.0个百分点,显著提升了检测精度,并有效降低了误检和漏检率;在SCB-Dataset3数据集上,mAP0.50和mAP0.50:0.95分别提高了3.4和4.4个百分点,进一步验证了改进算法的适用性和鲁棒性,证明了其在课堂行为检测中的应用潜力。 展开更多
关键词 课堂行为检测 高精度 YOLO11 多维度特征流动网络(MFFN) 特征增强聚合模块(FEAM)
在线阅读 下载PDF
基于跨模态特征融合的RGB-D显著性目标检测 被引量:3
11
作者 李可新 何丽 +1 位作者 刘哲凝 钟润豪 《国外电子测量技术》 2024年第6期59-67,共9页
RGB-D显著性目标检测因其有效性和易于捕捉深度线索而受到越来越多的关注。现有的工作通常侧重于通过各种融合策略学习共享表示,少有方法明确考虑如何维持RGB和深度的模态特征。提出了一种跨模态特征融合网络,该网络维持RGB-D显著目标... RGB-D显著性目标检测因其有效性和易于捕捉深度线索而受到越来越多的关注。现有的工作通常侧重于通过各种融合策略学习共享表示,少有方法明确考虑如何维持RGB和深度的模态特征。提出了一种跨模态特征融合网络,该网络维持RGB-D显著目标检测的RGB和深度的模态,通过探索共享信息以及RGB和深度模态的特性来提高显著检测性能。具体来说,采用RGB模态、深度模态网络和一个共享学习网络来生成RGB和深度模态显著性预测图以及共享显著性预测图。提出了一种跨模态特征融合模块,用于融合共享学习网络中的跨模态特征,然后将这些特征传播到下一层以整合跨层次信息。此外,提出了一种多模态特征聚合模块,将每个单独解码器的模态特定特征整合到共享解码器中,这可以提供丰富的互补多模态信息来提高显著性检测性能。最后,使用跳转连接来组合编码器和解码器层之间的分层特征。通过在4个基准数据集上与7种先进方法进行的实验表明,方法优于其他最先进的方法。 展开更多
关键词 RGB-D显著性目标检测 跨模态融合网络 跨模态特征融合 多模态聚合
原文传递
融合卷积和Transformer的多尺度皮肤病变分割算法 被引量:1
12
作者 蒋新辉 李筱林 +1 位作者 韦春苗 覃镇锋 《无线电工程》 2024年第3期670-678,共9页
皮肤病变自动分割对协助医生临床诊断、治疗及术后观察都具有非常重要的意义。现有卷积擅长建立局部相关性但无法捕获像素长程依赖关系,而Tansformer可以建立特征信息的全局依赖关系但会造成局部细节信息丢失。因此,提出了一种融合卷积... 皮肤病变自动分割对协助医生临床诊断、治疗及术后观察都具有非常重要的意义。现有卷积擅长建立局部相关性但无法捕获像素长程依赖关系,而Tansformer可以建立特征信息的全局依赖关系但会造成局部细节信息丢失。因此,提出了一种融合卷积和Transformer的多尺度自动分割网络。采用ResNet34作为基础编码块,利用其金字塔结构建立病灶的多级局部相关性;采用Swin Transformer模块捕获上下文特征的长程依赖关系,考虑到病灶形状多变、大小不一等情况,提出多尺度特征聚合模块来进一步提取上下文特征多尺度信息;采用具有注意力机制的解码块逐步融合编码块提取到的多级语义信息。实验结果表明,所提模型在ISIC 2017数据集上测试所得的Dice系数分别高达89.55%,FPS高达83,与其他先进模型相比,本模型参数更少、推理速度更快、精度更高。 展开更多
关键词 图像处理 Swin Transformer 多尺度特征聚合模块 注意力机制
在线阅读 下载PDF
基于局部特征增强的视网膜血管分割
13
作者 王倩 辛月兰 《激光杂志》 CAS 北大核心 2024年第4期216-222,共7页
视网膜血管具有细小复杂的特点,在对其进行分割时,经常出现噪点、断裂和欠分割等问题。针对此现象,提出一种基于局部特征增强的轻量化网络LRU-Net,以捕获更多细小血管特征。首先,在通道注意力模块中加入特征提取模块,对输入特征进行二... 视网膜血管具有细小复杂的特点,在对其进行分割时,经常出现噪点、断裂和欠分割等问题。针对此现象,提出一种基于局部特征增强的轻量化网络LRU-Net,以捕获更多细小血管特征。首先,在通道注意力模块中加入特征提取模块,对输入特征进行二次特征提取,以得到更多的细节特征;其次,设计了一个特征融合模块,在解码器中能更有效地融合高级和低级特性,加强最终的特征表示;最后,设计了一个上下文聚合模块,提取最深层特征不同分辨率的多尺度信息,然后进行拼接,使进入上采样的输入特征更加细化。在FIVES和OCTA-500数据集上的实验结果表明,与基础网络U-Net相比,本文所提方法在做到轻量化的同时,视网膜血管分割的准确度也有了一定的提升,在两个数据集上分别达到了98.45%、97.05%。 展开更多
关键词 特征增强 特征融合模块 上下文聚合模块 视网膜血管分割
原文传递
基于区域像素密度星座图的自动调制识别方法 被引量:1
14
作者 潘求凯 杨淑媛 冯志玺 《空间电子技术》 2024年第6期9-15,共7页
星座图是调制识别技术中被广泛使用的特征表达方式,目前已经发展出多种针对星座图的增强方法用于提升其表征效果。然而,大部分方法未能准确提取不同星座区域的星座点密度,对不同密度星座簇的对比增强效果有限。为了克服上述缺陷,本文提... 星座图是调制识别技术中被广泛使用的特征表达方式,目前已经发展出多种针对星座图的增强方法用于提升其表征效果。然而,大部分方法未能准确提取不同星座区域的星座点密度,对不同密度星座簇的对比增强效果有限。为了克服上述缺陷,本文提出了一种区域像素密度星座图增强方法,通过统计每个小网格区域的灰度像素密度,更加准确反映不同星座簇的密度。更进一步,通过分段像素阈值对像素值进行重置,提高了增强星座图的视觉对比效果。此外,本文设计了配套的深度特征聚合注意力网络(DFAAN),通过聚合不同层级的语义特征提高了对调制类型判别的鲁棒性。实验结果表明,本文提出的方法即使在具有相偏、频偏以及低信噪比的23种调制方式数据集上,OA比其他方法至少高出11.26%、AA至少高出8.65%、Kappa系数至少高出11.77%。 展开更多
关键词 自动调制识别 区域像素密度星座图 深度特征聚合注意力网络
在线阅读 下载PDF
基于双流增强编码和注意优化解码的图像篡改定位算法
15
作者 朱叶 赵晓祥 于洋 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1103-1115,共13页
主流图像篡改定位方法通常通过简单操作融合不同流的不一致特征,导致特征冗余且篡改区域的像素误检。基于此,本文提出基于双流增强编码和注意优化解码的图像篡改定位框架。首先,提出双流增强编码分别对图像和频域特征进行基于噪声和通... 主流图像篡改定位方法通常通过简单操作融合不同流的不一致特征,导致特征冗余且篡改区域的像素误检。基于此,本文提出基于双流增强编码和注意优化解码的图像篡改定位框架。首先,提出双流增强编码分别对图像和频域特征进行基于噪声和通道注意力的自增强和基于特征映射的交叉注意权重的交互增强。随后,引入多级感受野策略探索多尺度上下文信息,设计邻阶特征聚合模块融合多尺度相邻特征。最后,利用篡改区域和非篡改区域协同增强模型的篡改定位能力,提出注意优化解码模块,消除初始篡改区域预测中边缘像素的错误预测,逐步精确细化篡改定位。在4个主流公共基准数据集NIST16、Coverage、Columbia、CASIA和两个现实挑战数据集IMD20、Wild上与主流篡改定位方法进行对比,本文算法在无微调模型和微调模型两个设置下,在6个数据集上的性能最优,证明本文提出的篡改定位网络能够充分利用多种篡改线索,在不同的篡改数据集上实现篡改区域的有效定位,具有更高的定位精度和更强的鲁棒性。 展开更多
关键词 图像篡改定位 双流增强编码 注意优化解码 邻阶特征聚合
在线阅读 下载PDF
Modulation recognition network of multi-scale analysis with deep threshold noise elimination
16
作者 Xiang LI Yibing LI +1 位作者 Chunrui TANG Yingsong LI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第5期742-758,共17页
To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning... To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning techniques to replace traditional modulated signal processing techniques.To address the problem of low recognition accuracy of the modulated signal at low signal-to-noise ratios,we have designed a novel modulation recognition network of multi-scale analysis with deep threshold noise elimination to recognize the actually collected modulated signals under a symmetric cross-entropy function of label smoothing.The network consists of a denoising encoder with deep adaptive threshold learning and a decoder with multi-scale feature fusion.The two modules are skip-connected to work together to improve the robustness of the overall network.Experimental results show that this method has better recognition accuracy at low signal-to-noise ratios than previous methods.The network demonstrates a flexible self-learning capability for different noise thresholds and the effectiveness of the designed feature fusion module in multi-scale feature acquisition for various modulation types. 展开更多
关键词 Signal noise elimination Deep adaptive threshold learning network multi-scale feature fusion modulation ecognition
原文传递
基于光场EPI图像栈的6D位姿估计方法 被引量:3
17
作者 李扬 张旭东 +1 位作者 孙锐 范之国 《电子测量与仪器学报》 CSCD 北大核心 2023年第4期122-130,共9页
光场相机单次拍摄可以同时记录光线的强度与方向信息,相较于RGB相机能够更好地揭示场景的三维结构和几何特征,在目标6D位姿估计领域具有独特优势。针对现有RGB位姿估计方法存在复杂场景下检测精度低、鲁棒性差的问题,本文首次提出了一... 光场相机单次拍摄可以同时记录光线的强度与方向信息,相较于RGB相机能够更好地揭示场景的三维结构和几何特征,在目标6D位姿估计领域具有独特优势。针对现有RGB位姿估计方法存在复杂场景下检测精度低、鲁棒性差的问题,本文首次提出了一种基于光场图像的端到端卷积神经网络目标位姿估计方法。该方法首先利用双路EPI编码模块实现高维光场数据的处理,通过重构出光场EPI图像栈和引入水平和垂直EPI卷积算子,提高对光场空间角度信息关联的建模能力,并由双分支孪生网络进行光场图像的浅层特征提取。其次,设计了带跳跃连接的特征聚合模块,对串联后的水平和垂直方向光场EPI浅层特征进行全局上下文聚合,使网络在逐像素关键点位置预测时有效结合全局和局部特征线索。针对光场数据不足问题,本文使用Lytro Illum光场相机采集真实场景,构建了一个丰富且场景复杂的光场位姿数据集——LF-6Dpose。在光场位姿数据集LF-6Dpose上的实验结果表明,该方法在ADD-S和2D Projection指标下平均位姿检测精度分别为57.61%和91.97%,超越了其他基于RGB的先进方法,能够更好地解决复杂场景下的目标6D位姿估计问题。 展开更多
关键词 光场 6D位姿估计 光场位姿数据集 EPI图像栈 特征聚合模块 关键点
原文传递
高阶特征聚合与卷积调制的SAR图像舰船检测 被引量:3
18
作者 郭伟 王江达 +1 位作者 王欣哲 王春艳 《测绘科学》 CSCD 北大核心 2023年第8期81-93,共13页
针对合成孔径雷达(SAR)舰船图像在目标长宽比失衡和小目标聚集等复杂场景中检测困难的问题,该文提出了一种关于海洋舰船检测的目标检测算法,以YOLOv7-Tiny算法为基础采用高阶特征聚合的方法来保留更多小尺度舰船的特征信息,引入卷积调... 针对合成孔径雷达(SAR)舰船图像在目标长宽比失衡和小目标聚集等复杂场景中检测困难的问题,该文提出了一种关于海洋舰船检测的目标检测算法,以YOLOv7-Tiny算法为基础采用高阶特征聚合的方法来保留更多小尺度舰船的特征信息,引入卷积调制机制加强颈部网络的特征增强能力,动态非单调聚焦机制边界框损失函数与自适应锚框的有效结合,降低了低质量舰船的检测难度。在遥感舰船高分辨率SAR图像数据集上的实验结果表明,该算法的检测精度和模型参数量分别为90.5%和6.12MB,在SAR舰船检测数据集上进行泛化测试,检测精度能达到97.2%。该文的算法模型提升了小尺度样本的检测能力,相比基准模型具有更高的检测精度和更好的鲁棒性,与其他目标检测算法相比拥有更好的检测效果。 展开更多
关键词 目标检测 合成孔径雷达 高阶特征聚合 卷积调制
原文传递
基于新型特征融合的安全帽佩戴检测方法 被引量:7
19
作者 周敏新 张方舟 龚声蓉 《计算机工程与设计》 北大核心 2021年第11期3181-3187,共7页
针对在遮挡、光照和其它因素的影响下,检测小尺度工人佩戴安全帽情况时存在漏检、误检的问题,提出以高精度、高速的CenterNet目标检测算法为基础,引入新型特征融合方式用于安全帽佩戴检测的方法。采用U型结构的特征金字塔融合多层特征... 针对在遮挡、光照和其它因素的影响下,检测小尺度工人佩戴安全帽情况时存在漏检、误检的问题,提出以高精度、高速的CenterNet目标检测算法为基础,引入新型特征融合方式用于安全帽佩戴检测的方法。采用U型结构的特征金字塔融合多层特征提高对小尺度目标的敏感性,此外受PoolNet启发,在特征金字塔结构基础上添加全局引导模块和特征整合模块,进一步细化显著目标的细节。在Safety-Helmet-Wearing-Dataset(SHWD)公开数据集上的实验结果表明,整体检测平均精度提高了2.0%,对小尺度工人的检测平均精度提高了3.0%。检测速度达到21 fps,可以满足实时检测的需求。 展开更多
关键词 安全帽 目标检测 特征金字塔 全局引导模块 特征整合模块
在线阅读 下载PDF
基于特征聚合与多元协同特征交互的航拍图像小目标检测 被引量:16
20
作者 陈朋磊 王江涛 +1 位作者 张志伟 何程 《电子测量与仪器学报》 CSCD 北大核心 2023年第10期183-192,共10页
针对无人机航拍图像目标尺寸太小、包含的特征信息较少,导致现有的检测算法对小目标检测效果不理想的问题,提出一种基于特征聚合与多元协同特征交互的无人机航拍图像小目标检测算法。首先,针对主干网对特征提取不足的问题,采用Swin Tran... 针对无人机航拍图像目标尺寸太小、包含的特征信息较少,导致现有的检测算法对小目标检测效果不理想的问题,提出一种基于特征聚合与多元协同特征交互的无人机航拍图像小目标检测算法。首先,针对主干网对特征提取不足的问题,采用Swin Transformer作为RetinaNet主干网络,以增强算法对全局信息的提取能力。其次,为提高网络对远处目标即小目标的检测能力,设计出一种高效的小目标特征聚合网络(SFANet),实现对浅层特征图小目标细节信息的充分整合。最后,为进一步提高网络对多尺度目标的检测性能,使低层特征信息流向高层,提出全新的多元协同特征交互模板(MCFIM)。在公开无人机航拍数据集VisDrone2019-DET上的实验结果表明,所提算法相较于原RetinaNet基线网络检测精度提高7.6%,对于小目标具有更好的检测效果。 展开更多
关键词 小目标检测 航拍图像 小目标特征聚合网络 多元协同特征交互模块
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部