期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
Global context-aware multi-scale feature iterative refinement for aviation-road traffic semantic segmentation
1
作者 Mengyue ZHANG Shichun YANG +1 位作者 Xinjie FENG Yaoguang CAO 《Chinese Journal of Aeronautics》 2026年第2期429-441,共13页
Semantic segmentation for mixed scenes of aerial remote sensing and road traffic is one of the key technologies for visual perception of flying cars.The State-of-the-Art(SOTA)semantic segmentation methods have made re... Semantic segmentation for mixed scenes of aerial remote sensing and road traffic is one of the key technologies for visual perception of flying cars.The State-of-the-Art(SOTA)semantic segmentation methods have made remarkable achievements in both fine-grained segmentation and real-time performance.However,when faced with the huge differences in scale and semantic categories brought about by the mixed scenes of aerial remote sensing and road traffic,they still face great challenges and there is little related research.Addressing the above issue,this paper proposes a semantic segmentation model specifically for mixed datasets of aerial remote sensing and road traffic scenes.First,a novel decoding-recoding multi-scale feature iterative refinement structure is proposed,which utilizes the re-integration and continuous enhancement of multi-scale information to effectively deal with the huge scale differences between cross-domain scenes,while using a fully convolutional structure to ensure the lightweight and real-time requirements.Second,a welldesigned cross-window attention mechanism combined with a global information integration decoding block forms an enhanced global context perception,which can effectively capture the long-range dependencies and multi-scale global context information of different scenes,thereby achieving fine-grained semantic segmentation.The proposed method is tested on a large-scale mixed dataset of aerial remote sensing and road traffic scenes.The results confirm that it can effectively deal with the problem of large-scale differences in cross-domain scenes.Its segmentation accuracy surpasses that of the SOTA methods,which meets the real-time requirements. 展开更多
关键词 Aviation-road traffic Flying cars Global context-aware multi-scale feature iterative refinement Semantic segmentation
原文传递
Disease Recognition of Apple Leaf Using Lightweight Multi-Scale Network with ECANet 被引量:4
2
作者 Helong Yu Xianhe Cheng +2 位作者 Ziqing Li Qi Cai Chunguang Bi 《Computer Modeling in Engineering & Sciences》 SCIE EI 2022年第9期711-738,共28页
To solve the problem of difficulty in identifying apple diseases in the natural environment and the low application rate of deep learning recognition networks,a lightweight ResNet(LW-ResNet)model for apple disease rec... To solve the problem of difficulty in identifying apple diseases in the natural environment and the low application rate of deep learning recognition networks,a lightweight ResNet(LW-ResNet)model for apple disease recognition is proposed.Based on the deep residual network(ResNet18),the multi-scale feature extraction layer is constructed by group convolution to realize the compression model and improve the extraction ability of different sizes of lesion features.By improving the identity mapping structure to reduce information loss.By introducing the efficient channel attention module(ECANet)to suppress noise from a complex background.The experimental results show that the average precision,recall and F1-score of the LW-ResNet on the test set are 97.80%,97.92%and 97.85%,respectively.The parameter memory is 2.32 MB,which is 94%less than that of ResNet18.Compared with the classic lightweight networks SqueezeNet and MobileNetV2,LW-ResNet has obvious advantages in recognition performance,speed,parameter memory requirement and time complexity.The proposed model has the advantages of low computational cost,low storage cost,strong real-time performance,high identification accuracy,and strong practicability,which can meet the needs of real-time identification task of apple leaf disease on resource-constrained devices. 展开更多
关键词 Apple disease recognition deep residual network multi-scale feature efficient channel attention module lightweight network
在线阅读 下载PDF
A High Resolution Convolutional Neural Network with Squeeze and Excitation Module for Automatic Modulation Classification 被引量:1
3
作者 Duan Ruifeng Zhao Yuanlin +3 位作者 Zhang Haiyan Li Xinze Cheng Peng Li Yonghui 《China Communications》 SCIE CSCD 2024年第10期132-147,共16页
Automatic modulation classification(AMC) technology is one of the cutting-edge technologies in cognitive radio communications. AMC based on deep learning has recently attracted much attention due to its superior perfo... Automatic modulation classification(AMC) technology is one of the cutting-edge technologies in cognitive radio communications. AMC based on deep learning has recently attracted much attention due to its superior performances in classification accuracy and robustness. In this paper, we propose a novel, high resolution and multi-scale feature fusion convolutional neural network model with a squeeze-excitation block, referred to as HRSENet,to classify different kinds of modulation signals.The proposed model establishes a parallel computing mechanism of multi-resolution feature maps through the multi-layer convolution operation, which effectively reduces the information loss caused by downsampling convolution. Moreover, through dense skipconnecting at the same resolution and up-sampling or down-sampling connection at different resolutions, the low resolution representation of the deep feature maps and the high resolution representation of the shallow feature maps are simultaneously extracted and fully integrated, which is benificial to mine signal multilevel features. Finally, the feature squeeze and excitation module embedded in the decoder is used to adjust the response weights between channels, further improving classification accuracy of proposed model.The proposed HRSENet significantly outperforms existing methods in terms of classification accuracy on the public dataset “Over the Air” in signal-to-noise(SNR) ranging from-2dB to 20dB. The classification accuracy in the proposed model achieves 85.36% and97.30% at 4dB and 10dB, respectively, with the improvement by 9.71% and 5.82% compared to LWNet.Furthermore, the model also has a moderate computation complexity compared with several state-of-the-art methods. 展开更多
关键词 automatic modulation classification deep learning feature squeeze-and-excitation HIGH-RESOLUTION multi-scale
在线阅读 下载PDF
基于细化聚合多频特征的图像超分辨率研究
4
作者 吴大荣 胡仕刚 《湖南工业大学学报》 2025年第6期37-43,共7页
基于Transformer的方法在提取全局上下文方面表现优异,且在单图像超分辨率(SISR)方面拥有显著效果,但因其主要功能是捕获全局特征,这使得它更注重于捕获低频信息,从而忽略了对于高频特征的提取。为解决这一问题,提出了一种集成卷积和Tra... 基于Transformer的方法在提取全局上下文方面表现优异,且在单图像超分辨率(SISR)方面拥有显著效果,但因其主要功能是捕获全局特征,这使得它更注重于捕获低频信息,从而忽略了对于高频特征的提取。为解决这一问题,提出了一种集成卷积和Transformer结构优势的多频特征聚合网络(MFAN)。该网络由3个重要模块组成:用于提取全局上下文的耦合自注意Transformer(CSAT)、用于提取并增强高频信息的高频增强模块(HFEM),以及用于细化全局特征的细化融合模块(RFM)。通过实验得知,与其他SR方法相比,所提出的MFAN显著提高了分辨的视觉效果和图像质量。 展开更多
关键词 超分辨率 耦合自注意力机制 高频增强 细化融合模块 多频特征聚合网络(MFAN)
在线阅读 下载PDF
基于双域自适应融合与特征细化的古汉字图像补全
5
作者 邸梦 万金 《广西科学》 北大核心 2025年第6期1222-1232,共11页
目前针对古汉字图像补全鲜有研究,直接使用通用图像补全技术会导致古汉字字体结构失真、笔画模糊等问题,难以满足古汉字在可读性和易用性方面的需求。针对以上问题,本文构建古汉字图像补全数据集HanInpaint并提出一种基于双域自适应融... 目前针对古汉字图像补全鲜有研究,直接使用通用图像补全技术会导致古汉字字体结构失真、笔画模糊等问题,难以满足古汉字在可读性和易用性方面的需求。针对以上问题,本文构建古汉字图像补全数据集HanInpaint并提出一种基于双域自适应融合与特征细化的古汉字图像补全方法。具体来说,HanInpaint数据集包括1386张训练图像和347张测试图像,涵盖楷书、篆书、草书等多种字体风格,为古汉字图像补全提供标准化数据与评价基准。在提出的基于双域自适应融合与特征细化的古汉字图像补全方法中,双域特征融合模块(Dual-Domain Feature Fusion Module,DDFFM)通过联合空域与频域信息实现跨域特征自适应融合,以增强模型对古汉字结构信息的建模能力;多尺度特征细化模块(Multi-Scale Feature Refinement Module,MSFRM)通过对不同尺度下的局部与全局特征进行细化以提升补全图像细节保真度;高频感知损失(High-Frequency-Aware Loss,HFALoss)约束了补全图像与真实图像在高频上的差异,从而提升笔画等高频细节的复原质量。在HanInpaint数据集上的实验结果表明,本文所提方法在测试集上的平均绝对误差(Mean Absolute Error,MAE)为0.03,峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)为31.56 dB,结构相似性(Structural Similarity Index Measure,SSIM)为0.9731,学习感知图像块相似度(Learned Perceptual Image Patch similarity,LPIPS)为0.11,Fréchet初始距离(Fréchet Inception Distance,FID)为19.63,验证了所提方法的有效性和可行性。 展开更多
关键词 古汉字图像补全 数据集 双域特征融合模块 多尺度特征细化模块 高频感知损失
在线阅读 下载PDF
Learning multi-scale attention network for fine-grained visual classification
6
作者 Peipei Zhao Siyan Yang +4 位作者 Wei Ding Ruyi Liu Wentian Xin Xiangzeng Liu Qiguang Miao 《Journal of Information and Intelligence》 2025年第6期492-503,共12页
Fine-grained visual classification(FGVC)is a very challenging task due to distinguishing subcategories under the same super-category.Recent works mainly localize discriminative image regions and capture subtle inter-c... Fine-grained visual classification(FGVC)is a very challenging task due to distinguishing subcategories under the same super-category.Recent works mainly localize discriminative image regions and capture subtle inter-class differences by utilizing attention-based methods.However,at the same layer,most attention-based works only consider large-scale attention blocks with the same size as feature maps,and they ignore small-scale attention blocks that are smaller than feature maps.To distinguish subcategories,it is important to exploit small local regions.In this work,a novel multi-scale attention network(MSANet)is proposed to capture large and small regions at the same layer in fine-grained visual classification.Specifically,a novel multi-scale attention layer(MSAL)is proposed,which generates multiple groups in each feature maps to capture different-scale discriminative regions.The groups based on large-scale regions can exploit global features and the groups based on the small-scale regions can extract local subtle features.Then,a simple feature fusion strategy is utilized to fully integrate global features and local subtle features to mine information that are more conducive to FGVC.Comprehensive experiments in Caltech-UCSD Birds-200-2011(CUB),FGVC-Aircraft(AIR)and Stanford Cars(Cars)datasets show that our method achieves the competitive performances,which demonstrate its effectiveness. 展开更多
关键词 Fine-grained visual classification multi-scale attention network multi-scale attention module feature fusion strategy
原文传递
Modulation recognition network of multi-scale analysis with deep threshold noise elimination
7
作者 Xiang LI Yibing LI +1 位作者 Chunrui TANG Yingsong LI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第5期742-758,共17页
To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning... To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning techniques to replace traditional modulated signal processing techniques.To address the problem of low recognition accuracy of the modulated signal at low signal-to-noise ratios,we have designed a novel modulation recognition network of multi-scale analysis with deep threshold noise elimination to recognize the actually collected modulated signals under a symmetric cross-entropy function of label smoothing.The network consists of a denoising encoder with deep adaptive threshold learning and a decoder with multi-scale feature fusion.The two modules are skip-connected to work together to improve the robustness of the overall network.Experimental results show that this method has better recognition accuracy at low signal-to-noise ratios than previous methods.The network demonstrates a flexible self-learning capability for different noise thresholds and the effectiveness of the designed feature fusion module in multi-scale feature acquisition for various modulation types. 展开更多
关键词 Signal noise elimination Deep adaptive threshold learning network multi-scale feature fusion modulation ecognition
原文传递
基于级联蒸馏的窃电行为识别研究
8
作者 陈熙群 《宁夏电力》 2025年第4期27-30,52,共5页
现有的窃电行为识别方法大都采用单一模型对用电行为进行处理,泛化能力有限,容易导致过拟合问题,且用户窃电行为具有较高的隐蔽性,使用户行为特征难以捕捉。为此,提出基于级联蒸馏的窃电行为识别方法。收集用户用电行为数据,对收集到的... 现有的窃电行为识别方法大都采用单一模型对用电行为进行处理,泛化能力有限,容易导致过拟合问题,且用户窃电行为具有较高的隐蔽性,使用户行为特征难以捕捉。为此,提出基于级联蒸馏的窃电行为识别方法。收集用户用电行为数据,对收集到的数据进行修正和降维处理。基于处理后的用户行为数据,利用级联蒸馏的共享骨干网络,捕捉用户行为数据的时序特性,利用动态锚框蒸馏模块,基于数据的时序信息对其进行扩充,再利用动态锚框提纯模块,实现对用户行为数据的特征挖掘,捕捉用电数据的多样化特征,增强模型的泛化能力,减少过拟合现象。基于挖掘的用户行为特征,计算用户窃电行为指数,识别出用户窃电行为类型。实验结果表明,设计的窃电行为识别方法能够准确识别用户窃电行为的类型,识别精度较高。 展开更多
关键词 级联蒸馏 窃电行为识别 特征挖掘 动态锚框提纯模块
在线阅读 下载PDF
一种Yolov5颈部细化的小交通标志检测算法 被引量:8
9
作者 潘桂霞 赖惠成 +2 位作者 王同官 赵艳杰 文晓鹏 《现代电子技术》 2023年第14期56-62,共7页
针对现有交通标志检测算法对小尺寸交通标志特征提取不充分、检测精度低、速度慢等问题,文中提出一种Yolov5颈部细化的小交通标志检测算法。首先,为使网络更关注小交通标志的检测,在主干网络中添加一条浅层特征提取分支,获得浅层特征图... 针对现有交通标志检测算法对小尺寸交通标志特征提取不充分、检测精度低、速度慢等问题,文中提出一种Yolov5颈部细化的小交通标志检测算法。首先,为使网络更关注小交通标志的检测,在主干网络中添加一条浅层特征提取分支,获得浅层特征图,并与具有较强语义信息的深层特征图融合,改善浅层特征图的感受野;其次,在Yolov5颈部网络引入GSConv模块,通过深度可分离卷积与普通卷积信息渗透、网络通道减半压缩的方式提高算法的检测性能;最后,利用完备交并比(CIoU)损失函数加快模型收敛,提高检测速度。实验结果表明,改进后的Yolov5网络模型性能有所上升,在TT100K交通标志数据集上平均精度均值mAP可达83.56%,相较于原始Yolov5基本框架mAP提升2.24%,且检测速度FPS可达40.5 f/s,满足实时性要求。 展开更多
关键词 目标检测 小交通标志 Yolov5 颈部细化算法 特征融合 GSConv模块
在线阅读 下载PDF
注意力优化RetinaNet的多尺度目标检测算法 被引量:2
10
作者 吴宇震 胡朋 +2 位作者 赵一帆 丁洪伟 杨志军 《无线电工程》 北大核心 2023年第7期1725-1733,共9页
针对目标检测算法RetinaNet在多尺度物体检测任务中存在利用特征上下文信息和多尺度特征融合不充分及边界框回归不够快速精准的问题,提出了一种注意力优化RetinaNet的多尺度目标检测算法。在特征提取模块嵌入无参数的3D注意力机制,来充... 针对目标检测算法RetinaNet在多尺度物体检测任务中存在利用特征上下文信息和多尺度特征融合不充分及边界框回归不够快速精准的问题,提出了一种注意力优化RetinaNet的多尺度目标检测算法。在特征提取模块嵌入无参数的3D注意力机制,来充分利用特征上下文信息;同时,构建了特征融合细化模块,实现多尺度融合特征的细化和增强;使用距离交并比(Distance Intersection over Union,DIoU)损失函数优化定位损失,提升边界框回归精准度。为了论证该方法的有效性,分别在PASCAL VOC数据集和MS COCO数据集上进行实验。改进模型的检测精度分别达到了82.1%、52.3%,其中,小目标、中目标和大目标的检测精度相比原算法分别提升了1.9%、1.1%和1.4%。 展开更多
关键词 目标检测 特征融合细化模块 注意力机制 RetinaNet 距离交并比
在线阅读 下载PDF
基于注意力机制和编码解码网络的遥感影像分类 被引量:5
11
作者 张津 魏峰远 +2 位作者 冯凡 焦利伟 麻连伟 《测绘科学技术学报》 北大核心 2020年第6期610-615,共6页
针对不同类型遥感影像分类效果不理想的问题,基于卷积注意力机制提出一种特征精化模块。对U-Net的4个跳远连接,首先使用通道注意力对浅层特征中不同通道之间的关联进行进一步探索,对不同通道的特征图赋予新的权重;然后将带有不同通道权... 针对不同类型遥感影像分类效果不理想的问题,基于卷积注意力机制提出一种特征精化模块。对U-Net的4个跳远连接,首先使用通道注意力对浅层特征中不同通道之间的关联进行进一步探索,对不同通道的特征图赋予新的权重;然后将带有不同通道权重的特征图作为后续空间注意力的输入,通过对所有空间位置信息的逐点调节,完成对浅层特征的精化重构;最后利用改进后的编码-解码网络在多个高分辨率遥感数据集上进行分类实验,实验结果证明了该方法的有效性。 展开更多
关键词 图像处理 遥感 深度学习 注意力机制 编码解码网络 特征精化
在线阅读 下载PDF
一种复杂场景下高精度交通标志检测模型 被引量:4
12
作者 李嘉豪 闵卫东 +2 位作者 陈炯缙 朱梦 展国伟 《计算机工程》 CAS CSCD 北大核心 2023年第11期311-320,共10页
交通标志检测在智能交通领域的安全保障上具有重要作用。对于部分外观相似的交通标志在尺度变化下,现有模型难以提取它们之间的细微差异,导致标志被错误分类。此外,在复杂场景下,其他相似物体容易被误检为交通标志。为此,提出一种逐层... 交通标志检测在智能交通领域的安全保障上具有重要作用。对于部分外观相似的交通标志在尺度变化下,现有模型难以提取它们之间的细微差异,导致标志被错误分类。此外,在复杂场景下,其他相似物体容易被误检为交通标志。为此,提出一种逐层特征细化检测模型。根据交通标志特点提出分层聚类锚框和分组损失,分层聚类锚框根据目标尺度对数据集分层并通过K-means聚类算法获取各层锚框,更好地适应交通标志灵活的尺度变化,分组损失对外观相似的类别分组并设计损失函数,指导模型学习相似交通标志间的细微差距,从而降低错误分类。在Neck层加入弱语义分割模块和特征细化模块,通过弱语义分割模块学习浅层特征上下文信息,从而分割出可信区域和非可信区域,利用特征细化模块挖掘非可信区域的上下文信息,主动学习并消除造成误检的干扰,从而降低对其他相似物体的误检。弱语义分割模块和特征细化模块结合通道注意力构建逐层细化特征金字塔,实现对多尺度特征的整体优化并提高模型精确率。实验结果表明,该方法在TT100K和GTSDB交通标志数据集上的AP_(50)指标分别达到97.0%和98.6%。 展开更多
关键词 交通标志检测 复杂场景 分层聚类锚框 分组损失 弱语义分割模块 特征细化模块
在线阅读 下载PDF
改进U-net++的遥感图像语义分割方法 被引量:3
13
作者 何佳佳 徐杨 张永丹 《计算机工程与应用》 CSCD 北大核心 2024年第13期255-265,共11页
遥感图像语义分割在土地资源规划、智慧城市等领域有着广泛的应用。由于高分辨率遥感的图像存在边界分割不清、小尺寸目标分割不清等问题,为此提出了一种基于U-net++的改进网络TU-net,该模型通过优化网络结构加强模型的特征提取能力,引... 遥感图像语义分割在土地资源规划、智慧城市等领域有着广泛的应用。由于高分辨率遥感的图像存在边界分割不清、小尺寸目标分割不清等问题,为此提出了一种基于U-net++的改进网络TU-net,该模型通过优化网络结构加强模型的特征提取能力,引入特征头细化模块,通过构建了两条通道来增强通道特征表示和空间特征表示,提升了对高层语义信息的解析能力;引入基于Transformer的注意力聚合模块来捕捉全局上下文信息,设计了十字窗交互模块,显著降低了计算复杂度;在解码器末端设计了一个动态特征融合块,以此得到多类、多尺度的语义信息,增强最终的分割效果。TU-net在两个数据集上进行实验,其中OA、mIoU、mF1分数均高于主流模型,Vaihingen数据集中小尺寸目标车的IoU和F1分数分别为0.896和0.962,比次优模型提升了5%和15.8%;Potsdam数据集中树的IoU和F1分数分别为0.913和0.936,比次优模型提升了6.3%和4.3%,实验结果表明该模型能够更精准地分割小尺寸目标及目标边界。 展开更多
关键词 高分辨率遥感的图像 语义分割 小尺寸目标 特征头细化模块 十字窗交互模块 动态特征融合块
在线阅读 下载PDF
联合特征细化和耐噪声对比学习的无监督行人重识别 被引量:2
14
作者 钱亚萍 王凤随 +1 位作者 熊磊 闫涛 《光电子.激光》 CAS CSCD 北大核心 2023年第7期762-770,共9页
针对无监督行人重识别(person re-identification,ReID)中行人特征表达不充分以及聚类过程产生噪声标签的问题,提出一种联合特征细化和耐噪声对比学习的无监督ReID方法。首先,为丰富无标记的行人表征,设计了非局部通道细化模块(non-loca... 针对无监督行人重识别(person re-identification,ReID)中行人特征表达不充分以及聚类过程产生噪声标签的问题,提出一种联合特征细化和耐噪声对比学习的无监督ReID方法。首先,为丰富无标记的行人表征,设计了非局部通道细化模块(non-local channel refinement module,NCRM)对关键特征信息进行加权强化,其融合了非局部通道的重要特征来捕获无标记数据的类间区别表征,形成更具有鉴别度的特征描述符。其次,考虑到特征的充分表达,采用广义均值(generalized mean,GEM)池化自适应调整参数来增强不同细粒度区域信息的提取能力。再次,为了减轻噪声标签对网络的负面影响,设计了耐噪声的动态对比均衡(dynamic contrastive equilibrium,DCE)损失函数进行无监督联合学习。最终,在两个公共数据集上的实验结果验证了所提方法的有效性和先进性,mAP分别达到了83.1%和71.9%,优于其他先进方法。 展开更多
关键词 行人重识别(ReID) 无监督 深度特征网络 非局部通道细化模块(NCRM) 耐噪声对比学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部