-
题名基于细化聚合多频特征的图像超分辨率研究
- 1
-
-
作者
吴大荣
胡仕刚
-
机构
湖南科技大学信息与电气工程学院
-
出处
《湖南工业大学学报》
2025年第6期37-43,共7页
-
文摘
基于Transformer的方法在提取全局上下文方面表现优异,且在单图像超分辨率(SISR)方面拥有显著效果,但因其主要功能是捕获全局特征,这使得它更注重于捕获低频信息,从而忽略了对于高频特征的提取。为解决这一问题,提出了一种集成卷积和Transformer结构优势的多频特征聚合网络(MFAN)。该网络由3个重要模块组成:用于提取全局上下文的耦合自注意Transformer(CSAT)、用于提取并增强高频信息的高频增强模块(HFEM),以及用于细化全局特征的细化融合模块(RFM)。通过实验得知,与其他SR方法相比,所提出的MFAN显著提高了分辨的视觉效果和图像质量。
-
关键词
超分辨率
耦合自注意力机制
高频增强
细化融合模块
多频特征聚合网络(MFAN)
-
Keywords
super-resolution
coupling self-attention mechanism
high-frequency enhancement
fusion module refinement
multi-frequency feature aggregation network(MFAN)
-
分类号
TN911.73
[电子电信—通信与信息系统]
-
-
题名基于双域自适应融合与特征细化的古汉字图像补全
- 2
-
-
作者
邸梦
万金
-
机构
咸阳师范学院于右任书法学院
齐鲁工业大学(山东省科学院)
山东省算力互联网与服务计算重点实验室
-
出处
《广西科学》
北大核心
2025年第6期1222-1232,共11页
-
基金
国家自然科学基金项目(62401305)
国家重点研发计划项目(2024YFF0908105)
+1 种基金
山东省重点研发计划项目(2023CXGC010112,2024CXGC010108)
山东省高等学校青年创新团队发展计划项目(2024KJH028)资助。
-
文摘
目前针对古汉字图像补全鲜有研究,直接使用通用图像补全技术会导致古汉字字体结构失真、笔画模糊等问题,难以满足古汉字在可读性和易用性方面的需求。针对以上问题,本文构建古汉字图像补全数据集HanInpaint并提出一种基于双域自适应融合与特征细化的古汉字图像补全方法。具体来说,HanInpaint数据集包括1386张训练图像和347张测试图像,涵盖楷书、篆书、草书等多种字体风格,为古汉字图像补全提供标准化数据与评价基准。在提出的基于双域自适应融合与特征细化的古汉字图像补全方法中,双域特征融合模块(Dual-Domain Feature Fusion Module,DDFFM)通过联合空域与频域信息实现跨域特征自适应融合,以增强模型对古汉字结构信息的建模能力;多尺度特征细化模块(Multi-Scale Feature Refinement Module,MSFRM)通过对不同尺度下的局部与全局特征进行细化以提升补全图像细节保真度;高频感知损失(High-Frequency-Aware Loss,HFALoss)约束了补全图像与真实图像在高频上的差异,从而提升笔画等高频细节的复原质量。在HanInpaint数据集上的实验结果表明,本文所提方法在测试集上的平均绝对误差(Mean Absolute Error,MAE)为0.03,峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)为31.56 dB,结构相似性(Structural Similarity Index Measure,SSIM)为0.9731,学习感知图像块相似度(Learned Perceptual Image Patch similarity,LPIPS)为0.11,Fréchet初始距离(Fréchet Inception Distance,FID)为19.63,验证了所提方法的有效性和可行性。
-
关键词
古汉字图像补全
数据集
双域特征融合模块
多尺度特征细化模块
高频感知损失
-
Keywords
ancient Chinese character image inpainting
dataset
dual-domain feature fusion module
multi-scale feature refinement module
high-frequency-aware loss
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于级联蒸馏的窃电行为识别研究
- 3
-
-
作者
陈熙群
-
机构
国网浙江省电力有限公司泰顺县供电公司
-
出处
《宁夏电力》
2025年第4期27-30,52,共5页
-
文摘
现有的窃电行为识别方法大都采用单一模型对用电行为进行处理,泛化能力有限,容易导致过拟合问题,且用户窃电行为具有较高的隐蔽性,使用户行为特征难以捕捉。为此,提出基于级联蒸馏的窃电行为识别方法。收集用户用电行为数据,对收集到的数据进行修正和降维处理。基于处理后的用户行为数据,利用级联蒸馏的共享骨干网络,捕捉用户行为数据的时序特性,利用动态锚框蒸馏模块,基于数据的时序信息对其进行扩充,再利用动态锚框提纯模块,实现对用户行为数据的特征挖掘,捕捉用电数据的多样化特征,增强模型的泛化能力,减少过拟合现象。基于挖掘的用户行为特征,计算用户窃电行为指数,识别出用户窃电行为类型。实验结果表明,设计的窃电行为识别方法能够准确识别用户窃电行为的类型,识别精度较高。
-
关键词
级联蒸馏
窃电行为识别
特征挖掘
动态锚框提纯模块
-
Keywords
cascaded distillation
electricity theft detection
feature mining
dynamic anchor box refinement module
-
分类号
TM92
[电气工程—电力电子与电力传动]
-
-
题名一种Yolov5颈部细化的小交通标志检测算法
被引量:8
- 4
-
-
作者
潘桂霞
赖惠成
王同官
赵艳杰
文晓鹏
-
机构
新疆大学信息科学与工程学院
-
出处
《现代电子技术》
2023年第14期56-62,共7页
-
基金
国家自然科学基金项目(U1903213)。
-
文摘
针对现有交通标志检测算法对小尺寸交通标志特征提取不充分、检测精度低、速度慢等问题,文中提出一种Yolov5颈部细化的小交通标志检测算法。首先,为使网络更关注小交通标志的检测,在主干网络中添加一条浅层特征提取分支,获得浅层特征图,并与具有较强语义信息的深层特征图融合,改善浅层特征图的感受野;其次,在Yolov5颈部网络引入GSConv模块,通过深度可分离卷积与普通卷积信息渗透、网络通道减半压缩的方式提高算法的检测性能;最后,利用完备交并比(CIoU)损失函数加快模型收敛,提高检测速度。实验结果表明,改进后的Yolov5网络模型性能有所上升,在TT100K交通标志数据集上平均精度均值mAP可达83.56%,相较于原始Yolov5基本框架mAP提升2.24%,且检测速度FPS可达40.5 f/s,满足实时性要求。
-
关键词
目标检测
小交通标志
Yolov5
颈部细化算法
特征融合
GSConv模块
-
Keywords
target detection
small traffic sign
Yolov5
neck refinement algorithm
feature fusion
GSConv module
-
分类号
TN911.73-34
[电子电信—通信与信息系统]
-
-
题名注意力优化RetinaNet的多尺度目标检测算法
被引量:2
- 5
-
-
作者
吴宇震
胡朋
赵一帆
丁洪伟
杨志军
-
机构
云南大学信息学院
云南民族大学电气信息工程学院
-
出处
《无线电工程》
北大核心
2023年第7期1725-1733,共9页
-
基金
国家自然科学基金(61461053)。
-
文摘
针对目标检测算法RetinaNet在多尺度物体检测任务中存在利用特征上下文信息和多尺度特征融合不充分及边界框回归不够快速精准的问题,提出了一种注意力优化RetinaNet的多尺度目标检测算法。在特征提取模块嵌入无参数的3D注意力机制,来充分利用特征上下文信息;同时,构建了特征融合细化模块,实现多尺度融合特征的细化和增强;使用距离交并比(Distance Intersection over Union,DIoU)损失函数优化定位损失,提升边界框回归精准度。为了论证该方法的有效性,分别在PASCAL VOC数据集和MS COCO数据集上进行实验。改进模型的检测精度分别达到了82.1%、52.3%,其中,小目标、中目标和大目标的检测精度相比原算法分别提升了1.9%、1.1%和1.4%。
-
关键词
目标检测
特征融合细化模块
注意力机制
RetinaNet
距离交并比
-
Keywords
object detection
feature fusion refinement module
attention mechanism
RetinaNet
distance intersection over union
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于注意力机制和编码解码网络的遥感影像分类
被引量:5
- 6
-
-
作者
张津
魏峰远
冯凡
焦利伟
麻连伟
-
机构
河南理工大学测绘与国土信息工程学院
河南省地球物理空间信息研究院
-
出处
《测绘科学技术学报》
北大核心
2020年第6期610-615,共6页
-
基金
河南省自然资源科研资助项目(201937915)。
-
文摘
针对不同类型遥感影像分类效果不理想的问题,基于卷积注意力机制提出一种特征精化模块。对U-Net的4个跳远连接,首先使用通道注意力对浅层特征中不同通道之间的关联进行进一步探索,对不同通道的特征图赋予新的权重;然后将带有不同通道权重的特征图作为后续空间注意力的输入,通过对所有空间位置信息的逐点调节,完成对浅层特征的精化重构;最后利用改进后的编码-解码网络在多个高分辨率遥感数据集上进行分类实验,实验结果证明了该方法的有效性。
-
关键词
图像处理
遥感
深度学习
注意力机制
编码解码网络
特征精化
-
Keywords
image processing
remote sensing
deep learning
attention module
encoder-decoder network
feature refinement
-
分类号
P237
[天文地球—摄影测量与遥感]
-
-
题名一种复杂场景下高精度交通标志检测模型
被引量:4
- 7
-
-
作者
李嘉豪
闵卫东
陈炯缙
朱梦
展国伟
-
机构
南昌大学数学与计算机学院
南昌大学元宇宙研究院
江西省智慧城市重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第11期311-320,共10页
-
基金
国家自然科学基金(62076117)
江西省智慧城市重点实验室项目(20192BCD40002)。
-
文摘
交通标志检测在智能交通领域的安全保障上具有重要作用。对于部分外观相似的交通标志在尺度变化下,现有模型难以提取它们之间的细微差异,导致标志被错误分类。此外,在复杂场景下,其他相似物体容易被误检为交通标志。为此,提出一种逐层特征细化检测模型。根据交通标志特点提出分层聚类锚框和分组损失,分层聚类锚框根据目标尺度对数据集分层并通过K-means聚类算法获取各层锚框,更好地适应交通标志灵活的尺度变化,分组损失对外观相似的类别分组并设计损失函数,指导模型学习相似交通标志间的细微差距,从而降低错误分类。在Neck层加入弱语义分割模块和特征细化模块,通过弱语义分割模块学习浅层特征上下文信息,从而分割出可信区域和非可信区域,利用特征细化模块挖掘非可信区域的上下文信息,主动学习并消除造成误检的干扰,从而降低对其他相似物体的误检。弱语义分割模块和特征细化模块结合通道注意力构建逐层细化特征金字塔,实现对多尺度特征的整体优化并提高模型精确率。实验结果表明,该方法在TT100K和GTSDB交通标志数据集上的AP_(50)指标分别达到97.0%和98.6%。
-
关键词
交通标志检测
复杂场景
分层聚类锚框
分组损失
弱语义分割模块
特征细化模块
-
Keywords
traffic sign detection
complex scenes
hierarchical clustering anchor
group loss
Weak Semantic Segmentation(WSS)module
feature refinement module(frm)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进U-net++的遥感图像语义分割方法
被引量:3
- 8
-
-
作者
何佳佳
徐杨
张永丹
-
机构
贵州大学大数据与信息工程学院
贵阳铝镁设计研究院有限公司
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第13期255-265,共11页
-
基金
贵州省科技计划项目(黔科合支撑[2023]一般326)。
-
文摘
遥感图像语义分割在土地资源规划、智慧城市等领域有着广泛的应用。由于高分辨率遥感的图像存在边界分割不清、小尺寸目标分割不清等问题,为此提出了一种基于U-net++的改进网络TU-net,该模型通过优化网络结构加强模型的特征提取能力,引入特征头细化模块,通过构建了两条通道来增强通道特征表示和空间特征表示,提升了对高层语义信息的解析能力;引入基于Transformer的注意力聚合模块来捕捉全局上下文信息,设计了十字窗交互模块,显著降低了计算复杂度;在解码器末端设计了一个动态特征融合块,以此得到多类、多尺度的语义信息,增强最终的分割效果。TU-net在两个数据集上进行实验,其中OA、mIoU、mF1分数均高于主流模型,Vaihingen数据集中小尺寸目标车的IoU和F1分数分别为0.896和0.962,比次优模型提升了5%和15.8%;Potsdam数据集中树的IoU和F1分数分别为0.913和0.936,比次优模型提升了6.3%和4.3%,实验结果表明该模型能够更精准地分割小尺寸目标及目标边界。
-
关键词
高分辨率遥感的图像
语义分割
小尺寸目标
特征头细化模块
十字窗交互模块
动态特征融合块
-
Keywords
high-resolution remote sensing images
semantic segmentation
small target
feature head refinement module
cross window interaction module
dynamic feature fusion block
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名联合特征细化和耐噪声对比学习的无监督行人重识别
被引量:2
- 9
-
-
作者
钱亚萍
王凤随
熊磊
闫涛
-
机构
安徽工程大学电气工程学院
检测技术与节能装置安徽省重点实验室
高端装备先进感知与智能控制教育部重点实验室
-
出处
《光电子.激光》
CAS
CSCD
北大核心
2023年第7期762-770,共9页
-
基金
安徽省自然科学基金(2108085MF197,1708085MF154)
安徽高校省级自然科学研究重点项目(KJ2019A0162)
+2 种基金
检测技术与节能装置安徽省重点实验室开放基金(DTESD2020B02)
安徽工程大学国家自然科学基金预研项目(Xjky2022040)
安徽高校研究生科学研究项目(YJS20210448,YJS20210449)资助项目。
-
文摘
针对无监督行人重识别(person re-identification,ReID)中行人特征表达不充分以及聚类过程产生噪声标签的问题,提出一种联合特征细化和耐噪声对比学习的无监督ReID方法。首先,为丰富无标记的行人表征,设计了非局部通道细化模块(non-local channel refinement module,NCRM)对关键特征信息进行加权强化,其融合了非局部通道的重要特征来捕获无标记数据的类间区别表征,形成更具有鉴别度的特征描述符。其次,考虑到特征的充分表达,采用广义均值(generalized mean,GEM)池化自适应调整参数来增强不同细粒度区域信息的提取能力。再次,为了减轻噪声标签对网络的负面影响,设计了耐噪声的动态对比均衡(dynamic contrastive equilibrium,DCE)损失函数进行无监督联合学习。最终,在两个公共数据集上的实验结果验证了所提方法的有效性和先进性,mAP分别达到了83.1%和71.9%,优于其他先进方法。
-
关键词
行人重识别(ReID)
无监督
深度特征网络
非局部通道细化模块(NCRM)
耐噪声对比学习
-
Keywords
person re-identification
unsupervised
deep feature network
non-local channel refinement module(NCRM)
noise-tolerant comparative learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-