期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
基于卷积神经网络的轻量高效图像隐写 被引量:1
1
作者 段新涛 白鹿伟 +4 位作者 徐凯欧 张萌 保梦茹 武银行 秦川 《应用科学学报》 北大核心 2025年第1期80-93,共14页
基于深度学习的图像隐写方法,因存在模型参数量和计算量大等问题,而面临高参数和计算负载的挑战,为此提出了一种轻量高效的图像隐写方法。首先在编码器和解码器中引入Ghost模块,降低了编码器和解码器的参数量和计算量。其次提出了一个... 基于深度学习的图像隐写方法,因存在模型参数量和计算量大等问题,而面临高参数和计算负载的挑战,为此提出了一种轻量高效的图像隐写方法。首先在编码器和解码器中引入Ghost模块,降低了编码器和解码器的参数量和计算量。其次提出了一个多尺度特征融合模块,用以捕捉多维数据中的复杂关系。最后提出了一个新颖的混合损失函数,可在保持模型不变的情况下提升图像隐写质量。实验结果表明,所提方法在256×256像素的图像上峰值信噪比达到47.59 dB。与目前最优的图像隐写方法相比,所提方法的隐写质量提升1.7 dB,参数量减少77%,计算量减少91%,在隐写质量上有较优的表现,同时模型的参数量和计算量大大降低,实现了模型的轻量高效化。 展开更多
关键词 图像隐写 深度学习 多尺度特征融合 混合损失函数
在线阅读 下载PDF
融合空间信息的YOLOv7交通标志检测
2
作者 师红宇 张哲于 +1 位作者 杜文 李怡 《计算机与现代化》 2025年第10期7-13,共7页
交通标志在检测过程中,因受天气和光照强度的影响,导致检测时出现错检、漏检等问题,针对此问题提出一种融合空间信息的交通标志检测算法。首先,在网络中使用坐标卷积,增强网络对坐标位置信息的敏锐性。其次,在主干特征提取中加入坐标注... 交通标志在检测过程中,因受天气和光照强度的影响,导致检测时出现错检、漏检等问题,针对此问题提出一种融合空间信息的交通标志检测算法。首先,在网络中使用坐标卷积,增强网络对坐标位置信息的敏锐性。其次,在主干特征提取中加入坐标注意力机制,可以更好地关注融合处的空间位置信息。在特征融合部分使用多尺度加权融合网络和金字塔池化,利用加权计算和跳跃连接的方式,增强低层与高层之间的语义信息融合效果。最后,使用边框回归损失函数(Scalable Intersection over Union Loss,SIoU)提高目标定位的准确性。在CCTSDB2021和GTSDB数据集上的实验结果显示,该方法在2种数据集上的平均精度(mean Average Precision,mAP)分别达到84.9%和98.5%,与主流检测模型对比有显著提升,较原模型分别提升了5.39个百分点和1.67个百分点,提高了交通标志的检测精度。 展开更多
关键词 交通标志检测 坐标卷积 注意力机制 多尺度融合 SIoU损失函数
在线阅读 下载PDF
基于改进多模态多损失融合网络的情感分析方法
3
作者 骆科文 冯丽 彭商濂 《长江信息通信》 2025年第8期58-61,共4页
多模态情感分析(Multimodal Sentiment Analysis, MSA)是指通过综合利用多种数据模态(如文本、语音、图像、视频等)来分析和识别情感状态的方法。相较于单一模态的情感分析,多模态情感分析能够利用更多的信息,提高情感识别的准确性和鲁... 多模态情感分析(Multimodal Sentiment Analysis, MSA)是指通过综合利用多种数据模态(如文本、语音、图像、视频等)来分析和识别情感状态的方法。相较于单一模态的情感分析,多模态情感分析能够利用更多的信息,提高情感识别的准确性和鲁棒性。而在多模态情感分析中使用多损失函数的方法,可以更好地发挥多模态数据的优势,灵活应对不同的数据情况和应用需求。本文通过对现有的多模态多损失融合网络基础上进行改进,在文本,语音双模态的基础上加入图像模态特征提取模块;对原模型的多模特征融合网络中的交叉注意编码器进行改进;在自注意编码器后,点向前反馈网络之前添加动态融合策略。在公开数据集MOSI上的实验结果表明,相较于其他基准模型,改进后的多模态多损失融合网络整体性能表现更好,Acc、F1值的结果更优。 展开更多
关键词 多模态 情感分析 跨模态特征融合 多损失函数 动态融合策略
在线阅读 下载PDF
基于改进YOLOv4的车辆检测算法 被引量:1
4
作者 赖颖 巨志勇 叶雨新 《电子科技》 2025年第1期81-87,94,共8页
在交通监控中进行车辆检测过程时,存在车辆互相遮挡和远距离目标尺寸不足的问题,导致在检测中存在漏检和误检情况。针对此问题,文中提出一种基于YOLOv4(You Only Look Once version 4)的多尺度融合与注意力机制的交通车辆检测算法。在YO... 在交通监控中进行车辆检测过程时,存在车辆互相遮挡和远距离目标尺寸不足的问题,导致在检测中存在漏检和误检情况。针对此问题,文中提出一种基于YOLOv4(You Only Look Once version 4)的多尺度融合与注意力机制的交通车辆检测算法。在YOLOv4的路径聚合网络中增加一个新的特征层进行多尺度特征融合,提升模型对底层纹理特征的提取能力。在YOLO Head检测头前嵌入ECA(Efficient Channel Attention)通道注意力模块,对聚合后的特征进行合理的抑制和增强,将CIoU(Complete Intersection over Union)损失函数替换为Soft-CIoU损失函数,提高小目标车辆对损失函数的贡献度。在公开车辆数据集UA-DETRAC与KITTI中的实验结果表明,相较于原YOLOv4算法,所提算法的平均精度分别提升了2.45百分点和1.14百分点,检测速度达到41.67 frame·s^(-1)。相较于其他先进算法,所提算法在检测精度上表现良好。 展开更多
关键词 车辆检测 多尺度特征融合 注意力机制 Soft-CIOU损失函数 YOLOv4 深度学习 目标检测 小目标
在线阅读 下载PDF
基于改进YOLOv8n的轻量化水稻病害检测方法
5
作者 李新超 杨铭严 孙国玺 《中国农机化学报》 北大核心 2025年第12期94-102,F0003,共10页
针对现有水稻病害检测模型存在复杂度高、病害特征尺度差异显著以及检测精度低等问题,提出一种改进型的轻量化水稻病害检测算法YOLOv8n—ADMW。引入ADown轻量化下采样模块替代网络中的CBS模块,有助于模型捕获病害特征以及减少模型计算量... 针对现有水稻病害检测模型存在复杂度高、病害特征尺度差异显著以及检测精度低等问题,提出一种改进型的轻量化水稻病害检测算法YOLOv8n—ADMW。引入ADown轻量化下采样模块替代网络中的CBS模块,有助于模型捕获病害特征以及减少模型计算量,实现模型的轻量化;使用基于点采样的动态上采样算子Dysample替代传统上采样方法,根据输入特征内容自适应学习采样参数,减少病害边缘和特征信息的丢失;设计C2f—MSBlock模块更换颈部网络中的C2f模块,进一步增强多尺度病害特征融合能力,提高对多尺度目标的检测精度;将YOLOv8n原有的CIoU损失函数更改为动态非单调的聚焦机制WIoUv3,通过梯度增益分配策略提高模型的精确定位能力。试验结果表明,改进后的轻量化模型的平均精度均值mAP@0.5和mAP@0.5:0.95分别达到91.4%、56.8%,与YOLOv8n基线模型相比分别提高4.5%、3.5%,参数量和模型大小仅为2.4 M和5 MB,与改进前相比,分别减少20%、16.7%。YOLOv8n—ADMW算法使模型保持轻量化的同时提高检测精度,能够实现对水稻病害的有效检测,可为后续水稻不同病害的诊断提供技术支撑。 展开更多
关键词 水稻病害 目标检测 轻量化 损失函数 多尺度特征融合
在线阅读 下载PDF
MAFNet:基于多尺度空洞融合网络的遥感影像建筑物提取方法
6
作者 董子博 王竞雪 +2 位作者 卜丽静 房琳 许峥辉 《测绘学报》 北大核心 2025年第6期1094-1106,共13页
遥感影像建筑物提取对灾害管理、城市规划及变化监测等领域具有重要意义。由于城市建筑物大小不一,一张遥感影像中存在多种不同尺寸大小的建筑物,使得影像中建筑物提取精度不足。为提升影像中不同尺寸大小建筑物的提取精度,本文提出一... 遥感影像建筑物提取对灾害管理、城市规划及变化监测等领域具有重要意义。由于城市建筑物大小不一,一张遥感影像中存在多种不同尺寸大小的建筑物,使得影像中建筑物提取精度不足。为提升影像中不同尺寸大小建筑物的提取精度,本文提出一种利用多尺度空洞融合网络的遥感影像建筑物提取方法。以U-Net网络为基础,首先,在编码器和解码器部分融合残差结构,使其在训练过程中更好地传播梯度;然后,在编码-解码器的桥接部分提出一个多尺度空洞融合模块,该模块利用多种空洞卷积捕捉全局上下文特征,并进一步通过通道和空间注意力机制来增强特征表达,有效提升了影像中不同尺寸建筑物的提取精度;最后,通过设计一个混合损失函数提升整体的边界提取效果。基于WHU building和Massachusetts building数据集进行试验,并将本文方法与当前主流的语义分割网络进行对比。试验结果表明,本文方法可以显著地提升影像建筑物提取精度,能够适应各种尺寸大小的建筑物提取,对于建筑物边界的提取更加完整和平滑。 展开更多
关键词 遥感影像 建筑物提取 U-Net 多尺度空洞融合 混合损失函数
在线阅读 下载PDF
基于双向交叉注意力的多尺度特征融合情感分类
7
作者 梁一鸣 范菁 柴汶泽 《计算机应用》 北大核心 2025年第9期2773-2782,共10页
针对现有情感分类模型在深层情感理解上的局限性、传统注意力机制的单向性束缚以及自然语言处理(NLP)中的类别不平衡等问题,提出一种融合多尺度BERT(Bidirectional Encoder Representations from Transformers)特征和双向交叉注意力机... 针对现有情感分类模型在深层情感理解上的局限性、传统注意力机制的单向性束缚以及自然语言处理(NLP)中的类别不平衡等问题,提出一种融合多尺度BERT(Bidirectional Encoder Representations from Transformers)特征和双向交叉注意力机制的情感分类模型M-BCA(Multi-scale BERT features with Bidirectional Cross Attention)。首先,从BERT的低层、中层和高层分别提取多尺度特征,以捕捉句子文本的表面信息、语法信息和深层语义信息;其次,利用三通道门控循环单元(GRU)进一步提取深层语义特征,从而增强模型对文本的理解能力;最后,为促进不同尺度特征之间的交互与学习,引入双向交叉注意力机制,从而增强多尺度特征之间的相互作用。此外,针对不平衡数据问题,设计数据增强策略,并采用混合损失函数优化模型对少数类别样本的学习。实验结果表明,在细粒度情感分类任务中,M-BCA表现优异。M-BCA在处理分布不平衡的多分类情感数据集时,它的性能显著优于大多数基线模型。此外,M-BCA在少数类别样本的分类任务中表现突出,尤其是在NLPCC 2014与Online_Shopping_10_Cats数据集上,MBCA的少数类别的Macro-Recall领先其他所有对比模型。可见,该模型在细粒度情感分类任务中取得了显著的性能提升,并适用于处理不平衡数据集。 展开更多
关键词 BERT 细粒度情感分类 多尺度特征融合 数据增强 混合损失函数 双向交叉注意力
在线阅读 下载PDF
基于特征融合的视频行人重识别算法
8
作者 宋京浩 姬晓飞 +1 位作者 孙英超 王竹筠 《沈阳航空航天大学学报》 2025年第3期51-57,共7页
视频行人重识别是一种在多摄像机监控网络中识别特定行人的技术。相较于基于单帧图像的方法,该类算法可以提供更多的行人信息,但也存在着模型复杂、构建特征不对齐等问题。提出一种基于特征融合的视频行人重识别算法,算法包含全局分支... 视频行人重识别是一种在多摄像机监控网络中识别特定行人的技术。相较于基于单帧图像的方法,该类算法可以提供更多的行人信息,但也存在着模型复杂、构建特征不对齐等问题。提出一种基于特征融合的视频行人重识别算法,算法包含全局分支和空间变换的局部分支。全局分支提取行人的全局特征,捕捉行人的粗粒度信息和整体的上下文信息。空间变换的局部分支将空间变换矩阵插入局部分支,对特征进行重新学习,学习有区分性的局部区域特性并缓解特征不对齐的问题。通过多分支结构,将局部特征和全局特征有效融合,并通过时间平均池化聚合特征加强特征的多元化,增强模型的鲁棒性。最终,利用交叉熵和软边界三元损失进行模型训练。在Mars和DukeMTMC-Video数据集上的测试结果验证了所提算法的可行性,其在Mars数据集的mAP、Rank-1分别达到82.25%、89.76%,具有较好的实用性。 展开更多
关键词 行人重识别 深度学习 多损失函数 多分支结构 特征融合
在线阅读 下载PDF
基于多尺度网络与轴向注意力的3D目标检测算法
9
作者 颜承志 陈颖 +1 位作者 钟凯 高寒 《计算机应用》 北大核心 2025年第8期2537-2545,共9页
在3D目标检测中小目标诸如行人和骑行者的检测精确度较低,这是自动驾驶感知系统中存在的挑战性问题。为了准确估计周围环境的状态从而提高行车安全,对Voxel R-CNN(Voxel Region-based Convolutional Neural Network)算法进行改进,提出... 在3D目标检测中小目标诸如行人和骑行者的检测精确度较低,这是自动驾驶感知系统中存在的挑战性问题。为了准确估计周围环境的状态从而提高行车安全,对Voxel R-CNN(Voxel Region-based Convolutional Neural Network)算法进行改进,提出一种基于多尺度网络与轴向注意力的3D目标检测算法。首先,在主干网络中构建多尺度网络和像素级融合模块(PFM)获取更丰富和精准的特征表示,从而增强算法在复杂场景下的鲁棒性和泛化能力;其次,设计适用于具有3D空间维度特征的轴向注意力,并将它应用于感兴趣区域(RoI)的多尺度池化特征,以在有效捕捉局部和全局特征的同时保留3D空间结构中的重要信息,从而提升算法的目标检测和分类的精度和效率;最后,将一种旋转解耦的交并比(RDIoU)方法纳入回归和分类分支,从而使网络学习更精确的边界框,并解决分类和回归之间的对齐问题。在KITTI公开数据集上的实验结果表明,所提算法对行人和骑行者的平均精度均值(mAP)分别达到了62.25%和79.36%,与基准算法Voxel R-CNN相比分别提高了4.02和3.15个百分点,显示出了改进算法在难感知目标检测上的有效性。 展开更多
关键词 3D目标检测 多尺度网络 特征融合 轴向注意力 损失函数
在线阅读 下载PDF
基于Huber损失函数的改进型数据融合算法
10
作者 徐瑞昆 马娟 《舰船电子对抗》 2025年第4期74-78,84,共6页
针对传统数据融合算法对离群值和噪声存在鲁棒性不足的问题,提出了一种基于Huber损失函数的改进型数据融合方法。通过构建混合范数优化模型,引入Huber损失函数评估传感器可靠性,推导出具有抗离群值特性的动态权重解析解。建立包含离群... 针对传统数据融合算法对离群值和噪声存在鲁棒性不足的问题,提出了一种基于Huber损失函数的改进型数据融合方法。通过构建混合范数优化模型,引入Huber损失函数评估传感器可靠性,推导出具有抗离群值特性的动态权重解析解。建立包含离群值的雷达观测模型,设计了基于Huber损失函数的动态加权数据融合算法。仿真结果验证了该算法的有效性。 展开更多
关键词 Huber损失函数 动态加权融合 鲁棒估计 多雷达跟踪 离群值抑制
在线阅读 下载PDF
基于融合注意力和多尺度特征的热轧带钢表面缺陷检测方法
11
作者 包广清 周芷意 孟庆成 《北京工业大学学报》 北大核心 2025年第8期944-956,共13页
针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,... 针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,引入遗传算法(genetic algorithm, GA)以获得更具代表性的锚框尺寸,并提升模型的回归速度和小面积缺陷检测的精确度。其次,对于边界模糊且背景复杂的缺陷,提出一种目标检测边界框损失函数FocalSIoU,以减少模型中不必要特征的学习,加快检测速度,提升预测框的回归效果。最后,设计一种多尺度特征融合模块(multi-scale feature fusion module, MFFM),通过多尺度信息融合增强模型特征提取能力,提高小目标的检测精确度,并改善模型检测误检率。在模型Head结构中引入空到深(space to depth, SPD)卷积模块对模型进行改进,避免细粒度信息的丢失,降低目标漏检率。通过NEU-DET数据集进行验证,结果表明,SFSP-YOLOv7模型检测的平均精度均值(mean average precision, mAP)为78.3%,相比原YOLOv7模型提升了5.0个百分点,表明提出的检测方法具有有效性。 展开更多
关键词 带钢表面缺陷检测 深度学习 YOLOv7 损失函数 注意力机制 多尺度特征融合
在线阅读 下载PDF
空间域与频域特征融合的电力安全装备检测方法
12
作者 周龙伟 郭鹏程 +3 位作者 张仕勇 彭家从 田斌 袁天霖 《计算机测量与控制》 2025年第7期139-145,共7页
电力安全装备检测对保障作业人员人身安全、降低事故风险和经济损失至关重要;针对电力作业场景背景复杂和样本不均衡导致检测精度不高的问题,提出一种融合空间域与频域特征的双域门控融合检测方法;该方法设计了3种核心技术模块:双域特... 电力安全装备检测对保障作业人员人身安全、降低事故风险和经济损失至关重要;针对电力作业场景背景复杂和样本不均衡导致检测精度不高的问题,提出一种融合空间域与频域特征的双域门控融合检测方法;该方法设计了3种核心技术模块:双域特征增强模块,融合空间域与频域信息,提升细节与边缘感知能力;聚焦融合模块,结合深度可分离卷积与门控机制,聚焦关键区域,优化多尺度特征融合效果;时序平滑滑动损失函数,引入动态加权策略,提升困难样本学习表现并增强检测稳定性;采用RT-DETR作为基线框架,在绝缘手套和工作服数据集上进行了对比实验;实验结果表明,所提方法在绝缘手套与工作服数据集上的mAP_(50)分别提升了3.1和2.4个百分点,在mAP_(50-95)分别提升了2.8和1.8个百分点;所提出的D2GF-DETR在两个数据集上的检测精度较现有主流方法有显著提升,同时保持了较低计算开销。 展开更多
关键词 电力安全装备检测 目标检测算法 RT-DETR 双域特征增强 多尺度特征融合 损失函数
在线阅读 下载PDF
多信号特征融合机制的永磁同步电机故障诊断方法
13
作者 宋开元 辛现伟 《现代制造工程》 北大核心 2025年第10期127-137,158,共12页
针对永磁同步电机在多故障场景下特征提取不充分、时间依赖关系难捕捉及类别不平衡等问题,在1D卷积神经网络(1D Convolutional Neural Network,1D-CNN)基础上,提出了一种基于多信号特征融合机制的永磁同步电机故障诊断方法。首先,通过... 针对永磁同步电机在多故障场景下特征提取不充分、时间依赖关系难捕捉及类别不平衡等问题,在1D卷积神经网络(1D Convolutional Neural Network,1D-CNN)基础上,提出了一种基于多信号特征融合机制的永磁同步电机故障诊断方法。首先,通过多尺度卷积与动态残差连接构建了高效的振动信号和温度信号的特征提取模块,旨在捕捉不同频段的关键信息,增强特征提取的完整性;然后,引入时空门控循环单元与双向注意力机制,充分挖掘电流信号中的多层次时序依赖关系,强化对复杂故障特征的识别能力;最后,利用多信号特征融合与自适应多目标优化损失函数,有效平衡各类样本贡献,并优化了特征空间分布。实验结果表明,提出的改进方法与原始的1D卷积神经网络相比,在不同转速下均具有更高的故障诊断精度和更优的适应性,检测精度、召回率和mAP分别提升了2.3%、1.9%和2.3%,有效解决了多故障类型识别准确率与鲁棒性不足的问题。 展开更多
关键词 永磁同步电机 故障诊断 多尺度卷积 动态残差连接 信号融合 损失函数 注意力机制
在线阅读 下载PDF
基于改进YOLOv7的输电线路多类缺陷目标检测
14
作者 毕含嘉 杨楚睿 +1 位作者 王小雨 黄悦华 《电子科技》 2025年第4期16-24,共9页
针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transfor... 针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transformer模块,通过使用多头注意力机制提升对全局特征的提取效果来提高模型的检测精度。对于待检测目标的多尺度特性,在特征金字塔基础上引入自适应特征融合模块,提升了Neck部分特征融合网络对多类不同尺度缺陷目标的检测能力。使用SIoU(Structured Intersection over Union)损失函数在提高预测框回归精度的同时加快了模型的收敛。实验结果表明,相较于YOLOv5、YOLOv7和Faster R-CNN(Faster Region with Convolutional Neural Network)模型,改进YOLOv7模型具有较高的检测精度,其平均检测精度可达96.4%,检测速度为29.6 frame·s^(-1),能够为输电线路多类缺陷目标检测提供参考。 展开更多
关键词 YOLOv7 深度学习 输电线路缺陷检测 小目标检测 多尺度融合 Swin Transformer β-dropout 自适应特征融合 损失函数
在线阅读 下载PDF
基于改进残差网络的运动目标模糊图像复原方法 被引量:1
15
作者 孙灵 《现代电子技术》 北大核心 2024年第15期86-90,共5页
传统的残差网络在复原运动目标模糊图像时,在模糊程度较严重的情况下,存在特征提取不充分、噪声干扰等问题,导致恢复出的图像无法完全达到原始图像的清晰度和细节。对此,提出基于改进残差网络的运动目标模糊图像复原方法。对采集到的运... 传统的残差网络在复原运动目标模糊图像时,在模糊程度较严重的情况下,存在特征提取不充分、噪声干扰等问题,导致恢复出的图像无法完全达到原始图像的清晰度和细节。对此,提出基于改进残差网络的运动目标模糊图像复原方法。对采集到的运动目标模糊图像,采用多损失函数融合方法改进传统残差块结构,构建编码器-解码器网络训练结构,训练损失函数,提升网络的特征学习能力。通过完成训练的网络,输出运动目标模糊图像复原结果。实验结果表明,该方法复原运动目标模糊图像的峰值信噪比高于30 dB,结构相似性高于0.9。 展开更多
关键词 改进残差网络 运动目标 多损失函数融合 模糊图像 编辑器-解码器网络 复原方法
在线阅读 下载PDF
基于多尺度和注意力机制的红外与可见光图像融合 被引量:4
16
作者 闵莉 田林林 +2 位作者 赵怀慈 刘鹏飞 曹思健 《控制与决策》 EI CSCD 北大核心 2024年第1期227-235,共9页
现有的红外与可见光图像融合算法通常从单一尺度提取图像特征,导致融合图像无法全面保留原始特征信息.针对上述问题,提出一种基于多尺度和注意力机制的自编码网络结构实现红外与可见光图像融合.首先,采用密集连接和多尺度注意力模块构... 现有的红外与可见光图像融合算法通常从单一尺度提取图像特征,导致融合图像无法全面保留原始特征信息.针对上述问题,提出一种基于多尺度和注意力机制的自编码网络结构实现红外与可见光图像融合.首先,采用密集连接和多尺度注意力模块构建编码器网络,并引入自注意力机制增强像素间的依赖关系,充分提取红外图像的显著目标和可见光图像的细节纹理;然后,特征融合阶段采用基于通道与空间的联合注意融合网络,进一步融合图像典型特征;接着,设计基于像素、结构相似性和色彩的混合损失函数指导网络训练,进一步约束融合图像与源图像的相似性;最后,通过对比实验的主观和客观评价结果,验证所提出算法相比于其他代表性融合算法具有更优异的图像融合能力. 展开更多
关键词 图像融合 自编码网络 多尺度注意力模块 注意融合网络 混合损失函数
原文传递
多尺度和卷积注意力相结合的红外与可见光图像融合 被引量:2
17
作者 祁艳杰 侯钦河 《红外技术》 CSCD 北大核心 2024年第9期1060-1069,共10页
针对红外与可见光图像融合时,单一尺度特征提取不足、红外目标与可见光纹理细节丢失等问题,提出一种多尺度和卷积注意力相结合的红外与可见光图像融合算法。首先,设计多尺度特征提取模块和可变形卷积注意力模块相结合的编码器网络,多感... 针对红外与可见光图像融合时,单一尺度特征提取不足、红外目标与可见光纹理细节丢失等问题,提出一种多尺度和卷积注意力相结合的红外与可见光图像融合算法。首先,设计多尺度特征提取模块和可变形卷积注意力模块相结合的编码器网络,多感受野提取红外与可见光图像的重要特征信息。然后,采用基于空间和通道双注意力机制的融合策略,进一步融合红外和可见光图像的典型特征。最后,由3层卷积层构成解码器网络,用于重构融合图像。此外,设计基于均方误差、多尺度结构相似度和色彩的混合损失函数约束网络训练,进一步提高融合图像与源图像的相似性。本算法在公开数据集上与7种图像融合算法进行比较,在主观评价和客观评价方面,所提算法相较其它对比算法具有较好的边缘保持性、源图像信息保留度,较高的融合图像质量。 展开更多
关键词 红外与可见光图像 混合损失函数 多尺度特征提取 注意力机制 图像融合
在线阅读 下载PDF
多层特征融合与语义增强的盲图像质量评价 被引量:2
18
作者 赵文清 许丽娇 +1 位作者 陈昊阳 李梦伟 《智能系统学报》 CSCD 北大核心 2024年第1期132-141,共10页
针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信... 针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信息,进而指导失真图像到质量分数的映射过程;考虑预测分数和主观分数之间的相对排名关系,对L_(1)损失函数和三元组排名损失函数进行融合,构建新的损失函数L_(mix)。为了验证本文方法的有效性,在野生图像质量挑战数据集上进行了验证和对比实验,该算法的斯皮尔曼等级相关系数与皮尔逊线性相关系数指标相比原算法分别提升2.3%和2.3%;在康斯坦茨真实图像质量数据数据集和野生图像质量挑战数据集上进行了跨数据集实验,该算法在面对真实失真图像时表现出了良好的泛化性能。 展开更多
关键词 深度学习 图像质量 卷积神经网络 特征提取 通道注意力结构 多层次特征融合 扩张卷积 三元组损失函数
在线阅读 下载PDF
窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测
19
作者 张荣国 秦震 +2 位作者 胡静 王丽芳 刘小君 《模式识别与人工智能》 EI CSCD 北大核心 2024年第8期663-677,共15页
为了从小目标有限特征中获取关键的有效信息,提升小目标的定位能力和检测精度,文中提出窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测方法.首先,构造偏移受限动态蛇形卷积,在不同方位动态偏移,受限蛇形卷积核自适应地关注不同大小... 为了从小目标有限特征中获取关键的有效信息,提升小目标的定位能力和检测精度,文中提出窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测方法.首先,构造偏移受限动态蛇形卷积,在不同方位动态偏移,受限蛇形卷积核自适应地关注不同大小和形状的特征区域,使特征提取聚焦于微小局部结构,促进小目标特征的捕获.然后,采用双阶段多尺度特征融合方法,对不同层阶特征图进行特征对齐、融合和注入,增强底层细节信息与高层语义信息的融合,并强化不同尺寸目标信息传输,提高小目标的检测能力.与此同时,设计窗口锚定的边界框回归损失函数,基于辅助边界框和最小点距离进行边界回归,获得准确的回归结果,提高小目标的定位能力.最后,在3个航拍数据集上的实验表明,文中方法对小目标的检测性能有不同程度的改善和提高. 展开更多
关键词 小目标检测 特征提取 特征融合 多尺度特征 边界框回归损失函数
在线阅读 下载PDF
基于多层特征融合的行人检测方法研究 被引量:2
20
作者 黄玲娃 崔文成 邵虹 《计算机科学》 CSCD 北大核心 2024年第S02期479-485,共7页
针对遮挡行人检测识别困难、检测精度低,以及漏检率高等问题,在YOLOv7方法的基础上进行结构优化,提出了一种基于多层特征融合的行人检测网络模型,旨在提高遮挡行人检测的准确性。该方法是在主干网络特征提取部分采用ELAN-C模块,以增强... 针对遮挡行人检测识别困难、检测精度低,以及漏检率高等问题,在YOLOv7方法的基础上进行结构优化,提出了一种基于多层特征融合的行人检测网络模型,旨在提高遮挡行人检测的准确性。该方法是在主干网络特征提取部分采用ELAN-C模块,以增强行人特征信息的提取能力,从而提高行人检测的准确性。同时,在多尺度特征融合部分引入全局注意力机制构成多层特征融合,通过跨维度的信息交互,特别是对位置信息的关注,增强检测目标特征的表征,提高行人检测的准确性。此外,为了加速模型的收敛速度,采用EIoU作为损失函数,进一步提升检测框的定位精度。在公开数据集CityPresons上进行训练验证,模型对数平均漏检率MR-2下降,Bare,Partial,Reasonable,Heavy分别下降0.55%,0.91%,1.78%,1.68%,有效减少了漏检率。 展开更多
关键词 YOLOv7 行人检测 特征提取 多尺度融合 损失函数优化
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部