期刊文献+
共找到1,285篇文章
< 1 2 65 >
每页显示 20 50 100
Multi-Scale Vision Transformer with Dynamic Multi-Loss Function for Medical Image Retrieval and Classification
1
作者 Omar Alqahtani Mohamed Ghouse +2 位作者 Asfia Sabahath Omer Bin Hussain Arshiya Begum 《Computers, Materials & Continua》 2025年第5期2221-2244,共24页
This paper introduces a novel method for medical image retrieval and classification by integrating a multi-scale encoding mechanism with Vision Transformer(ViT)architectures and a dynamic multi-loss function.The multi... This paper introduces a novel method for medical image retrieval and classification by integrating a multi-scale encoding mechanism with Vision Transformer(ViT)architectures and a dynamic multi-loss function.The multi-scale encoding significantly enhances the model’s ability to capture both fine-grained and global features,while the dynamic loss function adapts during training to optimize classification accuracy and retrieval performance.Our approach was evaluated on the ISIC-2018 and ChestX-ray14 datasets,yielding notable improvements.Specifically,on the ISIC-2018 dataset,our method achieves an F1-Score improvement of+4.84% compared to the standard ViT,with a precision increase of+5.46% for melanoma(MEL).On the ChestX-ray14 dataset,the method delivers an F1-Score improvement of 5.3%over the conventional ViT,with precision gains of+5.0% for pneumonia(PNEU)and+5.4%for fibrosis(FIB).Experimental results demonstrate that our approach outperforms traditional CNN-based models and existing ViT variants,particularly in retrieving relevant medical cases and enhancing diagnostic accuracy.These findings highlight the potential of the proposedmethod for large-scalemedical image analysis,offering improved tools for clinical decision-making through superior classification and case comparison. 展开更多
关键词 Medical image retrieval vision transformer multi-scale encoding multi-loss function ISIC-2018 ChestX-ray14
在线阅读 下载PDF
频率感知驱动的深度鲁棒图像水印
2
作者 张国富 李鑫 +2 位作者 苏兆品 方涵 廉晨思 《中国图象图形学报》 北大核心 2026年第1期197-211,共15页
目的近年来,基于深度学习的水印方法得到了广泛研究。现有方法通常对特征图的低频和高频部分同等对待,忽视了不同频率成分之间的重要差异,导致模型在处理多样化攻击时缺乏灵活性,难以同时实现水印的高保真性和强鲁棒性。为此,本文提出... 目的近年来,基于深度学习的水印方法得到了广泛研究。现有方法通常对特征图的低频和高频部分同等对待,忽视了不同频率成分之间的重要差异,导致模型在处理多样化攻击时缺乏灵活性,难以同时实现水印的高保真性和强鲁棒性。为此,本文提出一种频率感知驱动的深度鲁棒图像水印技术(deep robust image watermarking driven by frequency awareness,RIWFP)。方法通过差异化机制处理低频和高频成分,提升水印性能。具体而言,低频成分通过小波卷积神经网络进行建模,利用宽感受野卷积在粗粒度层面高效学习全局结构和上下文信息;高频成分则采用深度可分离卷积和注意力机制组成的特征蒸馏块进行精炼,强化图像细节,在细粒度层面高效捕捉高频信息。此外,本文使用多频率小波损失函数,引导模型聚焦于不同频带的特征分布,进一步提升生成图像的质量。结果实验结果表明,提出的频率感知驱动的深度鲁棒图像水印技术在多个数据集上均表现出优越性能。在COCO(common objects in context)数据集上,RIWFP在随机丢弃攻击下的准确率达到91.4%;在椒盐噪声和中值滤波攻击下,RIWFP分别以100%和99.5%的准确率达到了最高水平,展现了其对高频信息的高效学习能力。在Ima⁃geNet数据集上,RIWFP在裁剪攻击下的准确率为93.4%;在JPEG压缩攻击下的准确率为99.6%,均显著优于其他对比方法。综合来看,RIWFP在COCO和ImageNet数据集上的平均准确率分别为96.7%和96.9%,均高于其他对比方法。结论本文所提方法通过频率感知的粗到细处理策略,显著增强了水印的不可见性和鲁棒性,在处理多种攻击时表现出优越性能。 展开更多
关键词 鲁棒图像水印 小波卷积神经网络 深度可分离卷积 注意力机制 多频率小波损失
原文传递
融合视觉Mamba与自适应多尺度损失的医学图像分割
3
作者 刘建明 曹圣浩 张志鹏 《中国图象图形学报》 北大核心 2026年第1期335-348,共14页
目的在医学图像分割领域,传统基于卷积神经网络(convolutional neural network,CNN)的模型在捕捉长距离依赖信息方面存在固有局限,而基于视觉Transformer(vision Transformer,ViT)的模型其自注意力机制的计算复杂度与图像尺寸呈平方关系... 目的在医学图像分割领域,传统基于卷积神经网络(convolutional neural network,CNN)的模型在捕捉长距离依赖信息方面存在固有局限,而基于视觉Transformer(vision Transformer,ViT)的模型其自注意力机制的计算复杂度与图像尺寸呈平方关系,在资源有限的现实环境中难以部署。为了解决这些问题,提出一种融合视觉Mamba和自适应多尺度损失的医学图像分割方法VMAML-UNet(medical image segmentation with vision Mamba and adaptive multi-scale loss)。方法VMAML-UNet采用编码器—解码器架构。在编码阶段,设计了融合小波卷积的视觉Mamba块,以线性复杂度提取病变区域的精确特征并扩大感受野,并通过块合并进行下采样。解码阶段同样引入融合小波卷积的视觉Mamba块并利用块扩展进行上采样。跳跃连接中,提出小波卷积注意力聚合模块,用于提取并融合不同尺度下的图像特征。此外,设计了柯尔莫哥洛夫—阿诺德网络(Kolmogorov-Arnold network,KAN)调控多尺度加权损失,动态调控各层级损失权重。结果在BUSI(breast ultrasound images dataset)、GlaS(gland segmenta⁃tion in histology images challenge dataset)和CVC(CVC-ClinicDB dataset)3个异质性显著的医学图像数据集上的实验结果表明,与主流的VM-UNet(vision Mamba UNet)等采用Mamba的医学图像分割方法相比取得显著的性能提升。在BUSI数据集上,交并比(intersection over union,IoU)和F1分数分别提升2.72%和2.02%;在GlaS数据集上,IoU和F1分数分别提升3.38%和1.89%;在CVC数据集上,IoU和F1分数分别提升2.51%和1.42%。结论提出的VMAML-UNet采用基于视觉Mamba的线性复杂度的长距离依赖建模与基于KAN的动态损失优化机制,显著减少了计算成本,同时提升了模型对复杂医学图像的分割精度。该模型在3个数据集上的优异表现证明了其在不同医学图像场景下的广泛适用性和高效性。 展开更多
关键词 状态空间模型(SSM) 柯尔莫哥洛夫-阿诺德网络(KAN) 小波卷积 多尺度加权损失 连续流
原文传递
基于改进YOLO11n模型的自动驾驶道路交通检测算法研究
4
作者 田晟 赵凯龙 苗佳霖 《广西师范大学学报(自然科学版)》 北大核心 2026年第1期1-9,共9页
随着自动驾驶技术的快速发展,道路交通检测作为感知模块的核心任务,直接影响自动驾驶系统的安全性与可靠性,当前基于深度学习方法作为研究的热点,却仍存在检测精度低、模型泛化性差等问题。为解决这些问题,本文提出一种改进YOLO11n模型... 随着自动驾驶技术的快速发展,道路交通检测作为感知模块的核心任务,直接影响自动驾驶系统的安全性与可靠性,当前基于深度学习方法作为研究的热点,却仍存在检测精度低、模型泛化性差等问题。为解决这些问题,本文提出一种改进YOLO11n模型的道路交通检测方法。该方法通过增加小目标检测层提高对小目标的检测精度,引入GhostConv+DWConv检测头结构,组合优化现有的双DWConv结构,并设计更适合小目标的Inner-CIoU损失函数,增强模型的泛化性,提高边界框回归的准确性。实验结果显示,与现有YOLO11n算法相比,该模型在KITTI和BDD100K数据集上的检测精度分别提升1.1个百分点和1.9个百分点,并达到125帧/s和124帧/s的检测速度,提升了低分辨率小目标检测的有效性,在不同交通场景下具有良好的泛化性。 展开更多
关键词 自动驾驶 小目标检测 YOLO11 多尺度检测 损失函数
在线阅读 下载PDF
基于粒子群优化算法的分区式磁场调制电机多目标优化设计
5
作者 吉敬华 王鹤 +1 位作者 赵文祥 凌志健 《电气工程学报》 北大核心 2026年第1期160-169,共10页
分区式磁场调制(Partitioned stator flux modulation,PSFM)电机气隙中含有丰富的谐波分量,不可避免产生较多铁耗。而凸极调制齿结构具有抑制铁损的作用,但也对电机其他性能产生一定影响,故采用基于粒子群优化算法的多目标优化设计以得... 分区式磁场调制(Partitioned stator flux modulation,PSFM)电机气隙中含有丰富的谐波分量,不可避免产生较多铁耗。而凸极调制齿结构具有抑制铁损的作用,但也对电机其他性能产生一定影响,故采用基于粒子群优化算法的多目标优化设计以得到性能最优的转子拓扑结构。通过分析永磁磁场与电枢反应磁场的谐波耦合过程,基于气隙磁场调制理论,揭示了电磁转矩产生机理。同时,研究了凸极调磁块对电机电磁性能的影响,探明了该拓扑结构在非工作谐波抑制方面的优势。其次,根据转子调磁环拓扑结构参数,以平均转矩、铁耗和转矩脉动为设计目标,结合响应面模型(Response surface methodology,RSM)和粒子群优化算法(Particle swarm optimization,PSO)进行了多目标优化设计。此外,基于有限元仿真,比较了优化前后分区式磁场调制电机的电磁性能,表明所采用方法具有良好的铁损抑制效果。最后,制作了样机并进行测试,验证了理论分析的正确性。 展开更多
关键词 分区式磁场调制电机 气隙磁场调制 铁损 多目标优化设计 粒子群优化算法
在线阅读 下载PDF
隔磁孔转子结构永磁同步电机效率与振动噪声优化设计
6
作者 谢颖 耿高旭 +3 位作者 蔡蔚 朱克非 吴宇轩 杨跃 《中国电机工程学报》 北大核心 2026年第2期789-798,I0029,共11页
工农业生产对永磁同步电机的效率和振动噪声性能提出了更高标准的要求,旨在生产过程中实现更高的能源利用效率和更低的环境噪声水平。文章基于多物理场有限元分析平台与永磁同步电机实验平台,对一台内置式永磁同步电机进行研究。基于电... 工农业生产对永磁同步电机的效率和振动噪声性能提出了更高标准的要求,旨在生产过程中实现更高的能源利用效率和更低的环境噪声水平。文章基于多物理场有限元分析平台与永磁同步电机实验平台,对一台内置式永磁同步电机进行研究。基于电机q轴切边转子的结构特点和磁路结构,提出一种具有隔磁孔结构的新型转子,该结构可以减小漏磁、提升主磁通,有利于降低损耗、提高效率,并降低径向电磁力密度幅值、减小振动噪声。针对该结构,结合遗传进化算法,以电机电磁力密度幅值、永磁体用量、输出转矩、转矩脉动为优化目标进行多目标优化。最后,对比分析优化前后电机的效率和振动噪声等性能,基于优选参数制造优化后的样机,并进行空载、负载和振动噪声实验,实验结果验证了电机新型转子结构的有效性和优化分析的正确性。 展开更多
关键词 内置式永磁同步电机 损耗 效率 振动噪声 多目标优化
原文传递
基于多尺度卷积和通道注意力机制的网络流量异常检测方法
7
作者 付钰 王玉珏 +2 位作者 俞艺涵 刘涛涛 安义帅 《通信学报》 北大核心 2026年第1期184-200,共17页
针对传统网络流量异常检测方法受限于模型表达能力较弱、数据类不平衡等问题,提出了一种融合多尺度卷积与通道注意力机制的网络流量异常检测方法。首先,设计金字塔卷积模块捕捉网络流量的多尺度特征,有效提升分类性能;其次,利用通道注... 针对传统网络流量异常检测方法受限于模型表达能力较弱、数据类不平衡等问题,提出了一种融合多尺度卷积与通道注意力机制的网络流量异常检测方法。首先,设计金字塔卷积模块捕捉网络流量的多尺度特征,有效提升分类性能;其次,利用通道注意力机制增强模型对异常流量敏感特征的通道响应,提高特征的可辨别性,从而抑制噪声干扰;最后,通过改进均衡损失函数调整不同类别权重系数,从而缓解数据集中的类不平衡问题。在NSL-KDD和CIC-IDS-2017数据集上开展了一系列实验,实验结果表明,所提方法取得了较好的分类结果,准确率分别为99.45%和99.95%,同时误报率仅为0.50%和0.02%。 展开更多
关键词 网络流量异常检测 多尺度卷积 注意力机制 均衡损失函数
在线阅读 下载PDF
双支特征融合的带约束的多损失视频异常检测
8
作者 韩磊 商浩宇 +3 位作者 钱小燕 顾妍 刘青松 王闯 《计算机科学》 北大核心 2026年第2期236-244,共9页
针对视频异常事件的时空相关性学习对检测性能存在重要影响的问题,提出了基于融合双支特征的带约束损失的视频异常检测方法(Dual-branch Feature Fusion Based Constrained Multi-loss Video Anomaly Detection,DBF-CML-transMIL)。该... 针对视频异常事件的时空相关性学习对检测性能存在重要影响的问题,提出了基于融合双支特征的带约束损失的视频异常检测方法(Dual-branch Feature Fusion Based Constrained Multi-loss Video Anomaly Detection,DBF-CML-transMIL)。该方法考虑多示例学习中片段的显著性和相关性,利用多层线性神经网络学习各片段的空间显著性特征,并设计级联Transformer融合模块来学习示例间的多层时序相关性;然后利用多损失模型对融合特征进行多loss监督学习,以丰富预测的多样性;针对现有top-k的离散性问题,提出了带约束机制的滑窗top-k强化异常事件的相关性。在ShanghaiTech和UCF-Crime数据集上的对比实验与消融实验表明,DBF-CML-transMIL的异常检测曲线下面积(Area Under Curve,AUC)分别达到97.33%和83.82%;各模块都能有效提升视频异常事件检测的性能。 展开更多
关键词 视频异常检测 多示例学习 级联注意力机制 多损失函数 滑窗top-k
在线阅读 下载PDF
基于YOLOv8改进的河道漂浮物检测算法
9
作者 王晓辉 吕方哲 +3 位作者 郭丰娟 宋可欣 刘为群 贾韫硕 《计算机工程与设计》 北大核心 2026年第1期64-72,共9页
为解决无人水面艇在清理河道垃圾过程中面临的挑战,如目标尺寸多样、形状复杂、光照变化多端以及水面反射干扰等问题,提出一种基于YOLOv8m的改进模型。通过引入RFCBAMConv模块增强多尺度特征提取能力,采用C2f_DeepDBB模块优化模型结构... 为解决无人水面艇在清理河道垃圾过程中面临的挑战,如目标尺寸多样、形状复杂、光照变化多端以及水面反射干扰等问题,提出一种基于YOLOv8m的改进模型。通过引入RFCBAMConv模块增强多尺度特征提取能力,采用C2f_DeepDBB模块优化模型结构。同时提出了Wise-Focaler-ShapeIoU损失函数,提升回归精度。实验结果表明,改进模型在公开数据集FloW-Img上mAP@0.5达0.893,mAP@0.5∶0.95达0.465,相较YOLOv8m分别提升了3.3%和2.8%,在map@0.5∶0.95上相较现有算法提升了1.4%,验证了其在河道漂浮物检测任务中的有效性和适应性。 展开更多
关键词 河道漂浮物检测 深度多分支模块 多尺度特征 YOLOv8 神经网络 深度学习 损失函数
在线阅读 下载PDF
一种抗遮挡重叠与尺度变化的行人检测算法
10
作者 马晞茗 李宁 吴迪 《现代电子技术》 北大核心 2026年第1期41-48,共8页
针对复杂人群密集场景中因行人目标受遮挡和行人目标尺度不一等因素导致行人检测器检测精度下降、漏检率变高的问题,基于Faster R-CNN算法进行改进,提出一种抗遮挡重叠与尺度变化的行人检测算法。在特征提取环节,设计一种融合注意力机... 针对复杂人群密集场景中因行人目标受遮挡和行人目标尺度不一等因素导致行人检测器检测精度下降、漏检率变高的问题,基于Faster R-CNN算法进行改进,提出一种抗遮挡重叠与尺度变化的行人检测算法。在特征提取环节,设计一种融合注意力机制的循环多尺度特征提取网络,用于学习更为丰富细致的多尺度特征信息,并重点聚焦于关键特征信息,提升网络对不同尺度行人目标的灵敏度;对于损失函数模块,引入斥力损失以降低目标相互遮挡对检测造成的干扰;在后处理环节,设计一种基于遮挡重叠率补偿的非极大值抑制算法,使得实际的抑制阈值能够随着遮挡程度的变化而自适应调整,从而进一步降低密集处行人目标的漏检率。实验结果表明:改进后算法的检测性能更为出色,在CrowdHuman和CityPersons数据集上的检测平均精度相比基准算法分别提升了2.5%和1.9%,对数平均漏检率分别降低了3.5%和3.2%,在TJU-DHD-pedestrian数据集上不同尺度行人目标的对数平均漏检率也得到较为明显的降低,所提算法可以适用于复杂场景中的行人检测。 展开更多
关键词 行人检测 人群密集场景 Faster R-CNN 多尺度特征融合 损失函数 非极大值抑制
在线阅读 下载PDF
基于KAN多损失神经网络的MEMS陀螺仪校准
11
作者 孟庆浩 杨铭 李云开 《中国惯性技术学报》 北大核心 2026年第1期52-59,共8页
针对微机电系统(MEMS)陀螺仪因零偏漂移、比例因子偏差及轴间耦合等非线性误差导致的校准精度下降问题,提出了一种基于KAN多损失神经网络的高精度校准方法。该方法以KAN表示定理为理论基础,利用可学习样条函数构建非线性映射,实现对复... 针对微机电系统(MEMS)陀螺仪因零偏漂移、比例因子偏差及轴间耦合等非线性误差导致的校准精度下降问题,提出了一种基于KAN多损失神经网络的高精度校准方法。该方法以KAN表示定理为理论基础,利用可学习样条函数构建非线性映射,实现对复杂误差的显式建模。在结构上设计了轻量化的双层KAN框架,并引入多损失函数以同时优化三轴角速度误差与总角速度误差,从而在训练过程中平衡局部精度与全局一致性。实验结果表明,在相同参数规模下,所提方法相较于传统线性校准模型与多层感知机模型,三轴平均绝对误差降低约一个数量级,总角速度均方误差减少超过85%,模型在抗噪性与泛化性能方面表现优异。所提方法能显著提升MEMS陀螺仪的校准精度,为非线性误差补偿与惯性传感器建模提供了理论与技术途径。 展开更多
关键词 陀螺仪标定 深度学习 多损失函数 KAN网络 误差补偿
在线阅读 下载PDF
计及元件多状态的电-气互联系统连锁故障风险评估
12
作者 南璐 马镱洋 何川 《电力系统自动化》 北大核心 2026年第1期130-142,共13页
随着电力系统和天然气系统耦合关系的愈加深化,跨系统连锁故障风险日益凸显,威胁了互联系统的安全稳定运行。为此,文中提出一种考虑元件多状态的电-气互联系统连锁故障风险评估方法。首先,以最小化失负荷、输电线路退出运行和输气管道... 随着电力系统和天然气系统耦合关系的愈加深化,跨系统连锁故障风险日益凸显,威胁了互联系统的安全稳定运行。为此,文中提出一种考虑元件多状态的电-气互联系统连锁故障风险评估方法。首先,以最小化失负荷、输电线路退出运行和输气管道断裂成本为目标函数,提出考虑元件多状态的电-气互联系统连锁故障仿真模型;其次,建立多状态元件故障概率模型以计算事故发生概率;最后,提出综合考虑互联系统失负荷严重度的电-气互联系统连锁故障风险评估方法。采用IEEE 24节点电力系统和比利时20节点天然气系统构成的电-气互联系统作为算例,验证了所提模型和方法的有效性。 展开更多
关键词 电-气互联系统 连锁故障 多状态元件 失负荷 风险评估
在线阅读 下载PDF
改进YOLOv11s的无人机图像小目标检测模型
13
作者 牟毅 黄海松 +3 位作者 李宜汀 付盛伟 李科 朱云伟 《电光与控制》 北大核心 2026年第1期51-57,共7页
为解决无人机目标检测中小尺寸、密集目标检测困难及在边缘设备部署困难的问题,提出了小目标检测模型Drone-YOLO。首先,提出了MF-FPN网络,在降低模型复杂度的同时融合高级语义与低级几何特征;其次,为解决小目标、密集目标难以检测问题... 为解决无人机目标检测中小尺寸、密集目标检测困难及在边缘设备部署困难的问题,提出了小目标检测模型Drone-YOLO。首先,提出了MF-FPN网络,在降低模型复杂度的同时融合高级语义与低级几何特征;其次,为解决小目标、密集目标难以检测问题提出了小目标检测头;而后,提出轻量化检测头LSCD,通过共享卷积降低模型复杂度,并利用组归一化提升检测性能;最后,引入Inner-WIoU损失函数,动态调整锚框权重,使模型更专注于中等质量锚框优化,从而提升回归效率与泛化能力。在公开数据集VisDrone2019上进行实验,改进后模型的mAP 0.5达到44.3%,较YOLOv11s提升6.4个百分点,参数量减少67.5%。 展开更多
关键词 无人机 小目标检测 YOLOv11s 多尺度特征融合 轻量化 损失函数
在线阅读 下载PDF
基于NSGA-Ⅱ算法的多腔室消声器结构优化
14
作者 蔡紫晴 陈跃华 +2 位作者 郑佳晖 白杨 令狐世勋 《噪声与振动控制》 北大核心 2026年第1期281-287,共7页
针对多腔室消声器结构的优化问题,提出一种基于快速非支配排序的多腔室消声器多目标结构优化方法。首先,构建基于Chebyshev-变分法的多腔室消声器三维理论模型,并通过能量方程和瑞利-里兹法计算得到传递损失结果;其次,建立消声器传递损... 针对多腔室消声器结构的优化问题,提出一种基于快速非支配排序的多腔室消声器多目标结构优化方法。首先,构建基于Chebyshev-变分法的多腔室消声器三维理论模型,并通过能量方程和瑞利-里兹法计算得到传递损失结果;其次,建立消声器传递损失实验平台和有限元模型,将实验结果、有限元结果与计算结果进行对比验证;最后,采用快速非支配排序多目标遗传算法(NSGA-Ⅱ),对多腔室消声器的6个轴向参数和2个径向参数进行优化。结果表明:传递损失计算结果与有限元结果最大相对误差为2.12%,实验结果与计算结果在全频段范围内基本吻合,证明了多腔室消声器三维理论模型和求解方法的正确性。此外,得到以最大平均传递损失及传递损失和为目标的系列Pareto优化解集,并确定了可实现全频段内消声性能最优的多腔室消声器结构参数,优化后消声器的传递损失提高48.05 dB。以上研究可为多腔室消声器结构优化提供参考。 展开更多
关键词 声学 多腔室消声器 多目标优化算法 传递损失 结构优化
在线阅读 下载PDF
基于多层次特征提取的细粒度图像哈希检索方法
15
作者 王森立 李梓杨 +2 位作者 李雪 陈鹏程 王鑫 《微电子学与计算机》 2026年第1期75-88,共14页
在细粒度图像检索领域,现有研究成果主要集中于采用深层网络实现判别特征提取与精准定位,忽略了浅层特征信息的重要性,且无法消除背景中的复杂噪声干扰,限制了检索性能的提升。有鉴于此,提出了一种基于多层次特征提取的细粒度图像哈希... 在细粒度图像检索领域,现有研究成果主要集中于采用深层网络实现判别特征提取与精准定位,忽略了浅层特征信息的重要性,且无法消除背景中的复杂噪声干扰,限制了检索性能的提升。有鉴于此,提出了一种基于多层次特征提取的细粒度图像哈希检索方法(Fine-grained Deep Hashing image retrieval method based on Multi-level Feature Extraction, FDH-MFE)。该方法主要关注不同层次间特征的关联性,并增强了局部特征的提取能力。首先,提出了一个特征提取模块,旨在从网络的不同阶段提取细粒度特征,并通过图神经网络揭示其潜在的长距离依赖关系,为后续阶段提供更全面和精细的特征表示。其次,设计了一种代理损失算法,使得哈希码分布更加均匀,从而提升细粒度特征的区分能力。最后,通过设计背景抑制算法并结合三元组损失,增强了模型拟合全局分布的能力,使得所提出的方法在细粒度图像检索任务中表现出色。实验结果表明:该方法在4个公开数据集上的平均检索精度相较于次先进方法分别提高了15.03%、10.94%、9.98%和9.78%。 展开更多
关键词 细粒度图像检索 特征提取 多尺度注意力 哈希损失
在线阅读 下载PDF
基于多尺度特征融合的航拍小目标检测算法
16
作者 赖来运 白东昊 +1 位作者 叶子豪 刘海龙 《湖北大学学报(自然科学版)》 2026年第2期219-229,共11页
针对无人机航拍图像中小目标检测面临的复杂背景干扰和高漏检率等问题,提出一种基于RT-DETR改进的多尺度小目标检测算法MSD-DETR。从特征提取、融合与优化三方面实现:1)设计双域协同注意力模块(DDSA),融合空间频率注意力(SFA)与通道转... 针对无人机航拍图像中小目标检测面临的复杂背景干扰和高漏检率等问题,提出一种基于RT-DETR改进的多尺度小目标检测算法MSD-DETR。从特征提取、融合与优化三方面实现:1)设计双域协同注意力模块(DDSA),融合空间频率注意力(SFA)与通道转置注意力(CTA),提升小目标高频细节捕捉能力;2)构建多尺度特征金字塔,引入旋转卷积核的PConv算子实现异构特征融合,结合面向边缘优化的MOFM模块,强化跨尺度特征交互与高频细节恢复;3)提出几何解耦的Focal-MPDIoU损失函数,通过关键点距离约束优化边界框回归,显著降低密集场景误检率。在VisDrone2019数据集上的实验结果表明,改进后的模型在mAP@0.5指标上达到了50.6%,相比原模型提升了4.5%,同时参数量减少了13.6%,有效改善了无人机航拍图像中的小目标漏检和误检问题。 展开更多
关键词 小目标检测 RT-DETR 无人机航拍图像 多尺度特征融合 损失函数
在线阅读 下载PDF
基于多属性自适应聚合网络架构的车辆重识别
17
作者 樊星 葛菲 +1 位作者 贾文文 肖方伟 《上海交通大学学报》 北大核心 2026年第1期123-132,共10页
针对车辆重识别任务中车辆目标的类内差异性及类间相似性导致的特征感知能力不足和重识别准确度降低的问题,提出一种基于多属性自适应聚合网络(MaAPN)架构的车辆重识别方法.首先以ResNet-50网络为特征提取骨干网络,并通过引入实例批量... 针对车辆重识别任务中车辆目标的类内差异性及类间相似性导致的特征感知能力不足和重识别准确度降低的问题,提出一种基于多属性自适应聚合网络(MaAPN)架构的车辆重识别方法.首先以ResNet-50网络为特征提取骨干网络,并通过引入实例批量归一化(IBN)自适应模块提取域适应性强的特征表示;然后,将摄像机视角、车辆类型和车辆颜色等属性集成至网络中,构建多属性自注意特征强化模型,提升特征表示的鲁棒性与可辨别性;最后,设计一种综合损失函数,通过优化样本间的特征距离,进一步提升网络模型的精度.结果表明,在VeRi-776数据集与VERI-Wild数据集上,MaAPN架构平均精度分别达到了87.3%和86.9%,在各类评价指标上均取得了最优结果,有效提升了车辆重识别任务的准确度. 展开更多
关键词 车辆重识别 特征自适应 多属性聚合 圆损失函数
在线阅读 下载PDF
基于改进Informer模型的无人机姿态估计方法
18
作者 肖蘅 包乃源 +1 位作者 周文 杨亚婷 《现代电子技术》 北大核心 2026年第4期57-63,共7页
传统无人机姿态估计方法由于传感器精度不高和设备成本限制,难以满足复杂环境中的精确需求。为此,提出一种基于改进Informer模型的无人机姿态估计方法,引入多尺度时间注意力机制和动态时间规整(DTW)损失函数,提升模型在长序列数据处理... 传统无人机姿态估计方法由于传感器精度不高和设备成本限制,难以满足复杂环境中的精确需求。为此,提出一种基于改进Informer模型的无人机姿态估计方法,引入多尺度时间注意力机制和动态时间规整(DTW)损失函数,提升模型在长序列数据处理和动态飞行数据适应方面的能力。此外,采用遗传算法对模型超参数进行优化,显著提高了复杂飞行数据处理的准确性和鲁棒性。基于苏黎世大学机器人实验室发布的UZH-FPV竞赛数据集,将改进后的Informer模型与LSTM、GRU和DNN模型进行了实验对比。结果表明,改进Informer模型在无人机的俯仰角、滚转角和偏航角估计方面均显著优于其他对比模型。 展开更多
关键词 无人机姿态估计 Informer模型 多尺度时间注意力机制 动态时间规整损失函数 遗传算法优化 长序列数据处理
在线阅读 下载PDF
基于智能体的图像风格迁移网络构建与优化
19
作者 陆盈嘉 《移动信息》 2026年第2期163-166,共4页
基于智能体的图像风格迁移网络依靠多智能体协作框架和层次化组织结构,实现了传统风格迁移技术的突破。文中通过构建Transformer融合CNN的混合架构,集成Mamba注意力混合器等关键算法,借助粒子群优化算法的自适应权重调节和收敛加速机制... 基于智能体的图像风格迁移网络依靠多智能体协作框架和层次化组织结构,实现了传统风格迁移技术的突破。文中通过构建Transformer融合CNN的混合架构,集成Mamba注意力混合器等关键算法,借助粒子群优化算法的自适应权重调节和收敛加速机制,显著提升了训练效率,并基于多目标联合优化损失函数保证了内容与风格的精确平衡,最后通过实验验证了智能体协作机制的有效性。 展开更多
关键词 智能体协作框架 图像风格迁移 粒子群优化 多目标损失函数
在线阅读 下载PDF
基于改进YOLOv12的煤矸石智能识别方法
20
作者 周伟 李广棵 《工矿自动化》 北大核心 2026年第1期106-113,139,共9页
针对矿井粉尘浓度大、光照多变等复杂环境因素导致难以准确、高效识别煤矸石的问题,在YOLOv12网络模型基础上进行改进,提出了一种基于改进YOLOv12的煤矸石智能识别方法。通过设计双尺度稀疏注意力(DSSA)机制,提升了模型对多尺度煤矸石... 针对矿井粉尘浓度大、光照多变等复杂环境因素导致难以准确、高效识别煤矸石的问题,在YOLOv12网络模型基础上进行改进,提出了一种基于改进YOLOv12的煤矸石智能识别方法。通过设计双尺度稀疏注意力(DSSA)机制,提升了模型对多尺度煤矸石目标区域的关注力与空间感知能力;设计了多条件特征精炼(MCFR)机制,对深层和浅层特征进行条件引导融合,有效增强煤炭与煤矸石的类别差异性表达;构建了动态多任务平衡损失(DMTBL)函数,实现位置、类别与置信度之间的权重自适应调节,从而增强模型对难样本区域的学习能力。实验结果表明,改进YOLOv12在煤矸石识别任务中的识别精准率、召回率和mAP分别达96.5%,94.9%,95.8%,较原始YOLOv12分别提升了3.8%,4.5%,4.5%,有效解决了煤矸石漏检、误检和边界模糊等问题,且保持高达47.7帧/s的推理速度。可视化激活热力图表明,改进YOLOv12在处理不同结构与纹理复杂度的煤矸石时,均能准确聚焦于目标本体区域,无明显背景干扰,激活区域基本覆盖了煤块与煤矸石的主要轮廓。 展开更多
关键词 煤矸石识别 改进YOLOv12 双尺度稀疏注意力 多条件特征精炼 动态多任务平衡损失
在线阅读 下载PDF
上一页 1 2 65 下一页 到第
使用帮助 返回顶部