期刊文献+
共找到5,942篇文章
< 1 2 250 >
每页显示 20 50 100
FEC-PVT:基于PVT架构的甲骨钻凿图像分割网络
1
作者 刘国奇 李文格 +3 位作者 茹琳媛 宋黎明 刘杰 韩燕彪 《河南师范大学学报(自然科学版)》 北大核心 2026年第1期8-16,I0003,共10页
由于长时间埋藏于地下和风化腐蚀,造成甲骨片破损和甲骨钻凿边界模糊不易分辨,给甲骨钻凿分割带来极大挑战.从甲骨数据库及著录书中系统收集并标注甲骨钻凿图像.基于该数据集,提出一种以Transformer为编码器的甲骨钻凿分割网络FEC-PVT(f... 由于长时间埋藏于地下和风化腐蚀,造成甲骨片破损和甲骨钻凿边界模糊不易分辨,给甲骨钻凿分割带来极大挑战.从甲骨数据库及著录书中系统收集并标注甲骨钻凿图像.基于该数据集,提出一种以Transformer为编码器的甲骨钻凿分割网络FEC-PVT(feature extraction and connection pyramid vision transformer).首先,FEC-PVT利用FE_C和FE_D模块分别补充低层和高层特征,以获取细节和全局特征;其次,FCOM模块用交叉注意力让不同层特征交互,获取有效细节;最后,FFDM模块逐层解码并整合多层次特征,提升解码精度,避免特征丢失.实验验证,所提FEC-PVT优于其他的方法,与次优的DuAT方法相比,IoU提高5.18%. 展开更多
关键词 图像分割 甲骨钻凿 金字塔视觉变换器 卷积神经网络
在线阅读 下载PDF
自适应特征的轻量化路面裂缝检测方法
2
作者 刘媛媛 朱凯 +3 位作者 顾志辉 岳猛 王靖智 朱路 《光学精密工程》 北大核心 2026年第2期336-351,共16页
针对路面裂缝形态复杂、易受环境干扰,且检测存在精度与轻量化不平衡等问题,本文提出一种自适应特征的轻量化路面裂缝检测方法。首先,根据裂缝狭长且跨度大的特点,设计了裂缝高效注意力机制,通过压缩特征维度,以捕捉其长距离空间依赖。... 针对路面裂缝形态复杂、易受环境干扰,且检测存在精度与轻量化不平衡等问题,本文提出一种自适应特征的轻量化路面裂缝检测方法。首先,根据裂缝狭长且跨度大的特点,设计了裂缝高效注意力机制,通过压缩特征维度,以捕捉其长距离空间依赖。其次,构建动态采样金字塔进行自适应采样和提取目标特征,以增强对异构裂缝特征的表示能力。然后,改进HGNet_GS轻量化主干网络,并提出了轻量化检测头,显著降低了计算冗余;采用Powerful IoU损失函数解决框锚膨胀问题并提升小模型的收敛速度。此外为验证模型泛化性,自建了民用路面缺陷数据集,其中包含不同光照条件下路面缺陷共计2985张。实验结果表明,与基准模型YOLOv8n相比,本文模型参数量和计算量分别减少了50%和52%。在自建数据集上,mAP50和mAP95分别提升了5.4%和4.1%;在公开的RDD2022数据集上,mAP50和mAP95分别提升了2.1%和1.5%。该模型已应用于边缘设备并完成工程作业测试,验证了其能够满足轻量化路面裂缝检测的工程应用需求,为自动化道路维护提供了技术方案。 展开更多
关键词 路面裂缝检测 注意力机制 轻量化 动态采样金字塔 YOLOv8
在线阅读 下载PDF
面向原煤分选场景的多模态融合异物开集检测方法
3
作者 曹现刚 刘航 +2 位作者 刘家辉 吴旭东 王鹏 《煤炭科学技术》 北大核心 2026年第1期464-474,共11页
原煤分选过程首先需要对大块矸石、铁丝、编织袋等异物进行识别与拣选,以避免对后续工艺环节造成影响或引发安全事故。目前煤炭异物目标检测算法主要是面向已知对象的检测算法,对未知目标,尤其是各类锚杆、新式支护材料等具有复杂外观... 原煤分选过程首先需要对大块矸石、铁丝、编织袋等异物进行识别与拣选,以避免对后续工艺环节造成影响或引发安全事故。目前煤炭异物目标检测算法主要是面向已知对象的检测算法,对未知目标,尤其是各类锚杆、新式支护材料等具有复杂外观与语义不确定目标的检测能力不足,亟须研究能够同时具备已知与未知异物检测能力的目标检测模型。提出了一种基于多模态融合的煤炭异物开集检测方法。首先,基于DINO网络,设计了文本与图像的双模态特征信息提取架构,以获取更具类别判别性的文本与视觉特征,引入路径聚合特征金字塔网络,采用多层特征抽取策略,将深层语义特征与浅层空间细节有效结合,强化对小尺度煤炭异物的感知能力,提升检测精度;其次,构建了基于自注意力机制与交叉注意力机制的多模态特征融合模块,实现文本与视觉特征的深度交互与高效融合,并引入基于语言引导的查询选择机制,使任意类别文本描述与视觉查询建立对应关系,从而提升特征语义一致性与跨类别泛化能力;最后,设计了一种基于视觉-文本多模态解码模块,在每层查询更新阶段插入文本引导机制,使可学习查询在与图像特征交互前对齐语言特征,有效提升多模态特征对齐的准确性与鲁棒性。基于自建煤炭异物数据集构建多类别组合的开放动态环境,并系统开展了试验,结果表明本文方法在已知类别检测不同开放度任务中mAP@0.5精度均优于其他对比方法,在未知类别检测不同开放度任务中,未知类召回率分别达到41.24%、52.26%、57.13%,验证了零样本条件下的有效性。本文方法具备针对未知类别煤炭异物的检测能力,为煤炭异物的开集检测提供了有效的技术支撑。 展开更多
关键词 煤炭异物 多模态融合 开集检测 特征金字塔 特征语义一致性
在线阅读 下载PDF
动态场景下基于跨域掩膜分割的视觉SLAM算法
4
作者 亢洁 徐婷 +4 位作者 王佳乐 郭进 赫轩 王沫 夏宇 《陕西科技大学学报》 北大核心 2026年第1期178-185,193,共9页
针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减... 针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减除法实现运动物体检测,利用深度图结合深度阈值分割构建跨域掩膜分割机制,并设计相机运动几何校正策略补偿检测框坐标误差,在实现运动物体分割的同时提升处理速度.为优化特征点利用率,采用金字塔光流对动态特征点进行帧间连续跟踪与更新,同时确保仅由静态特征点参与位姿估计过程.在TUM数据集上进行系统性评估,实验结果表明,相比于ORB-SLAM3算法,该算法的绝对位姿误差平均降幅达97.1%,与使用深度学习分割网络的DynaSLAM和DS-SLAM的动态SLAM算法相比,其单帧跟踪时间大幅减少,在精度与效率之间实现了更好的平衡. 展开更多
关键词 视觉SLAM 动态场景 YOLO-Fastest 金字塔光流 深度阈值分割
在线阅读 下载PDF
双域多尺度状态空间网络下的口腔颌面全景X射线图像分割算法研究
5
作者 李冰 胡伟杰 刘侠 《电子与信息学报》 北大核心 2026年第1期382-393,共12页
针对口腔颌面全景X射线图像中存在的形态变异显著、牙体-牙龈边界模糊以及牙周组织灰度值重叠等问题,该研究提出基于双域多尺度状态空间网络的口腔颌面全景X射线图像分割算法。空间域利用视觉状态空间块建立牙弓动态传播模型,并利用微... 针对口腔颌面全景X射线图像中存在的形态变异显著、牙体-牙龈边界模糊以及牙周组织灰度值重叠等问题,该研究提出基于双域多尺度状态空间网络的口腔颌面全景X射线图像分割算法。空间域利用视觉状态空间块建立牙弓动态传播模型,并利用微分方程实现跨象限长程关联捕捉。特征域构建可变形多尺度注意力金字塔,并利用通道-空间注意力动态加权关键解剖标志的灰度渐变特征,解析牙体-牙龈模糊边界。双域特征进一步通过三重注意力融合机制,强化解剖标注的语义表达。实验表明,该算法在颌面全景X射线图像分割任务中取得显著效果,戴斯系数(Dice)达93.8%,豪斯多夫距离(HD95)为18.73像素,充分验证了算法的有效性。 展开更多
关键词 口腔颌面全景X射线图像分割 视觉状态空间块 可变形多尺度注意力金字塔 三重注意力融合
在线阅读 下载PDF
基于金字塔注意力与双路径融合的皮肤病变图像分割
6
作者 宋存利 傅景鑫 +2 位作者 王依 张雪松 时维国 《计算机系统应用》 2026年第1期178-187,共10页
在皮肤病变图像分割任务中,U-Net在处理皮肤镜图像时存在多尺度适应性不足、跨层特征融合低效及计算冗余导致边缘信息丢失等问题.本文提出层次化金字塔注意力网络HPANet(hierarchical pyramid attention network),通过金字塔注意力模块... 在皮肤病变图像分割任务中,U-Net在处理皮肤镜图像时存在多尺度适应性不足、跨层特征融合低效及计算冗余导致边缘信息丢失等问题.本文提出层次化金字塔注意力网络HPANet(hierarchical pyramid attention network),通过金字塔注意力模块和双路径特征融合机制,实现了多尺度特征捕获和跨层特征传递的双重优化.其中,双路径自适应融合模块结合CNN与Transformer双分支特征,通过通道注意力与压缩空间注意力增强互补特征的信息交互,并利用双线性交互与残差连接缓解特征稀释问题.金字塔注意力模块结合分层多核卷积、深度可分离下采样及分块空间通道注意力机制,显著提升多尺度病变特征捕获能力.实验结果表明,本架构在ISIC 2017、ISIC 2018数据集中的表现均超越主流模型,证实其在病变边界保留与小病灶检测方面的双重优势. 展开更多
关键词 金字塔注意力 多尺度特征融合 医学图像分割 深度学习
在线阅读 下载PDF
基于多注意力机制的脊柱病灶MRI影像识别模型
7
作者 周慧 宋新景 《计算机科学与探索》 北大核心 2026年第1期291-300,共10页
人工检测脊柱病变是一项耗时的工作,并且高度依赖于该领域的专家,因此脊柱病灶的自动识别是非常必要的。然而,因为脊柱病灶的大小、位置和结构存在着广泛的差异,同时脊柱肿瘤与稀有病布鲁氏菌在影像上高度相似,所以脊柱病灶的准确定位... 人工检测脊柱病变是一项耗时的工作,并且高度依赖于该领域的专家,因此脊柱病灶的自动识别是非常必要的。然而,因为脊柱病灶的大小、位置和结构存在着广泛的差异,同时脊柱肿瘤与稀有病布鲁氏菌在影像上高度相似,所以脊柱病灶的准确定位和分类是一项具有挑战性的工作。为了应对这些挑战,提出了一种改进的脊柱病灶MRI影像识别模型。引入以ResNet-101为基础的双向特征金字塔主干网络,利用可变卷积在不同层替代传统的卷积神经网络,从特征层中获得更多的特征信息。在不同的模块中加入了多重注意力,包括自注意力机制和柔性注意力机制,有效地融合特征中贡献较大的部分。为了克服脊柱肿瘤、感染性病变、稀有病布鲁氏菌的数据不平衡问题,引入了改进的平衡交叉熵损失函数。在大连某医院提供的临床数据集上进行验证,识别精确率达到了94.2%,识别召回率达到90.8%。与其他识别模型进行对比实验,结果说明了该方法相对于其他模型识别性能更好。 展开更多
关键词 脊柱病灶识别 双向特征金字塔 多注意力机制 可变卷积 多特征融合
在线阅读 下载PDF
基于PyConv-Transformer的锂离子电池剩余寿命预测
8
作者 吴忠强 吴江浩 《计量学报》 北大核心 2026年第1期102-110,共9页
锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL... 锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL预测模型,选取容量作为健康因子,利用金字塔卷积网络中不同大小的卷积核提取容量序列的特征信息,利用Transformer中的多头注意力机制进一步学习序列的时序特征。采用加权Huber损失函数,提高模型的鲁棒性;采用Dropout技术,提高模型的泛化能力,防止训练过程中出现过拟合。将所提预测模型在NASA和CALCE数据集上实验,并与其他模型比较。实验结果表明,所提模型的预测精度更高,在NASA和CALCE数据集上的相对误差分别为0.008 6、0.019 3;平均绝对误差分别为0.011 5、0.012 6;均方根误差分别为0.017 3、0.018 9。 展开更多
关键词 电学计量 剩余使用寿命 锂电池容量 金字塔卷积网络 TRANSFORMER 加权Huber损失函数 DROPOUT
在线阅读 下载PDF
Enhancement of Rice Germplasm by Pyramiding the Cultivars with Multi-resistance to Orseolia oryzae (Wood-Mason) 被引量:2
9
作者 冯锐 秦学毅 +5 位作者 唐建淮 朱汝财 潘英华 刘百龙 韦素美 黄凤宽 《Agricultural Science & Technology》 CAS 2009年第1期7-10,共4页
[ Objective] This study was to breed rice cultivars with multi-resistance to Orseolia oryzae (Wood-Mason). [ Method] The Guangxi local cultivar GX-M001 (Jiangchao) with high resistance to Orseolia oryzae (Wood-Ma... [ Objective] This study was to breed rice cultivars with multi-resistance to Orseolia oryzae (Wood-Mason). [ Method] The Guangxi local cultivar GX-M001 (Jiangchao) with high resistance to Orseolia oryzae (Wood-Mason) was used to hybrid with the known resistance cultivars "Kangwenqingzhan" (harboring GM5 gene), OB677( harboring GM3 gene) from Sri Lanka, HT1350 and high yield end quality cultivar " Guiruanzhan". [ Result] Through pyramiding the multi-resistant genes via routine hybridization, the general resistances of the hybrids were remarkably enhanced. The grades of resistance were also improved, many of the combinations were endowed with a resistance at immune level (grade 0) ; and interestingly, the respective hybridization of GX-M001 (high resistance) with OB677( medium resistance) and HT1350(suscepti- ble) also generate two lines at immune level, which is probably the effects of additive effects of genes.[ Conclusion] By routine hybridization, multiple genes were successfully pyramided, thus generating novel rice lines with multiple resistances. For the rice breeding scientists at the grass-roots level, the resistance-resistance pyramiding is an effective approach to breed high resistance cultivars. 展开更多
关键词 Orseolia oryzae (Wood-Mason) pyramiding via hybridization Rice breeding
在线阅读 下载PDF
基于空间通道自适应特征的肝脏病理图像分割网络
10
作者 王建宇 王朝立 +1 位作者 孙占全 刘晓虹 《电子科技》 2026年第1期9-17,共9页
针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与... 针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与肝脏病灶相关的重要特征,并在编码器最深层引入空洞空间金字塔池化模块来弥补高级特征所缺失的多尺度信息,提高模型的分割精度。在私有肝脏数据集、公开肝脏数据集以及其他两种公开病理数据集对所提网络进行对比实验和消融实验。实验结果表明,相较于其他方法,所提网络的分割结果较佳,且有效解决了肝细胞癌分割问题。 展开更多
关键词 肝细胞癌 病理图像 编解码架构 混合校准注意力模块 空间注意力 通道注意力 空洞空间金字塔池化模块 多尺度信息
在线阅读 下载PDF
甘蓝型春油菜早花基因BnCRY2功能位点KASP标记的开发及应用
11
作者 王楚锐 李开祥 +6 位作者 赵志 肖麓 唐国永 赵志刚 徐亮 杜德志 柳海东 《作物学报》 北大核心 2026年第3期708-721,共14页
通过前期对早花位点BnaC08cqDTF的候选基因BnCRY2的克隆发现,其等位基因第3外显子存在一个A/G的SNP,根据该SNP开发了相应的KASP标记BN900449,进一步利用上述标记及与早花位点qFT.A02-1和qFTA10紧密连锁的4个标记(多重PCR标记PB05、PB06... 通过前期对早花位点BnaC08cqDTF的候选基因BnCRY2的克隆发现,其等位基因第3外显子存在一个A/G的SNP,根据该SNP开发了相应的KASP标记BN900449,进一步利用上述标记及与早花位点qFT.A02-1和qFTA10紧密连锁的4个标记(多重PCR标记PB05、PB06和KASP标记A015348、K000272)对497份甘蓝型油菜自然群体进行早花基因型鉴定,结果显示, 3个位点均可将自然群体分成花期显著差异的2组,且含双位点品系的平均开花时间早于单位点品系;从中筛选出分别含有BnaC08cqDTF、qFTA10、qFT.A02-1位点的资源各3份,不同单位点资源两两杂交进行位点聚合,结合分子标记辅助选择创建特早熟资源41份,这些资源比亲本早开花3~4 d;从中筛选出初花期较早且品质双低的品系195,连续2年在高海拔区5点进行测产试验,结果表明, 2年平均产量比高海拔春油菜区白菜型主栽品种浩油11号增产23.07%。该研究不仅拓宽了特早熟甘蓝型春油菜种质资源创建的思路,也为特早熟高产优质油菜品种的培育提供了亲本支撑。 展开更多
关键词 基因聚合 甘蓝型春油菜 早花资源 分子标记 早花位点
在线阅读 下载PDF
基于改进Faster R—CNN的水稻秧苗漏插识别研究
12
作者 邹立雯 梁春英 +2 位作者 胡军 陈玉恒 李圳鹏 《中国农机化学报》 北大核心 2026年第2期101-107,共7页
水稻是我国的主要粮食作物,实现水稻的高产优产是必然趋势。针对传统人工补苗效率低、主观性高的问题,提出一种基于改进Faster R—CNN的水稻秧苗漏插识别方法。以Faster R—CNN模型为基础,将主干网络替换为残差网络ResNet50,结合FPN特... 水稻是我国的主要粮食作物,实现水稻的高产优产是必然趋势。针对传统人工补苗效率低、主观性高的问题,提出一种基于改进Faster R—CNN的水稻秧苗漏插识别方法。以Faster R—CNN模型为基础,将主干网络替换为残差网络ResNet50,结合FPN特征金字塔对特征信息进行提取;引入RoI Align双线性插值的思想替代RoI Pooling层粗糙量化操作。结果表明,改进后的Faster R—CNN模型识别的精确率为93.62%,平均精度均值mAP@0.5为95.06%;与未改进的模型相比,识别精确率提高7.33%,模型的平均精度均值mAP@0.5提高4.6%。该模型可以提高水稻秧苗的分类和插秧机漏插位置的检测精度,为制定水稻秧苗补苗计划打下坚实的基础,并为评价水稻插秧机质量提供数据支持。 展开更多
关键词 水稻秧苗 漏插识别 特征金字塔 深度学习 残差网络
在线阅读 下载PDF
结合双通道Mamba与金字塔通道注意力的事件驱动运动图像去模糊
13
作者 罗炜麒 高灿 +2 位作者 刘泓驿 夏桂松 余磊 《中国图象图形学报》 北大核心 2026年第1期243-260,共18页
目的高时间分辨率的事件相机为传统运动图像去模糊任务提供新的发展思路,但是当前基于事件驱动的运动图像去模糊方法中存在跨模态补偿机制不足、深度特征计算复杂度较高以及缺乏多尺度时空信息关注的问题,在复杂场景中的去模糊泛化性能... 目的高时间分辨率的事件相机为传统运动图像去模糊任务提供新的发展思路,但是当前基于事件驱动的运动图像去模糊方法中存在跨模态补偿机制不足、深度特征计算复杂度较高以及缺乏多尺度时空信息关注的问题,在复杂场景中的去模糊泛化性能受限。针对以上挑战,提出一种双通道Mamba去模糊网络(dual channel Mamba network,DCM-Net)。方法使用一种双通道跨模态Mamba模块(dual channel cross-modal Mamba,DCCM),通过线性复杂度的状态空间模型(state space model,SSM)隐状态映射,将事件与模糊图像投影至共享的潜在特征空间中,再通过非线性交叉门控结构,利用低噪声的模糊图像信息抑制事件噪声,并提取事件的清晰边缘特征,将其嵌入到图像特征中,实现事件和模糊图像的跨模态特征互补融合,达到去模糊的效果。此外,提出一种金字塔通道注意力模块(pyramid channel attention,PyCA)对特征的多尺度时空信息进行提取,引导网络聚焦关键时间通道,增强对空间内局部模糊的细节重建,进一步提高潜在清晰图像序列的复原精度。结果实验在合成的REDS(realistic and diverse scenes)数据集与半合成的HQF(high quality frames)数据集上进行,与11种方法进行了比较。与DeMo-IVF方法相比,本文方法在REDS数据集重建序列的峰值信噪比(peak signal-to-noise ratio,PSNR)平均提升了0.16 dB,结构相似性指数(structural similarity,SSIM)平均提升了0.003;在HQF数据集上,PSNR和SSIM分别平均提升约0.11 dB和0.002;在两个数据集上的序列重建结果的学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)达到最优。在与其中5种较先进方法进行比较的主观对比实验中,本文方法取得最佳评分。结论本文方法可以结合模糊图像和事件数据,重建出清晰潜在图像序列,证明了所提网络框架的有效性。 展开更多
关键词 运动图像去模糊 事件相机 Mamba模型 金字塔通道注意力 跨模态融合
原文传递
TC4金字塔点阵结构超塑成形及力学性能研究
14
作者 戴群 王会东 +5 位作者 付和国 史吉鹏 董志 廖恕 戚英伟 赵天章 《兵器材料科学与工程》 北大核心 2026年第1期40-48,共9页
点阵结构作为高比强度、高比刚度的结构功能一体化材料,在航空航天领域具有广泛的应用前景。通过有限元模拟,分析芯板肋条尺寸对钛合金金字塔点阵结构超塑成形变形机制的影响;通过将试验和有限元相结合,研究钛合金金字塔点阵结构在受到... 点阵结构作为高比强度、高比刚度的结构功能一体化材料,在航空航天领域具有广泛的应用前景。通过有限元模拟,分析芯板肋条尺寸对钛合金金字塔点阵结构超塑成形变形机制的影响;通过将试验和有限元相结合,研究钛合金金字塔点阵结构在受到平面压缩和球面压缩载荷时的变形机制。结果表明:芯板肋条尺寸对金字塔点阵结构超塑成形后的应力影响不大;钛合金金字塔点阵结构的平压及球压变形机制主要分为弹性阶段和失效阶段;由于面板与肋条的多次接触/支撑作用,失效阶段点阵结构的承载能力出现波动。点阵结构的承载位置对点阵结构的能量吸收效果影响较大,反节点承载的失效前峰值载荷及能量吸收量均优于节点承载。 展开更多
关键词 金字塔点阵结构 超塑成形 力学性能 有限元
原文传递
LP-YOLO:Enhanced Smoke and Fire Detection via Self-Attention and Feature Pyramid Integration
15
作者 Qing Long Bing Yi +2 位作者 Haiqiao Liu Zhiling Peng Xiang Liu 《Computers, Materials & Continua》 2026年第3期1490-1509,共20页
Accurate detection of smoke and fire sources is critical for early fire warning and environmental monitoring.However,conventional detection approaches are highly susceptible to noise,illumination variations,and comple... Accurate detection of smoke and fire sources is critical for early fire warning and environmental monitoring.However,conventional detection approaches are highly susceptible to noise,illumination variations,and complex environmental conditions,which often reduce detection accuracy and real-time performance.To address these limitations,we propose Lightweight and Precise YOLO(LP-YOLO),a high-precision detection framework that integrates a self-attention mechanism with a feature pyramid,built upon YOLOv8.First,to overcome the restricted receptive field and parameter redundancy of conventional Convolutional Neural Networks(CNNs),we design an enhanced backbone based on Wavelet Convolutions(WTConv),which expands the receptive field through multifrequency convolutional processing.Second,a Bidirectional Feature Pyramid Network(BiFPN)is employed to achieve bidirectional feature fusion,enhancing the representation of smoke features across scales.Third,to mitigate the challenge of ambiguous object boundaries,we introduce the Frequency-aware Feature Fusion(FreqFusion)module,in which the Adaptive Low-Pass Filter(ALPF)reduces intra-class inconsistencies,the offset generator refines boundary localization,and the Adaptive High-Pass Filter(AHPF)recovers high-frequency details lost during down-sampling.Experimental evaluations demonstrate that LP-YOLO significantly outperforms the baseline YOLOv8,achieving an improvement of 9.3%in mAP@50 and 9.2%in F1-score.Moreover,the model is 56.6%and 32.4%smaller than YOLOv7-tiny and EfficientDet,respectively,while maintaining real-time inference speed at 238 frames per second(FPS).Validation on multiple benchmark datasets,including D-Fire,FIRESENSE,and BoWFire,further confirms its robustness and generalization ability,with detection accuracy consistently exceeding 82%.These results highlight the potential of LP-YOLO as a practical solution with high accuracy,robustness,and real-time performance for smoke and fire source detection. 展开更多
关键词 Deep learning smoke detection feature pyramid boundary refinement
在线阅读 下载PDF
EHDC-YOLO: Enhancing Object Detection for UAV Imagery via Multi-Scale Edge and Detail Capture
16
作者 Zhiyong Deng Yanchen Ye Jiangling Guo 《Computers, Materials & Continua》 2026年第1期1665-1682,共18页
With the rapid expansion of drone applications,accurate detection of objects in aerial imagery has become crucial for intelligent transportation,urban management,and emergency rescue missions.However,existing methods ... With the rapid expansion of drone applications,accurate detection of objects in aerial imagery has become crucial for intelligent transportation,urban management,and emergency rescue missions.However,existing methods face numerous challenges in practical deployment,including scale variation handling,feature degradation,and complex backgrounds.To address these issues,we propose Edge-enhanced and Detail-Capturing You Only Look Once(EHDC-YOLO),a novel framework for object detection in Unmanned Aerial Vehicle(UAV)imagery.Based on the You Only Look Once version 11 nano(YOLOv11n)baseline,EHDC-YOLO systematically introduces several architectural enhancements:(1)a Multi-Scale Edge Enhancement(MSEE)module that leverages multi-scale pooling and edge information to enhance boundary feature extraction;(2)an Enhanced Feature Pyramid Network(EFPN)that integrates P2-level features with Cross Stage Partial(CSP)structures and OmniKernel convolutions for better fine-grained representation;and(3)Dynamic Head(DyHead)with multi-dimensional attention mechanisms for enhanced cross-scale modeling and perspective adaptability.Comprehensive experiments on the Vision meets Drones for Detection(VisDrone-DET)2019 dataset demonstrate that EHDC-YOLO achieves significant improvements,increasing mean Average Precision(mAP)@0.5 from 33.2%to 46.1%(an absolute improvement of 12.9 percentage points)and mAP@0.5:0.95 from 19.5%to 28.0%(an absolute improvement of 8.5 percentage points)compared with the YOLOv11n baseline,while maintaining a reasonable parameter count(2.81 M vs the baseline’s 2.58 M).Further ablation studies confirm the effectiveness of each proposed component,while visualization results highlight EHDC-YOLO’s superior performance in detecting objects and handling occlusions in complex drone scenarios. 展开更多
关键词 UAV imagery object detection multi-scale feature fusion edge enhancement detail preservation YOLO feature pyramid network attention mechanism
在线阅读 下载PDF
基于改进YOLOv11的CNN-Transformer混合水域垃圾检测算法
17
作者 赵建永 李瑞东 +1 位作者 姚浩 魏秀蓉 《无线互联科技》 2026年第4期21-25,50,共6页
河流水面漂浮物检测受限于复杂环境条件(如光照变化、波纹干扰)和检测目标尺度较小的特点,传统方法难以实现高精度检测。文章提出一种面向复杂水域场景的单阶段检测模型YOLOv11n-SPT,在YOLOv11n基础上引入新型Spatial Pyramid Transform... 河流水面漂浮物检测受限于复杂环境条件(如光照变化、波纹干扰)和检测目标尺度较小的特点,传统方法难以实现高精度检测。文章提出一种面向复杂水域场景的单阶段检测模型YOLOv11n-SPT,在YOLOv11n基础上引入新型Spatial Pyramid Transformer(SPT)模块与通道注意力机制。SPT模块采用多分支空间金字塔结构,实现高分辨率细节保留与超大感受野全局建模的协同。在FloW-Img数据集上,YOLOv11n-SPT的mAP@0.5达到81.2%,较基线YOLOv11n提升2.9个百分点;消融实验表明,单独引入SPT模块使mAP@0.5提升2.0%,召回率提升2.1%,进一步叠加通道注意力后精确率提升至85.4%。YOLOv11n-SPT在微小目标与强干扰场景下表现出更强的鲁棒性与定位精度,为无人清漂船、无人机巡河等实际水域环境治理任务提供了高效可靠的感知方案。 展开更多
关键词 水面漂浮物检测 Spatial Pyramid Transformer YOLOv11
在线阅读 下载PDF
Enhancing Underwater Monocular Depth Estimation with Lpg-Lap Unet for Target Tracking Mission
18
作者 YAO Peng WANG Yalu 《Journal of Ocean University of China》 2026年第1期161-170,共10页
Accurately estimating depth from underwater monocular images is essential for the target tracking task of unmanned underwater vehicles.This work proposes a method based on the Lpg-Lap Unet architecture.First,the Unet ... Accurately estimating depth from underwater monocular images is essential for the target tracking task of unmanned underwater vehicles.This work proposes a method based on the Lpg-Lap Unet architecture.First,the Unet architecture integrates Laplacian pyramid depth residuals and Sobel operators to improve the boundary details in depth images,which may suffer from the feature loss caused by upsampling and the blurriness of underwater images.Multiscale local planar guidance layers then fully exploit the intermediate depth features,and a comprehensive loss function ensures robustness and accuracy.Experimental results on benchmarks demonstrate the effectiveness of Lpg-Lap Unet and its superior performance over state-of-the-art models.An underwater target tracking system is then designed to further validate its real-time capabilities in the AirSim simulation platform. 展开更多
关键词 underwater monocular depth estimation Laplacian pyramid multiscale local planar guidance underwater target tracking
在线阅读 下载PDF
基于深度可分离卷积与注意力的SSD目标检测模型
19
作者 卜子渝 杨哲 刘纯平 《计算机应用与软件》 北大核心 2026年第1期149-157,共9页
SSD是基于深度学习的单阶段目标检测模型,但其特征金字塔中的特征图缺乏多尺度信息融合,导致对中小型目标识别效果不佳。针对该问题,提出一种基于注意力机制与深度可分离卷积的SSD目标检测模型(Attention&DSC Single Shot MultiBox ... SSD是基于深度学习的单阶段目标检测模型,但其特征金字塔中的特征图缺乏多尺度信息融合,导致对中小型目标识别效果不佳。针对该问题,提出一种基于注意力机制与深度可分离卷积的SSD目标检测模型(Attention&DSC Single Shot MultiBox Detector,AD-SSD)。AD-SSD首先归一化融合特征金字塔中的特征图,再引入注意力机制加强对目标信息的表征,并采用深度可分离卷积降低参数量。该方法提高了SSD的检测精度的同时,还加快了检测速度。在PASCAL VOC07+12数据集中,AD-SSD获得了81.7%的平均精度(mAP),小型目标精度提高6.3百分点,中型目标精度提高6.4百分点,检测速度达到55.1 FPS。 展开更多
关键词 目标检测 注意力机制 深度可分离卷积 特征金字塔
在线阅读 下载PDF
融合边缘特征增强的级联群注意力工地施工安全带检测模型
20
作者 邓悦 陆保国 +1 位作者 钱夔 龚晨涛 《中国测试》 北大核心 2026年第1期172-180,共9页
针对现有深度学习技术在建筑工地高空作业人员安全带检测任务中,存在施工环境复杂、距离远导致检测效率低下的问题,提出一种融合边缘特征增强的级联群注意力工地施工安全带检测模型。首先,该模型在主干网络中进行边缘特征增强,有效提升... 针对现有深度学习技术在建筑工地高空作业人员安全带检测任务中,存在施工环境复杂、距离远导致检测效率低下的问题,提出一种融合边缘特征增强的级联群注意力工地施工安全带检测模型。首先,该模型在主干网络中进行边缘特征增强,有效提升了网络对复杂场景下模糊目标形态结构和边缘细节的特征提取;其次,设计CSP(cross stage partial)模块,通过融合级联群注意力(cascaded group attention,CGA)机制,减少冗余信息,提高计算效率;最后,引入融合ELA(efficient local attention)注意力的特征金字塔ELA-HSFPN,实现高、中、低不同尺度的跨分辨率特征高效的动态加权融合,提升了检测精度。实验结果表明,改进后的算法与基准模型YOLOv11n相比,其平均精度值mAP提升了8.27百分点,检测效果明显得到提升,并且和其他的主流目标检测算法相比,也有明显改善,验证了新模型的有效性。 展开更多
关键词 安全带检测 边缘特征增强 级联群注意力 金字塔网络
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部