期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
Enhancing Classroom Behavior Recognition with Lightweight Multi-Scale Feature Fusion
1
作者 Chuanchuan Wang Ahmad Sufril Azlan Mohamed +3 位作者 Xiao Yang Hao Zhang Xiang Li Mohd Halim Bin Mohd Noor 《Computers, Materials & Continua》 2025年第10期855-874,共20页
Classroom behavior recognition is a hot research topic,which plays a vital role in assessing and improving the quality of classroom teaching.However,existing classroom behavior recognition methods have challenges for ... Classroom behavior recognition is a hot research topic,which plays a vital role in assessing and improving the quality of classroom teaching.However,existing classroom behavior recognition methods have challenges for high recognition accuracy with datasets with problems such as scenes with blurred pictures,and inconsistent objects.To address this challenge,we proposed an effective,lightweight object detector method called the RFNet model(YOLO-FR).The YOLO-FR is a lightweight and effective model.Specifically,for efficient multi-scale feature extraction,effective feature pyramid shared convolutional(FPSC)was designed to improve the feature extract performance by leveraging convolutional layers with varying dilation rates from the input image in the backbone.Secondly,to address the problem of multi-scale variability in the scene,we design the Rep Ghost fusion Cross Stage Partial and Efficient Layer Aggregation Network(RGCSPELAN)to improve the network performance further and reduce the amount of computation and the number of parameters.In addition,by conducting experimental valuation on the SCB dataset3 and STBD-08 dataset.Experimental results indicate that,compared to the baseline model,the RFNet model has increased mean accuracy precision(mAP@50)from 69.6%to 71.0%on the SCB dataset3 and from 91.8%to 93.1%on the STBD-08 dataset.The RFNet approach has effectiveness precision at 68.6%,surpassing the baseline method(YOLOv11)at 3.3%and archieve the minimal size(4.9 M)on the SCB dataset3.Finally,comparing it with other algorithms,it accurately detects student behavior in complex classroom environments results confirmed that RFNet is well-suited for real-time and efficiently recognizing classroom behaviors. 展开更多
关键词 Classroom action recognition YOLO-FR feature pyramid shared convolutional rep ghost cross stage partial efficient layer aggregation network(RGCSPELAN)
在线阅读 下载PDF
FireLight-YOLO:面向森林火灾实时监测的轻量化模型
2
作者 李敏学 张晓宇 +2 位作者 程英杰 霍光煜 许福 《北京林业大学学报》 北大核心 2026年第1期12-25,共14页
【目的】为应对森林火灾频发对生态安全构成的严峻挑战,构建轻量化实时智能监测体系以提升生态风险防控能力具有重要现实意义。针对现有火灾检测方法易受环境干扰,且模型复杂度与实时性难以兼顾的问题,本研究旨在开发一种无需外部预训... 【目的】为应对森林火灾频发对生态安全构成的严峻挑战,构建轻量化实时智能监测体系以提升生态风险防控能力具有重要现实意义。针对现有火灾检测方法易受环境干扰,且模型复杂度与实时性难以兼顾的问题,本研究旨在开发一种无需外部预训练权重即可从零训练的高效轻量化检测模型。【方法】研究首先构建了涵盖1万余张高质量图像的森林火灾监测数据集并开源发布。在此基础上,基于YOLOv8提出FireLight-YOLO轻量化架构:引入幽灵卷积压缩冗余计算,设计融合部分卷积与点态卷积的FasterC2fBlock构建T形感受野以增强关键区域感知,并优化SPPF模块提出特征金字塔共享卷积机制实现高效跨尺度特征融合。模型通过交叉验证、独立测试、消融实验及多噪声场景鲁棒性检验完成性能评估。【结果】FireLight-YOLO在未使用预训练权重条件下实现mAP@0.5达0.491,仅需约2.26×10^(6)参数与5.9GFLOPs计算量,在精度、轻量化与实时性间达到有效平衡。相较于原始YOLOv8,模型计算量减少2.2 GFLOPs,参数量降低了25%,推理速度提升15%,并在复杂干扰场景中展现出优异的鲁棒性。【结论】FireLight-YOLO实现了轻量化条件下对森林火灾的精准检测。该研究不仅为森林火灾智能监测提供了低成本、高效率的技术方案,其轻量化特性亦显著增强了模型在移动终端的部署适应性。研究成果可为森林生态系统的保护与修复提供坚实的智能化支撑。 展开更多
关键词 YOLOv8 Ghost卷积 森林火灾检测 实时目标检测 轻量化模型 特征金字塔共享卷积(fpsc) 边缘部署 生态安全
在线阅读 下载PDF
FFD-YOLO:面向小目标与复杂背景的液晶屏缺陷检测
3
作者 山宏刚 倪奕麟 +3 位作者 蔡建刚 朱军 廖泽威 戚顺楠 《液晶与显示》 北大核心 2026年第2期208-221,共14页
液晶屏表面缺陷会影响外观并降低可靠性,且存在尺度跨度大、背景复杂、小目标难检测等问题。本文基于轻量的YOLOv8n提出了一种液晶屏缺陷检测算法FFD-YOLO。该算法引入FasterNet主干网络以提升特征提取能力;设计特征金字塔共享卷积模块F... 液晶屏表面缺陷会影响外观并降低可靠性,且存在尺度跨度大、背景复杂、小目标难检测等问题。本文基于轻量的YOLOv8n提出了一种液晶屏缺陷检测算法FFD-YOLO。该算法引入FasterNet主干网络以提升特征提取能力;设计特征金字塔共享卷积模块FPSC,通过多膨胀率卷积与共享卷积机制增强多尺度特征建模能力;提出多尺度自适应卷积模块MACM,利用动态卷积权重与多尺度卷积核融合强化小目标特征表达与复杂背景下的稳定性。实验结果表明,在自建工业级LCD-NET数据集上,FFD-YOLO的精度(Precision)、召回率(Recall)和mAP50分别较基线模型提升5.0%、4.7%和3.2%,其中污渍类小目标检测精度提升达6.4%。证明FFD-YOLO在保持轻量化的同时可显著提升液晶屏缺陷检测性能,为工业视觉检测系统提供了一种高效、可靠的解决方案。 展开更多
关键词 液晶屏 缺陷检测 特征金字塔共享卷积 多尺度自适应卷积 YOLOv8
在线阅读 下载PDF
面向无人机小目标检测的多尺度特征融合的YOLOv11n算法
4
作者 梁嘉欣 《厦门理工学院学报》 2026年第1期40-48,共9页
针对无人机航拍图像分辨率低、目标小且背景复杂等问题,提出一种改进的YOLOv11n算法。采用混合聚合网络(mixed aggregation network,MANet)替换原模型的C3k2模块,有效增强捕捉目标特征的能力;设计并使用共享特征金字塔卷积(shared featu... 针对无人机航拍图像分辨率低、目标小且背景复杂等问题,提出一种改进的YOLOv11n算法。采用混合聚合网络(mixed aggregation network,MANet)替换原模型的C3k2模块,有效增强捕捉目标特征的能力;设计并使用共享特征金字塔卷积(shared feature pyramid convolution,SFPC)替换原有的SPPF层,利用多孔卷积核的并行计算特性实现多尺度特征提取,既保持了感受野扩展的优势,又提升了特征提取效果;构建加权双向特征金字塔网络(bidirectional feature pyramid network,BiFPN),通过可学习的特征权重系数强化跨层级语义信息交互,进一步提高密集目标检测的精度。实验结果表明,优化后的算法在VisDrone数据集上的mAP50达到了38.4%,相较于基准模型提升了5.6%。 展开更多
关键词 无人机 小目标检测 YOLOv11n算法 多尺度特征 共享卷积 双向特征金字塔网络
在线阅读 下载PDF
基于YOLOv8-AFDP的红外道路目标检测
5
作者 栾庆磊 毛宜东 +2 位作者 陈梓华 陈中 张雅丽 《光电工程》 北大核心 2025年第8期52-66,共15页
针对现有模型在检测红外道路目标时精度不足的问题,提出一种YOLOv8-AFDP模型。首先,该模型利用ASF-YOLO模型的多尺度注意力特征融合思想对颈部网络进行优化,并且在此基础上加入小目标检测层,进一步增强网络对不同尺度目标的检测性能。其... 针对现有模型在检测红外道路目标时精度不足的问题,提出一种YOLOv8-AFDP模型。首先,该模型利用ASF-YOLO模型的多尺度注意力特征融合思想对颈部网络进行优化,并且在此基础上加入小目标检测层,进一步增强网络对不同尺度目标的检测性能。其次,使用特征金字塔共享卷积(feature pyramid shared convolution,FPSC)模块替换快速空间金字塔池化(spatial pyramid pooling fast,SPPF)模块,在处理多尺度特征图时捕捉更多细粒度信息;同时,在控制计算成本的前提下,引入动态上采样(DySample)方法,从而保留更多红外道路目标的提取特征。最后,使用PIoU(Powerful-IoU)损失函数代替CIoU损失函数,提高模型的检测精度和收敛速度。实验结果表明,YOLOv8-AFDP相比于YOLOv8在红外数据集M3FD上的评价指标mAP@0.5提高8.3个百分点,达到83.8%,并且模型参数量减少12.3%。所设计的YOLOv8-AFDP模型能够实现对红外道路目标的精确检测,降低道路安全隐患。 展开更多
关键词 红外道路目标检测 特征金字塔共享卷积 动态上采样 损失函数 YOLOv8
在线阅读 下载PDF
共享核空洞卷积与注意力引导FPN文本检测 被引量:4
6
作者 孟月波 金丹 +3 位作者 刘光辉 徐胜军 韩九强 石德旺 《光学精密工程》 EI CAS CSCD 北大核心 2021年第8期1955-1967,共13页
高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测... 高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测方法;提出最小交集(Intersection Over Minimum,IOM)后处理策略,改善因文本长宽比变化较大特性导致的掩膜重叠现象,提升检测效果。首先,模型以Resnet50为主干网络采用FPN结构捕获多尺度特征;然后,利用空洞卷积扩大特征感受野,提高特征信息的多尺度捕获能力,深层次挖掘文本细粒度特征,并通过共享核手段减少模型参数量,降低计算成本;同时,采用上下文注意模块(Context Attention Module,CxAM)捕捉多感受野间的语义信息关系,通过内容注意模块(Content Attention Module,CnAM)精确定位目标位置信息,增强多尺度融合能力,提升特征图质量;最后,将同一文本区域预测的候选框按大小排列,提出将面积最大的框与相邻文本框之间区域的交集面积占较小框面积的比值作为候选框筛选指标,抑制检测结果的掩模重叠现象,实现文本的精准检测。采用ICDAR2013、ICDAR2015、TotalText数据集进行对比实验,实验结果表明,本文模型对于水平场景文本检测的精度和召回率分别为95.3和90.4;对于倾斜文本检测的精度和召回率分别为87.1和84.2;对于任意形状文本检测的精度和召回率分别为69.6和57.3。提出的算法有效克服了图像分辨率、文本形状与长度等因素的影响,提高了检测精度,得到了更为精准的文本边界。 展开更多
关键词 文本检测 注意力结构 共享核空洞卷积 特征金字塔网络
在线阅读 下载PDF
基于多级金字塔卷积神经网络的快速特征表示方法 被引量:14
7
作者 王冠皓 徐军 《计算机应用研究》 CSCD 北大核心 2015年第8期2492-2495,共4页
由于在大尺度图像中卷积滤波的过程速度过慢,导致卷积神经网络(convolutional neural network,CNN)参数调节困难、训练时间过长。针对这一问题,通过对传统卷积神经网络(traditional convolution neural network,TCNN)的改进,提出一种快... 由于在大尺度图像中卷积滤波的过程速度过慢,导致卷积神经网络(convolutional neural network,CNN)参数调节困难、训练时间过长。针对这一问题,通过对传统卷积神经网络(traditional convolution neural network,TCNN)的改进,提出一种快速有效的多级金字塔卷积神经网络(multi-level pyramid CNN,MLPCNN)。这一网络使用权值共享的方法将低级的滤波权值共享到高级,保证CNN的训练只在较小尺寸的图像块上进行,加快了训练速度。实验表明,在特征维数比较低的情况下,MLPCNN提取到的特征比传统的特征提取方法更加有效,在Caltech101数据库上,MLPCNN识别率达到81.32%,而且训练速度较TCNN提高了约2.5倍。 展开更多
关键词 深度学习 多级金字塔卷积神经网络 特征表示 特征共享
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部