期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
Enhancing Classroom Behavior Recognition with Lightweight Multi-Scale Feature Fusion
1
作者 Chuanchuan Wang Ahmad Sufril Azlan Mohamed +3 位作者 Xiao Yang Hao Zhang Xiang Li Mohd Halim Bin Mohd Noor 《Computers, Materials & Continua》 2025年第10期855-874,共20页
Classroom behavior recognition is a hot research topic,which plays a vital role in assessing and improving the quality of classroom teaching.However,existing classroom behavior recognition methods have challenges for ... Classroom behavior recognition is a hot research topic,which plays a vital role in assessing and improving the quality of classroom teaching.However,existing classroom behavior recognition methods have challenges for high recognition accuracy with datasets with problems such as scenes with blurred pictures,and inconsistent objects.To address this challenge,we proposed an effective,lightweight object detector method called the RFNet model(YOLO-FR).The YOLO-FR is a lightweight and effective model.Specifically,for efficient multi-scale feature extraction,effective feature pyramid shared convolutional(FPSC)was designed to improve the feature extract performance by leveraging convolutional layers with varying dilation rates from the input image in the backbone.Secondly,to address the problem of multi-scale variability in the scene,we design the Rep Ghost fusion Cross Stage Partial and Efficient Layer Aggregation Network(RGCSPELAN)to improve the network performance further and reduce the amount of computation and the number of parameters.In addition,by conducting experimental valuation on the SCB dataset3 and STBD-08 dataset.Experimental results indicate that,compared to the baseline model,the RFNet model has increased mean accuracy precision(mAP@50)from 69.6%to 71.0%on the SCB dataset3 and from 91.8%to 93.1%on the STBD-08 dataset.The RFNet approach has effectiveness precision at 68.6%,surpassing the baseline method(YOLOv11)at 3.3%and archieve the minimal size(4.9 M)on the SCB dataset3.Finally,comparing it with other algorithms,it accurately detects student behavior in complex classroom environments results confirmed that RFNet is well-suited for real-time and efficiently recognizing classroom behaviors. 展开更多
关键词 Classroom action recognition YOLO-FR feature pyramid shared convolutional rep ghost cross stage partial efficient layer aggregation network(RGCSPELAN)
在线阅读 下载PDF
FireLight-YOLO:面向森林火灾实时监测的轻量化模型
2
作者 李敏学 张晓宇 +2 位作者 程英杰 霍光煜 许福 《北京林业大学学报》 北大核心 2026年第1期12-25,共14页
【目的】为应对森林火灾频发对生态安全构成的严峻挑战,构建轻量化实时智能监测体系以提升生态风险防控能力具有重要现实意义。针对现有火灾检测方法易受环境干扰,且模型复杂度与实时性难以兼顾的问题,本研究旨在开发一种无需外部预训... 【目的】为应对森林火灾频发对生态安全构成的严峻挑战,构建轻量化实时智能监测体系以提升生态风险防控能力具有重要现实意义。针对现有火灾检测方法易受环境干扰,且模型复杂度与实时性难以兼顾的问题,本研究旨在开发一种无需外部预训练权重即可从零训练的高效轻量化检测模型。【方法】研究首先构建了涵盖1万余张高质量图像的森林火灾监测数据集并开源发布。在此基础上,基于YOLOv8提出FireLight-YOLO轻量化架构:引入幽灵卷积压缩冗余计算,设计融合部分卷积与点态卷积的FasterC2fBlock构建T形感受野以增强关键区域感知,并优化SPPF模块提出特征金字塔共享卷积机制实现高效跨尺度特征融合。模型通过交叉验证、独立测试、消融实验及多噪声场景鲁棒性检验完成性能评估。【结果】FireLight-YOLO在未使用预训练权重条件下实现mAP@0.5达0.491,仅需约2.26×10^(6)参数与5.9GFLOPs计算量,在精度、轻量化与实时性间达到有效平衡。相较于原始YOLOv8,模型计算量减少2.2 GFLOPs,参数量降低了25%,推理速度提升15%,并在复杂干扰场景中展现出优异的鲁棒性。【结论】FireLight-YOLO实现了轻量化条件下对森林火灾的精准检测。该研究不仅为森林火灾智能监测提供了低成本、高效率的技术方案,其轻量化特性亦显著增强了模型在移动终端的部署适应性。研究成果可为森林生态系统的保护与修复提供坚实的智能化支撑。 展开更多
关键词 YOLOv8 Ghost卷积 森林火灾检测 实时目标检测 轻量化模型 特征金字塔共享卷积(fpsc) 边缘部署 生态安全
在线阅读 下载PDF
基于YOLOv8-AFDP的红外道路目标检测
3
作者 栾庆磊 毛宜东 +2 位作者 陈梓华 陈中 张雅丽 《光电工程》 北大核心 2025年第8期52-66,共15页
针对现有模型在检测红外道路目标时精度不足的问题,提出一种YOLOv8-AFDP模型。首先,该模型利用ASF-YOLO模型的多尺度注意力特征融合思想对颈部网络进行优化,并且在此基础上加入小目标检测层,进一步增强网络对不同尺度目标的检测性能。其... 针对现有模型在检测红外道路目标时精度不足的问题,提出一种YOLOv8-AFDP模型。首先,该模型利用ASF-YOLO模型的多尺度注意力特征融合思想对颈部网络进行优化,并且在此基础上加入小目标检测层,进一步增强网络对不同尺度目标的检测性能。其次,使用特征金字塔共享卷积(feature pyramid shared convolution,FPSC)模块替换快速空间金字塔池化(spatial pyramid pooling fast,SPPF)模块,在处理多尺度特征图时捕捉更多细粒度信息;同时,在控制计算成本的前提下,引入动态上采样(DySample)方法,从而保留更多红外道路目标的提取特征。最后,使用PIoU(Powerful-IoU)损失函数代替CIoU损失函数,提高模型的检测精度和收敛速度。实验结果表明,YOLOv8-AFDP相比于YOLOv8在红外数据集M3FD上的评价指标mAP@0.5提高8.3个百分点,达到83.8%,并且模型参数量减少12.3%。所设计的YOLOv8-AFDP模型能够实现对红外道路目标的精确检测,降低道路安全隐患。 展开更多
关键词 红外道路目标检测 特征金字塔共享卷积 动态上采样 损失函数 YOLOv8
在线阅读 下载PDF
共享核空洞卷积与注意力引导FPN文本检测 被引量:4
4
作者 孟月波 金丹 +3 位作者 刘光辉 徐胜军 韩九强 石德旺 《光学精密工程》 EI CAS CSCD 北大核心 2021年第8期1955-1967,共13页
高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测... 高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测方法;提出最小交集(Intersection Over Minimum,IOM)后处理策略,改善因文本长宽比变化较大特性导致的掩膜重叠现象,提升检测效果。首先,模型以Resnet50为主干网络采用FPN结构捕获多尺度特征;然后,利用空洞卷积扩大特征感受野,提高特征信息的多尺度捕获能力,深层次挖掘文本细粒度特征,并通过共享核手段减少模型参数量,降低计算成本;同时,采用上下文注意模块(Context Attention Module,CxAM)捕捉多感受野间的语义信息关系,通过内容注意模块(Content Attention Module,CnAM)精确定位目标位置信息,增强多尺度融合能力,提升特征图质量;最后,将同一文本区域预测的候选框按大小排列,提出将面积最大的框与相邻文本框之间区域的交集面积占较小框面积的比值作为候选框筛选指标,抑制检测结果的掩模重叠现象,实现文本的精准检测。采用ICDAR2013、ICDAR2015、TotalText数据集进行对比实验,实验结果表明,本文模型对于水平场景文本检测的精度和召回率分别为95.3和90.4;对于倾斜文本检测的精度和召回率分别为87.1和84.2;对于任意形状文本检测的精度和召回率分别为69.6和57.3。提出的算法有效克服了图像分辨率、文本形状与长度等因素的影响,提高了检测精度,得到了更为精准的文本边界。 展开更多
关键词 文本检测 注意力结构 共享核空洞卷积 特征金字塔网络
在线阅读 下载PDF
基于多级金字塔卷积神经网络的快速特征表示方法 被引量:13
5
作者 王冠皓 徐军 《计算机应用研究》 CSCD 北大核心 2015年第8期2492-2495,共4页
由于在大尺度图像中卷积滤波的过程速度过慢,导致卷积神经网络(convolutional neural network,CNN)参数调节困难、训练时间过长。针对这一问题,通过对传统卷积神经网络(traditional convolution neural network,TCNN)的改进,提出一种快... 由于在大尺度图像中卷积滤波的过程速度过慢,导致卷积神经网络(convolutional neural network,CNN)参数调节困难、训练时间过长。针对这一问题,通过对传统卷积神经网络(traditional convolution neural network,TCNN)的改进,提出一种快速有效的多级金字塔卷积神经网络(multi-level pyramid CNN,MLPCNN)。这一网络使用权值共享的方法将低级的滤波权值共享到高级,保证CNN的训练只在较小尺寸的图像块上进行,加快了训练速度。实验表明,在特征维数比较低的情况下,MLPCNN提取到的特征比传统的特征提取方法更加有效,在Caltech101数据库上,MLPCNN识别率达到81.32%,而且训练速度较TCNN提高了约2.5倍。 展开更多
关键词 深度学习 多级金字塔卷积神经网络 特征表示 特征共享
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部