期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
FMCSNet: Mobile Devices-Oriented Lightweight Multi-Scale Object Detection via Fast Multi-Scale Channel Shuffling Network Model
1
作者 Lijuan Huang Xianyi Liu +1 位作者 Jinping Liu Pengfei Xu 《Computers, Materials & Continua》 2026年第1期1292-1311,共20页
The ubiquity of mobile devices has driven advancements in mobile object detection.However,challenges in multi-scale object detection in open,complex environments persist due to limited computational resources.Traditio... The ubiquity of mobile devices has driven advancements in mobile object detection.However,challenges in multi-scale object detection in open,complex environments persist due to limited computational resources.Traditional approaches like network compression,quantization,and lightweight design often sacrifice accuracy or feature representation robustness.This article introduces the Fast Multi-scale Channel Shuffling Network(FMCSNet),a novel lightweight detection model optimized for mobile devices.FMCSNet integrates a fully convolutional Multilayer Perceptron(MLP)module,offering global perception without significantly increasing parameters,effectively bridging the gap between CNNs and Vision Transformers.FMCSNet achieves a delicate balance between computation and accuracy mainly by two key modules:the ShiftMLP module,including a shift operation and an MLP module,and a Partial group Convolutional(PGConv)module,reducing computation while enhancing information exchange between channels.With a computational complexity of 1.4G FLOPs and 1.3M parameters,FMCSNet outperforms CNN-based and DWConv-based ShuffleNetv2 by 1%and 4.5%mAP on the Pascal VOC 2007 dataset,respectively.Additionally,FMCSNet achieves a mAP of 30.0(0.5:0.95 IoU threshold)with only 2.5G FLOPs and 2.0M parameters.It achieves 32 FPS on low-performance i5-series CPUs,meeting real-time detection requirements.The versatility of the PGConv module’s adaptability across scenarios further highlights FMCSNet as a promising solution for real-time mobile object detection. 展开更多
关键词 Object detection lightweight network partial group convolution multilayer perceptron
在线阅读 下载PDF
Improved lightweight road damage detection based on YOLOv5
2
作者 LIU Chang SUN Yu +2 位作者 CHEN Jin YANG Jing WANG Fengchao 《Optoelectronics Letters》 2025年第5期314-320,共7页
There is a problem of real-time detection difficulty in road surface damage detection. This paper proposes an improved lightweight model based on you only look once version 5(YOLOv5). Firstly, this paper fully utilize... There is a problem of real-time detection difficulty in road surface damage detection. This paper proposes an improved lightweight model based on you only look once version 5(YOLOv5). Firstly, this paper fully utilized the convolutional neural network(CNN) + ghosting bottleneck(G_bneck) architecture to reduce redundant feature maps. Afterwards, we upgraded the original upsampling algorithm to content-aware reassembly of features(CARAFE) and increased the receptive field. Finally, we replaced the spatial pyramid pooling fast(SPPF) module with the basic receptive field block(Basic RFB) pooling module and added dilated convolution. After comparative experiments, we can see that the number of parameters and model size of the improved algorithm in this paper have been reduced by nearly half compared to the YOLOv5s. The frame rate per second(FPS) has been increased by 3.25 times. The mean average precision(m AP@0.5: 0.95) has increased by 8%—17% compared to other lightweight algorithms. 展开更多
关键词 road surface damage detection convolutional neural network feature maps convolutional neural network cnn lightweight model yolov improved lightweight model spatial pyram
原文传递
改进YOLOv8n算法的船舶工业钢材表面缺陷检测
3
作者 刘鹏 侯博文 +2 位作者 王彩霞 姜晓娇 丛海芳 《兵工学报》 北大核心 2026年第3期35-49,共15页
为提高船舶工业中钢材表面缺陷检测的准确性,针对现有YOLOv8n算法在特征提取能力不足、检测精度低以及特征融合不充分等问题,提出一种基于改进YOLOv8n的钢材表面缺陷检测方法。构建高效视觉空间金字塔池化增强层聚合网络(Efficient Visi... 为提高船舶工业中钢材表面缺陷检测的准确性,针对现有YOLOv8n算法在特征提取能力不足、检测精度低以及特征融合不充分等问题,提出一种基于改进YOLOv8n的钢材表面缺陷检测方法。构建高效视觉空间金字塔池化增强层聚合网络(Efficient Vision Transformer-Spatial Pyramid Pooling with Enhanced Layer Aggregation Network,EfficientViT-SPPELAN),以增强多维度特征提取能力;设计多尺度时空卷积(Multi-Scale Spatial-Temporal Convolution,MSSTConv)实现多尺度特征融合;在此基础上构建多尺度时空(Multi-Scale Spatial-Temporal,MSST)模块以获取丰富的上下文信息,提高缺陷定位精度并降低计算复杂度,从而提升算法的推理效率。基于东北大学表面缺陷数据集(Northeastern University Surface Defect Dataset,NEU-DET)和镀锌钢10类缺陷检测数据集(Galvanized Steel 10-category Defect Detection Dataset,GC10-DET)两个数据集的实验结果表明,所提方法的检测精准度相较于原始YOLOv8n算法分别提升6.8%和5.7%,均值平均精确率mAP@0.5分别提高3.7%和7.9%;每秒帧数(Frames Per Second,FPS)分别达到189帧/s和142帧/s。研究结果表明,该方法在提升检测精度的同时保持较高计算效率,能够有效完成船舶钢材表面缺陷的定位和类别识别,满足工业场景对检测精度与实时性的需求。 展开更多
关键词 缺陷检测 YOLOv8n算法 多尺度时空模块 多尺度时空卷积 分组注意力
在线阅读 下载PDF
面向边缘计算设备的轻量级双目立体匹配网络
4
作者 武忠 朱虹 +1 位作者 蔺广逢 贺丽丽 《中国图象图形学报》 北大核心 2026年第2期589-608,共20页
目的 现有的高精度双目立体匹配网络因计算开销较高,难以部署到算力受限的边缘计算设备上,极大地限制了双目立体视觉系统的适用场景。针对此问题,提出一种轻量级实时立体匹配网络框架(light-weight binocular stereo matching framework... 目的 现有的高精度双目立体匹配网络因计算开销较高,难以部署到算力受限的边缘计算设备上,极大地限制了双目立体视觉系统的适用场景。针对此问题,提出一种轻量级实时立体匹配网络框架(light-weight binocular stereo matching framework, LBSM)。方法 首先,摒弃了高计算开销的“4D代价体+3D卷积”的主流方案,仅采用2D卷积与轻量化通道注意力机制构建了高效的融合注意力(merged attention, MA)代价聚合模块,在降低计算开销的同时减少了信息丢失,使得代价聚合过程更加高效;其次,提出空间自适应视差传播(adaptive disparity propagation, ADP)策略以替代双线性插值,以极低的代价(仅增加约0.03 M参数、0.36 G“乘法—累加”操作数和1.1 ms推理时间)将端点误差和1像素误差分别降低了21.54%和20.73%,揭示了视差上采样策略在轻量级模型中的重要性。在上述方法的基础上,构建了仅依赖2D卷积、无需任何3D卷积层的轻量级模型框架LBSM,通过简单配置即可生成系列模型。结果 实验结果表明,所提模型在大型数据集Scene Flow上以更低的计算开销取得了更高的准确性(LBSM-L以68.5%的“乘法—累加”操作数取得了明显高于BGNet(bilateral grid learning network)的准确性),而且在真实道路场景数据集KITTI 2012(Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago)和KITTI 2015上分别取得了低至2.41%和2.52%的错误率,显著优于ADCPNet(adaptive disparity candidates prediction network)、P3SNet(parallel pyramid pooling stereo network)等主流轻量级立体匹配模型。此外,在嵌入式AI(artificial intelligence)硬件平台上的部署实测显示,模型处理速度达4.59~20.29帧/s。结论 LBSM在计算开销与准确性之间实现了更好的权衡,能够在低算力边缘计算设备上实时完成双目立体匹配任务,在算力受限的实际场景中具有较大的应用潜力。 展开更多
关键词 双目立体视觉 全卷积网络 空间自适应性 轻量级模型 嵌入式智能设备
原文传递
基于多尺度特征融合的矿用钢索损伤检测网络
5
作者 徐永恒 裴晓芳 《计算机工程与设计》 北大核心 2026年第2期576-583,共8页
矿用钢索的安全性直接影响作业人员生命保障与设备运行,其损伤检测面临尺度多变、形态不规则的挑战。针对此问题,提出一种轻量级的可形变与多尺度融合网络。设计一种DRConv卷积模块,提升网络在复杂环境下的精度。基于MSDA注意力机制,提... 矿用钢索的安全性直接影响作业人员生命保障与设备运行,其损伤检测面临尺度多变、形态不规则的挑战。针对此问题,提出一种轻量级的可形变与多尺度融合网络。设计一种DRConv卷积模块,提升网络在复杂环境下的精度。基于MSDA注意力机制,提出空洞空间金字塔SPDA改进原有的SPPF模块,提升上采样效果。基于DCN和D-LKA的思想设计SLNK模块,并结合RT-DETR解码器中的CCFM网络,形成一种全新的融合多尺度和可形变卷积的颈部网络RTSLNK,轻量化模型的同时提高精度。实验结果表明,相较于原模型YOLOv8n,平均精度提高5.2%,参数量降低10.5%,在矿用钢索损伤检测任务中表现出色。 展开更多
关键词 矿用钢丝绳索 表面损伤检测 可形变卷积 空洞空间金字塔 可变形大核注意力 跨尺度特征融合 轻量化网络
在线阅读 下载PDF
基于DenseNet的儿童肺炎识别与多分类研究
6
作者 杨传婕 马志庆 +1 位作者 赵文华 赵爽 《中国医学物理学杂志》 2026年第3期393-400,共8页
针对儿童肺炎影像难以诊断的问题,提出一种基于DenseNet算法改进的儿童肺炎诊断模型,以提高诊断准确率。以DenseNet网络为基础模型融合空间和信道重构卷积,利用特征之间的空间和信道冗余对卷积神经网络进行压缩,提高推理效率。将空间组... 针对儿童肺炎影像难以诊断的问题,提出一种基于DenseNet算法改进的儿童肺炎诊断模型,以提高诊断准确率。以DenseNet网络为基础模型融合空间和信道重构卷积,利用特征之间的空间和信道冗余对卷积神经网络进行压缩,提高推理效率。将空间组智能增强模块嵌入网络,利用注意力掩码对不同位置的特征向量进行缩放调整,从而提高各组特征在空间维度上的鲁棒性。同时,增大网络前期卷积核和池化核,提高模型的表达能力。引入A2-Nets双重注意力网络,通过高效的特征聚合与传播机制,显著提升图像识别性能。实验结果表明,提出的方法取得显著的效果,在正常和肺炎的二分类准确率为97.8%;在细菌性和病毒性肺炎的二分类实验中达到82.3%的准确率;在正常、细菌性肺炎和病毒性肺炎三分类中取得83.1%的准确率。 展开更多
关键词 图像分类 医学图像处理 儿童肺炎 空间和信道重构卷积 空间组智能增强
在线阅读 下载PDF
TungNetV2:轻量级多尺度融合的钨矿石X射线图像分类网络
7
作者 朱建勇 张志 +1 位作者 杨文龙 杨辉 《中南大学学报(自然科学版)》 北大核心 2026年第2期488-504,共17页
提出了一种轻量级多尺度融合的钨矿石X射线图像分类网络——TungNetV2,该模型基于MobileNetV2架构,通过三阶段优化实现矿石分类性能的突破。首先,在步长为2的倒残差结构中,采用空间与通道重构卷积替换升维卷积,结合通道扩展因子压缩与... 提出了一种轻量级多尺度融合的钨矿石X射线图像分类网络——TungNetV2,该模型基于MobileNetV2架构,通过三阶段优化实现矿石分类性能的突破。首先,在步长为2的倒残差结构中,采用空间与通道重构卷积替换升维卷积,结合通道扩展因子压缩与残差连接构建SRC-Resblock模块,显著降低特征冗余并提升计算效率;其次,在步长为1的倒残差结构及网络末端嵌入高效多尺度注意力机制,自适应融合多尺度空间与通道特征,强化图像关键区域聚焦能力;再次,设计特征增强模块,通过空洞卷积与全局池化协同优化多尺度特征表达,缓解注意力机制的局部特征过拟合问题;最后,在包含5753张图像的钨矿石X射线数据集上进行仿真实验。研究结果表明:TungNetV2测试集准确率达91.03%,较MobileNetV2提升2.86个百分点,单图推理时间仅为23.06 ms。与MobileNetV3、ShuffleNetV2、RepVit等模型对比,TungNetV2在准确率、F_(1)分数等指标上均具显著优势。本文所提方法为工业场景下钨矿石的实时分选提供了高精度、低延迟的解决方案。 展开更多
关键词 钨矿石 X射线图像分类 轻量级网络 空间与通道重构卷积 高效多尺度注意力机制 特征增强模块
在线阅读 下载PDF
结合CWT和LightweightNet的滚动轴承实时故障诊断方法 被引量:7
8
作者 李飞龙 和伟辉 +1 位作者 刘立芳 齐小刚 《智能系统学报》 CSCD 北大核心 2023年第3期496-505,共10页
针对普通的深度学习算法用于轴承故诊断分类时计算量大、消耗成本高的问题,提出一种结合连续小波变换和轻量级神经网络的滚动轴承实时故障诊断方法。首先,使用Morlet母小波函数对轴承振动加速度数据进行连续小波变换,提取出时频域特征... 针对普通的深度学习算法用于轴承故诊断分类时计算量大、消耗成本高的问题,提出一种结合连续小波变换和轻量级神经网络的滚动轴承实时故障诊断方法。首先,使用Morlet母小波函数对轴承振动加速度数据进行连续小波变换,提取出时频域特征并将一维信号转换成二维图片;然后,结合分组卷积、通道混洗、倒残差结构等轻量级神经网络设计元素设计一个轻量级卷积神经网络LightweightNet用于时频图片的故障分类,LightweightNet网络在保证具有足够特征提取能力的同时还具有轻量级特点。使用凯斯西储大学轴承故障数据集进行实验表明,本方法相比于其他使用经典轻量级神经网络的方法具有更少的参数、最高的准确率和更快的诊断速度,基本可以实现滚动轴承的实时故障诊断,且在内存消耗与模型存储占用空间方面远小于其他同类方法。 展开更多
关键词 滚动轴承 故障诊断 连续小波变换 时频域特征 轻量级神经网络 分组卷积 通道混洗 倒残差结构
在线阅读 下载PDF
S^(2)ANet:Combining local spectral and spatial point grouping for point cloud processing 被引量:1
9
作者 Yujie LIU Xiaorui SUN +1 位作者 Wenbin SHAO Yafu YUAN 《虚拟现实与智能硬件(中英文)》 EI 2024年第4期267-279,共13页
Background Despite the recent progress in 3D point cloud processing using deep convolutional neural networks,the inability to extract local features remains a challenging problem.In addition,existing methods consider ... Background Despite the recent progress in 3D point cloud processing using deep convolutional neural networks,the inability to extract local features remains a challenging problem.In addition,existing methods consider only the spatial domain in the feature extraction process.Methods In this paper,we propose a spectral and spatial aggregation convolutional network(S^(2)ANet),which combines spectral and spatial features for point cloud processing.First,we calculate the local frequency of the point cloud in the spectral domain.Then,we use the local frequency to group points and provide a spectral aggregation convolution module to extract the features of the points grouped by the local frequency.We simultaneously extract the local features in the spatial domain to supplement the final features.Results S^(2)ANet was applied in several point cloud analysis tasks;it achieved stateof-the-art classification accuracies of 93.8%,88.0%,and 83.1%on the ModelNet40,ShapeNetCore,and ScanObjectNN datasets,respectively.For indoor scene segmentation,training and testing were performed on the S3DIS dataset,and the mean intersection over union was 62.4%.Conclusions The proposed S^(2)ANet can effectively capture the local geometric information of point clouds,thereby improving accuracy on various tasks. 展开更多
关键词 Local frequency Spectral and spatial aggregation convolution Spectral group convolution Point cloud representation learning Graph convolutional network
在线阅读 下载PDF
复杂场景下的多人人体姿态估计算法
10
作者 石磊 王天宝 +3 位作者 孟彩霞 王清贤 高宇飞 卫琳 《郑州大学学报(理学版)》 北大核心 2025年第4期1-7,共7页
复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,... 复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,在不引入额外计算成本的前提下提高算法精度;其次,引入空间注意力机制挖掘与人体姿态估计任务相关的空间语义特征,将网络结构并行化处理以提高算法性能;最后,对大卷积核和空间注意力机制的嵌入位置进行轻量化处理,减少时间开销。与现有的自底向上的姿态估计算法OpenPifPaf++相比,所提算法在COCO 2017数据集上平均准确率提高0.8个百分点;在CrowdPose数据集上平均准确率比OpenPifPaf算法提高1.2个百分点,复杂场景下对应的准确率提高1.5个百分点。 展开更多
关键词 复杂场景 多人人体姿态估计 分组卷积 空间注意力机制 轻量化
在线阅读 下载PDF
基于改进FasterNet和YOLOv8s的轨道扣件缺陷快速检测方法
11
作者 刘二林 李涛 冯海照 《北京交通大学学报》 北大核心 2025年第6期64-74,共11页
针对轨道扣件缺陷特征复杂且多样,传统检测方法存在效率低下和漏检率高的问题,基于YOLOv8s网络提出一种轻量级轨道扣件检测模型FPSI-YOLOv8s.首先,为降低模型复杂度,采用速度更快、参数量更小的FasterNet网络替代YOLOv8s中的CSPDarkNet5... 针对轨道扣件缺陷特征复杂且多样,传统检测方法存在效率低下和漏检率高的问题,基于YOLOv8s网络提出一种轻量级轨道扣件检测模型FPSI-YOLOv8s.首先,为降低模型复杂度,采用速度更快、参数量更小的FasterNet网络替代YOLOv8s中的CSPDarkNet53主干网络进行扣件缺陷特征提取;其次,采用位置感知循环卷积对YOLOv8s颈部的C2f模块进行重新设计,命名为FasterBlock,以实现多尺度特征融合与模型轻量化;再次,在SPPF层后引入空间分组增强(Spatial Group-wise Enhance,SGE)注意力机制,增强模型对扣件缺陷特征的敏感度,防止检测精度大幅下降;最后,使用Inner-IoU损失函数替代CIoU损失函数,加强模型对不同尺度和形状目标的检测能力,通过精细化的质量评估和梯度增益策略,增强模型的鲁棒性.实验结果表明:改进后的模型在仅损失0.7%检测精度的情况下,模型大小降低了29.78%,计算量和参数量分别减少了29.93%和30.46%,能够在保持较高精度的同时实现轻量化和提升运行效率,在轨道扣件的快速巡检领域具有良好的应用前景. 展开更多
关键词 YOLOv8s 轻量化 轨道扣件 位置感知循环卷积 空间分组增强注意力机制
在线阅读 下载PDF
YOLOv8-DEL:基于改进YOLOv8n的实时车辆检测算法研究 被引量:11
12
作者 古佳欣 陈高华 张春美 《计算机工程与应用》 北大核心 2025年第1期142-152,共11页
车辆检测是智能交通系统和自动驾驶的重要组成部分。然而,实际交通场景中存在许多不确定因素,导致车辆检测模型的准确率低实时性差。为了解决这个问题,提出了一种快速准确的车辆检测算法——YOLOv8-DEL。使用DGCST(dynamic group convol... 车辆检测是智能交通系统和自动驾驶的重要组成部分。然而,实际交通场景中存在许多不确定因素,导致车辆检测模型的准确率低实时性差。为了解决这个问题,提出了一种快速准确的车辆检测算法——YOLOv8-DEL。使用DGCST(dynamic group convolution shuffle transformer)模块代替C2f模块来重构主干网络,以增强特征提取能力并使网络更轻量;添加的P2检测层能使模型更敏锐地定位和检测小目标,同时采用Efficient RepGFPN进行多尺度特征融合,以丰富特征信息并提高模型的特征表达能力;通过结合GroupNorm和共享卷积的优点,设计了一种轻量型共享卷积检测头,在保持精度的前提下,有效减少参数量并提升检测速度。与YOLOv8相比,提出的YOLOv8-DEL在BDD100K数据集和KITTI数据集上,mAP@0.5分别提高了4.8个百分点和1.2个百分点,具有实时检测速度(208.6 FPS和216.4 FPS),在检测精度和速度方面实现了更有利的折中。 展开更多
关键词 车辆检测 YOLOv8 DGCST Efficient RepGFPN 轻量级检测头
在线阅读 下载PDF
基于结构重参数化和共享卷积的实时工业缺陷检测方法 被引量:1
13
作者 苏源 孙丹枫 +1 位作者 赵建勇 巫宝军 《现代制造工程》 北大核心 2025年第12期83-96,共14页
针对现代工业生产中高效缺陷检测的需求,提出了一种基于结构重参数化和共享卷积的实时工业缺陷检测方法,旨在提高检测精度与推理速度,降低模型复杂度。在特征提取阶段,设计了基于部分通道卷积与结构重参数化的LRD-ELAN模块。通过重参数... 针对现代工业生产中高效缺陷检测的需求,提出了一种基于结构重参数化和共享卷积的实时工业缺陷检测方法,旨在提高检测精度与推理速度,降低模型复杂度。在特征提取阶段,设计了基于部分通道卷积与结构重参数化的LRD-ELAN模块。通过重参数化模块与可变形卷积的引入,强化特征表达能力,减少冗余计算。在检测头设计中,提出轻量化GS-Head模块,利用Ghost共享卷积降低检测头计算量,结合组归一化提升小批量训练的稳定性。此外,在边界框预测分支中引入轻量级特征缩放层,增强多尺度目标检测能力,并使用inner-MPDIoU损失函数替代传统CIoU损失函数,进一步优化边界框预测性能。试验结果表明,在NEU-DET数据集上,该模型的mAP50较基线模型提升了2.46%,参数量和计算量分别减少了37.10%和33.58%,推理帧率达286.1 FPS,提升了10.82%,具备良好的实时性。在PKU-Market-PCB数据集的泛化测试中,mAP50较基线模型提升了1.91%,表现出较强的泛化能力和高效性。该模型在速度、精度与复杂度之间实现了良好平衡,展现出在工业缺陷检测中的应用潜力与优势。 展开更多
关键词 实时缺陷检测 结构重参数化 共享卷积 组归一化 模型轻量化 损失函数
在线阅读 下载PDF
改进YOLOv8的实时轻量化鲁棒绿篱检测算法 被引量:1
14
作者 张佳承 韦锦 陈义时 《计算机工程》 北大核心 2025年第7期362-374,共13页
针对道路两侧绿篱修剪的目标检测过程中对算法实时性、轻量化的要求以及算法在实际检测中的精度和光照鲁棒性问题,提出一种基于YOLOv8n的算法MGW-YOLO,并给出一种新的C2f_ModuGhost+模块来替换主干网络中的C2f模块,其中设计的调制可变... 针对道路两侧绿篱修剪的目标检测过程中对算法实时性、轻量化的要求以及算法在实际检测中的精度和光照鲁棒性问题,提出一种基于YOLOv8n的算法MGW-YOLO,并给出一种新的C2f_ModuGhost+模块来替换主干网络中的C2f模块,其中设计的调制可变形卷积增加了偏移量特征通道数,以加速模型的推理,增强算法实时性。在颈部网络中引入分组空间卷积(GSConv)轻量级卷积技术和slim-neck设计范式,并通过融合标准卷积、深度可分离卷积和Shuffle模块的思想,降低模型的参数量,实现模型的轻量化。设计一种具有双重加权机制的Focal-WIoU损失函数,WIoU中的双层交叉注意力机制可有效降低多个绿篱相连和遮挡时的误检率,并且利用Focal Loss权重因子提升对特殊形状绿篱等难分类样本的检测精度。另外采用TRADES方法的对抗训练策略,在分类问题鲁棒性与精度之间进行有效权衡。实验结果表明,相比基线算法YOLOv8n,MGW-YOLO的mAP@0.5和mAP@0.5∶0.95分别提高了3.29和2.87百分点,在无人驾驶底盘上的实验结果表明,MGW-YOLO相较于原始算法的预处理时间、每帧平均推理时间和每帧后处理时间分别降低了0.7 ms、10.7 ms和0.7 ms,检测速度提升了15.7帧/s,适用于绿篱修剪机在道路两侧实时性作业的需求。 展开更多
关键词 YOLOv8算法 目标检测 C2f_ModuGhost+模块 分组空间卷积轻量级卷积 Focal-WIoU损失函数 对抗训练
在线阅读 下载PDF
改进YOLOpose的轻量化多人姿态检测模型 被引量:1
15
作者 张欣毅 张运楚 +1 位作者 王菲 刘一铭 《小型微型计算机系统》 北大核心 2025年第1期167-172,共6页
二维人体姿态估计对安全生产、智能交互等研究都有重要的意义.针对目前的人体姿态估计模型计算量大、检测速度慢等问题,本文提出一种基于YOLOpose模型的轻量化改进算法.首先引入运算更精巧的GSConv卷积模块替换普通Conv卷积,大大降低模... 二维人体姿态估计对安全生产、智能交互等研究都有重要的意义.针对目前的人体姿态估计模型计算量大、检测速度慢等问题,本文提出一种基于YOLOpose模型的轻量化改进算法.首先引入运算更精巧的GSConv卷积模块替换普通Conv卷积,大大降低模型计算量和复杂度;然后用CARAFE模块替换UPSample模块,完成上采样工作,同时引入CBAM注意力机制模块以避免模型轻量化带来的精度降低的问题.实验结果表明,YOLOpose模型经过上述轻量化改进后,模型体量降低为135.6MB,降低了约15.8%,GFLOPS降为了86.9,降低了约15.0%,模型计算量显著降低,再加入CBAM注意力机制对模型精度影响较小,改进后模型既可以保证识别的准确度,又可以实现检测算法的轻量化. 展开更多
关键词 姿态估计 YOLOpose 轻量化 gsconv卷积 CARAFE模块
在线阅读 下载PDF
基于多尺度空间自适应注意力网络的轻量级图像超分辨率方法 被引量:2
16
作者 黄峰 刘鸿伟 +2 位作者 沈英 裘兆炳 陈丽琼 《模式识别与人工智能》 北大核心 2025年第1期36-50,共15页
针对现有图像超分辨率重建方法存在模型复杂度过高和参数量过大等问题,文中提出基于多尺度空间自适应注意力网络(Multi-scale Spatial Adaptive Attention Network,MSAAN)的轻量级图像超分辨率重建方法.首先,设计全局特征调制模块(Globa... 针对现有图像超分辨率重建方法存在模型复杂度过高和参数量过大等问题,文中提出基于多尺度空间自适应注意力网络(Multi-scale Spatial Adaptive Attention Network,MSAAN)的轻量级图像超分辨率重建方法.首先,设计全局特征调制模块(Global Feature Modulation Module,GFM),学习全局纹理特征.同时,设计轻量级的多尺度特征聚合模块(Multi-scale Feature Aggregation Module,MFA),自适应聚合局部至全局的高频空间特征.然后,融合GFM和MFA,提出多尺度空间自适应注意力模块(Multi-scale Spatial Adaptive Attention Module,MSAA).最后,通过特征交互门控前馈模块(Feature Interactive Gated Feed-Forward Module,FIGFF)增强局部信息提取能力,同时减少通道冗余.大量实验表明,MSAAN能捕捉更全面、更精细的特征,在保证轻量化的同时显著提升图像的重建效果. 展开更多
关键词 卷积神经网络 Transformer 轻量级图像超分辨率重建 多尺度空间自适应注意力
在线阅读 下载PDF
基于两阶段特征空间增强的小样本图像分类模型 被引量:1
17
作者 黎格献 章晓爽 +3 位作者 贺永姣 杜阳 张艳莎 王林 《湖北民族大学学报(自然科学版)》 2025年第2期231-236,279,共7页
在小样本学习任务中,针对传统的骨干卷积网络在提取图像特征时,由于多层卷积忽视细节特征导致特征信息丢失,因而图像分类准确率不高的问题,提出了基于两阶段特征空间增强的小样本图像分类模型。首先,该模型在残差网络(residual network,... 在小样本学习任务中,针对传统的骨干卷积网络在提取图像特征时,由于多层卷积忽视细节特征导致特征信息丢失,因而图像分类准确率不高的问题,提出了基于两阶段特征空间增强的小样本图像分类模型。首先,该模型在残差网络(residual network, ResNet)12的底层引入中值增强的空间和通道注意力块(median-enhanced spatial and channel attention block, MESC);然后,该模型在ResNet12的中高层引入空间组增强(spatial group-wise enhance, SGE)模块,提升卷积神经网络中的语义特征学习能力,使模型有效提取特征图关键信息。该模型通过增强有限的训练样本的特征表示来提高分类性能,增强模型对噪声的鲁棒性。结果表明,该模型在加州理工学院-加利福尼亚大学圣地亚哥分校鸟类(California Institute of Technology-University of California at San Diego birds, CUB)-200-2011数据集上,5类别1样本和5类别5样本2种参数设置下的分类准确率分别比分布传播图网络(distribution propagation graph network, DPGN)模型提高了约5.15%和1.92%;在分层图像网络(tiered ImageNet, tieredImageNet)数据集上,这2种参数设置下的分类准确率分别比DPGN模型提高了约1.04%和0.55%。该模型提升了小样本图像分类任务的性能。 展开更多
关键词 卷积神经网络 小样本学习 图像分类 特征空间增强 注意力机制 通道注意力 空间组增强
在线阅读 下载PDF
基于改进YOLOv8n的林草火灾检测算法 被引量:1
18
作者 赵佳硕 马晓春 刘舰泽 《森林工程》 北大核心 2025年第5期1013-1024,共12页
在林草火灾场景中,明火形态的多样性以及环境的复杂性可能导致误检或漏检的现象发生,为此,针对森林与草原火灾提出一种基于改进的YOLOv8n火灾检测算法(YOLOv8n-CSA),CSA(channel-spatial attention)为通道-空间注意力模块,引入分组混洗... 在林草火灾场景中,明火形态的多样性以及环境的复杂性可能导致误检或漏检的现象发生,为此,针对森林与草原火灾提出一种基于改进的YOLOv8n火灾检测算法(YOLOv8n-CSA),CSA(channel-spatial attention)为通道-空间注意力模块,引入分组混洗卷积模块(group shuffle convolution,GSConv)替换原YOLOv8n中第3层标准卷积模块(convolution,Conv),降低模型计算量,提高特征提取能力。并且在head中引入Slim-Neck结构进一步降低模型计算量。同时设计YOLOv8n-CSA融入Backbone部分,以增强输入特征图的表达能力。该模块结合通道注意力、通道洗牌和空间注意力机制,旨在捕捉特征图中的全局依赖关系。基于林草火灾数据集,在未导入预训练模型的情况下,提出的火灾检测网络模型在测试的数据集上相比原模型YOLOv8n,其精确率(Precision)提高了3.7%、召回率(Recall)提高了1.51%、平均精度均值(mAP50)提高了3.24%、计算复杂度(GFLOPs)下降5.62%。试验结果表明,该算法验证计算量减少的同时,能够提升火灾迹象目标的检测性能。 展开更多
关键词 火灾检测 YOLOv8 通道空间注意力 Slim-Neck结构 分组混洗卷积模块gsconv
在线阅读 下载PDF
融合空间与通道重构卷积和注意力的轻量型动物姿态估计 被引量:1
19
作者 宰清鹏 徐杨 《计算机工程与应用》 北大核心 2025年第6期282-294,共13页
动物姿态估计在行为生态学、动物健康监测、野生动物保护等领域的重要性不断凸显。然而,目前主流的动物姿态估计算法过于关注准确率,导致网络复杂度和计算成本不断攀升,这使得在移动设备和嵌入式平台上的应用受到了限制。针对该问题,提... 动物姿态估计在行为生态学、动物健康监测、野生动物保护等领域的重要性不断凸显。然而,目前主流的动物姿态估计算法过于关注准确率,导致网络复杂度和计算成本不断攀升,这使得在移动设备和嵌入式平台上的应用受到了限制。针对该问题,提出融合空间与通道重构卷积和金字塔分割注意力的多尺度动物姿态估计网络SPANet。使用金字塔分割注意力与坐标注意力机制,重新设计了高分辨率网络的瓶颈层EPSAneck,在减轻过度使用大卷积核带来的计算成本的同时,增强了网络对有用特征的提取能力;提出了基于空间和通道重构卷积以及坐标注意力机制的SCCAblock基础模块,在显著减少计算冗余和内存访问的同时,增强了通道与空间之间的信息交互;利用反卷积模块对网络输出的特征融合方式进行重新设计,进一步提升了网络的准确率。实验结果表明,提出的网络模型相较于高分辨率网络在AP10K测试集上的平均精度提升了1.8个百分点,同时浮点运算量降低了48.5%、模型参数量减少了67.0%。在AnimalPose数据集上,浮点运算量降低49.5%,模型参数量降低67.0%。实验数据表明,该网络可在降低模型复杂度的同时实现预测精度的小范围提升。 展开更多
关键词 动物姿态估计 轻量型 高分辨率 注意力机制 空间与通道重构卷积
在线阅读 下载PDF
基于GADF与SAM-LCNN机制的石化离心风机轴承故障诊断方法 被引量:1
20
作者 刘森 刘美 +2 位作者 韩惠子 崔坤 陈曦 《机电工程》 北大核心 2025年第1期72-81,共10页
针对石化离心风机轴承故障诊断方法精度不高、诊断速度慢和泛化性较差的问题,提出了一种基于格拉姆角差场(GADF)图像编码以及融合了空间注意力机制的轻量化卷积神经网络(SAM-LCNN)的石化离心风机轴承故障诊断方法。首先,使用格拉姆角差... 针对石化离心风机轴承故障诊断方法精度不高、诊断速度慢和泛化性较差的问题,提出了一种基于格拉姆角差场(GADF)图像编码以及融合了空间注意力机制的轻量化卷积神经网络(SAM-LCNN)的石化离心风机轴承故障诊断方法。首先,使用格拉姆角差场将轴承一维振动信号编码为二维图像;然后,构建了融合空间注意力机制的轻量化卷积神经网络;最后,将GADF转换所得二维图像作为融合空间注意力机制的轻量化卷积神经网络的输入,进行了特征提取与故障诊断,分别采用了广东石油化工学院的石化多级离心风机轴承故障数据集与凯斯西储大学轴承故障数据集,对该方法的有效性及优越性进行了验证。研究结果表明:两种数据集的测试集分类准确率分别为99.7%和98.5%;相较于卷积神经网络(CNN)、LeNet-5和MobileNetV2三种对比方法,该离心风机滚动轴承诊断方法具有诊断精度高、诊断速度快和泛化能力强等优点。该方法能够有效地对石化离心风机轴承故障振动信号进行分类,可为石化安全生产提供保障,同时也为其他机械设备故障诊断提供参考。 展开更多
关键词 离心风机 滚动轴承 图像编码 格拉姆角场 轻量化卷积神经网络 空间注意力机制
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部