期刊文献+
共找到162篇文章
< 1 2 9 >
每页显示 20 50 100
High-Quality Single-Pixel Imaging Based on Large-Kernel Convolution under Low-Sampling Conditions
1
作者 Chenyu Yuan Yuanhao Su Chunfang Wang 《Chinese Physics Letters》 2025年第4期55-61,共7页
In recent years,deep learning has been introduced into the field of Single-pixel imaging(SPI),garnering significant attention.However,conventional networks still exhibit limitations in preserving image details.To addr... In recent years,deep learning has been introduced into the field of Single-pixel imaging(SPI),garnering significant attention.However,conventional networks still exhibit limitations in preserving image details.To address this issue,we integrate Large Kernel Convolution(LKconv)into the U-Net framework,proposing an enhanced network structure named U-LKconv network,which significantly enhances the capability to recover image details even under low sampling conditions. 展开更多
关键词 large kernel convolution lkconv recover image details U lkconv network high quality single pixel imaging U Net low sampling conditions enhanced network structure large kernel convolution
原文传递
Multi-perception large kernel convnet for efficient image super-resolution
2
作者 MIAO Xuan LI Zheng XU Wen-Zheng 《四川大学学报(自然科学版)》 北大核心 2025年第1期67-78,共12页
Significant advancements have been achieved in the field of Single Image Super-Resolution(SISR)through the utilization of Convolutional Neural Networks(CNNs)to attain state-of-the-art performance.Recent efforts have e... Significant advancements have been achieved in the field of Single Image Super-Resolution(SISR)through the utilization of Convolutional Neural Networks(CNNs)to attain state-of-the-art performance.Recent efforts have explored the incorporation of Transformers to augment network performance in SISR.However,the high computational cost of Transformers makes them less suitable for deployment on lightweight devices.Moreover,the majority of enhancements for CNNs rely predominantly on small spatial convolutions,thereby neglecting the potential advantages of large kernel convolution.In this paper,the authors propose a Multi-Perception Large Kernel convNet(MPLKN)which delves into the exploration of large kernel convolution.Specifically,the authors have architected a Multi-Perception Large Kernel(MPLK)module aimed at extracting multi-scale features and employ a stepwise feature fusion strategy to seamlessly integrate these features.In addition,to enhance the network's capacity for nonlinear spatial information processing,the authors have designed a Spatial-Channel Gated Feed-forward Network(SCGFN)that is capable of adapting to feature interactions across both spatial and channel dimensions.Experimental results demonstrate that MPLKN outperforms other lightweight image super-resolution models while maintaining a minimal number of parameters and FLOPs. 展开更多
关键词 Single Image Super-Resolution Lightweight model deep learning large kernel
在线阅读 下载PDF
LKAW: A Robust Watermarking Method Based on Large Kernel Convolution and Adaptive Weight Assignment
3
作者 Xiaorui Zhang Rui Jiang +3 位作者 Wei Sun Aiguo Song Xindong Wei Ruohan Meng 《Computers, Materials & Continua》 SCIE EI 2023年第4期1-17,共17页
Robust watermarking requires finding invariant features under multiple attacks to ensure correct extraction.Deep learning has extremely powerful in extracting features,and watermarking algorithms based on deep learnin... Robust watermarking requires finding invariant features under multiple attacks to ensure correct extraction.Deep learning has extremely powerful in extracting features,and watermarking algorithms based on deep learning have attracted widespread attention.Most existing methods use 3×3 small kernel convolution to extract image features and embed the watermarking.However,the effective perception fields for small kernel convolution are extremely confined,so the pixels that each watermarking can affect are restricted,thus limiting the performance of the watermarking.To address these problems,we propose a watermarking network based on large kernel convolution and adaptive weight assignment for loss functions.It uses large-kernel depth-wise convolution to extract features for learning large-scale image information and subsequently projects the watermarking into a highdimensional space by 1×1 convolution to achieve adaptability in the channel dimension.Subsequently,the modification of the embedded watermarking on the cover image is extended to more pixels.Because the magnitude and convergence rates of each loss function are different,an adaptive loss weight assignment strategy is proposed to make theweights participate in the network training together and adjust theweight dynamically.Further,a high-frequency wavelet loss is proposed,by which the watermarking is restricted to only the low-frequency wavelet sub-bands,thereby enhancing the robustness of watermarking against image compression.The experimental results show that the peak signal-to-noise ratio(PSNR)of the encoded image reaches 40.12,the structural similarity(SSIM)reaches 0.9721,and the watermarking has good robustness against various types of noise. 展开更多
关键词 Robust watermarking large kernel convolution adaptive loss weights high-frequency wavelet loss deep learning
在线阅读 下载PDF
A multi-scale convolutional auto-encoder and its application in fault diagnosis of rolling bearings 被引量:12
4
作者 Ding Yunhao Jia Minping 《Journal of Southeast University(English Edition)》 EI CAS 2019年第4期417-423,共7页
Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on ... Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on the standard convolutional auto-encoder.In this model,the parallel convolutional and deconvolutional kernels of different scales are used to extract the features from the input signal and reconstruct the input signal;then the feature map extracted by multi-scale convolutional kernels is used as the input of the classifier;and finally the parameters of the whole model are fine-tuned using labeled data.Experiments on one set of simulation fault data and two sets of rolling bearing fault data are conducted to validate the proposed method.The results show that the model can achieve 99.75%,99.3%and 100%diagnostic accuracy,respectively.In addition,the diagnostic accuracy and reconstruction error of the one-dimensional multi-scale convolutional auto-encoder are compared with traditional machine learning,convolutional neural networks and a traditional convolutional auto-encoder.The final results show that the proposed model has a better recognition effect for rolling bearing fault data. 展开更多
关键词 fault diagnosis deep learning convolutional auto-encoder multi-scale convolutional kernel feature extraction
在线阅读 下载PDF
基于YOLOv8改进的跌倒检测算法:CASL-YOLO 被引量:1
5
作者 徐慧英 赵蕊 +1 位作者 朱信忠 黄晓 《浙江师范大学学报(自然科学版)》 CAS 2025年第1期36-44,共9页
跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部... 跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部署应用于实际生活场景.针对上述问题,提出了一种在复杂环境下轻量级的基于YOLOv8模型改进的跌倒检测算法:CASL-YOLO.首先,该模型引入空间深度卷积(SPD-Conv)模块替代传统卷积模块,通过对每个特征映射进行卷积操作,保留通道维度中的全部信息,从而提高模型在低分辨率图像和小物体检测方面的性能;其次,引入基于位置信息的注意力机制,以捕获跨通道、方向和位置感知的信息,从而更准确地定位和识别人体目标;最后,在特征提取模块中引入选择性大卷积核(LSKNet)动态调整感受野,以有效处理跌倒检测场景中的复杂环境信息,提高网络的感知能力和检测精度.实验结果表明,在公开的Human Fall数据集上,CASL-YOLO的mAP@0.5达到96.8%,优于基线YOLOv8n,同时模型仅有3.4×MiB的参数量和11.7×10^(9)的计算量.相比其他检测算法,CASL-YOLO在参数量和计算量小幅增加的情况下,实现了更高的精度和性能,同时满足实际场景的部署要求. 展开更多
关键词 跌倒检测 YOLOv8 注意力机制 空间深度卷积 选择性大卷积核
在线阅读 下载PDF
改进YOLOv8n的选通图像目标检测算法 被引量:1
6
作者 田青 王颖 +1 位作者 张正 羊强 《计算机工程与应用》 北大核心 2025年第2期124-134,共11页
激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,... 激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,使用大核卷积C2f-DSF更有效地捕获输入数据的全局信息。添加了多头注意力检测头Detect-SEAM模块,增强了特征提取和目标识别的能力。为了获取不同感受野的上下文信息,增强特征提取能力,使用了SPPF-M模块。采用上采样算子Dysample,减少特征信息的损失,从而提高小目标的检测精度。改进的YOLOv8n算法在选通图像数据集上mAP@0.5提高了2.4个百分点,mAP@0.5:0.95提高了1.8个百分点。为了验证改进的YOLOv8n算法的泛化性,选取KITTI数据集实验,相比于YOLOv8n算法改进YOLOv8n的mAP@0.5提高了4.3个百分点,mAP@0.5:0.95提高了3.5个百分点。 展开更多
关键词 选通图像 YOLOv8n 遮挡目标 小目标 大卷积核
在线阅读 下载PDF
基于EE-YOLOv8s的多场景火灾迹象检测算法 被引量:2
7
作者 崔克彬 耿佳昌 《图学学报》 北大核心 2025年第1期13-27,共15页
针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征... 针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征提取网络,保证模型轻量化的同时,优化图像特征提取;引入大型可分离核注意力机制LSKA改进SPPELAN模块,将空间金字塔部分改进为SPP_LSKA_ELAN,充分捕获大范围内的空间细节信息,在复杂多变的火灾场景中提取更全面的特征,从而区分目标与相似物体的差异;Neck部分引入可变形卷积DCN和跨空间高效多尺度注意力EMA,实现C2f_DCN_EMA可变形卷积校准模块,增强对烟火目标边缘轮廓变化的适应能力,促进特征的融合与校准,突出目标特征;在Head部分增设携带有轻量级、无参注意力机制SimAM的小目标检测头,并重新规划检测头通道数,加强多尺寸目标表征能力的同时,降低冗余以提高参数有效利用率。实验结果表明,改进后的EE-YOLOv8s网络模型相较于原模型,其参数量减少了13.6%,准确率提升了6.8%,召回率提升了7.3%,mAP提升了5.4%,保证检测速度的同时,提升了火灾迹象目标的检测性能。 展开更多
关键词 烟火目标检测 EfficientNetEasy主干网络 大型可分离核注意力机制 可变形卷积校准模块 小目标检测
在线阅读 下载PDF
增强特征表示的绝缘子缺陷检测方法
8
作者 李丽芬 王明 +1 位作者 曹旺斌 梅华威 《计算机工程与设计》 北大核心 2025年第8期2373-2379,共7页
针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提... 针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提取能力;以重参数化技术为基础,提出了C2f-DBB模块,处理目标缺陷特征相似的问题;在边界框回归阶段使用MPDIoU作为损失函数,使得模型更加关注高质量锚框。实验结果表明,FLDM-YOLO模型在保证一定检测速度的前提下,mAP为91.3%,较YOLOv8模型提高了4.2%,可有效应用于实际的巡检工作。 展开更多
关键词 目标检测 绝缘子 部分卷积 主干特征提取网络 大核可分离注意力 重参数化 边界框损失函数
在线阅读 下载PDF
多尺度动态视觉网络的手术机器人场景分割
9
作者 刘敏 秦敦璇 +2 位作者 韩雨斌 陈祥 王耀南 《中国图象图形学报》 北大核心 2025年第7期2542-2557,共16页
目的机器人辅助腹腔镜手术指的是临床医生借助腔镜手术机器人完成外科手术。然而,腔镜手术在密闭的人体腔道完成,且分割目标的特征复杂多变,对医生的手术技能有较高要求。为辅助医生完成腔镜手术,提出一种高精度的腔镜手术场景分割方法... 目的机器人辅助腹腔镜手术指的是临床医生借助腔镜手术机器人完成外科手术。然而,腔镜手术在密闭的人体腔道完成,且分割目标的特征复杂多变,对医生的手术技能有较高要求。为辅助医生完成腔镜手术,提出一种高精度的腔镜手术场景分割方法,并搭建分体式腔镜手术机器人对所提出的方法进行了验证。方法首先,提出了多尺度动态视觉网络(multi-scale dynamic visual network,MDVNet)。该网络采用编码器—解码器结构。在编码器部分,动态大核卷积注意力模块(dynamic large kernel attention module,DLKA)可以通过多尺度大核注意力提取不同分割目标的多尺度特征,并动态选择机制进行自适应的特征融合。在解码器部分,低秩矩阵分解模块(lowrank matrix decomposition module,LMD)引导不同分辨率的特征图进行融合,可以有效滤除特征图中的噪声;边界引导模块(boundary guided module,BGM)可以引导模型学习手术场景的边界特征。最后,展示了基于Lap Game腹腔镜模拟器搭建的分体式腔镜手术机器人,网络模型的分割结果可以映射在手术机器人的视野中,辅助医生进行腔镜手术。结果MDVNet在3个手术场景数据集上取得了最先进的结果,平均交并比分别为51.19%、71.28%和52.47%。结论本文提出了适用于腔镜手术场景分割的多尺度动态视觉网络MDVNet,并在搭建的分体式腔镜手术机器人上对所提出方法进行了验证。代码开源地址为:https://github.com/YubinHan73/MDVNet。 展开更多
关键词 腔镜手术机器人 语义分割 大核卷积 低秩矩阵分解(LMD) 边界分割
原文传递
基于改进YOLOv7的遥感图像旋转目标检测 被引量:1
10
作者 崔家礼 刘远 《微电子学与计算机》 2025年第4期48-57,共10页
遥感图像目标的高效精确检测是目标检测领域的重要问题。然而,物体有限的外观纹理特征和多样的旋转方向使得遥感图像目标检测变得困难。针对这些问题,提出了一种改进YOLOv7的遥感图像旋转目标检测算法。首先,引入KL(Kullback-Leibler)... 遥感图像目标的高效精确检测是目标检测领域的重要问题。然而,物体有限的外观纹理特征和多样的旋转方向使得遥感图像目标检测变得困难。针对这些问题,提出了一种改进YOLOv7的遥感图像旋转目标检测算法。首先,引入KL(Kullback-Leibler)散度作为回归损失函数将旋转框坐标转换为二维高斯分布,解决了传统水平框检测在计算旋转角度时产生边界不连续的问题。其次,引入选择性大核卷积改造YOLOv7网络的特征提取模块,增强网络对目标形状、类别、尺度等特征信息的感知能力,提高网络模型的精度。最后,针对检测头中分类和回归任务共享特征带来的精度下降问题,采用了TSCODE特征解耦的检测头,提升了网络对分类特征和回归特征的学习能力。在DOTAv1.0和HRSC2016数据集上进行了相关实验,验证了所提方法的有效性和鲁棒性。 展开更多
关键词 遥感图像旋转检测 密集场景 选择性大核卷积 渐进式融合解耦检测头 YOLOv7
在线阅读 下载PDF
融合大卷积核的风电锚栓裂纹检测
11
作者 孙前来 荆佳鹏 +2 位作者 张帅 胡啸 刘瑞珍 《制造业自动化》 2025年第3期142-148,共7页
风电锚栓在加工过程中通常会产生表面裂纹等缺陷,针对锚栓表面细长裂纹检测效率低、精度差的问题,提出了一种融合大卷积核的YOLOv5s网络。首先,在特征提取网络中融合大卷积核,来获得更大的有效感受野、提取更多的空间信息。其次,引入单... 风电锚栓在加工过程中通常会产生表面裂纹等缺陷,针对锚栓表面细长裂纹检测效率低、精度差的问题,提出了一种融合大卷积核的YOLOv5s网络。首先,在特征提取网络中融合大卷积核,来获得更大的有效感受野、提取更多的空间信息。其次,引入单卷积核的全维动态卷积,采用并行策略,同时学习四个不同维度的特征,不仅减少了计算量,而且提高了特征提取能力。最后添加协调注意力机制,增强对位置信息的提取能力。实验结果表明,该算法较原YOLOv5s模型在风电锚栓裂纹数据集上mAP提高了3%,FLOPs减少了21.5%,FPS达到了85帧/秒。可以满足工业生产的实时性、准确性要求。 展开更多
关键词 Yolov5s 锚栓裂纹检测 全维动态卷积 大卷积核
在线阅读 下载PDF
FFConvNeXt3D:提取中大规模目标特征的大卷积核网络 被引量:1
12
作者 黄乾坤 黄蔚 凌兴宏 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期37-43,共7页
目前大卷积核模型在图像领域已经证明其有效性,但是在视频领域还没有优秀的3D大卷积核模型。此外,之前的工作中忽视了时空行为检测任务主体是人的特点,其中的骨干网络只针对通用目标提取特征。针对上述原因,提出了一种含有特征融合结构... 目前大卷积核模型在图像领域已经证明其有效性,但是在视频领域还没有优秀的3D大卷积核模型。此外,之前的工作中忽视了时空行为检测任务主体是人的特点,其中的骨干网络只针对通用目标提取特征。针对上述原因,提出了一种含有特征融合结构的3D大卷积核神经网络(FFConvNeXt3D)。首先,将成熟的ConvNeXt网络膨胀成用于视频领域的ConvNeXt3D网络,其中,预训练权重也进行处理用于膨胀后的网络。其次,研究了卷积核时间维度大小和位置对模型性能的影响。最后,提出了一个特征融合结构,着重提高骨干网络提取人物大小目标特征的能力。在UCF101-24数据集上进行了消融实验和对比实验,实验结果验证了特征融合结构的有效性,并且该模型性能优于其他方法。 展开更多
关键词 大卷积核 目标检测 时空行为检测 行为识别 特征融合
在线阅读 下载PDF
基于改进SqueezeNet网络模型的破碎玉米籽粒识别方法 被引量:1
13
作者 姚艳春 崔春晓 +1 位作者 耿端阳 赵博 《农业工程学报》 北大核心 2025年第9期154-164,共11页
为解决SqueezeNet网络模型识别玉米等小籽粒目标存在网络层次深、卷积计算量大等问题,该研究提出了一种改进SqueezeNet网络模型的破碎玉米籽粒识别方法。首先,为优化网络结构并降低计算量,设计了SqueezeNet-dw2网络模型,改变SqueezeNet... 为解决SqueezeNet网络模型识别玉米等小籽粒目标存在网络层次深、卷积计算量大等问题,该研究提出了一种改进SqueezeNet网络模型的破碎玉米籽粒识别方法。首先,为优化网络结构并降低计算量,设计了SqueezeNet-dw2网络模型,改变SqueezeNet经典模型Fire层数,并修改了末尾卷积层的输入通道参数,修改普通卷积为深度可分离卷积;其次,利用Ghost模块设计了Fire模块expand层里的3×3卷积,改进SqueezeNet-dw2网络模型为SqueezeNet-dw2-gh网络模型,降低了模型计算量和参数量;最后,优选网络激活函数为具有参数化修正线性单元的变体激活函数PReLU,改进SqueezeNet-dw2-gh网络模型为SqueezeNet-dw2-gh-P网络模型,减小了因轻量化改进造成的准确率损失。结果表明,改进后的SqueezeNet-dw2-gh-P网络模型参数量仅为0.60 MB,比原始模型降低了51.61%,模型浮点运算量为36.71 MFLOPs,降低了48.54%,验证集准确率为93.98%,测试集准确率为92.33%,同时保证了破碎玉米籽粒识别精度。本文提出的改进SqueezeNet网络模型明显减少了参数量和浮点运算量,能够实现在移动端等资源受限的嵌入式设备上部署模型,对在线实时准确识别破碎玉米籽粒具有重要参考价值。 展开更多
关键词 深度学习 卷积神经网络 图像识别 破碎玉米籽粒 轻量化 SqueezeNet
在线阅读 下载PDF
基于多尺度自适应残差网络的轴承故障诊断 被引量:1
14
作者 朱海龙 董绍江 +1 位作者 赵兴新 黄翔 《组合机床与自动化加工技术》 北大核心 2025年第5期189-193,200,共6页
针对轴承故障诊断过程中传统模型在高噪声背景下依赖单一高维特征预测的局限性及其特征学习能力的不足,提出了一种基于多尺度自适应混合残差神经网络结构(MSCNN-FFDRSN)深度学习模型,该方法首先通过应用多尺度混合空洞卷积模块,增加模... 针对轴承故障诊断过程中传统模型在高噪声背景下依赖单一高维特征预测的局限性及其特征学习能力的不足,提出了一种基于多尺度自适应混合残差神经网络结构(MSCNN-FFDRSN)深度学习模型,该方法首先通过应用多尺度混合空洞卷积模块,增加模型的感受野和特征融合能力,减少参数量,实现高噪声背景下提升模型的性能和泛化能力。其次,对于深度残差收缩网络模块,通过引入可变核卷积,根据输入数据的变化自主进行动态改变卷积核大小,引入concat连接,使深层特征和浅层特征进一步融合,利用注意力模块和软阈值对逐通道特征赋不同阈值并降噪。实验表明,所提方法在XJTU-SY公开轴承数据集上平均准确率表现为98.70%,并在某公司自制的轴承故障数据集(CME)上也表现出了极高的准确率和较快的收敛速度。 展开更多
关键词 多尺度空洞卷积 深度残差收缩网络 可变核卷积 注意力机制
在线阅读 下载PDF
基于残差网络的特征融合方法 被引量:1
15
作者 蒲巍 李文辉 《吉林大学学报(信息科学版)》 2025年第2期276-287,共12页
针对残差网络存在特征冗余、有效感受野不足等问题,提出了特征融合模块。该模块可以在模型通道扩增过程中,实现不同尺度特征融合,从而构建出信息更丰富的多尺度特征,提高通道利用率。并且该模块还包含了少量大核卷积,其有助于扩大模型... 针对残差网络存在特征冗余、有效感受野不足等问题,提出了特征融合模块。该模块可以在模型通道扩增过程中,实现不同尺度特征融合,从而构建出信息更丰富的多尺度特征,提高通道利用率。并且该模块还包含了少量大核卷积,其有助于扩大模型的有效感受野,实现性能和计算效率的平衡。同时还提出了轻量化的下采样和混排压缩模块,可充分降低模型的参数,使整个方法更高效。将特征融合、下采样以及混排压缩模块引入残差网络可以构建出特征融合网络(FFNet:Feature Fusion Network)。其具有更快的收敛速度、更大的有效感受野,以及更好的性能表现。经在CIFAR(Canadian Institute for Advanced Research)、ImageNet以及COCO(Microsoft Common Objects in Context)数据集的大量实验结果证明了其能在仅增加少量参数和FLOPs(Floating Point Operations)的前提下,在分类、目标检测以及实例分割任务上使其性能显著提升。 展开更多
关键词 特征融合 残差网络 卷积神经网络 大核卷积
在线阅读 下载PDF
复杂场景下无人驾驶障碍检测算法
16
作者 程铄棋 伊力哈木·亚尔买买提 +2 位作者 谢丽蓉 侯雪扬 马颖 《哈尔滨工业大学学报》 北大核心 2025年第6期160-170,共11页
为解决复杂路况下因目标遮挡及小目标信息缺失导致现有无人驾驶目标检测算法准确率低的问题,提出了基于改进YOLOv8的无人驾驶障碍检测算法(YOLOv8 effectual accurate,YOLOv8-EA)。该算法首先引入快速神经网络作为主干网络,利用部分卷... 为解决复杂路况下因目标遮挡及小目标信息缺失导致现有无人驾驶目标检测算法准确率低的问题,提出了基于改进YOLOv8的无人驾驶障碍检测算法(YOLOv8 effectual accurate,YOLOv8-EA)。该算法首先引入快速神经网络作为主干网络,利用部分卷积提取空间特征,保证特征的完整性;其次,利用大内核深度卷积层重构快速金字塔池化层,采用并行多尺度连接的方式融合不同分辨率的自注意力特征,增强模型在复杂环境中的特征提取能力;然后,采用多分支结构和重参数化抑制信息干扰,并通过不断堆叠梯度流的方式提升特征融合能力;最后,基于部分卷积设计小目标检测头以处理小目标像素级特征信息。对比实验结果表明,相较于原模型,上述改进后,模型在性能上均有明显提升,并在检测精度上显著优于其他改进方式。消融实验结果表明,YOLOv8-EA在障碍检测精度方面取得显著提升,在KITTI数据集下,mAP50和mAP50-95分别提升了2.4%和4.7%;采用SODA10M数据集进行二次验证,mAP50和mAP50-95分别提升了1.4%和1.1%,证明YOLOv8-EA算法具有很好的泛化能力。所提算法在处理遮挡目标及小目标时,展现了出色的性能,为无人驾驶系统中的后续决策任务提供了更加可靠的支持。 展开更多
关键词 目标检测 无人驾驶 复杂道路场景 部分卷积 大内核深度卷积层
在线阅读 下载PDF
基于重参数化大核卷积的高分辨率姿态估计
17
作者 陈佳艺 黄晓宇 +1 位作者 吴胜昔 王学武 《华东理工大学学报(自然科学版)》 北大核心 2025年第3期341-352,共12页
尽管人体姿态估计领域的研究已取得显著进展,但面对动态场景变化、目标遮挡及背景复杂等难题,实现高精度、强鲁棒性的姿态估计依然面临巨大挑战。为解决这些问题,特别是关键点遮挡、重合及复杂环境干扰问题,本文提出了一种融合大核卷积... 尽管人体姿态估计领域的研究已取得显著进展,但面对动态场景变化、目标遮挡及背景复杂等难题,实现高精度、强鲁棒性的姿态估计依然面临巨大挑战。为解决这些问题,特别是关键点遮挡、重合及复杂环境干扰问题,本文提出了一种融合大核卷积技术的高分辨率人体姿态估计模型(RepLK-HRNet)。该模型的核心在于特征提取网络的独特设计,通过引入重参数化大核卷积策略,增强了模型捕捉多尺度、多层次特征信息的能力,同时通过调整网络结构,显著降低了参数量和计算复杂度。实验结果表明,相较于传统的高分辨率网络(HRNet)模型,RepLK-HRNet模型在标准数据集MS COCO2017上的精度提高了1.83%,在遮挡数据集OCHuman上的精度提高了23.7%,计算复杂度参数Params和GFLOPs分别下降了63.84%、37.69%。RepLK-HRNet模型在常规及遮挡、关键点混淆等条件下的人体姿态估计精度均实现了显著提升,展现了出色的鲁棒性和泛化能力,同时还满足了实际应用中对计算效率和存储空间的要求。 展开更多
关键词 姿态估计 重参数化大核卷积 HRNet 感受野 特征融合
在线阅读 下载PDF
机器视觉下吊装作业吊物与吊钩实时监测方法
18
作者 张颖 刘洋 +2 位作者 赵鹏程 张珂 吴义蓉 《安全与环境学报》 北大核心 2025年第2期508-517,共10页
为解决吊装作业数据集获取困难与吊装作业过程中重要对象(吊物与吊钩)监管难题,提出虚实结合的方法构建数据集,基于SketchUp软件建立虚拟吊装作业场景获取虚拟吊装作业图片,同时从网络获取吊装作业图片及现场作业视频截图,将真实作业场... 为解决吊装作业数据集获取困难与吊装作业过程中重要对象(吊物与吊钩)监管难题,提出虚实结合的方法构建数据集,基于SketchUp软件建立虚拟吊装作业场景获取虚拟吊装作业图片,同时从网络获取吊装作业图片及现场作业视频截图,将真实作业场景的图片与虚拟作业场景的图片共同组成虚实结合的数据集。引入可改变核卷积(Arbitrary Kernel Convolution,AKConv)和鬼魅空洞可分离卷积(Concentrated-Comprehensive Convolution with GhostBottleneck,C3Ghost)改进目标检测算法模型YOLOv5(You Only Look Once version 5),改进后的模型比原始模型在精确率上高出2.6百分点,在推理速度上高出9.1帧/s,且模型所占存储容量降低1.9 MB。搭建可视化操作界面,与优化好的模型整合成吊装作业实时监测系统,实现对吊物和吊钩的安全状态识别和风险预警,及时进行风险管控。 展开更多
关键词 安全工程 机器视觉 深度学习 吊装作业 可改变核卷积
原文传递
基于改进Yolov8的红外弱小目标识别算法
19
作者 李雪峰 李宁 +2 位作者 吴迪 于祥跃 郭永强 《激光与红外》 北大核心 2025年第5期789-797,共9页
为解决现有深度学习网络结构对红外弱小目标的识别针对性不足问题,提出了一种基于改进Yolov8的红外弱小目标识别算法(Yolov8n based on UniRepLK Block and Triplet Attention,UT-Yolov8)。该算法通过特征融合网络输出端的检测头引入三... 为解决现有深度学习网络结构对红外弱小目标的识别针对性不足问题,提出了一种基于改进Yolov8的红外弱小目标识别算法(Yolov8n based on UniRepLK Block and Triplet Attention,UT-Yolov8)。该算法通过特征融合网络输出端的检测头引入三重注意力机制,为特征融合网络内部添加新的小目标检测层、检测头,以及在特征提取网络的空间池化金字塔内结合大内核卷积,针对红外弱小目标的成像特性进行改进。算法在真实红外图像数据上进行验证,实验结果表明,UT-Yolov8算法在保持高检测速度的同时,有效提高了网络对于红外弱小目标识别精度,平均精度均值mAP@0.5达到了95.9%。 展开更多
关键词 红外弱小目标识别 Yolov8 大内核卷积 三重注意力机制 目标检测
在线阅读 下载PDF
基于多尺度特征聚合的轻量化跨视角匹配定位方法
20
作者 刘瑞康 卢俊 +4 位作者 郭海涛 朱坤 侯青峰 张雪松 汪泽田 《地球信息科学学报》 北大核心 2025年第1期193-206,共14页
【目的】跨视角图像匹配与定位是指通过将地视查询影像与带有地理标记的空视参考影像进行匹配,从而确定地视查询影像地理位置的技术。目前的跨视角图像匹配与定位技术主要使用固定感受野的CNN或者具有全局建模能力的Transformer作为特... 【目的】跨视角图像匹配与定位是指通过将地视查询影像与带有地理标记的空视参考影像进行匹配,从而确定地视查询影像地理位置的技术。目前的跨视角图像匹配与定位技术主要使用固定感受野的CNN或者具有全局建模能力的Transformer作为特征提取主干网络,不能充分考虑影像中不同特征之间的尺度差异,且由于网络参数量和计算复杂度较高,轻量化部署面临显著挑战。【方法】为了解决这些问题,本文提出了一种面向地面全景影像和卫星影像的多尺度特征聚合轻量化跨视角图像匹配与定位方法,首先使用LskNet提取影像特征,然后设计一个多尺度特征聚合模块,将影像特征聚合为全局描述符。在该模块中,本文将单个大卷积核分解为两个连续的相对较小的逐层卷积,从多个尺度聚合影像特征,显著减少了网络的参数量与计算量。【结果】本文在CVUSA、CVACT、VIGOR 3个公开数据集上进行了对比实验和消融实验,实验结果表明,本文方法在VIGOR数据集和CVACT数据集上的Top1召回率分别达到79.00%和91.43%,相比于目前精度最高的Sample4Geo分别提升了1.14%、0.62%,在CVUSA数据集上的Top1召回率达到98.64%,与Sample4Geo几乎相同,但参数量与计算量降至30.09 M和16.05 GFLOPs,仅为Sample4Geo的34.36%、23.70%。【结论】与现有方法相比,本文方法在保持高精度的同时,显著减少了参数量和计算量,降低了模型部署的硬件要求。 展开更多
关键词 跨视角图像匹配 多尺度特征 特征聚合 大卷积核分解 轻量化 地理定位
原文传递
上一页 1 2 9 下一页 到第
使用帮助 返回顶部