期刊文献+
共找到178篇文章
< 1 2 9 >
每页显示 20 50 100
High-Quality Single-Pixel Imaging Based on Large-Kernel Convolution under Low-Sampling Conditions
1
作者 Chenyu Yuan Yuanhao Su Chunfang Wang 《Chinese Physics Letters》 2025年第4期55-61,共7页
In recent years,deep learning has been introduced into the field of Single-pixel imaging(SPI),garnering significant attention.However,conventional networks still exhibit limitations in preserving image details.To addr... In recent years,deep learning has been introduced into the field of Single-pixel imaging(SPI),garnering significant attention.However,conventional networks still exhibit limitations in preserving image details.To address this issue,we integrate Large Kernel Convolution(LKconv)into the U-Net framework,proposing an enhanced network structure named U-LKconv network,which significantly enhances the capability to recover image details even under low sampling conditions. 展开更多
关键词 large kernel convolution lkconv recover image details U lkconv network high quality single pixel imaging U Net low sampling conditions enhanced network structure large kernel convolution
原文传递
LKAW: A Robust Watermarking Method Based on Large Kernel Convolution and Adaptive Weight Assignment
2
作者 Xiaorui Zhang Rui Jiang +3 位作者 Wei Sun Aiguo Song Xindong Wei Ruohan Meng 《Computers, Materials & Continua》 SCIE EI 2023年第4期1-17,共17页
Robust watermarking requires finding invariant features under multiple attacks to ensure correct extraction.Deep learning has extremely powerful in extracting features,and watermarking algorithms based on deep learnin... Robust watermarking requires finding invariant features under multiple attacks to ensure correct extraction.Deep learning has extremely powerful in extracting features,and watermarking algorithms based on deep learning have attracted widespread attention.Most existing methods use 3×3 small kernel convolution to extract image features and embed the watermarking.However,the effective perception fields for small kernel convolution are extremely confined,so the pixels that each watermarking can affect are restricted,thus limiting the performance of the watermarking.To address these problems,we propose a watermarking network based on large kernel convolution and adaptive weight assignment for loss functions.It uses large-kernel depth-wise convolution to extract features for learning large-scale image information and subsequently projects the watermarking into a highdimensional space by 1×1 convolution to achieve adaptability in the channel dimension.Subsequently,the modification of the embedded watermarking on the cover image is extended to more pixels.Because the magnitude and convergence rates of each loss function are different,an adaptive loss weight assignment strategy is proposed to make theweights participate in the network training together and adjust theweight dynamically.Further,a high-frequency wavelet loss is proposed,by which the watermarking is restricted to only the low-frequency wavelet sub-bands,thereby enhancing the robustness of watermarking against image compression.The experimental results show that the peak signal-to-noise ratio(PSNR)of the encoded image reaches 40.12,the structural similarity(SSIM)reaches 0.9721,and the watermarking has good robustness against various types of noise. 展开更多
关键词 Robust watermarking large kernel convolution adaptive loss weights high-frequency wavelet loss deep learning
在线阅读 下载PDF
Multi-perception large kernel convnet for efficient image super-resolution
3
作者 MIAO Xuan LI Zheng XU Wen-Zheng 《四川大学学报(自然科学版)》 北大核心 2025年第1期67-78,共12页
Significant advancements have been achieved in the field of Single Image Super-Resolution(SISR)through the utilization of Convolutional Neural Networks(CNNs)to attain state-of-the-art performance.Recent efforts have e... Significant advancements have been achieved in the field of Single Image Super-Resolution(SISR)through the utilization of Convolutional Neural Networks(CNNs)to attain state-of-the-art performance.Recent efforts have explored the incorporation of Transformers to augment network performance in SISR.However,the high computational cost of Transformers makes them less suitable for deployment on lightweight devices.Moreover,the majority of enhancements for CNNs rely predominantly on small spatial convolutions,thereby neglecting the potential advantages of large kernel convolution.In this paper,the authors propose a Multi-Perception Large Kernel convNet(MPLKN)which delves into the exploration of large kernel convolution.Specifically,the authors have architected a Multi-Perception Large Kernel(MPLK)module aimed at extracting multi-scale features and employ a stepwise feature fusion strategy to seamlessly integrate these features.In addition,to enhance the network's capacity for nonlinear spatial information processing,the authors have designed a Spatial-Channel Gated Feed-forward Network(SCGFN)that is capable of adapting to feature interactions across both spatial and channel dimensions.Experimental results demonstrate that MPLKN outperforms other lightweight image super-resolution models while maintaining a minimal number of parameters and FLOPs. 展开更多
关键词 Single Image Super-Resolution Lightweight model deep learning large kernel
在线阅读 下载PDF
Multi-Scale Adaptive Large Kernel Graph Convolutional Network for Skeleton-Based Action Recognition
4
作者 Yu-Qing Zhang Chen Pang +2 位作者 Pei Geng Xue-Quan Lu Lei Lyu 《Journal of Computer Science & Technology》 2025年第5期1285-1300,共16页
Graph convolutional networks(GCNs)have become a dominant approach for skeleton-based action recognition tasks.Although GCNs have made significant progress in modeling skeletons as spatial-temporal graphs,they often re... Graph convolutional networks(GCNs)have become a dominant approach for skeleton-based action recognition tasks.Although GCNs have made significant progress in modeling skeletons as spatial-temporal graphs,they often require stacking multiple graph convolution layers to effectively capture long-distance relationships among nodes.This stacking not only increases computational burdens but also raises the risk of over-smoothing,which can lead to the neglect of crucial local action features.To address this issue,we propose a novel multi-scale adaptive large kernel graph convolutional network(MSLK-GCN)to effectively aggregate local and global spatio-temporal correlations while maintaining the computational efficiency.The core components of the network include two multi-scale large kernel graph convolution(LKGC)modules,a multi-channel adaptive graph convolution(MAGC)module,and a multi-scale temporal self-attention convolution(MSTC)module.The LKGC module adaptively focuses on active motion regions by utilizing a large convolution kernel and a gating mechanism,effectively capturing long-distance dependencies within the skeleton sequence.Meanwhile,the MAGC module dynamically learns relationships between different joints by adjusting connection weights between nodes.To further enhance the ability to capture temporal dynamics,the MSTC module effectively aggregates the temporal information by integrating Efficient Channel Attention(ECA)with multi-scale convolution.In addition,we use a multi-stream fusion strategy to make full use of different modal skeleton data,including bone,joint,joint motion,and bone motion.Exhaustive experiments on three scale-varying datasets,i.e.,NTU-60,NTU-120,and NW-UCLA,demonstrate that our MSLK-GCN can achieve state-of-the-art performance with fewer parameters. 展开更多
关键词 skeleton-based action recognition graph convolutional network(GCN) multi-scale large kernel attention
原文传递
A multi-scale convolutional auto-encoder and its application in fault diagnosis of rolling bearings 被引量:12
5
作者 Ding Yunhao Jia Minping 《Journal of Southeast University(English Edition)》 EI CAS 2019年第4期417-423,共7页
Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on ... Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on the standard convolutional auto-encoder.In this model,the parallel convolutional and deconvolutional kernels of different scales are used to extract the features from the input signal and reconstruct the input signal;then the feature map extracted by multi-scale convolutional kernels is used as the input of the classifier;and finally the parameters of the whole model are fine-tuned using labeled data.Experiments on one set of simulation fault data and two sets of rolling bearing fault data are conducted to validate the proposed method.The results show that the model can achieve 99.75%,99.3%and 100%diagnostic accuracy,respectively.In addition,the diagnostic accuracy and reconstruction error of the one-dimensional multi-scale convolutional auto-encoder are compared with traditional machine learning,convolutional neural networks and a traditional convolutional auto-encoder.The final results show that the proposed model has a better recognition effect for rolling bearing fault data. 展开更多
关键词 fault diagnosis deep learning convolutional auto-encoder multi-scale convolutional kernel feature extraction
在线阅读 下载PDF
基于多方位感知深度融合检测头的目标检测算法
6
作者 包晓安 彭书友 +3 位作者 张娜 涂小妹 张庆琪 吴彪 《浙江大学学报(工学版)》 北大核心 2026年第1期32-42,共11页
针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用... 针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用重参化大核卷积(RLK)模块,减小来自主干网络的特征空间差异,增强网络对中小型数据集的适应性;引入编码器选择保留模块(ESM),选择性地累积来自EDWE模块的输出,优化反向传播.实验结果表明,在规模较大的MS-COCO2017数据集上,所提算法应用于常见模型RetinaNet、FCOS、ATSS时使AP分别提升了2.9、2.6、3.4个百分点;在规模较小的PASCAL VOC2007数据集上,所提算法使3种模型的AP分别实现了1.3、1.0和1.1个百分点的提升.通过EDWE、RLK和ESM模块的协同作用,所提算法有效提升了目标检测精度,在不同规模的数据集上均展现了显著的性能优势. 展开更多
关键词 检测头 目标检测 Transformer编码器 深度融合 大核卷积
在线阅读 下载PDF
基于CNN-BiLSTM-SSA的锅炉再热器壁温预测模型
7
作者 徐世明 何至谦 +6 位作者 彭献永 商忠宝 范景玮 王俊略 曲舒杨 刘洋 周怀春 《动力工程学报》 北大核心 2026年第1期121-130,共10页
针对锅炉高温再热器壁温动态特点,提出了一种基于稀疏自注意力(SSA)、卷积神经网络(CNN)及双向长短期记忆神经网络(BiLSTM)相融合的再热器壁温软测量模型。首先,采用核主成分分析(KPCA)算法对原始候选变量进行筛选降维,选择前26个主成... 针对锅炉高温再热器壁温动态特点,提出了一种基于稀疏自注意力(SSA)、卷积神经网络(CNN)及双向长短期记忆神经网络(BiLSTM)相融合的再热器壁温软测量模型。首先,采用核主成分分析(KPCA)算法对原始候选变量进行筛选降维,选择前26个主成分变量作为模型的最终输入。其次,考虑利用CNN捕捉局部相关性,BiLSTM学习数据的长期序列依赖性的优势,使用卷积神经网络-双向长短期记忆神经网络(CNN-BiLSTM)捕捉时序数据中的短期和长期依赖关系,引入稀疏自注意力SSA机制,通过为不同特征部分分配自适应权重,从而增强CNN-BiLSTM模型的特征提取与建模能力,最后利用在役1000 MW超超临界锅炉的历史数据进行仿真实验。结果表明:CNN-BiLSTM-SSA模型在高温再热器壁温预测中的均方根误差(RMSE)、平均绝对误差(MAE)及平均绝对百分比误差(MAPE)分别为4.92℃、3.81℃和0.6241%,相应的指标均优于CNN、LSTM、BiLSTM、CNN-LSTM和CNN-BiLSTM模型。 展开更多
关键词 再热器壁温软测量 深度学习 卷积神经网络 长短期记忆网络 注意力机制 核主成分分析 CNN-BiLSTM
在线阅读 下载PDF
基于大核卷积注意力网络的方面级情感分析
8
作者 王经钧 苏娜 +2 位作者 徐力 裴厚清 纪淑娟 《计算机工程与设计》 北大核心 2026年第2期511-519,共9页
为解决句法建模中因过度依赖依存树单一结构引发的邻接矩阵信息缺失问题,以及语义表征中多粒度特征融合不足导致的局部-全局语义失衡难题。提出了双通道图卷积注意力大核卷积网络模型(SDLA-GCN)。在句法信息处理方面,对句法邻接矩阵进... 为解决句法建模中因过度依赖依存树单一结构引发的邻接矩阵信息缺失问题,以及语义表征中多粒度特征融合不足导致的局部-全局语义失衡难题。提出了双通道图卷积注意力大核卷积网络模型(SDLA-GCN)。在句法信息处理方面,对句法邻接矩阵进行了数据增强和优化,以生成信息更丰富的句法邻接矩阵;在语义信息处理方面,设计多尺度提取模块,即通过语义图卷积与大型选择性核网络的有效结合,提升了模型对语义特征的提取能力。在多个公开数据集上的实验结果表明,该模型在多项性能指标上均优于现有方法。 展开更多
关键词 图卷积 注意力机制 大核卷积 预训练模型 情感知识 双通道 方面级情感分析
在线阅读 下载PDF
基于多任务学习的跳频调制方式识别与信噪比估计方法
9
作者 汪有鹏 王昊 曹建银 《现代电子技术》 北大核心 2026年第1期66-72,共7页
针对目前在跳频信号识别的多任务学习中存在跷跷板现象和使用IQ信号训练出的模型泛化能力较差的问题,文中提出一种改进的方法,采用CGC的多任务网络框架结合大卷积核与结构重参数化技术,以提高跳频信号调制识别和信噪比估计的准确性。该... 针对目前在跳频信号识别的多任务学习中存在跷跷板现象和使用IQ信号训练出的模型泛化能力较差的问题,文中提出一种改进的方法,采用CGC的多任务网络框架结合大卷积核与结构重参数化技术,以提高跳频信号调制识别和信噪比估计的准确性。该多任务网络架构采用硬参数共享,将网络通道划分为专家通道和共享通道,并引入了包含大卷积核结构重参数化与残差结构的MobileBlock层。与多任务学习中常用的MMOE结构模型相比,跳频信号调制识别的分类准确率更高,信噪比估计的均方误差更小。实验结果证明了该方法在现代军事通信对抗中的应用潜力,为跳频信号识别和参数估计提供了一个较好的解决方案。 展开更多
关键词 跳频信号 调制识别 信噪比估计 多任务学习 大核卷积 结构重参数化
在线阅读 下载PDF
一种提取多尺度特征的烧烫伤影像分割模型
10
作者 张克诚 王瑞 《计量与测试技术》 2026年第2期81-85,共5页
全球每年因烧伤意外受伤者众多,准确评估烧伤创面严重程度对治疗至关重要。针对评估过程受主观因素和数据稀缺限制的问题,本文提出了基于自适应提取多尺度局部特征,提高网络特征表达能力和分割精度的分层Transformer和动态大核卷积相结... 全球每年因烧伤意外受伤者众多,准确评估烧伤创面严重程度对治疗至关重要。针对评估过程受主观因素和数据稀缺限制的问题,本文提出了基于自适应提取多尺度局部特征,提高网络特征表达能力和分割精度的分层Transformer和动态大核卷积相结合的方法。实验表明,本文提出的DHViT模型在IoU 76.31%、DSC 84.74%、Acc 93.73%等指标上均优于其他模型,可用于烧烫伤辅助诊断,帮助医生快速制定治疗方案,提高工作效率,减轻工作负担。 展开更多
关键词 深度学习 烧烫伤图像分割 动态大核卷积
在线阅读 下载PDF
基于大核选择和形状自适应的遥感图像目标检测
11
作者 赵子澳 董爱华 黄荣 《宁夏大学学报(自然科学版中英文)》 2026年第1期33-41,共9页
光学遥感图像目标检测是遥感图像数据智能解译的关键技术。为了解决遥感图像目标检测时,目标尺度差异大,目标受背景因素干扰,目标形状各异的问题,提出了LMK(large multiscale kernel)网络。该网络通过大核卷积分解和多尺度注意力机制模... 光学遥感图像目标检测是遥感图像数据智能解译的关键技术。为了解决遥感图像目标检测时,目标尺度差异大,目标受背景因素干扰,目标形状各异的问题,提出了LMK(large multiscale kernel)网络。该网络通过大核卷积分解和多尺度注意力机制模块,能够动态调整空间感受野,从而更好地捕获遥感场景中物体的上下文信息。此外,设计了一种面向目标检测的形状自适应选择(SAS,shape-adaptive selection)标签分配策略。该策略将目标形状信息集中于长宽比,通过结合物体的形状信息和特征分布计算IoU(intersection over union)最优阈值。针对遥感图像目标姿态旋转定位难的问题,引入了KFIoU损失函数。实验结果表明,所提出的目标检测模型在HRSC2016、UCAS-AOD和DOTA数据集上的精度分别达到了96.73%、97.85%和77.26%。改进后的模型优于目前绝大多数目标检测算法。 展开更多
关键词 目标检测 深度学习 标签分配 多尺度注意力 大核网络
在线阅读 下载PDF
基于自适应大核卷积和特征融合的视线估计
12
作者 李晓鹏 王演 刘教 《计算机工程与设计》 北大核心 2026年第2期495-502,共8页
针对视线估计在无约束环境中准确率不高的问题,提出了一种自适应大核卷积和自适应特征融合的全脸视线估计方法。改进残差网络,增加自适应大核卷积(ALK)进行多层次的特征提取,扩大CNN的感受野,有效捕捉面部区域的细节特征;增加自适应特... 针对视线估计在无约束环境中准确率不高的问题,提出了一种自适应大核卷积和自适应特征融合的全脸视线估计方法。改进残差网络,增加自适应大核卷积(ALK)进行多层次的特征提取,扩大CNN的感受野,有效捕捉面部区域的细节特征;增加自适应特征融合(AFF)模块,根据全局信息自适应地融合多尺度局部特征,增强模型对视线的表征能力。改进后的模型在MPIIFaceGaze数据集和Gaze360数据集上进行评估,在两个数据集上测试的视线估计平均角度误差分别为4.2°和10.65°。通过与其它模型进行比较,验证了改进后的模型能够较为准确地进行三维视线估计。 展开更多
关键词 视线估计 自适应大核卷积 特征融合 残差网络 特征提取 多尺度特征 注意力机制
在线阅读 下载PDF
基于改进YOLOv5s模型的无人机巡检图像目标检测
13
作者 孙一峰 夏敏燕 《上海电机学院学报》 2026年第1期19-24,共6页
在无人机巡检图像检测领域,实现高精度与快速的目标检测是一项具有挑战性的任务。当前多数检测模型往往难以兼顾检测精度与速度之间取得的良好平衡。为此,本文提出了一种名为Uni-YOLOv5s的改进检测模型。该模型基于YOLOv5s架构,引入了Un... 在无人机巡检图像检测领域,实现高精度与快速的目标检测是一项具有挑战性的任务。当前多数检测模型往往难以兼顾检测精度与速度之间取得的良好平衡。为此,本文提出了一种名为Uni-YOLOv5s的改进检测模型。该模型基于YOLOv5s架构,引入了UniRepLKNet模块,利用大卷积核增强图像特征的提取能力。在InsPLAD数据集上的实验结果表明,该模型能够对无人机巡检场景中的电力线路资产实现快速准确的检测,且性能较优。其召回率达92.72%,相比原始YOLOv5s提升了2.45%,验证了所提方法的有效性。 展开更多
关键词 电力线路资产 无人机巡检 目标检测 Uni-YOLOv5s 大卷积核
在线阅读 下载PDF
Deep Learning Applied to Computational Mechanics:A Comprehensive Review,State of the Art,and the Classics 被引量:1
14
作者 Loc Vu-Quoc Alexander Humer 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第11期1069-1343,共275页
Three recent breakthroughs due to AI in arts and science serve as motivation:An award winning digital image,protein folding,fast matrix multiplication.Many recent developments in artificial neural networks,particularl... Three recent breakthroughs due to AI in arts and science serve as motivation:An award winning digital image,protein folding,fast matrix multiplication.Many recent developments in artificial neural networks,particularly deep learning(DL),applied and relevant to computational mechanics(solid,fluids,finite-element technology)are reviewed in detail.Both hybrid and pure machine learning(ML)methods are discussed.Hybrid methods combine traditional PDE discretizations with ML methods either(1)to help model complex nonlinear constitutive relations,(2)to nonlinearly reduce the model order for efficient simulation(turbulence),or(3)to accelerate the simulation by predicting certain components in the traditional integration methods.Here,methods(1)and(2)relied on Long-Short-Term Memory(LSTM)architecture,with method(3)relying on convolutional neural networks.Pure ML methods to solve(nonlinear)PDEs are represented by Physics-Informed Neural network(PINN)methods,which could be combined with attention mechanism to address discontinuous solutions.Both LSTM and attention architectures,together with modern and generalized classic optimizers to include stochasticity for DL networks,are extensively reviewed.Kernel machines,including Gaussian processes,are provided to sufficient depth for more advanced works such as shallow networks with infinite width.Not only addressing experts,readers are assumed familiar with computational mechanics,but not with DL,whose concepts and applications are built up from the basics,aiming at bringing first-time learners quickly to the forefront of research.History and limitations of AI are recounted and discussed,with particular attention at pointing out misstatements or misconceptions of the classics,even in well-known references.Positioning and pointing control of a large-deformable beam is given as an example. 展开更多
关键词 deep learning breakthroughs network architectures backpropagation stochastic optimization methods from classic to modern recurrent neural networks long short-term memory gated recurrent unit attention transformer kernel machines Gaussian processes libraries Physics-Informed Neural Networks state-of-the-art history limitations challenges Applications to computational mechanics Finite-element matrix integration improved Gauss quadrature Multiscale geomechanics fluid-filled porous media Fluid mechanics turbulence proper orthogonal decomposition Nonlinear-manifold model-order reduction autoencoder hyper-reduction using gappy data control of large deformable beam
在线阅读 下载PDF
改进YOLOv8n的选通图像目标检测算法 被引量:3
15
作者 田青 王颖 +1 位作者 张正 羊强 《计算机工程与应用》 北大核心 2025年第2期124-134,共11页
激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,... 激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,使用大核卷积C2f-DSF更有效地捕获输入数据的全局信息。添加了多头注意力检测头Detect-SEAM模块,增强了特征提取和目标识别的能力。为了获取不同感受野的上下文信息,增强特征提取能力,使用了SPPF-M模块。采用上采样算子Dysample,减少特征信息的损失,从而提高小目标的检测精度。改进的YOLOv8n算法在选通图像数据集上mAP@0.5提高了2.4个百分点,mAP@0.5:0.95提高了1.8个百分点。为了验证改进的YOLOv8n算法的泛化性,选取KITTI数据集实验,相比于YOLOv8n算法改进YOLOv8n的mAP@0.5提高了4.3个百分点,mAP@0.5:0.95提高了3.5个百分点。 展开更多
关键词 选通图像 YOLOv8n 遮挡目标 小目标 大卷积核
在线阅读 下载PDF
基于YOLOv8改进的跌倒检测算法:CASL-YOLO 被引量:1
16
作者 徐慧英 赵蕊 +1 位作者 朱信忠 黄晓 《浙江师范大学学报(自然科学版)》 CAS 2025年第1期36-44,共9页
跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部... 跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部署应用于实际生活场景.针对上述问题,提出了一种在复杂环境下轻量级的基于YOLOv8模型改进的跌倒检测算法:CASL-YOLO.首先,该模型引入空间深度卷积(SPD-Conv)模块替代传统卷积模块,通过对每个特征映射进行卷积操作,保留通道维度中的全部信息,从而提高模型在低分辨率图像和小物体检测方面的性能;其次,引入基于位置信息的注意力机制,以捕获跨通道、方向和位置感知的信息,从而更准确地定位和识别人体目标;最后,在特征提取模块中引入选择性大卷积核(LSKNet)动态调整感受野,以有效处理跌倒检测场景中的复杂环境信息,提高网络的感知能力和检测精度.实验结果表明,在公开的Human Fall数据集上,CASL-YOLO的mAP@0.5达到96.8%,优于基线YOLOv8n,同时模型仅有3.4×MiB的参数量和11.7×10^(9)的计算量.相比其他检测算法,CASL-YOLO在参数量和计算量小幅增加的情况下,实现了更高的精度和性能,同时满足实际场景的部署要求. 展开更多
关键词 跌倒检测 YOLOv8 注意力机制 空间深度卷积 选择性大卷积核
在线阅读 下载PDF
基于EE-YOLOv8s的多场景火灾迹象检测算法 被引量:5
17
作者 崔克彬 耿佳昌 《图学学报》 北大核心 2025年第1期13-27,共15页
针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征... 针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征提取网络,保证模型轻量化的同时,优化图像特征提取;引入大型可分离核注意力机制LSKA改进SPPELAN模块,将空间金字塔部分改进为SPP_LSKA_ELAN,充分捕获大范围内的空间细节信息,在复杂多变的火灾场景中提取更全面的特征,从而区分目标与相似物体的差异;Neck部分引入可变形卷积DCN和跨空间高效多尺度注意力EMA,实现C2f_DCN_EMA可变形卷积校准模块,增强对烟火目标边缘轮廓变化的适应能力,促进特征的融合与校准,突出目标特征;在Head部分增设携带有轻量级、无参注意力机制SimAM的小目标检测头,并重新规划检测头通道数,加强多尺寸目标表征能力的同时,降低冗余以提高参数有效利用率。实验结果表明,改进后的EE-YOLOv8s网络模型相较于原模型,其参数量减少了13.6%,准确率提升了6.8%,召回率提升了7.3%,mAP提升了5.4%,保证检测速度的同时,提升了火灾迹象目标的检测性能。 展开更多
关键词 烟火目标检测 EfficientNetEasy主干网络 大型可分离核注意力机制 可变形卷积校准模块 小目标检测
在线阅读 下载PDF
增强特征表示的绝缘子缺陷检测方法
18
作者 李丽芬 王明 +1 位作者 曹旺斌 梅华威 《计算机工程与设计》 北大核心 2025年第8期2373-2379,共7页
针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提... 针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提取能力;以重参数化技术为基础,提出了C2f-DBB模块,处理目标缺陷特征相似的问题;在边界框回归阶段使用MPDIoU作为损失函数,使得模型更加关注高质量锚框。实验结果表明,FLDM-YOLO模型在保证一定检测速度的前提下,mAP为91.3%,较YOLOv8模型提高了4.2%,可有效应用于实际的巡检工作。 展开更多
关键词 目标检测 绝缘子 部分卷积 主干特征提取网络 大核可分离注意力 重参数化 边界框损失函数
在线阅读 下载PDF
多尺度动态视觉网络的手术机器人场景分割
19
作者 刘敏 秦敦璇 +2 位作者 韩雨斌 陈祥 王耀南 《中国图象图形学报》 北大核心 2025年第7期2542-2557,共16页
目的机器人辅助腹腔镜手术指的是临床医生借助腔镜手术机器人完成外科手术。然而,腔镜手术在密闭的人体腔道完成,且分割目标的特征复杂多变,对医生的手术技能有较高要求。为辅助医生完成腔镜手术,提出一种高精度的腔镜手术场景分割方法... 目的机器人辅助腹腔镜手术指的是临床医生借助腔镜手术机器人完成外科手术。然而,腔镜手术在密闭的人体腔道完成,且分割目标的特征复杂多变,对医生的手术技能有较高要求。为辅助医生完成腔镜手术,提出一种高精度的腔镜手术场景分割方法,并搭建分体式腔镜手术机器人对所提出的方法进行了验证。方法首先,提出了多尺度动态视觉网络(multi-scale dynamic visual network,MDVNet)。该网络采用编码器—解码器结构。在编码器部分,动态大核卷积注意力模块(dynamic large kernel attention module,DLKA)可以通过多尺度大核注意力提取不同分割目标的多尺度特征,并动态选择机制进行自适应的特征融合。在解码器部分,低秩矩阵分解模块(lowrank matrix decomposition module,LMD)引导不同分辨率的特征图进行融合,可以有效滤除特征图中的噪声;边界引导模块(boundary guided module,BGM)可以引导模型学习手术场景的边界特征。最后,展示了基于Lap Game腹腔镜模拟器搭建的分体式腔镜手术机器人,网络模型的分割结果可以映射在手术机器人的视野中,辅助医生进行腔镜手术。结果MDVNet在3个手术场景数据集上取得了最先进的结果,平均交并比分别为51.19%、71.28%和52.47%。结论本文提出了适用于腔镜手术场景分割的多尺度动态视觉网络MDVNet,并在搭建的分体式腔镜手术机器人上对所提出方法进行了验证。代码开源地址为:https://github.com/YubinHan73/MDVNet。 展开更多
关键词 腔镜手术机器人 语义分割 大核卷积 低秩矩阵分解(LMD) 边界分割
原文传递
基于边界增强和加权大核的多尺度RGB-D显著性目标检测
20
作者 严灵毓 周婷 +1 位作者 高榕 叶志伟 《计算机应用研究》 北大核心 2025年第12期3815-3822,共8页
针对显著性目标检测中前景与背景分离效果不佳及背景噪声抑制不足的问题,提出了一种加权大核边界增强多尺度RGB-D显著性目标检测网络(LKMNet)。该方法通过引入边界增强加权大核融合模块(BWLKF),结合边界信息与加权大核卷积结构,提升前... 针对显著性目标检测中前景与背景分离效果不佳及背景噪声抑制不足的问题,提出了一种加权大核边界增强多尺度RGB-D显著性目标检测网络(LKMNet)。该方法通过引入边界增强加权大核融合模块(BWLKF),结合边界信息与加权大核卷积结构,提升前景聚焦能力并增强边界检测精度。同时,设计了动态门控多尺度融合模块(DGMF),通过自适应门控机制平衡局部与全局信息,从而突出空间相关特征并有效抑制背景干扰。实验结果表明,该方法在四个RGB-D数据集上的检测精度优于现有方法,验证了其在显著性目标检测任务中的优越性能。 展开更多
关键词 RGB-D显著性检测 多尺度特征融合 边界增强 加权大核卷积
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部