期刊文献+
共找到180篇文章
< 1 2 9 >
每页显示 20 50 100
High-Quality Single-Pixel Imaging Based on Large-Kernel Convolution under Low-Sampling Conditions
1
作者 Chenyu Yuan Yuanhao Su Chunfang Wang 《Chinese Physics Letters》 2025年第4期55-61,共7页
In recent years,deep learning has been introduced into the field of Single-pixel imaging(SPI),garnering significant attention.However,conventional networks still exhibit limitations in preserving image details.To addr... In recent years,deep learning has been introduced into the field of Single-pixel imaging(SPI),garnering significant attention.However,conventional networks still exhibit limitations in preserving image details.To address this issue,we integrate Large Kernel Convolution(LKconv)into the U-Net framework,proposing an enhanced network structure named U-LKconv network,which significantly enhances the capability to recover image details even under low sampling conditions. 展开更多
关键词 large kernel convolution lkconv recover image details U lkconv network high quality single pixel imaging U Net low sampling conditions enhanced network structure large kernel convolution
原文传递
LKAW: A Robust Watermarking Method Based on Large Kernel Convolution and Adaptive Weight Assignment
2
作者 Xiaorui Zhang Rui Jiang +3 位作者 Wei Sun Aiguo Song Xindong Wei Ruohan Meng 《Computers, Materials & Continua》 SCIE EI 2023年第4期1-17,共17页
Robust watermarking requires finding invariant features under multiple attacks to ensure correct extraction.Deep learning has extremely powerful in extracting features,and watermarking algorithms based on deep learnin... Robust watermarking requires finding invariant features under multiple attacks to ensure correct extraction.Deep learning has extremely powerful in extracting features,and watermarking algorithms based on deep learning have attracted widespread attention.Most existing methods use 3×3 small kernel convolution to extract image features and embed the watermarking.However,the effective perception fields for small kernel convolution are extremely confined,so the pixels that each watermarking can affect are restricted,thus limiting the performance of the watermarking.To address these problems,we propose a watermarking network based on large kernel convolution and adaptive weight assignment for loss functions.It uses large-kernel depth-wise convolution to extract features for learning large-scale image information and subsequently projects the watermarking into a highdimensional space by 1×1 convolution to achieve adaptability in the channel dimension.Subsequently,the modification of the embedded watermarking on the cover image is extended to more pixels.Because the magnitude and convergence rates of each loss function are different,an adaptive loss weight assignment strategy is proposed to make theweights participate in the network training together and adjust theweight dynamically.Further,a high-frequency wavelet loss is proposed,by which the watermarking is restricted to only the low-frequency wavelet sub-bands,thereby enhancing the robustness of watermarking against image compression.The experimental results show that the peak signal-to-noise ratio(PSNR)of the encoded image reaches 40.12,the structural similarity(SSIM)reaches 0.9721,and the watermarking has good robustness against various types of noise. 展开更多
关键词 Robust watermarking large kernel convolution adaptive loss weights high-frequency wavelet loss deep learning
在线阅读 下载PDF
Multi-perception large kernel convnet for efficient image super-resolution
3
作者 MIAO Xuan LI Zheng XU Wen-Zheng 《四川大学学报(自然科学版)》 北大核心 2025年第1期67-78,共12页
Significant advancements have been achieved in the field of Single Image Super-Resolution(SISR)through the utilization of Convolutional Neural Networks(CNNs)to attain state-of-the-art performance.Recent efforts have e... Significant advancements have been achieved in the field of Single Image Super-Resolution(SISR)through the utilization of Convolutional Neural Networks(CNNs)to attain state-of-the-art performance.Recent efforts have explored the incorporation of Transformers to augment network performance in SISR.However,the high computational cost of Transformers makes them less suitable for deployment on lightweight devices.Moreover,the majority of enhancements for CNNs rely predominantly on small spatial convolutions,thereby neglecting the potential advantages of large kernel convolution.In this paper,the authors propose a Multi-Perception Large Kernel convNet(MPLKN)which delves into the exploration of large kernel convolution.Specifically,the authors have architected a Multi-Perception Large Kernel(MPLK)module aimed at extracting multi-scale features and employ a stepwise feature fusion strategy to seamlessly integrate these features.In addition,to enhance the network's capacity for nonlinear spatial information processing,the authors have designed a Spatial-Channel Gated Feed-forward Network(SCGFN)that is capable of adapting to feature interactions across both spatial and channel dimensions.Experimental results demonstrate that MPLKN outperforms other lightweight image super-resolution models while maintaining a minimal number of parameters and FLOPs. 展开更多
关键词 Single Image Super-Resolution Lightweight model deep learning large kernel
在线阅读 下载PDF
Multi-Scale Adaptive Large Kernel Graph Convolutional Network for Skeleton-Based Action Recognition
4
作者 Yu-Qing Zhang Chen Pang +2 位作者 Pei Geng Xue-Quan Lu Lei Lyu 《Journal of Computer Science & Technology》 2025年第5期1285-1300,共16页
Graph convolutional networks(GCNs)have become a dominant approach for skeleton-based action recognition tasks.Although GCNs have made significant progress in modeling skeletons as spatial-temporal graphs,they often re... Graph convolutional networks(GCNs)have become a dominant approach for skeleton-based action recognition tasks.Although GCNs have made significant progress in modeling skeletons as spatial-temporal graphs,they often require stacking multiple graph convolution layers to effectively capture long-distance relationships among nodes.This stacking not only increases computational burdens but also raises the risk of over-smoothing,which can lead to the neglect of crucial local action features.To address this issue,we propose a novel multi-scale adaptive large kernel graph convolutional network(MSLK-GCN)to effectively aggregate local and global spatio-temporal correlations while maintaining the computational efficiency.The core components of the network include two multi-scale large kernel graph convolution(LKGC)modules,a multi-channel adaptive graph convolution(MAGC)module,and a multi-scale temporal self-attention convolution(MSTC)module.The LKGC module adaptively focuses on active motion regions by utilizing a large convolution kernel and a gating mechanism,effectively capturing long-distance dependencies within the skeleton sequence.Meanwhile,the MAGC module dynamically learns relationships between different joints by adjusting connection weights between nodes.To further enhance the ability to capture temporal dynamics,the MSTC module effectively aggregates the temporal information by integrating Efficient Channel Attention(ECA)with multi-scale convolution.In addition,we use a multi-stream fusion strategy to make full use of different modal skeleton data,including bone,joint,joint motion,and bone motion.Exhaustive experiments on three scale-varying datasets,i.e.,NTU-60,NTU-120,and NW-UCLA,demonstrate that our MSLK-GCN can achieve state-of-the-art performance with fewer parameters. 展开更多
关键词 skeleton-based action recognition graph convolutional network(GCN) multi-scale large kernel attention
原文传递
A multi-scale convolutional auto-encoder and its application in fault diagnosis of rolling bearings 被引量:12
5
作者 Ding Yunhao Jia Minping 《Journal of Southeast University(English Edition)》 EI CAS 2019年第4期417-423,共7页
Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on ... Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on the standard convolutional auto-encoder.In this model,the parallel convolutional and deconvolutional kernels of different scales are used to extract the features from the input signal and reconstruct the input signal;then the feature map extracted by multi-scale convolutional kernels is used as the input of the classifier;and finally the parameters of the whole model are fine-tuned using labeled data.Experiments on one set of simulation fault data and two sets of rolling bearing fault data are conducted to validate the proposed method.The results show that the model can achieve 99.75%,99.3%and 100%diagnostic accuracy,respectively.In addition,the diagnostic accuracy and reconstruction error of the one-dimensional multi-scale convolutional auto-encoder are compared with traditional machine learning,convolutional neural networks and a traditional convolutional auto-encoder.The final results show that the proposed model has a better recognition effect for rolling bearing fault data. 展开更多
关键词 fault diagnosis deep learning convolutional auto-encoder multi-scale convolutional kernel feature extraction
在线阅读 下载PDF
基于多方位感知深度融合检测头的目标检测算法
6
作者 包晓安 彭书友 +3 位作者 张娜 涂小妹 张庆琪 吴彪 《浙江大学学报(工学版)》 北大核心 2026年第1期32-42,共11页
针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用... 针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用重参化大核卷积(RLK)模块,减小来自主干网络的特征空间差异,增强网络对中小型数据集的适应性;引入编码器选择保留模块(ESM),选择性地累积来自EDWE模块的输出,优化反向传播.实验结果表明,在规模较大的MS-COCO2017数据集上,所提算法应用于常见模型RetinaNet、FCOS、ATSS时使AP分别提升了2.9、2.6、3.4个百分点;在规模较小的PASCAL VOC2007数据集上,所提算法使3种模型的AP分别实现了1.3、1.0和1.1个百分点的提升.通过EDWE、RLK和ESM模块的协同作用,所提算法有效提升了目标检测精度,在不同规模的数据集上均展现了显著的性能优势. 展开更多
关键词 检测头 目标检测 Transformer编码器 深度融合 大核卷积
在线阅读 下载PDF
基于大核卷积和Mamba的遥感目标检测
7
作者 严灵毓 何子健 +3 位作者 高榕 叶志伟 王苑 韩洪木 《计算机工程与设计》 北大核心 2026年第3期778-785,共8页
针对遥感图像目标尺度变化大、背景信息复杂等问题,提出了一种目标检测主干网络(LK-MambaNet)。通过设计一种基于多维空间动态选择性注意机制的大核动态卷积(LK-DConv),以动态调整多尺度特征的感受野,有效捕捉局部上下文信息。提出了多... 针对遥感图像目标尺度变化大、背景信息复杂等问题,提出了一种目标检测主干网络(LK-MambaNet)。通过设计一种基于多维空间动态选择性注意机制的大核动态卷积(LK-DConv),以动态调整多尺度特征的感受野,有效捕捉局部上下文信息。提出了多核空间Mamba块(MKSpa-Mamba),采用Inception策略来降低计算成本并减轻多个扫描路线中的功能冗余,以便高效地识别检测目标的全局上下文信息。在DOTA1.0数据集和HRCS2016数据集上的实验结果表明所提方法的mAP分别达到了78.39%和90.45%,有效提高了遥感图像的目标检测效果。 展开更多
关键词 遥感图像 目标检测 深度学习 上下文信息增强 状态空间模型 大核卷积 注意力机制
在线阅读 下载PDF
基于CNN-BiLSTM-SSA的锅炉再热器壁温预测模型 被引量:1
8
作者 徐世明 何至谦 +6 位作者 彭献永 商忠宝 范景玮 王俊略 曲舒杨 刘洋 周怀春 《动力工程学报》 北大核心 2026年第1期121-130,共10页
针对锅炉高温再热器壁温动态特点,提出了一种基于稀疏自注意力(SSA)、卷积神经网络(CNN)及双向长短期记忆神经网络(BiLSTM)相融合的再热器壁温软测量模型。首先,采用核主成分分析(KPCA)算法对原始候选变量进行筛选降维,选择前26个主成... 针对锅炉高温再热器壁温动态特点,提出了一种基于稀疏自注意力(SSA)、卷积神经网络(CNN)及双向长短期记忆神经网络(BiLSTM)相融合的再热器壁温软测量模型。首先,采用核主成分分析(KPCA)算法对原始候选变量进行筛选降维,选择前26个主成分变量作为模型的最终输入。其次,考虑利用CNN捕捉局部相关性,BiLSTM学习数据的长期序列依赖性的优势,使用卷积神经网络-双向长短期记忆神经网络(CNN-BiLSTM)捕捉时序数据中的短期和长期依赖关系,引入稀疏自注意力SSA机制,通过为不同特征部分分配自适应权重,从而增强CNN-BiLSTM模型的特征提取与建模能力,最后利用在役1000 MW超超临界锅炉的历史数据进行仿真实验。结果表明:CNN-BiLSTM-SSA模型在高温再热器壁温预测中的均方根误差(RMSE)、平均绝对误差(MAE)及平均绝对百分比误差(MAPE)分别为4.92℃、3.81℃和0.6241%,相应的指标均优于CNN、LSTM、BiLSTM、CNN-LSTM和CNN-BiLSTM模型。 展开更多
关键词 再热器壁温软测量 深度学习 卷积神经网络 长短期记忆网络 注意力机制 核主成分分析 CNN-BiLSTM
在线阅读 下载PDF
基于改进YOLOX的小麦叶片病害识别模型研究
9
作者 孙文峰 周德福 +4 位作者 王轩力 王继芬 杨雅麟 张洋 王轩慧 《山东农业科学》 北大核心 2026年第2期171-180,共10页
条锈病、黄矮病和白粉病是威胁小麦正常生长的三种重要叶片病害,早期精准识别对于及时采取有效防治措施至关重要。针对小麦叶片病害图像特征复杂、目标尺寸微小,以及现有深度学习模型精度低、鲁棒性差等问题,本研究提出一种基于改进YOLO... 条锈病、黄矮病和白粉病是威胁小麦正常生长的三种重要叶片病害,早期精准识别对于及时采取有效防治措施至关重要。针对小麦叶片病害图像特征复杂、目标尺寸微小,以及现有深度学习模型精度低、鲁棒性差等问题,本研究提出一种基于改进YOLOX的小麦叶片病害识别模型。首先,通过强化StemLayer无损下采样和引入通道注意力机制优化主干网络中的Stage层级,增强模型对细微病斑特征的表征能力;其次,改进空间金字塔池化模块,采用5×5池化核替代大尺寸池化核,减少细粒度特征丢失;再次,在颈部网络的CSPNextBlock中引入7×7大核深度可分离卷积和expand_ratio参数,同时调整CSPLayer的Block数量,扩大感受野并降低计算量;最后,引入平均绝对误差(L1)损失函数,并将分配器的center_radius参数从2.5调至2.0以优化正样本分配策略,提升微小目标定位精度。实验结果表明,改进后的模型在保持与原始YOLOX相当的参数量和推理速度(31.4帧·s^(-1))的同时,平均精度均值(mAP^(50))提升2.0个百分点,达到92.5%,对条锈病、黄矮病和白粉病的识别平均精度分别为94.7%、85.5%和97.4%。相比RTMDet、YOLOF、YOLOV3和Faster-RCNN模型,本研究提出模型的mAP^(50)分别提升15.5、0.5、5.2、0.2个百分点。本研究结果可为农业生产中的小麦叶片病害精准识别提供可靠的方法和技术支持。 展开更多
关键词 YOLOX 小麦叶片病害识别 大核深度卷积 深度学习
在线阅读 下载PDF
基于大核卷积注意力网络的方面级情感分析
10
作者 王经钧 苏娜 +2 位作者 徐力 裴厚清 纪淑娟 《计算机工程与设计》 北大核心 2026年第2期511-519,共9页
为解决句法建模中因过度依赖依存树单一结构引发的邻接矩阵信息缺失问题,以及语义表征中多粒度特征融合不足导致的局部-全局语义失衡难题。提出了双通道图卷积注意力大核卷积网络模型(SDLA-GCN)。在句法信息处理方面,对句法邻接矩阵进... 为解决句法建模中因过度依赖依存树单一结构引发的邻接矩阵信息缺失问题,以及语义表征中多粒度特征融合不足导致的局部-全局语义失衡难题。提出了双通道图卷积注意力大核卷积网络模型(SDLA-GCN)。在句法信息处理方面,对句法邻接矩阵进行了数据增强和优化,以生成信息更丰富的句法邻接矩阵;在语义信息处理方面,设计多尺度提取模块,即通过语义图卷积与大型选择性核网络的有效结合,提升了模型对语义特征的提取能力。在多个公开数据集上的实验结果表明,该模型在多项性能指标上均优于现有方法。 展开更多
关键词 图卷积 注意力机制 大核卷积 预训练模型 情感知识 双通道 方面级情感分析
在线阅读 下载PDF
基于多任务学习的跳频调制方式识别与信噪比估计方法
11
作者 汪有鹏 王昊 曹建银 《现代电子技术》 北大核心 2026年第1期66-72,共7页
针对目前在跳频信号识别的多任务学习中存在跷跷板现象和使用IQ信号训练出的模型泛化能力较差的问题,文中提出一种改进的方法,采用CGC的多任务网络框架结合大卷积核与结构重参数化技术,以提高跳频信号调制识别和信噪比估计的准确性。该... 针对目前在跳频信号识别的多任务学习中存在跷跷板现象和使用IQ信号训练出的模型泛化能力较差的问题,文中提出一种改进的方法,采用CGC的多任务网络框架结合大卷积核与结构重参数化技术,以提高跳频信号调制识别和信噪比估计的准确性。该多任务网络架构采用硬参数共享,将网络通道划分为专家通道和共享通道,并引入了包含大卷积核结构重参数化与残差结构的MobileBlock层。与多任务学习中常用的MMOE结构模型相比,跳频信号调制识别的分类准确率更高,信噪比估计的均方误差更小。实验结果证明了该方法在现代军事通信对抗中的应用潜力,为跳频信号识别和参数估计提供了一个较好的解决方案。 展开更多
关键词 跳频信号 调制识别 信噪比估计 多任务学习 大核卷积 结构重参数化
在线阅读 下载PDF
一种提取多尺度特征的烧烫伤影像分割模型
12
作者 张克诚 王瑞 《计量与测试技术》 2026年第2期81-85,共5页
全球每年因烧伤意外受伤者众多,准确评估烧伤创面严重程度对治疗至关重要。针对评估过程受主观因素和数据稀缺限制的问题,本文提出了基于自适应提取多尺度局部特征,提高网络特征表达能力和分割精度的分层Transformer和动态大核卷积相结... 全球每年因烧伤意外受伤者众多,准确评估烧伤创面严重程度对治疗至关重要。针对评估过程受主观因素和数据稀缺限制的问题,本文提出了基于自适应提取多尺度局部特征,提高网络特征表达能力和分割精度的分层Transformer和动态大核卷积相结合的方法。实验表明,本文提出的DHViT模型在IoU 76.31%、DSC 84.74%、Acc 93.73%等指标上均优于其他模型,可用于烧烫伤辅助诊断,帮助医生快速制定治疗方案,提高工作效率,减轻工作负担。 展开更多
关键词 深度学习 烧烫伤图像分割 动态大核卷积
在线阅读 下载PDF
基于大核选择和形状自适应的遥感图像目标检测
13
作者 赵子澳 董爱华 黄荣 《宁夏大学学报(自然科学版中英文)》 2026年第1期33-41,共9页
光学遥感图像目标检测是遥感图像数据智能解译的关键技术。为了解决遥感图像目标检测时,目标尺度差异大,目标受背景因素干扰,目标形状各异的问题,提出了LMK(large multiscale kernel)网络。该网络通过大核卷积分解和多尺度注意力机制模... 光学遥感图像目标检测是遥感图像数据智能解译的关键技术。为了解决遥感图像目标检测时,目标尺度差异大,目标受背景因素干扰,目标形状各异的问题,提出了LMK(large multiscale kernel)网络。该网络通过大核卷积分解和多尺度注意力机制模块,能够动态调整空间感受野,从而更好地捕获遥感场景中物体的上下文信息。此外,设计了一种面向目标检测的形状自适应选择(SAS,shape-adaptive selection)标签分配策略。该策略将目标形状信息集中于长宽比,通过结合物体的形状信息和特征分布计算IoU(intersection over union)最优阈值。针对遥感图像目标姿态旋转定位难的问题,引入了KFIoU损失函数。实验结果表明,所提出的目标检测模型在HRSC2016、UCAS-AOD和DOTA数据集上的精度分别达到了96.73%、97.85%和77.26%。改进后的模型优于目前绝大多数目标检测算法。 展开更多
关键词 目标检测 深度学习 标签分配 多尺度注意力 大核网络
在线阅读 下载PDF
基于自适应大核卷积和特征融合的视线估计
14
作者 李晓鹏 王演 刘教 《计算机工程与设计》 北大核心 2026年第2期495-502,共8页
针对视线估计在无约束环境中准确率不高的问题,提出了一种自适应大核卷积和自适应特征融合的全脸视线估计方法。改进残差网络,增加自适应大核卷积(ALK)进行多层次的特征提取,扩大CNN的感受野,有效捕捉面部区域的细节特征;增加自适应特... 针对视线估计在无约束环境中准确率不高的问题,提出了一种自适应大核卷积和自适应特征融合的全脸视线估计方法。改进残差网络,增加自适应大核卷积(ALK)进行多层次的特征提取,扩大CNN的感受野,有效捕捉面部区域的细节特征;增加自适应特征融合(AFF)模块,根据全局信息自适应地融合多尺度局部特征,增强模型对视线的表征能力。改进后的模型在MPIIFaceGaze数据集和Gaze360数据集上进行评估,在两个数据集上测试的视线估计平均角度误差分别为4.2°和10.65°。通过与其它模型进行比较,验证了改进后的模型能够较为准确地进行三维视线估计。 展开更多
关键词 视线估计 自适应大核卷积 特征融合 残差网络 特征提取 多尺度特征 注意力机制
在线阅读 下载PDF
基于改进YOLOv5s模型的无人机巡检图像目标检测
15
作者 孙一峰 夏敏燕 《上海电机学院学报》 2026年第1期19-24,共6页
在无人机巡检图像检测领域,实现高精度与快速的目标检测是一项具有挑战性的任务。当前多数检测模型往往难以兼顾检测精度与速度之间取得的良好平衡。为此,本文提出了一种名为Uni-YOLOv5s的改进检测模型。该模型基于YOLOv5s架构,引入了Un... 在无人机巡检图像检测领域,实现高精度与快速的目标检测是一项具有挑战性的任务。当前多数检测模型往往难以兼顾检测精度与速度之间取得的良好平衡。为此,本文提出了一种名为Uni-YOLOv5s的改进检测模型。该模型基于YOLOv5s架构,引入了UniRepLKNet模块,利用大卷积核增强图像特征的提取能力。在InsPLAD数据集上的实验结果表明,该模型能够对无人机巡检场景中的电力线路资产实现快速准确的检测,且性能较优。其召回率达92.72%,相比原始YOLOv5s提升了2.45%,验证了所提方法的有效性。 展开更多
关键词 电力线路资产 无人机巡检 目标检测 Uni-YOLOv5s 大卷积核
在线阅读 下载PDF
基于神经网络的网络流量分类算法
16
作者 蔡云冰 《智能计算机与应用》 2026年第2期84-89,共6页
在数字化转型背景下,全球网络流量快速增长对网络治理技术体系提出新挑战。为提升入侵检测系统效能,提高网络流量分类的准确性,本文提出基于YOLOv12改进的网络流量分类模型,通过引入高效多尺度注意力结构,在保持计算复杂度不变的情况下... 在数字化转型背景下,全球网络流量快速增长对网络治理技术体系提出新挑战。为提升入侵检测系统效能,提高网络流量分类的准确性,本文提出基于YOLOv12改进的网络流量分类模型,通过引入高效多尺度注意力结构,在保持计算复杂度不变的情况下有效解决了原有模型区域注意力机制在最终分类阶段的不足;同时采用C3K2_RepLKNet大卷积核架构扩展感受野,优化空间信息捕获能力,减少模型对局部纹理特征的过度依赖。实验结果表明,相较于现有技术方法,本文提出的模型在USTC-TFC2016基准数据集上取得了显著提升,其准确率、精确率、召回率和F1值分别达到99.22%、99.26%、99.17%和99.21%,充分展现了模型的卓越性能。本方法充分满足了网络流量分类领域对算法实时性和准确性的需求。 展开更多
关键词 网络流量分类 YOLOv12 高效多尺度注意力结构 大卷积核架构 USTC-TFC2016
在线阅读 下载PDF
Deep Learning Applied to Computational Mechanics:A Comprehensive Review,State of the Art,and the Classics 被引量:1
17
作者 Loc Vu-Quoc Alexander Humer 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第11期1069-1343,共275页
Three recent breakthroughs due to AI in arts and science serve as motivation:An award winning digital image,protein folding,fast matrix multiplication.Many recent developments in artificial neural networks,particularl... Three recent breakthroughs due to AI in arts and science serve as motivation:An award winning digital image,protein folding,fast matrix multiplication.Many recent developments in artificial neural networks,particularly deep learning(DL),applied and relevant to computational mechanics(solid,fluids,finite-element technology)are reviewed in detail.Both hybrid and pure machine learning(ML)methods are discussed.Hybrid methods combine traditional PDE discretizations with ML methods either(1)to help model complex nonlinear constitutive relations,(2)to nonlinearly reduce the model order for efficient simulation(turbulence),or(3)to accelerate the simulation by predicting certain components in the traditional integration methods.Here,methods(1)and(2)relied on Long-Short-Term Memory(LSTM)architecture,with method(3)relying on convolutional neural networks.Pure ML methods to solve(nonlinear)PDEs are represented by Physics-Informed Neural network(PINN)methods,which could be combined with attention mechanism to address discontinuous solutions.Both LSTM and attention architectures,together with modern and generalized classic optimizers to include stochasticity for DL networks,are extensively reviewed.Kernel machines,including Gaussian processes,are provided to sufficient depth for more advanced works such as shallow networks with infinite width.Not only addressing experts,readers are assumed familiar with computational mechanics,but not with DL,whose concepts and applications are built up from the basics,aiming at bringing first-time learners quickly to the forefront of research.History and limitations of AI are recounted and discussed,with particular attention at pointing out misstatements or misconceptions of the classics,even in well-known references.Positioning and pointing control of a large-deformable beam is given as an example. 展开更多
关键词 deep learning breakthroughs network architectures backpropagation stochastic optimization methods from classic to modern recurrent neural networks long short-term memory gated recurrent unit attention transformer kernel machines Gaussian processes libraries Physics-Informed Neural Networks state-of-the-art history limitations challenges Applications to computational mechanics Finite-element matrix integration improved Gauss quadrature Multiscale geomechanics fluid-filled porous media Fluid mechanics turbulence proper orthogonal decomposition Nonlinear-manifold model-order reduction autoencoder hyper-reduction using gappy data control of large deformable beam
在线阅读 下载PDF
改进YOLOv8n的选通图像目标检测算法 被引量:3
18
作者 田青 王颖 +1 位作者 张正 羊强 《计算机工程与应用》 北大核心 2025年第2期124-134,共11页
激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,... 激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,使用大核卷积C2f-DSF更有效地捕获输入数据的全局信息。添加了多头注意力检测头Detect-SEAM模块,增强了特征提取和目标识别的能力。为了获取不同感受野的上下文信息,增强特征提取能力,使用了SPPF-M模块。采用上采样算子Dysample,减少特征信息的损失,从而提高小目标的检测精度。改进的YOLOv8n算法在选通图像数据集上mAP@0.5提高了2.4个百分点,mAP@0.5:0.95提高了1.8个百分点。为了验证改进的YOLOv8n算法的泛化性,选取KITTI数据集实验,相比于YOLOv8n算法改进YOLOv8n的mAP@0.5提高了4.3个百分点,mAP@0.5:0.95提高了3.5个百分点。 展开更多
关键词 选通图像 YOLOv8n 遮挡目标 小目标 大卷积核
在线阅读 下载PDF
基于YOLOv8改进的跌倒检测算法:CASL-YOLO 被引量:1
19
作者 徐慧英 赵蕊 +1 位作者 朱信忠 黄晓 《浙江师范大学学报(自然科学版)》 CAS 2025年第1期36-44,共9页
跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部... 跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部署应用于实际生活场景.针对上述问题,提出了一种在复杂环境下轻量级的基于YOLOv8模型改进的跌倒检测算法:CASL-YOLO.首先,该模型引入空间深度卷积(SPD-Conv)模块替代传统卷积模块,通过对每个特征映射进行卷积操作,保留通道维度中的全部信息,从而提高模型在低分辨率图像和小物体检测方面的性能;其次,引入基于位置信息的注意力机制,以捕获跨通道、方向和位置感知的信息,从而更准确地定位和识别人体目标;最后,在特征提取模块中引入选择性大卷积核(LSKNet)动态调整感受野,以有效处理跌倒检测场景中的复杂环境信息,提高网络的感知能力和检测精度.实验结果表明,在公开的Human Fall数据集上,CASL-YOLO的mAP@0.5达到96.8%,优于基线YOLOv8n,同时模型仅有3.4×MiB的参数量和11.7×10^(9)的计算量.相比其他检测算法,CASL-YOLO在参数量和计算量小幅增加的情况下,实现了更高的精度和性能,同时满足实际场景的部署要求. 展开更多
关键词 跌倒检测 YOLOv8 注意力机制 空间深度卷积 选择性大卷积核
在线阅读 下载PDF
增强特征表示的绝缘子缺陷检测方法 被引量:1
20
作者 李丽芬 王明 +1 位作者 曹旺斌 梅华威 《计算机工程与设计》 北大核心 2025年第8期2373-2379,共7页
针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提... 针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提取能力;以重参数化技术为基础,提出了C2f-DBB模块,处理目标缺陷特征相似的问题;在边界框回归阶段使用MPDIoU作为损失函数,使得模型更加关注高质量锚框。实验结果表明,FLDM-YOLO模型在保证一定检测速度的前提下,mAP为91.3%,较YOLOv8模型提高了4.2%,可有效应用于实际的巡检工作。 展开更多
关键词 目标检测 绝缘子 部分卷积 主干特征提取网络 大核可分离注意力 重参数化 边界框损失函数
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部