期刊文献+
共找到505篇文章
< 1 2 26 >
每页显示 20 50 100
SEFormer:A Lightweight CNN-Transformer Based on Separable Multiscale Depthwise Convolution and Efficient Self-Attention for Rotating Machinery Fault Diagnosis 被引量:3
1
作者 Hongxing Wang Xilai Ju +1 位作者 Hua Zhu Huafeng Li 《Computers, Materials & Continua》 SCIE EI 2025年第1期1417-1437,共21页
Traditional data-driven fault diagnosis methods depend on expert experience to manually extract effective fault features of signals,which has certain limitations.Conversely,deep learning techniques have gained promine... Traditional data-driven fault diagnosis methods depend on expert experience to manually extract effective fault features of signals,which has certain limitations.Conversely,deep learning techniques have gained prominence as a central focus of research in the field of fault diagnosis by strong fault feature extraction ability and end-to-end fault diagnosis efficiency.Recently,utilizing the respective advantages of convolution neural network(CNN)and Transformer in local and global feature extraction,research on cooperating the two have demonstrated promise in the field of fault diagnosis.However,the cross-channel convolution mechanism in CNN and the self-attention calculations in Transformer contribute to excessive complexity in the cooperative model.This complexity results in high computational costs and limited industrial applicability.To tackle the above challenges,this paper proposes a lightweight CNN-Transformer named as SEFormer for rotating machinery fault diagnosis.First,a separable multiscale depthwise convolution block is designed to extract and integrate multiscale feature information from different channel dimensions of vibration signals.Then,an efficient self-attention block is developed to capture critical fine-grained features of the signal from a global perspective.Finally,experimental results on the planetary gearbox dataset and themotor roller bearing dataset prove that the proposed framework can balance the advantages of robustness,generalization and lightweight compared to recent state-of-the-art fault diagnosis models based on CNN and Transformer.This study presents a feasible strategy for developing a lightweight rotating machinery fault diagnosis framework aimed at economical deployment. 展开更多
关键词 CNN-Transformer separable multiscale depthwise convolution efficient self-attention fault diagnosis
在线阅读 下载PDF
Fire Detection Method Based on Depthwise Separable Convolution and YOLOv3 被引量:6
2
作者 Yue-Yan Qin Jiang-Tao Cao Xiao-Fei Ji 《International Journal of Automation and computing》 EI CSCD 2021年第2期300-310,共11页
Recently,video-based fire detection technology has become an important research topic in the field of machine vision.This paper proposes a method of combining the classification model and target detection model in dee... Recently,video-based fire detection technology has become an important research topic in the field of machine vision.This paper proposes a method of combining the classification model and target detection model in deep learning for fire detection.Firstly,the depthwise separable convolution is used to classify fire images,which saves a lot of detection time under the premise of ensuring detection accuracy.Secondly,You Only Look Once version 3(YOLOv3)target regression function is used to output the fire position information for the images whose classification result is fire,which avoids the problem that the accuracy of detection cannot be guaranteed by using YOLOv3 for target classification and position regression.At the same time,the detection time of target regression for images without fire is greatly reduced saved.The experiments were tested using a network public database.The detection accuracy reached 98%and the detection rate reached 38fps.This method not only saves the workload of manually extracting flame characteristics,reduces the calculation cost,and reduces the amount of parameters,but also improves the detection accuracy and detection rate. 展开更多
关键词 Fire detection depthwise separable convolution fire classification You Only Look Once version 3(YOLOv3) target regression
原文传递
PokerNet:Expanding Features Cheaply via Depthwise Convolutions 被引量:1
3
作者 Wei Tang Yan Huang Liang Wang 《International Journal of Automation and computing》 EI CSCD 2021年第3期432-442,共11页
Pointwise convolution is usually utilized to expand or squeeze features in modern lightweight deep models.However,it takes up most of the overall computational cost(usually more than 90%).This paper proposes a novel P... Pointwise convolution is usually utilized to expand or squeeze features in modern lightweight deep models.However,it takes up most of the overall computational cost(usually more than 90%).This paper proposes a novel Poker module to expand features by taking advantage of cheap depthwise convolution.As a result,the Poker module can greatly reduce the computational cost,and meanwhile generate a large number of effective features to guarantee the performance.The proposed module is standardized and can be employed wherever the feature expansion is needed.By varying the stride and the number of channels,different kinds of bottlenecks are designed to plug the proposed Poker module into the network.Thus,a lightweight model can be easily assembled.Experiments conducted on benchmarks reveal the effectiveness of our proposed Poker module.And our Poker Net models can reduce the computational cost by 7.1%-15.6%.Poker Net models achieve comparable or even higher recognition accuracy than previous state-of-the-art(SOTA)models on the Image Net ILSVRC2012 classification dataset.Code is available at https://github.com/diaomin/pokernet. 展开更多
关键词 Deep learning depthwise convolution lightweight deep model model compression model acceleration
原文传递
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification 被引量:2
4
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight convolutional Neural Network depthwise Dilated Separable convolution Hierarchical Multi-Scale Feature Fusion
在线阅读 下载PDF
A Framework of Lightweight Deep Cross-Connected Convolution Kernel Mapping Support Vector Machines
5
作者 Qi Wang Zhaoying Liu +3 位作者 Ting Zhang Shanshan Tu Yujian Li Muhammad Waqas 《Journal on Artificial Intelligence》 2022年第1期37-48,共12页
Deep kernel mapping support vector machines have achieved good results in numerous tasks by mapping features from a low-dimensional space to a high-dimensional space and then using support vector machines for classifi... Deep kernel mapping support vector machines have achieved good results in numerous tasks by mapping features from a low-dimensional space to a high-dimensional space and then using support vector machines for classification.However,the depth kernel mapping support vector machine does not take into account the connection of different dimensional spaces and increases the model parameters.To further improve the recognition capability of deep kernel mapping support vector machines while reducing the number of model parameters,this paper proposes a framework of Lightweight Deep Convolutional Cross-Connected Kernel Mapping Support Vector Machines(LC-CKMSVM).The framework consists of a feature extraction module and a classification module.The feature extraction module first maps the data from low-dimensional to high-dimensional space by fusing the representations of different dimensional spaces through cross-connections;then,it uses depthwise separable convolution to replace part of the original convolution to reduce the number of parameters in the module;The classification module uses a soft margin support vector machine for classification.The results on 6 different visual datasets show that LC-CKMSVM obtains better classification accuracies on most cases than the other five models. 展开更多
关键词 convolutional neural network cross-connected lightweight framework depthwise separable convolution
在线阅读 下载PDF
频率感知驱动的深度鲁棒图像水印
6
作者 张国富 李鑫 +2 位作者 苏兆品 方涵 廉晨思 《中国图象图形学报》 北大核心 2026年第1期197-211,共15页
目的近年来,基于深度学习的水印方法得到了广泛研究。现有方法通常对特征图的低频和高频部分同等对待,忽视了不同频率成分之间的重要差异,导致模型在处理多样化攻击时缺乏灵活性,难以同时实现水印的高保真性和强鲁棒性。为此,本文提出... 目的近年来,基于深度学习的水印方法得到了广泛研究。现有方法通常对特征图的低频和高频部分同等对待,忽视了不同频率成分之间的重要差异,导致模型在处理多样化攻击时缺乏灵活性,难以同时实现水印的高保真性和强鲁棒性。为此,本文提出一种频率感知驱动的深度鲁棒图像水印技术(deep robust image watermarking driven by frequency awareness,RIWFP)。方法通过差异化机制处理低频和高频成分,提升水印性能。具体而言,低频成分通过小波卷积神经网络进行建模,利用宽感受野卷积在粗粒度层面高效学习全局结构和上下文信息;高频成分则采用深度可分离卷积和注意力机制组成的特征蒸馏块进行精炼,强化图像细节,在细粒度层面高效捕捉高频信息。此外,本文使用多频率小波损失函数,引导模型聚焦于不同频带的特征分布,进一步提升生成图像的质量。结果实验结果表明,提出的频率感知驱动的深度鲁棒图像水印技术在多个数据集上均表现出优越性能。在COCO(common objects in context)数据集上,RIWFP在随机丢弃攻击下的准确率达到91.4%;在椒盐噪声和中值滤波攻击下,RIWFP分别以100%和99.5%的准确率达到了最高水平,展现了其对高频信息的高效学习能力。在Ima⁃geNet数据集上,RIWFP在裁剪攻击下的准确率为93.4%;在JPEG压缩攻击下的准确率为99.6%,均显著优于其他对比方法。综合来看,RIWFP在COCO和ImageNet数据集上的平均准确率分别为96.7%和96.9%,均高于其他对比方法。结论本文所提方法通过频率感知的粗到细处理策略,显著增强了水印的不可见性和鲁棒性,在处理多种攻击时表现出优越性能。 展开更多
关键词 鲁棒图像水印 小波卷积神经网络 深度可分离卷积 注意力机制 多频率小波损失
原文传递
基于改进YOLOv5s的自动导引运输车托盘孔位视觉定位方法
7
作者 崔升 唐芳丽 +2 位作者 郑亮宇 曾伟理 曲伟伟 《食品与机械》 北大核心 2026年第1期79-85,共7页
[目的]自动导引运输车在搬运过程中,需定位的托盘孔位中存在的细小、形变、低对比度孔位的视觉定位不准的问题。因此,提出一种基于改进YOLOv5s的自动导引运输车托盘孔位视觉定位方法。[方法]结合ShuffleNetV2的通道混洗操作改进和CBAM... [目的]自动导引运输车在搬运过程中,需定位的托盘孔位中存在的细小、形变、低对比度孔位的视觉定位不准的问题。因此,提出一种基于改进YOLOv5s的自动导引运输车托盘孔位视觉定位方法。[方法]结合ShuffleNetV2的通道混洗操作改进和CBAM注意力机制改进,对基本YOLOv5s框架进行改进,使其聚焦于形变关键区域中亚像素级边界模糊的孔位区域;基于SloU损失函数关注微小孔位,并计算托盘孔位在相机坐标系下的空间三维坐标,得到相机坐标系到孔位区域坐标系的变换关系,采用改进的YOLOv5s框架输出AGV机械臂坐标系下的托盘孔位三维坐标。[结果]试验方法可有效捕捉亚像素级定位精度边界,绝对误差<0.03 cm,相对误差<0.83%;F1分数、mAP指标分别为95.2%、94.8%;浮点运算次数、参数量和模型体积分别为4.8 G、2.6 M、4.28 MB。[结论]试验方法有效解决了需定位托盘孔位中存在的细小、形变、低对比度孔位的视觉定位难题,提升了自动导引运输车托盘搬运效率。 展开更多
关键词 YOLOv5s 自动导引运输车 托盘孔位定位 深度可分离卷积 CBAM注意力
在线阅读 下载PDF
基于扩散先验的脑部MRI超分辨率重建
8
作者 熊承义 曹雨轩 高志荣 《中南民族大学学报(自然科学版)》 2026年第2期202-211,共10页
现有基于Transformer的MRI超分辨率方法虽具有良好的全局建模能力,但忽略了深度先验约束建模的重要性.为此,提出了一种基于扩散先验的脑部MRI超分辨率方法,利用潜在扩散模型生成的先验来引导Transformer进行超分辨率重建,以提升MRI细节... 现有基于Transformer的MRI超分辨率方法虽具有良好的全局建模能力,但忽略了深度先验约束建模的重要性.为此,提出了一种基于扩散先验的脑部MRI超分辨率方法,利用潜在扩散模型生成的先验来引导Transformer进行超分辨率重建,以提升MRI细节重建能力.具体而言,采用两阶段协同训练策略:第一阶段通过真实图像潜编码构建内容先验;第二阶段引入扩散模型重构先验,并联合优化去噪与重建过程,实现无监督条件下的图像超分辨率.此外,采用深度可分离卷积与置换自注意力机制,实现编码器的高效建模与感受野扩展.在IXI多模态MRI数据集上的4倍超分辨率实验表明:所提出方法在提升重建图像主客观质量与重建效率方面优于已有方法 . 展开更多
关键词 MRI超分辨率 扩散先验 置换自注意力 深度可分离卷积
在线阅读 下载PDF
基于DenseNet优化Swin Transformer模型的苹果叶部病害多尺度特征分类
9
作者 谷伟 叶峥 矫桂娥 《农业机械学报》 北大核心 2026年第2期181-192,共12页
针对人工检测苹果病害效率低、成本高且准确性差的问题,本文以Swin Transformer作为基础模型,在核心模块中引入DenseNet思想,增强特征传递和梯度流动;使用Outlook Attention捕捉图像中细节特征,提升模型细粒度信息提取能力。为了进一步... 针对人工检测苹果病害效率低、成本高且准确性差的问题,本文以Swin Transformer作为基础模型,在核心模块中引入DenseNet思想,增强特征传递和梯度流动;使用Outlook Attention捕捉图像中细节特征,提升模型细粒度信息提取能力。为了进一步优化模型性能,引入了深度可分离卷积和膨胀卷积,实现在较小参数量前提下捕捉不同尺度的特征;在模型中引入Non-Local,以整合全局上下文信息,进一步提高模型的综合性能。以上改进共同作用,使得本文模型在多个任务上表现出了优异的性能和鲁棒性。实验结果显示,苹果叶部病害分类识别准确率达到95.8%,精确率、召回率和F1分数分别达到95.80%、95.74%、95.76%,均超过基线模型。基于改进Swin Transformer的苹果叶部病害分类模型能够有效实现苹果叶部病害的种类识别及其严重程度分类,为大规模作物病害监测提供了理论支持和研究基础,助力精准防控与绿色农业。 展开更多
关键词 苹果叶部病害 深度可分离卷积 细粒度信息 全局上下文信息 特征传递
在线阅读 下载PDF
一种基于FL-TransCNN神经网络的水声智能频谱感知算法
10
作者 李玉芳 王锴 +2 位作者 张力良 徐凌伟 Thomas Aaron Gulliver 《电讯技术》 北大核心 2026年第1期11-20,共10页
为了提高频谱利用率,提出了一种基于联邦学习(Federated Learning,FL)、Transformer和卷积神经网络(Convolutional Neural Network,CNN)的水声智能频谱感知算法。首先,基于FL实现数据隔离状态下的信息共享,并应用Paillier加密技术进行... 为了提高频谱利用率,提出了一种基于联邦学习(Federated Learning,FL)、Transformer和卷积神经网络(Convolutional Neural Network,CNN)的水声智能频谱感知算法。首先,基于FL实现数据隔离状态下的信息共享,并应用Paillier加密技术进行权重加密保障;其次,本地感知数据经连续小波变换构建为时频谱图;最后,融合CNN与Transformer构建了TransCNN感知器,通过并行分支实现了高精度感知。在信噪比-18~0 dB范围内,与RepVGG、Swin-Transformer、YOLOv7、MobileNet算法相比,所提的水声智能频谱感知算法的平均检测概率提升了4%~10%,平均虚警概率降低了2%~9%。 展开更多
关键词 海洋物联网 智能频谱感知 联邦学习 连续小波变换 深度可分离卷积
在线阅读 下载PDF
基于多尺度注意力与双流融合特征的微表情识别
11
作者 郭小龙 薛珮芸 +1 位作者 白静 徐姜帅 《现代电子技术》 北大核心 2026年第5期175-184,共10页
为了解决微表情识别中特征提取能力不足和样本数据不均衡导致的识别偏差问题,文中提出一种基于多尺度注意力与双流融合特征的微表情识别方法。首先设计多尺度注意力模块,通过光流和差分序列特征的融合提升微表情关键动态信息的提取能力... 为了解决微表情识别中特征提取能力不足和样本数据不均衡导致的识别偏差问题,文中提出一种基于多尺度注意力与双流融合特征的微表情识别方法。首先设计多尺度注意力模块,通过光流和差分序列特征的融合提升微表情关键动态信息的提取能力;其次设计了改进的多核Inception模块,结合深度可分离卷积和多尺寸卷积核,在提升特征表达能力的同时降低计算复杂度;最后采用数据扩充策略和Focal Loss损失函数以缓解样本类间不均导致的识别偏移。实验结果显示,该方法在CASMEⅡ、SMIC-HS、SAMM和MEGC2019等4个自发微表情数据集上实现了优异性能。其中UAR和UF1指标分别达到最高,为0.914和0.912,显著优于近期主流方法。同时,设计的消融实验验证了多尺度注意力模块和多核Inception模块在特征提取中的关键作用。实验结果表明,所提方法通过多维度融合、创新特征提取、数据扩充和改善损失函数等操作,获得了高精度且具有竞争力的微表情识别性能。 展开更多
关键词 微表情识别 多尺度注意力 双流特征融合 深度可分离卷积 数据扩充 Focal Loss损失函数
在线阅读 下载PDF
CPViG-Net:基于局部跨阶段视觉图卷积的学生课堂行为识别
12
作者 张浩鹏 施铮 +1 位作者 刘峰 宋婉茹 《计算机科学》 北大核心 2026年第2期57-66,共10页
随着教育范式从“人机协同”向“人智协同共育”演进,课堂教学的智能化评价也面临着新的要求和挑战,其中以学生行为为出发点的任务近些年来获得了广泛的关注。针对真实课堂环境中存在的学生行为多样、遮挡频繁及背景干扰严重等问题,提... 随着教育范式从“人机协同”向“人智协同共育”演进,课堂教学的智能化评价也面临着新的要求和挑战,其中以学生行为为出发点的任务近些年来获得了广泛的关注。针对真实课堂环境中存在的学生行为多样、遮挡频繁及背景干扰严重等问题,提出一种局部跨阶段视觉图卷积模型,旨在提升复杂课堂环境下的学生行为识别精度。该模型以经典目标检测算法为基准框架,通过融合视觉图卷积神经网络的动态特征建模能力,构建了局部最大相对图卷积模块(PMG)与局部跨阶段融合(CPF)模块。其中,PMG模块通过嵌入最大相对图卷积来捕捉节点间特征差异最大的邻域信息,进而针对性地解决局部区域遮挡引起的信息丢失问题,并结合了深度可分离卷积降低图卷积算法的计算开销;CPF模块利用全连接层重构特征结构,并通过C2f模块的跨阶段连接机制,实现多层级的特征融合,从而增强模型对小尺度目标的识别能力。此外,模型通过近邻K值优化,提出针对不同数据集的优化策略。在公开数据集SCB03-S上,CPViG-Net的mAP@50达到70.9%,较基准模型提升2个百分点;在多个公开数据集上的实验表明,该模型在处理真实课堂情境下学生行为识别面临的诸多问题中表现出较好的性能和较高的鲁棒性。 展开更多
关键词 学生行为 最大相对图卷积 多尺度目标识别 遮挡 深度可分离卷积
在线阅读 下载PDF
空对地观测目标识别轻量化网络构建方法
13
作者 倪平 张维光 +1 位作者 刘亚红 杨小勇 《西安工业大学学报》 2026年第1期69-82,共14页
针对空对地观测目标识别网络向嵌入式载体硬件平台移植时,因网络模型参数规模大而引起系统目标识别性能大幅下降等问题,提出了一种目标识别轻量化网络构建方法。选用深度可分离卷积来替代标准卷积,同时在Mobilenetv3网络中引入三重注意... 针对空对地观测目标识别网络向嵌入式载体硬件平台移植时,因网络模型参数规模大而引起系统目标识别性能大幅下降等问题,提出了一种目标识别轻量化网络构建方法。选用深度可分离卷积来替代标准卷积,同时在Mobilenetv3网络中引入三重注意力机制提升对目标的识别能力,完成骨干网络构建,基于Jonson准则设计了目标检测网络,选用PAFPN颈部网络和EIOU_Loss损失函数,完成了轻量化网络MPDNET构建。在PASCAL VOC2007数据集和自建数据集上进行对比分析,与YOLOv5s网络相比,MPDNET网络精度降低了4.4%,但网络模型参数减少了62%,运算量减少了52%,并对小目标具有较高的识别精度。在自建数据库中,与YOLOv5s网络相比,MPDNET网络精度降低了3.8%。最后在Jetson TX2平台上进行部署,使用TensorRT优化后的网络模型推理速度可达到每秒80帧以上。 展开更多
关键词 目标识别网络 网络模型参数 轻量化网络 深度可分离卷积 运算量
在线阅读 下载PDF
融合最大池化的Conformer中文语音识别
14
作者 胡从刚 杨立鹏 +2 位作者 孙永奇 陈华龙 韩可可 《计算机工程》 北大核心 2026年第1期105-115,共11页
语音识别旨在通过先进的算法与信号处理技术,赋予机器理解人类语音的能力,使得人与机器之间的交流更加便捷、顺畅。目前,大多数端到端语音识别的研究工作主要围绕Conformer模型进行优化。针对Conformer编码器对语音细粒度局部特征提取... 语音识别旨在通过先进的算法与信号处理技术,赋予机器理解人类语音的能力,使得人与机器之间的交流更加便捷、顺畅。目前,大多数端到端语音识别的研究工作主要围绕Conformer模型进行优化。针对Conformer编码器对语音细粒度局部特征提取能力不足的问题,提出一种融合最大池化(MP)的Conformer中文语音识别模型。首先,将编码器卷积模块中门控线性单元的输出在时间维度上进行MP,以提取多帧语音信号对应一个字符的细粒度局部特征。然后,将池化后的特征与逐通道卷积(DWC)提取的粗粒度局部特征以逐元素相加的方式进行融合,以增加语音局部特征的信息量,从而提高Conformer模型的语音识别准确率。最后,在公开的中文数据集Aishell-1上的实验结果表明:采用贪心搜索方式进行解码,所提模型可以将基线模型的字错误率(CER)从5.58%降低至5.32%;采用注意力重打分方式进行解码,所提模型可以将基线模型的CER从5.06%降低至4.92%。 展开更多
关键词 语音识别 细粒度局部特征 Conformer模型 最大池化 逐通道卷积
在线阅读 下载PDF
基于一维深度可分离卷积的轻量化辐射源识别
15
作者 孙文鑫 孟华 +1 位作者 杨佳煌 周礼亮 《太赫兹科学与电子信息学报》 2026年第1期89-97,共9页
针对深度神经网络的辐射源个体识别技术,为达到良好的识别性能,网络深度不断增加,致使模型参数量与计算复杂度爆炸式增长,难以在边缘端算力受限的设备上部署。为此,本文提出基于一维深度可分离卷积和一维卷积块注意力模块的网络(ODCNet... 针对深度神经网络的辐射源个体识别技术,为达到良好的识别性能,网络深度不断增加,致使模型参数量与计算复杂度爆炸式增长,难以在边缘端算力受限的设备上部署。为此,本文提出基于一维深度可分离卷积和一维卷积块注意力模块的网络(ODCNet)架构,通过结合逐深度卷积和逐点卷积,一维深度可分离卷积有效减少了模型的参数量和计算复杂度;轻量级的一维卷积块注意力模块可有效提升模型性能,保障模型的识别能力。实验表明,ODCNet的识别性能与MobileNet V3相当,而参数量仅为MobileNet V3的11.27%,计算复杂度为MobileNet V3的17.49%,推理时间缩短至MobileNet V3的50%。 展开更多
关键词 辐射源识别 模型轻量化 深度可分离卷积 卷积块注意力模块
在线阅读 下载PDF
QuarkModule:一种用于多目标跟踪(MOT)的高效卷积
16
作者 张敬尊 何宁 +3 位作者 晏康 王琪 王鑫 陈明 《计算机应用与软件》 北大核心 2026年第2期317-323,共7页
以轻量化为目标,提出一种可用于多目标跟踪(Multi-Object Tracking,MOT)模型的高效卷积QuarkModule,该卷积算子可从宽度和深度两个方面对深度神经网络模型进行轻量化。基于QuarkModule,对经典JDE(Joint Detection and Embedding)算法进... 以轻量化为目标,提出一种可用于多目标跟踪(Multi-Object Tracking,MOT)模型的高效卷积QuarkModule,该卷积算子可从宽度和深度两个方面对深度神经网络模型进行轻量化。基于QuarkModule,对经典JDE(Joint Detection and Embedding)算法进行改进,提出一种轻量化的MOT模型QuarkJDE,为进一步验证QuarkModule的泛化能力,构建轻量化分类模型QuarkNet。基于公开数据集,对两个轻量化模型展开多维实验,实验结果充分验证QuarkModule的效率和特征学习能力。 展开更多
关键词 多目标跟踪 轻量化模型 ECA 深度可分离卷积 JDE
在线阅读 下载PDF
基于改进的YOLOv11检测苹果树叶片黑腐病
17
作者 张莉 王裕灿 《中国农业气象》 2026年第2期202-215,共14页
苹果树叶片黑腐病(Black rot)是常见且具有破坏性的果树病害之一,严重时影响苹果的品质和产量。针对传统病害识别方法存在的小目标识别困难、复杂背景干扰以及检测效率低等问题,本文提出一种基于改进的YOLOv11检测苹果树叶片黑腐病的方... 苹果树叶片黑腐病(Black rot)是常见且具有破坏性的果树病害之一,严重时影响苹果的品质和产量。针对传统病害识别方法存在的小目标识别困难、复杂背景干扰以及检测效率低等问题,本文提出一种基于改进的YOLOv11检测苹果树叶片黑腐病的方法,在Backbone中引入C3K2模块,结合多尺度卷积的调节能力;在SPPF模块后添加C2PSA注意力模块;最后在Head结构中采用深度可分离卷积并引入分布焦点损失函数(DFL)和CIoU Loss。结果表明:改进后的YOLOv11模型在检测苹果树叶片黑腐病的表现在平均精确率均值m AP指标上达到99.5%,召回率达99.7%,F1分数为99.6%,相较YOLOv8模型提升3.2个百分点,且检测帧率提升至48帧·s^(-1)。消融实验结果显示,C3K2、C2PSA模块与深度可分离卷积的组合可将m AP从93.1%提升至95.2%。本方法在保证苹果树叶片黑腐病小目标高精度识别的同时,显著提升检测结果的计算实时性,具备较强的实用性与部署价值。 展开更多
关键词 苹果黑腐病 YOLOv11 目标检测 深度可分离卷积
在线阅读 下载PDF
融合DW卷积与SE注意力的ResNet50模型用于MRI预测阿尔茨海默症
18
作者 肖作文 毕吉霖 何红宇 《计算机时代》 2026年第2期28-34,共7页
本文提出一种改进的ResNet50深度学习模型(ResNet50-DW-SE模型),用于核磁共振(MRI)图像识别以预测阿尔茨海默症。ResNet50深度学习模型的改进体现在其残差块(Bottleneck)中:一方面引入深度可分离卷积(Depthwise separable convolutions,... 本文提出一种改进的ResNet50深度学习模型(ResNet50-DW-SE模型),用于核磁共振(MRI)图像识别以预测阿尔茨海默症。ResNet50深度学习模型的改进体现在其残差块(Bottleneck)中:一方面引入深度可分离卷积(Depthwise separable convolutions,DW)替代传统卷积,实现模型轻量化,即减少模型参数、提升计算效率;另一方面引入压缩激励(Squeeze-and-Excitation,SE)注意力模块,提高模型对图像的识别准确率。该模型预测流程为:首先收集核磁共振图像构建数据集并预处理;再对模型预训练,划分训练集与测试集;随后用训练集训练模型并评估计算效率;最后用测试集测试模型,以召回率、精确率、F1分数为评估指标。实验显示,该模型较原ResNet50参数量降低45.2%,召回率、精确率、F1分数平均值均达0.99,较原模型对应指标分别提升1.25%、2.5%、2.25%。 展开更多
关键词 阿尔茨海默症 深度学习 残差块 深度可分离卷积 注意力机制
在线阅读 下载PDF
基于自适应时频增强框架的电能质量扰动识别研究
19
作者 张欣语 《现代信息科技》 2026年第1期1-6,12,共7页
为解决传统电能质量扰动信号识别模型中特征融合固定和计算复杂度高的问题,文章提出了一种自适应格拉姆时间频率增强网络(Adaptive Gramian Time Frequency Enhancement Network,AGTFENet)。首先引入基于格拉姆矩阵的降噪策略处理一维... 为解决传统电能质量扰动信号识别模型中特征融合固定和计算复杂度高的问题,文章提出了一种自适应格拉姆时间频率增强网络(Adaptive Gramian Time Frequency Enhancement Network,AGTFENet)。首先引入基于格拉姆矩阵的降噪策略处理一维输入信号,采用三分支并行架构,分别处理原始信号、格拉姆降噪信号和频谱;其次堆叠多个特征学习模块,通过深度可分离卷积提取各分支特征;最后引入自适应平均池化和自适应权重机制,动态调整各分支特征的贡献度,实现特征的加权融合及扰动信号的分类。仿真实验表明,AGTFENet在不同噪声等级(无噪声、40 dB、30 dB、20 dB)条件下的识别准确率分别为98.9%、98.7%、98.5%和97.8%,优于其他分类模型;且得益于其轻量化设计,在计算复杂度方面表现出色。 展开更多
关键词 电能质量扰动 格拉姆降噪 自适应机制 深度可分离卷积 扰动识别
在线阅读 下载PDF
基于轻量化编码器与特征增强的人脸毛孔分割方法
20
作者 杨周 王健超 《现代信息科技》 2026年第3期107-111,共5页
为解决人脸毛孔分割中存在的结构模糊性(与色斑相似)、皮脂高光干扰及多尺度特征挑战,文章提出融合轻量化编码器与特征增强的方法。该方法采用深度可分离卷积构建轻量化主干网络,降低了复杂度;通过嵌入SE通道注意力模块,强化了毛孔特征... 为解决人脸毛孔分割中存在的结构模糊性(与色斑相似)、皮脂高光干扰及多尺度特征挑战,文章提出融合轻量化编码器与特征增强的方法。该方法采用深度可分离卷积构建轻量化主干网络,降低了复杂度;通过嵌入SE通道注意力模块,强化了毛孔特征响应并抑制干扰;引入深度信息预测辅助任务,利用毛孔凹陷几何特性提升判别力。在自建高分辨率人脸毛孔数据集上的实验表明,该方法IoU达0.872、Dice系数0.921、精度0.896、召回率0.913,显著优于传统CNN与UNet模型,有效减少色斑误检与毛孔漏检,为皮肤分析及美容评估提供高效精准的分割工具。 展开更多
关键词 毛孔分割 深度可分离卷积 SE通道注意力 深度信息预测 Unet
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部