期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于多任务学习的跳频调制方式识别与信噪比估计方法
1
作者 汪有鹏 王昊 曹建银 《现代电子技术》 北大核心 2026年第1期66-72,共7页
针对目前在跳频信号识别的多任务学习中存在跷跷板现象和使用IQ信号训练出的模型泛化能力较差的问题,文中提出一种改进的方法,采用CGC的多任务网络框架结合大卷积核与结构重参数化技术,以提高跳频信号调制识别和信噪比估计的准确性。该... 针对目前在跳频信号识别的多任务学习中存在跷跷板现象和使用IQ信号训练出的模型泛化能力较差的问题,文中提出一种改进的方法,采用CGC的多任务网络框架结合大卷积核与结构重参数化技术,以提高跳频信号调制识别和信噪比估计的准确性。该多任务网络架构采用硬参数共享,将网络通道划分为专家通道和共享通道,并引入了包含大卷积核结构重参数化与残差结构的MobileBlock层。与多任务学习中常用的MMOE结构模型相比,跳频信号调制识别的分类准确率更高,信噪比估计的均方误差更小。实验结果证明了该方法在现代军事通信对抗中的应用潜力,为跳频信号识别和参数估计提供了一个较好的解决方案。 展开更多
关键词 跳频信号 调制识别 信噪比估计 多任务学习 大核卷积 结构重参数化
在线阅读 下载PDF
基于EE-YOLOv8s的多场景火灾迹象检测算法 被引量:4
2
作者 崔克彬 耿佳昌 《图学学报》 北大核心 2025年第1期13-27,共15页
针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征... 针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征提取网络,保证模型轻量化的同时,优化图像特征提取;引入大型可分离核注意力机制LSKA改进SPPELAN模块,将空间金字塔部分改进为SPP_LSKA_ELAN,充分捕获大范围内的空间细节信息,在复杂多变的火灾场景中提取更全面的特征,从而区分目标与相似物体的差异;Neck部分引入可变形卷积DCN和跨空间高效多尺度注意力EMA,实现C2f_DCN_EMA可变形卷积校准模块,增强对烟火目标边缘轮廓变化的适应能力,促进特征的融合与校准,突出目标特征;在Head部分增设携带有轻量级、无参注意力机制SimAM的小目标检测头,并重新规划检测头通道数,加强多尺寸目标表征能力的同时,降低冗余以提高参数有效利用率。实验结果表明,改进后的EE-YOLOv8s网络模型相较于原模型,其参数量减少了13.6%,准确率提升了6.8%,召回率提升了7.3%,mAP提升了5.4%,保证检测速度的同时,提升了火灾迹象目标的检测性能。 展开更多
关键词 烟火目标检测 EfficientNetEasy主干网络 大型可分离核注意力机制 可变形卷积校准模块 小目标检测
在线阅读 下载PDF
基于改进EfficientDet的食品生产线核桃仁分选智能化研究
3
作者 秦新华 王义亮 +1 位作者 李玉贵 李晋 《食品与机械》 北大核心 2025年第8期77-84,共8页
[目的]提高现有食品生产线核桃仁分选的效率和精度。[方法]基于核桃仁分拣的智能化生产线,提出一种改进的EfficientDet模型用于食品生产线核桃仁智能化分选。通过在主干网络引入卷积注意力机制模块,强化模型对食品区域的聚焦能力。通过... [目的]提高现有食品生产线核桃仁分选的效率和精度。[方法]基于核桃仁分拣的智能化生产线,提出一种改进的EfficientDet模型用于食品生产线核桃仁智能化分选。通过在主干网络引入卷积注意力机制模块,强化模型对食品区域的聚焦能力。通过改进双向特征金字塔网络,增强模型对不同尺度食品的检测能力。通过Dynamic ReLU激活函数对原激活函数进行优化,增强模型对食品的检测性能,并将优化后的模型部署于食品生产线进行试验验证。[结果]试验方法在核桃仁分选任务中实现对正常、碎壳、黑斑和干瘪核桃仁的精准识别与高效分类,单张图像检测时间为18 ms,平均精度均值达到97.92%,误检率降至1.0%,可有效提高食品生产线自动化水平。[结论]该智能化分选方法有效解决了传统分选效率低和精度差的问题,在食品生产线自动化领域具有良好的应用前景与推广价值。 展开更多
关键词 食品生产线 核桃仁分选 智能化 EfficientDet模型 双向特征金字塔网络 卷积注意力机制模块
在线阅读 下载PDF
基于高效空间信道信息编码的轻量级图像超分辨率重构
4
作者 莫开治 滕奇志 任超 《智能计算机与应用》 2025年第8期1-9,共9页
作为计算机视觉的基础任务,单幅图像超分辨率(Single Image Super-Resolution,SISR)长期以来一直是一个备受关注的研究课题。近期的研究表明,Transformer的成功不仅归功于其自注意力(Self-Attention,SA)机制,还体现在其宏观框架和先进... 作为计算机视觉的基础任务,单幅图像超分辨率(Single Image Super-Resolution,SISR)长期以来一直是一个备受关注的研究课题。近期的研究表明,Transformer的成功不仅归功于其自注意力(Self-Attention,SA)机制,还体现在其宏观框架和先进组件的整体设计上。空间池化、位移、多层感知机(Multi-Layer Perception,MLP)、傅里叶变换和常数矩阵等方法,具有与SA机制相似的空间信息编码能力,能够替代并实现与其相当的效果。基于这一发现,本文的目标是利用Transformer中优越的宏观架构与高效的空间信息编码技术结合,改进复杂度较高的SA机制,以提升SISR性能。具体而言,本文重新审视了空间卷积的设计,旨在通过卷积调制技术实现更高效的空间特征编码,并通过动态调制方法表达特征。提出的高效空间信息编码(Efficient Spatial Information Encoding,ESIE)层,采用大核卷积和Hadamard积的方式,模仿查询与键之间的点积操作,并实现与SA机制中值表示再校准类似的效果。因此,ESIE层不仅能够捕捉长程依赖和自适应行为,还能够保持线性计算复杂度。另一方面,针对传统前馈网络(Feed-Forward Network,FFN)在处理空间信息时的次优表现,本文在提出的高效通道信息编码(Efficient Channel Information Encoding,ECIE)层中引入了空间感知和动态自适应机制。该方法有助于增强特征的多样性,并有效地调节层间的信息流动。实验结果表明,本文提出的高效空间-通道信息编码网络(Efficient Spatial-Channel Information Encoding,ESCIEN)在定量和定性评估上均优于现有模型。 展开更多
关键词 图像超分辨率 空间信息编码 卷积调制技术 大核卷积
在线阅读 下载PDF
基于EWBiLSTM-ATT的数据手套手语识别 被引量:1
5
作者 武东辉 王金凤 +1 位作者 仇森 刘国志 《计算机工程》 北大核心 2025年第8期107-119,共13页
手语识别近年来受到广泛关注,但现有手语识别模型存在训练时间长和计算成本高的问题。为此,基于穿戴式数据手套提出一种融合注意力机制的首层宽卷积核扩展深度卷积神经网络(EWDCNN)和双向长短期记忆网络(BiLSTM)的混合深度学习方法——E... 手语识别近年来受到广泛关注,但现有手语识别模型存在训练时间长和计算成本高的问题。为此,基于穿戴式数据手套提出一种融合注意力机制的首层宽卷积核扩展深度卷积神经网络(EWDCNN)和双向长短期记忆网络(BiLSTM)的混合深度学习方法——EWBiLSTM-ATT模型。首先通过加宽首层卷积层来减少模型参数量,提升计算速度,通过扩展WDCNN卷积层深度来提高模型自动提取手语特征的能力;其次引入BiLSTM作为时间建模器捕捉手语序列数据的时间动态信息,有效处理传感器数据中的时序关系;最后利用注意力机制通过映射加权和学习参数矩阵赋予BiLSTM隐含状态不同权重,通过计算每个时间段的注意力权重,模型自动选择与手势动作相关的关键时间段。以STM32F103为主控模块,以MPU6050与Flex Sensor 4.5传感器为核心搭建数据手套手语采集平台。选取16种动态手语动作用于构建GR-Dataset数据训练模型。同一实验条件下,EWBiLSTM-ATT准确率为99.40%,相对于CLT-net、CNN-GRU、CLA-net、CNN-GRU-ATT模型分别提升10.36、8.41、3.87、3.05百分点,训练总时间分别缩减至这4种对比模型的57%、61%、55%、56%。 展开更多
关键词 扩展深度卷积神经网络 双向长短期记忆网络 注意力模块 手语识别 数据手套 深度学习
在线阅读 下载PDF
基于改进HRNet和PPM的图像语义分割方法的研究
6
作者 师佳琪 杨皓浚 +1 位作者 刘晓悦 陈鑫 《现代电子技术》 北大核心 2025年第7期29-34,共6页
为解决现有语义分割模型无法兼顾全局语义信息与局部细节信息,以及残差模块细节特征提取能力弱的问题,提出一种语义分割方法。在HRNet的基础上引入了金字塔池化模块,兼顾了全局语义信息和局部细节信息,同时在原有残差模块Basic Block的... 为解决现有语义分割模型无法兼顾全局语义信息与局部细节信息,以及残差模块细节特征提取能力弱的问题,提出一种语义分割方法。在HRNet的基础上引入了金字塔池化模块,兼顾了全局语义信息和局部细节信息,同时在原有残差模块Basic Block的基础上引入大核深度卷积提高模型的细节特征提取能力,大幅度提高模型的精度。在PASCAL VOC2012图像数据集上的实验表明,相较于原始HRNet等其他分割网络,该算法取得了分割精度的显著提升,平均分割精度达到了89.27%。各设计模块的有效性也通过消融实验得以验证,尤其是改进Basic Block对提升分割性能具有关键作用,该模型大幅度提升了图像语义分割精度,提供了一种高效率、稳定且适用场景更加普遍的多尺度语义分割算法。 展开更多
关键词 HRNet 金字塔池化模块 大核深度卷积 残差模块 语义分割 深度学习
在线阅读 下载PDF
面向低算力设备的改进轻量化语音识别模型
7
作者 李政霖 介婧 +2 位作者 柴佳辉 郑慧 武晓莉 《计算机工程与设计》 北大核心 2025年第10期2969-2977,共9页
针对语音识别模型在低算力设备上部署难且识别精度低的问题,提出一种改进的轻量化语音识别模型。该模型采用双通道多核卷积结构,以深度残差收缩网络为主要识别单元;引入卷积块注意力模块提高其对通道和空间位置的特征敏感度;结合门控线... 针对语音识别模型在低算力设备上部署难且识别精度低的问题,提出一种改进的轻量化语音识别模型。该模型采用双通道多核卷积结构,以深度残差收缩网络为主要识别单元;引入卷积块注意力模块提高其对通道和空间位置的特征敏感度;结合门控线性单元,提高对长序列语音信息的识别能力;采用非对称卷积策略减少参数量;通过像素注意力引导模块进行特征融合,增强对关键语音信息的捕捉能力。在中文数据集Aishell-1上的实验结果表明,该模型字错误率为12.13%,相较于结果最好的ResNet降低了5.76%,同时其参数量因引入非对称卷积策略降低了40.26%,有效降低了模型的复杂度。 展开更多
关键词 轻量化语音识别模型 双通道多核卷积结构 深度残差收缩网络 卷积块注意力模块 门控线性单元 非对称卷积策略 像素注意力引导模块
在线阅读 下载PDF
用解卷积方法提取笔射束核的实现 被引量:7
8
作者 金浩宇 吕庆文 周凌宏 《中国生物医学工程学报》 EI CAS CSCD 北大核心 2004年第4期382-384,F004,共4页
本研究论述了在三维放疗计划的剂量计算中,如何用解卷积方法从测量的宽平行射束离轴比数据中提取笔射束卷积核,并且用这个核重建其它尺寸射野的射束分布,与实际测量的相同尺寸射野的射束分布进行比较,取得了较好的一致性,从而为进一步... 本研究论述了在三维放疗计划的剂量计算中,如何用解卷积方法从测量的宽平行射束离轴比数据中提取笔射束卷积核,并且用这个核重建其它尺寸射野的射束分布,与实际测量的相同尺寸射野的射束分布进行比较,取得了较好的一致性,从而为进一步的实际应用奠定了理论基础。 展开更多
关键词 笔射束核 卷积 解卷积 调强放疗 剂量计算
暂未订购
基于改进YOLOv5网络的复杂背景图像中茶尺蠖检测 被引量:37
9
作者 胡根生 吴继甜 +1 位作者 鲍文霞 曾伟辉 《农业工程学报》 EI CAS CSCD 北大核心 2021年第21期191-198,共8页
茶叶的产量和品质深受病虫害的影响。茶尺蠖是一种常见的茶叶害虫,精确检测茶尺蠖对茶叶病虫害防治有重要意义。由于茶尺蠖和茶树枝、枯死茶叶的颜色、纹理相近,茶尺蠖的体积小、形态多变、被遮挡等问题,现有方法检测茶尺蠖的精度不高... 茶叶的产量和品质深受病虫害的影响。茶尺蠖是一种常见的茶叶害虫,精确检测茶尺蠖对茶叶病虫害防治有重要意义。由于茶尺蠖和茶树枝、枯死茶叶的颜色、纹理相近,茶尺蠖的体积小、形态多变、被遮挡等问题,现有方法检测茶尺蠖的精度不高。该研究提出一种基于深度学习的复杂背景图像中茶尺蠖检测方法,该方法使用YOLOv5为基线网络,利用卷积核组增强对茶尺蠖的特征提取,在不增加计算量的条件下减少复杂背景对茶尺蠖检测结果的干扰;使用注意力模块关注茶尺蠖整体,根据茶尺蠖的大小和形状自适应调节感受野,降低因目标大小形状不一导致的漏检;使用Focal loss损失函数减少前景和背景的类不平衡对检测结果的影响。试验结果表明,所提方法用于复杂背景图像中茶尺蠖的检测,可以达到0.94的召回率,0.96的精确度和92.89%的平均精度均值。与基线网络相比,该方法的平均精度均值提高了6.44个百分点。使用相同的数据集和预处理的对比分析表明,该方法优于SSD、Faster RCNN和YOLOv4等其他经典深度学习方法,平均精度均值比SSD、Faster RCNN、YOLOv4分别高17.18个百分点、6.52个百分点和4.78个百分点。该方法可实现对茶尺蠖的智能检测,减少人力成本,有助于实现精准施药,提高茶叶的产量和品质。 展开更多
关键词 农业 算法 目标检测 深度学习 卷积核组 注意力模块 茶尺蠖
在线阅读 下载PDF
基于属性散射中心卷积核调制的SAR目标识别深层网络 被引量:3
10
作者 李毅 杜兰 +1 位作者 周可儿 杜宇昂 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期443-456,共14页
卷积神经网络(CNN)的特征提取能力与其参数量有关,一般来说,参数量越多,CNN的特征提取能力越强。但要学好这些参数需要大量的训练数据,而在实际应用中,可用于模型训练的合成孔径雷达(SAR)图像往往是有限的。减少CNN的参数量可以降低对... 卷积神经网络(CNN)的特征提取能力与其参数量有关,一般来说,参数量越多,CNN的特征提取能力越强。但要学好这些参数需要大量的训练数据,而在实际应用中,可用于模型训练的合成孔径雷达(SAR)图像往往是有限的。减少CNN的参数量可以降低对训练样本的需求,但同时也会降低CNN的特征表达能力,影响其目标识别性能。针对此问题,该文提出一种基于属性散射中心(ASC)卷积核调制的SAR目标识别深层网络。由于SAR图像具有电磁散射特性,为了提取更符合SAR目标特性的散射结构和边缘特征,所提网络使用预先设定的具有不同指向和长度的ASC核对少量CNN卷积核进行调制以生成更多卷积核,从而在降低网络参数量的同时保证其特征提取能力。此外,该网络在浅层使用ASC调制卷积核来提取更符合SAR图像特性的散射结构和边缘特征,而在高层使用CNN卷积核来提取SAR图像的语义特征。由于同时使用ASC调制卷积核和CNN卷积核,该网络能够兼顾SAR目标的电磁散射特性和CNN的特征提取优势。使用实测SAR图像进行的实验证明了所提网络可以在降低对训练样本需求的同时保证优秀的SAR目标识别性能。 展开更多
关键词 合成孔径雷达(SAR) 目标识别 卷积神经网络(CNN) 属性散射中心(ASC) 卷积核调制
在线阅读 下载PDF
基于MDM-ResNet的脑肿瘤分类方法 被引量:8
11
作者 夏景明 邢露萍 +1 位作者 谈玲 宣大伟 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2022年第2期212-219,共8页
脑肿瘤是世界上最致命的癌症之一.由于脑肿瘤的多样性,其图像分类成为了当代研究的热点.近年来,深度神经网络(DNN)常用于医学图像分类,但随着深度的增加网络会出现梯度消失和过拟合的问题,而残差网络(ResNet)通过引入恒等映射可以缓解... 脑肿瘤是世界上最致命的癌症之一.由于脑肿瘤的多样性,其图像分类成为了当代研究的热点.近年来,深度神经网络(DNN)常用于医学图像分类,但随着深度的增加网络会出现梯度消失和过拟合的问题,而残差网络(ResNet)通过引入恒等映射可以缓解这些问题.因此,本文基于ResNet提出了一种MDM-ResNet网络,该网络由多尺寸卷积核模块(Multi-size convolution kernel module)、双通道池化层(Dual-channel pooling layer)和多深度融合残差块(Multi-depth fusion residual block)组成.本文实验在Figshare数据集上展开,采用数据增强操作对图像进行预处理,并利用5倍交叉验证方法对网络性能进行评估.最终实验结果表明MDM-ResNet能够对脑膜瘤(Meningioma)、胶质瘤(Glioma)和垂体瘤(Pituitary tumor)进行有效分类. 展开更多
关键词 脑肿瘤 深度神经网络(DNN) 残差网络(ResNet) 多尺寸卷积核模块 双通道池化层 多深度融合残差块
在线阅读 下载PDF
多尺度卷积核U-Net模型的视网膜血管分割方法 被引量:5
12
作者 杨丹 刘国如 +1 位作者 任梦成 裴宏杨 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期7-14,共8页
针对病变视网膜血管结构的计算机辅助诊断问题,提出了一种多尺度卷积核U-Net模型的视网膜血管分割方法.在U-Net模型基础上设计了融合Inception模块和最大索引值上采样方法的多尺度卷积神经网络结构.在网络训练阶段,采取旋转、镜像等操... 针对病变视网膜血管结构的计算机辅助诊断问题,提出了一种多尺度卷积核U-Net模型的视网膜血管分割方法.在U-Net模型基础上设计了融合Inception模块和最大索引值上采样方法的多尺度卷积神经网络结构.在网络训练阶段,采取旋转、镜像等操作进行数据集扩充,运用CLAHE算法进行图像预处理;训练后得到的双通道特征图,进行Softmax归一化;最后通过改进的代价损失函数对归一化结果迭代优化,得到完整的视网膜血管分割模型.实验结果表明,所提方法在DRIVE数据集上分割的准确率达到0.9694,灵敏性达到0.7762,特异性达到0.9835,比U-Net模型具有更优的分割效果和泛化能力,与其他现存方法相比具有一定的竞争力. 展开更多
关键词 视网膜血管 多尺度卷积核 U-Net模型 Inception模块 CLAHE算法
在线阅读 下载PDF
基于改进YOLOv5s的跌倒行为检测 被引量:4
13
作者 朱正林 钱予阳 +2 位作者 马辰宇 王悦炜 史腾 《计算机测量与控制》 2024年第10期26-31,38,共7页
为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使... 为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使得网络可以自动地利用对分类有效的感受野捕捉到的信息,这种新的深层结构允许CNN在卷积核心上执行动态选择机制,从而自适应地调整其感受野的大小;同时结合ASFF自适应空间融合,并在其中充分利用不同特征,又在算法中引入权重参数,以多层次功能为基础,实现了水下目标识别精度提升的目标;加入空间金字塔池化结构SPPFCSPC,大幅缩短了推理时间;实验结果表明,相比于原始YOLOv5s,新网络在mAP平均精度均值方面提升了2.1%,查全率提升了16%;改进后的网络在感知细节和空间建模方面更加强大,能够更准确地捕捉到人员跌倒的异常行为,检测效果有了显著提升。 展开更多
关键词 SKAttention注意力模块 卷积核 ASFF 权重参数 空间金字塔池化
在线阅读 下载PDF
X线照射野笔形束模型建立方法的研究
14
作者 金浩宇 吕庆文 +1 位作者 周凌宏 王志远 《医疗卫生装备》 CAS 2004年第1期5-7,共3页
通常,用于高能X线照射野剂量计算的笔形束核是用MonteCarlo方法得到的。在本文中,我们通过使用反卷积方法建立了笔形束模型,并且用这个模型重建其它尺寸射野的射束分布,与实际测量的相同尺寸射野的射束分布进行比较,取得了较好的一致性... 通常,用于高能X线照射野剂量计算的笔形束核是用MonteCarlo方法得到的。在本文中,我们通过使用反卷积方法建立了笔形束模型,并且用这个模型重建其它尺寸射野的射束分布,与实际测量的相同尺寸射野的射束分布进行比较,取得了较好的一致性,从而为进一步的实际应用奠定了理论基础。 展开更多
关键词 X线照射 笔形束模型 反卷积方法 射束分布 剂量计算模型
暂未订购
基于空洞卷积与动态多核融合池化的裂缝检测 被引量:5
15
作者 杨秋媛 李宁 +2 位作者 石林 庄丽华 徐守坤 《计算机工程与设计》 北大核心 2022年第12期3529-3537,共9页
针对现有裂缝检测方法在裂缝拓扑结构复杂、前后景像素不协调情况下产生的检测精度低的问题,提出一种基于空洞卷积和动态多核融合池化的裂缝检测方法。采用编、解码结构,编码器阶段插入空洞卷积,能够更大限度保留裂缝的细节与结构信息;... 针对现有裂缝检测方法在裂缝拓扑结构复杂、前后景像素不协调情况下产生的检测精度低的问题,提出一种基于空洞卷积和动态多核融合池化的裂缝检测方法。采用编、解码结构,编码器阶段插入空洞卷积,能够更大限度保留裂缝的细节与结构信息;解码器阶段引入动态多核融合池化模块,以更高效获得不同尺寸的裂缝信息。在自制数据集与公共数据集CRACK500上分别进行实验,并与其它算法进行比较,实验结果表明,该算法能更加精细化分割出细小的裂缝,有效提高裂缝检测精度。 展开更多
关键词 图像分割 裂缝检测 编解码网络结构 空洞卷积 动态多核融合池化模块
在线阅读 下载PDF
面向遥感图像检索的级联池化自注意力研究 被引量:6
16
作者 吴刚 葛芸 +1 位作者 储珺 叶发茂 《光电工程》 CAS CSCD 北大核心 2022年第12期53-65,共13页
高分辨率遥感图像检索中,由于图像内容复杂,细节信息丰富,以致通过卷积神经网络提取的特征难以有效表达图像的显著信息。针对该问题,提出一种基于级联池化的自注意力模块,用来提高卷积神经网络的特征表达。首先,设计了级联池化自注意力... 高分辨率遥感图像检索中,由于图像内容复杂,细节信息丰富,以致通过卷积神经网络提取的特征难以有效表达图像的显著信息。针对该问题,提出一种基于级联池化的自注意力模块,用来提高卷积神经网络的特征表达。首先,设计了级联池化自注意力模块,自注意力在建立语义依赖关系的基础上,可以学习图像关键的显著特征,级联池化是在小区域最大池化的基础上再进行均值池化,将其用于自注意力模块,能够在关注图像显著信息的同时保留图像重要的细节信息,进而增强特征的判别能力。然后,将级联池化自注意力模块嵌入到卷积神经网络中,进行特征的优化和提取。最后,为了进一步提高检索效率,采用监督核哈希对提取的特征进行降维,并将得到的低维哈希码用于遥感图像检索。在UC Merced、AID和NWPU-RESISC45数据集上的实验结果表明,本文方法能够有效提高检索性能。 展开更多
关键词 遥感图像检索 级联池化 自注意力模块 监督核哈希 卷积神经网络
在线阅读 下载PDF
基于改进YOLOX算法的X射线图像违禁品检测方法 被引量:5
17
作者 袁金豪 张南峰 +1 位作者 阮洁珊 高向东 《激光技术》 CAS CSCD 北大核心 2023年第4期547-552,共6页
为了实现自动检测X射线图像中的违禁品,解决相互遮挡、目标相近和小目标违禁品检测难的问题,提出一种基于改进的你只观察一次(YOLOX)算法的X射线图像违禁品检测方法。首先在YOLOX的主干网络低层中引入使用大核注意力构建的空间注意力,... 为了实现自动检测X射线图像中的违禁品,解决相互遮挡、目标相近和小目标违禁品检测难的问题,提出一种基于改进的你只观察一次(YOLOX)算法的X射线图像违禁品检测方法。首先在YOLOX的主干网络低层中引入使用大核注意力构建的空间注意力,提取低层特征图的远距离依赖信息和纹理信息,之后在主干网络的中层和高层增加卷积块的注意力模块以增强感兴趣区域信息并抑制无用信息;该方法在公开的安全检查X射线数据集上进行实验,同时为改善模型的鲁棒性,在训练前70个周期使用Mosaic数据增强方法。结果表明,改进的模型较基本模型增加少量的参数和计算量,均值平均精度增加2.45%,提升到87.88%,平均推理速率为58.5 frame/s。该研究为即时自动检测X射线图像中违禁品提供了有益的参考。 展开更多
关键词 X射线光学 违禁品检测 YOLOX算法 大核注意力 空间注意力 卷积块的注意力模块
在线阅读 下载PDF
基于深度残差网络的人体行为识别算法研究 被引量:2
18
作者 冯宇 席志红 《计算机测量与控制》 2022年第3期251-258,共8页
针对原始C3D卷积神经网络的层数较少、参数量较大和难以关注关键帧而导致的人体行为识别准确率较低的问题,提出一种基于改进型C3D的注意力残差网络模型;首先,增加原始网络卷积层并采用卷积核合并与拆分操作实现(3×1×7)和(3... 针对原始C3D卷积神经网络的层数较少、参数量较大和难以关注关键帧而导致的人体行为识别准确率较低的问题,提出一种基于改进型C3D的注意力残差网络模型;首先,增加原始网络卷积层并采用卷积核合并与拆分操作实现(3×1×7)和(3×7×1)的非对称式卷积核,之后采用全预激活式残差网络结构来增加构建的非对称卷积层,并且在残差块中增加时空通道注意力模块;最后,为展示该算法的先进性和应用性,则将该算法与原始C3D网络以及其他流行算法分别在基准数据集HMDB51和自建的43类别体育运动数据集上相比较;实验结果表明,该算法与原始C3D网络相比,在HMDB51和43类体育运动数据集上分别提高了9.88%和21.61%,参数量比原来降低了38.68%,并且结果也优于其他流行算法。 展开更多
关键词 深度学习 三维卷积 非对称式卷积核 残差网络 注意力模块 人体行为识别
在线阅读 下载PDF
基于注意力机制轻量化模型的植物病害识别方法 被引量:1
19
作者 苏航 陈旭昊 +3 位作者 寿德荣 张朝阳 许彪 孙丙宇 《江苏农业学报》 CSCD 北大核心 2024年第8期1389-1399,共11页
针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可... 针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可分离卷积进行特征提取。为了防止网络传播过程中的梯度消失并增强病害像素特征融合,在特征提取层中引入了大卷积核倒置残差结构(IRBCKS)模块。此外,在特征增强层集成了轻量级卷积块注意力模块(CBAM)注意力机制,以捕捉植物病害相关图像中像素之间的关系,增强关键信息的提取。最后,采用剪枝技术剔除模型中冗余特征信息,从而再次减少模型参数量,形成最终的轻量级网络模型Cut-MobileNet。为验证该模型的先进性,将其与轻量化模型(MobileNet V2、SqueezeNet、GoogLeNet)和非轻量化模型(Vision Transformer、AlexNet)进行性能对比,研究结果表明,Cut-MobileNet在浮点运算量、准确率、单张图片推理时间、参数量、F1值和模型大小等性能指标上都取得了较优的效果。 展开更多
关键词 模型剪枝 卷积块注意力模块(CBAM)注意力机制 大卷积核倒置残差结构(IRBCKS)模块 植物病害 轻量化网络
在线阅读 下载PDF
A Multi-Category Brain Tumor Classification Method Bases on Improved ResNet50 被引量:1
20
作者 Linguo Li Shujing Li Jian Su 《Computers, Materials & Continua》 SCIE EI 2021年第11期2355-2366,共12页
Brain tumor is one of the most common tumors with high mortality.Early detection is of great significance for the treatment and rehabilitation of patients.The single channel convolution layer and pool layer of traditi... Brain tumor is one of the most common tumors with high mortality.Early detection is of great significance for the treatment and rehabilitation of patients.The single channel convolution layer and pool layer of traditional convolutional neural network(CNN)structure can only accept limited local context information.And most of the current methods only focus on the classification of benign and malignant brain tumors,multi classification of brain tumors is not common.In response to these shortcomings,considering that convolution kernels of different sizes can extract more comprehensive features,we put forward the multi-size convolutional kernel module.And considering that the combination of average-pooling with max-pooling can realize the complementary of the high-dimensional information extracted by the two structures,we proposed the dual-channel pooling layer.Combining the two structures with ResNet50,we proposed an improved ResNet50 CNN for the applications in multi-category brain tumor classification.We used data enhancement before training to avoid model over fitting and used five-fold cross-validation in experiments.Finally,the experimental results show that the network proposed in this paper can effectively classify healthy brain,meningioma,diffuse astrocytoma,anaplastic oligodendroglioma and glioblastoma. 展开更多
关键词 Brain tumor convolutional neural network multi-size convolutional kernel module dual-channel pooling layer ResNet50
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部