期刊文献+
共找到270篇文章
< 1 2 14 >
每页显示 20 50 100
基于改进ConvNeXt Block的新型双域融合图像隐写
1
作者 段新涛 徐凯欧 +4 位作者 白鹿伟 张萌 保梦茹 武银行 秦川 《郑州大学学报(理学版)》 北大核心 2026年第1期1-9,共9页
针对图像隐写中不可感知性差、安全性不足和隐写容量低的问题,提出一种基于改进ConvNeXt Block的新型双域融合图像隐写方案。首先,改进后的深度可分离卷积模块可以学习到更为细节的图像特征信息。其次,设计一种新型的空间域和频域信息... 针对图像隐写中不可感知性差、安全性不足和隐写容量低的问题,提出一种基于改进ConvNeXt Block的新型双域融合图像隐写方案。首先,改进后的深度可分离卷积模块可以学习到更为细节的图像特征信息。其次,设计一种新型的空间域和频域信息融合方式来提高图像的不可感知性和安全性。最后,采用多个损失函数对网络进行级联约束。实验结果表明,相比其他隐写方案,所提方案在峰值信噪比上平均提高3~4 dB,结构相似性和学习感知图像块相似度的平均值分别为0.99和0.001;抗隐写分析能力更接近50%,具有更高的安全性,且大容量隐藏时仍具有较好效果。 展开更多
关键词 图像隐写 深度可分离卷积 空间域 频域 安全性 大容量
在线阅读 下载PDF
基于注意力机制和轻量级自适应CNN模型的滚动轴承故障诊断
2
作者 汤家辉 孙宁 王松雷 《兵工自动化》 北大核心 2026年第2期32-36,共5页
为解决滚动轴承故障在实际复杂环境中的诊断需要精准性、鲁棒性和泛化性等全面的性能,提出一种融合注意力机制的轻量级自适应CNN网络(1D-LECA-Inception)。通过1维的深度可分离卷积重构Inception模块并拓宽卷积核的尺度,由有效通道注意... 为解决滚动轴承故障在实际复杂环境中的诊断需要精准性、鲁棒性和泛化性等全面的性能,提出一种融合注意力机制的轻量级自适应CNN网络(1D-LECA-Inception)。通过1维的深度可分离卷积重构Inception模块并拓宽卷积核的尺度,由有效通道注意力(efficient channel attention,ECA)模块筛选出不重要的信息,融入了残差结构、批量归一化层(batch normalization,BN)以及自适应激活函数AdaptH_Swish来提升整体网络模型的稳定性和泛化能力,并通过帕德博恩和凯斯西储轴承数据集与其他分类模型进行对比试验。结果表明:不论是同负荷、变负荷还是噪声干扰条件下,该方法在与其他分类模型的对比中综合表现更优。 展开更多
关键词 故障诊断 轻量化 深度可分离卷积 自适应激活函数
在线阅读 下载PDF
基于深度可分离卷积与注意力的SSD目标检测模型
3
作者 卜子渝 杨哲 刘纯平 《计算机应用与软件》 北大核心 2026年第1期149-157,共9页
SSD是基于深度学习的单阶段目标检测模型,但其特征金字塔中的特征图缺乏多尺度信息融合,导致对中小型目标识别效果不佳。针对该问题,提出一种基于注意力机制与深度可分离卷积的SSD目标检测模型(Attention&DSC Single Shot MultiBox ... SSD是基于深度学习的单阶段目标检测模型,但其特征金字塔中的特征图缺乏多尺度信息融合,导致对中小型目标识别效果不佳。针对该问题,提出一种基于注意力机制与深度可分离卷积的SSD目标检测模型(Attention&DSC Single Shot MultiBox Detector,AD-SSD)。AD-SSD首先归一化融合特征金字塔中的特征图,再引入注意力机制加强对目标信息的表征,并采用深度可分离卷积降低参数量。该方法提高了SSD的检测精度的同时,还加快了检测速度。在PASCAL VOC07+12数据集中,AD-SSD获得了81.7%的平均精度(mAP),小型目标精度提高6.3百分点,中型目标精度提高6.4百分点,检测速度达到55.1 FPS。 展开更多
关键词 目标检测 注意力机制 深度可分离卷积 特征金字塔
在线阅读 下载PDF
基于多粒度特征融合模型的多说话人声纹识别研究
4
作者 李娅 周斌 胡波 《中南民族大学学报(自然科学版)》 2026年第1期77-85,共9页
声纹识别是一种通过比对语音中的说话人特征来确认身份的技术.其流程包括从不定长的单人语音片段中提取声学特征,再由模型提取说话人特征,最后通过余弦相似度判断是否为同一说话人.多说话人声纹识别则需从包含多位说话人的音频中识别各... 声纹识别是一种通过比对语音中的说话人特征来确认身份的技术.其流程包括从不定长的单人语音片段中提取声学特征,再由模型提取说话人特征,最后通过余弦相似度判断是否为同一说话人.多说话人声纹识别则需从包含多位说话人的音频中识别各自身份,该任务的关键在于提取具判别力的说话人特征.为此提出了多粒度特征融合模型(MGFF-TDNN),在MGFF-TDNN中,首先使用二维深度可分离卷积模块(DSM)作为前端特征提取器,以增强时频域特征的建模.其次,为了实现多粒度特征融合,设计了多粒度融合结构(M-TDNN),采用时延神经网络和音素级特征池化来捕获不同粒度的信息.在VoxCeleb数据集上的实验表明:MGFF-TDNN模型在使用了更少的参数量(4.78M)和计算资源(1.49G的浮点计算量)的情况下,仍表现出良好的性能. 展开更多
关键词 声纹识别 多说话人 多粒度特征融合 深度可分离卷积
在线阅读 下载PDF
基于改进YOLOv11的SAR图像小目标船舶检测
5
作者 艾君鹏 蒋海军 +2 位作者 罗亮 郝连东 王仕杰 《计算机工程与应用》 北大核心 2026年第1期162-171,共10页
复杂的海况背景、目标多尺度特性及传感器噪声等因素,给基于合成孔径雷达(SAR)图像的船舶检测带来了巨大挑战。因此,提出了一种基于改进YOLOv11的SAR图像小目标船舶检测模型。使用深度可分离卷积构建新骨干网络,减少计算量和参数量;采... 复杂的海况背景、目标多尺度特性及传感器噪声等因素,给基于合成孔径雷达(SAR)图像的船舶检测带来了巨大挑战。因此,提出了一种基于改进YOLOv11的SAR图像小目标船舶检测模型。使用深度可分离卷积构建新骨干网络,减少计算量和参数量;采用SE注意力机制替换C2PSA注意力,增强特征提取能力;设计残差空间通道重建卷积模块替换C3K2,提升特征表示能力;使用NWD损失函数代替CIoU损失函数,使模型推理更关注于小目标。实验结果表明,改进的模型在HRSID数据集上的mAP@0.5和召回率较YOLOv11分别提升1.5个百分点和1.4个百分点,参数量为1.39×10~7,推理时间为0.51 s。与主流模型相比,改进模型在检测精度和速度上均表现出优越性。此外,模型在SSDD和RSDD数据集上的泛化性测试也取得了较好的结果。综上,改进的模型在SAR图像小目标船舶检测任务中具有较高的应用潜力和推广价值。 展开更多
关键词 YOLOv11 合成孔径雷达(SAR)图像 船舶检测 深度可分离卷积 残差空间通道重建卷积 归一化曼哈顿距离(NWD)损失函数
在线阅读 下载PDF
基于轻量化YOLOv11的道路目标检测
6
作者 张熙函 刘军 齐向晶 《沈阳理工大学学报》 2026年第2期61-66,共6页
在复杂道路环境下,自动驾驶系统在目标检测过程中仍然面临误检与漏检的挑战,难以兼顾精度和实时性。本文提出一种基于YOLOv11的轻量化改进道路目标检测方法。首先应用深度可分离卷积(SPD-Conv)替换部分传统卷积,以增强特征之间的关联性... 在复杂道路环境下,自动驾驶系统在目标检测过程中仍然面临误检与漏检的挑战,难以兼顾精度和实时性。本文提出一种基于YOLOv11的轻量化改进道路目标检测方法。首先应用深度可分离卷积(SPD-Conv)替换部分传统卷积,以增强特征之间的关联性,提高卷积操作的表达能力。其次对C2PSA结构中的PSABlock模块进行优化,引入结合空间与通道的注意力机制SCSA,实现更全面的特征融合,有效捕捉多语义信息,降低关键信息遗漏的风险。最后将传统上采样模块替换为动态上采样(DySample)模块,既保持检测精度,又提高整体推理速度,实现模型的轻量化。实验结果表明,该方法在KITTI数据集上相比于原模型参数量降低18.9%,平均精度均值提升1.04%,推理速度提升16.9%,有效提升了检测性能与推理效率。 展开更多
关键词 YOLOv11 深度可分离卷积 SCSA DySample 轻量化
在线阅读 下载PDF
基于轻量化编码器与特征增强的人脸毛孔分割方法
7
作者 杨周 王健超 《现代信息科技》 2026年第3期107-111,共5页
为解决人脸毛孔分割中存在的结构模糊性(与色斑相似)、皮脂高光干扰及多尺度特征挑战,文章提出融合轻量化编码器与特征增强的方法。该方法采用深度可分离卷积构建轻量化主干网络,降低了复杂度;通过嵌入SE通道注意力模块,强化了毛孔特征... 为解决人脸毛孔分割中存在的结构模糊性(与色斑相似)、皮脂高光干扰及多尺度特征挑战,文章提出融合轻量化编码器与特征增强的方法。该方法采用深度可分离卷积构建轻量化主干网络,降低了复杂度;通过嵌入SE通道注意力模块,强化了毛孔特征响应并抑制干扰;引入深度信息预测辅助任务,利用毛孔凹陷几何特性提升判别力。在自建高分辨率人脸毛孔数据集上的实验表明,该方法IoU达0.872、Dice系数0.921、精度0.896、召回率0.913,显著优于传统CNN与UNet模型,有效减少色斑误检与毛孔漏检,为皮肤分析及美容评估提供高效精准的分割工具。 展开更多
关键词 毛孔分割 深度可分离卷积 SE通道注意力 深度信息预测 Unet
在线阅读 下载PDF
基于轻量化PPINET的花生荚果实时识别方法 被引量:2
8
作者 员玉良 黄劲龙 +2 位作者 李德豪 王方艳 马德新 《农业工程学报》 北大核心 2025年第12期182-190,共9页
传统CNN算法在花生荚果外观识别任务中存在内存密集型和计算密集型问题,以及其在资源受限的边缘终端上部署困难,基于此,该研究提出了一种高效的花生荚果识别模型——PPINET(peanut pod identification network),以适应嵌入式设备的资源... 传统CNN算法在花生荚果外观识别任务中存在内存密集型和计算密集型问题,以及其在资源受限的边缘终端上部署困难,基于此,该研究提出了一种高效的花生荚果识别模型——PPINET(peanut pod identification network),以适应嵌入式设备的资源限制需求。该模型通过结合深度可分离卷积和倒残差结构显著降低参数量和计算量,同时保留特征提取能力,并引入MQA(multi-query attention)模块增强关键特征提取,并利用TuNAS(easy-to-tune and scalable implementation of efficient neural architecture search with weight sharing)策略优化模型结构,使其在资源受限设备上表现优异。此外,采用ResNet(residual neural network)进行知识蒸馏配合三折交叉验证训练提升精度,最终量化为RKNN格式并在瑞芯微RK3588上实现NPU加速部署。PPINET模型尺寸仅为1.85 MB,参数量为0.49 M,浮点运算数为0.30G。PPINET在花生荚果分类中表现优异,准确率达98.65%,在RK3588上推理速度达321 fps。该模型具备较高的识别准确率和快速的识别速度,能够实现花生荚果的实时精准检测。 展开更多
关键词 花生荚果 深度可分离卷积 三折交叉验证 知识蒸馏 嵌入式部署
在线阅读 下载PDF
基于DDE-BIT的无人机高速公路护栏损坏检测 被引量:3
9
作者 王洋 郭杜杜 帅洪波 《现代电子技术》 北大核心 2025年第4期123-129,共7页
针对现有方法对无人机高速公路护栏损坏检测存在边缘信息提取效果差、识别精度低的问题,提出一种基于深度学习的变化检测模型DDE-BIT。首先,采用深度可分离卷积优化主干网络Resnet18,减少模型的参数数量,降低计算成本;然后,在主干网络... 针对现有方法对无人机高速公路护栏损坏检测存在边缘信息提取效果差、识别精度低的问题,提出一种基于深度学习的变化检测模型DDE-BIT。首先,采用深度可分离卷积优化主干网络Resnet18,减少模型的参数数量,降低计算成本;然后,在主干网络输出部分引入ECA注意力模块,在仅增加少量参数的情况下提高模型的跨通道信息捕捉能力;最后,通过跳跃连接方式对BIT双时空图像转换器的输出特征进行堆叠,提高模型的上下文信息理解能力。以采集的无人机高速公路护栏损坏图像为实验数据,实验结果表明:DDE-BIT模型的交并比和F1分数分别为90.99%、95.28%,相较于原始模型分别提高了2.71%、1.51%,能够有效地提取护栏损坏的边缘信息。 展开更多
关键词 护栏损坏检测 无人机 ECA注意力机制 深度可分离卷积 图像处理 信息提取
在线阅读 下载PDF
基于Transformer与深度可分离卷积的轻量级遥感图像语义分割 被引量:1
10
作者 马飞 张森峰 +1 位作者 杨飞霞 徐光宪 《电光与控制》 北大核心 2025年第7期33-38,66,共7页
遥感图像语义分割在环境变化监测、汽车辅助驾驶等领域具有广泛的应用。遥感图像在语义对象层面表现出较大的类内变化和较小的类间差异,导致分割模型精度受限且耗费计算资源。为此提出了一种基于Transformer与深度可分离卷积的轻量级遥... 遥感图像语义分割在环境变化监测、汽车辅助驾驶等领域具有广泛的应用。遥感图像在语义对象层面表现出较大的类内变化和较小的类间差异,导致分割模型精度受限且耗费计算资源。为此提出了一种基于Transformer与深度可分离卷积的轻量级遥感图像语义分割方法。首先,引入权重自适应的多头自注意力,在全局范围内对远距离像素关联性建模,获取丰富的上下文信息;其次,构建堆叠的深度可分离卷积层,以低计算复杂度减少空间细节信息的丢失;此外利用线性注意力机制设计特征聚合模块,对全局情景信息与空间细节信息进行融合。经过在Vaihingen和Potsdam数据集上测试结果表明,所提方法的分割总体准确率分别高达92.6%和92.1%,GFLOPs仅为11.5,不仅有效提升了分割精度,而且大大降低了计算复杂度。 展开更多
关键词 遥感图像 语义分割 深度学习 深度可分离卷积 线性注意力机制
在线阅读 下载PDF
融合改进注意力的自适应双分支密集行人检测 被引量:1
11
作者 李建东 焦晓光 曲海成 《计算机系统应用》 2025年第7期23-36,共14页
为解决复杂背景干扰导致的行人检测精度低和漏检率高的问题,本文提出一种融合改进注意力的自适应双分支密集行人检测算法DACD-YOLO.首先,主干网络采用自适应融合双分支结构,通过动态权重实现不同特征的融合,并引入深度可分离卷积降低计... 为解决复杂背景干扰导致的行人检测精度低和漏检率高的问题,本文提出一种融合改进注意力的自适应双分支密集行人检测算法DACD-YOLO.首先,主干网络采用自适应融合双分支结构,通过动态权重实现不同特征的融合,并引入深度可分离卷积降低计算量,有效缓解传统单分支网络中信息丢失的问题;其次,提出自适应视觉中心,通过动态优化增强层内特征提取,并重设通道数以平衡精度与计算量;然后,提出坐标双通道注意力机制,结合异构卷积核设计轻量化融合模块,降低计算复杂度并增强对关键特征的捕捉能力;最后,采用膨胀卷积检测头,通过不同膨胀率卷积融合多尺度特征,有效增强小目标和遮挡目标的特征提取能力.实验结果表明,与原版YOLOv8n相比,改进算法在WiderPerson数据集上的mAP@0.5和mAP@0.5:0.95分别提高2.3%和2.2%,在CrowdHuman数据集上mAP@0.5和mAP@0.5:0.95分别提升3.5%和4.6%.实验结果表明,改进算法在密集行人检测方面相较于原算法具有显著的精度提升. 展开更多
关键词 行人检测 自适应 双分支 深度可分离卷积 注意力机制 异构卷积核
在线阅读 下载PDF
双分支卷积结合细节增强的图像去雾
12
作者 翟凤文 朱玉彤 金静 《西北工业大学学报》 北大核心 2025年第1期109-118,共10页
针对雾天环境下图像去雾过程中出现的细节丢失、颜色失真、对比度下降的问题,提出了一种双分支卷积结合细节增强的图像去雾网络DBDENet(double branch convolution combined with detail enhanced image de-fogging network),此网络包... 针对雾天环境下图像去雾过程中出现的细节丢失、颜色失真、对比度下降的问题,提出了一种双分支卷积结合细节增强的图像去雾网络DBDENet(double branch convolution combined with detail enhanced image de-fogging network),此网络包含图像去雾模块和细节增强模块两部分。在图像去雾模块中,设计了基于深度可分离卷积和差分卷积的双分支卷积块DBConv(double branch convolution),并将其与U-Net网络相结合,有效减轻了图像去雾过程中的细节丢失问题;将由通道注意力机制和像素注意力机制组合成的ATT(Attenion)块引入到图像去雾模块中,提高了模块的特征提取能力,抑制了与当前任务不相关的特征,进一步减轻了去雾过程中颜色失真和对比度下降问题。在细节增强模块中,将经过图像去雾模块后的图像输入到细节增强模块中进一步恢复图像的细节信息,使图像更趋近于真实域中的图像。图像去雾模块与细节增强模块相结合提升了网络的泛化能力,使其在有雾数据集中具有更好的适应能力。实验在公开数据集ITS、Haze4K与公开真实数据集IHAZE上进行,在定量客观分析比较中,平均峰值信噪比和平均结构相似性的数值分别达到了39.69 dB和0.994,相较于对比网络模型中的最优算法有一定提升。在主观视觉分析中,经过DBDENet网络去雾后的图像在细节、颜色、对比度等方面相较与所提对比算法更接近于真实无雾图像。 展开更多
关键词 差分卷积 深度可分离卷积 图像去雾 注意力机制
在线阅读 下载PDF
基于增强特征融合的轻量级人体姿态估计网络
13
作者 施昕昕 张昊亮 《电子测量技术》 北大核心 2025年第2期189-198,共10页
为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征... 为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征图的信息提取和归纳总结能力;接着设计了结合特征融合模块设计了特征融合分支,以达到保留模型不同阶段的信息不会随长期卷积运算而丢失的效果;最后对模型输出的关键点分类图进行后处理操作,对分类部分使用分类损失增强模块进行进一步增强,使其能够更好地专注于关键点分类任务,以提高模型输出的准确性。在CrowdPose数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为50.7%和48.4%;在S结构下,AP值分别为59.1%和58.3%。在MS COCO val2017数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为41.9%和40.6%;在S结构下,AP值分别为57.0%和56.8%。实验结果表明,本文算法提出的多层级特征融合模块和高分辨率融合分支以及后处理操作对人体姿态估计网络检测性能提升具有正向作用。 展开更多
关键词 人体姿态估计 轻量级网络 多尺度特征融合 深度可分离卷积
原文传递
基于时序卷积网络的轻量级日志异常检测
14
作者 顾兆军 王亚飞 +1 位作者 刘春波 张智凯 《计算机工程与设计》 北大核心 2025年第8期2272-2279,共8页
针对物联网边缘设备计算能力和存储空间有限,现有方法难以直接部署应用。提出一种基于改进时序卷积网络(TCN)的轻量级日志异常检测模型LLAD。日志预处理后提取语义特征并表征单词与日志事件的关系;在异常检测阶段,采用深度可分离卷积操... 针对物联网边缘设备计算能力和存储空间有限,现有方法难以直接部署应用。提出一种基于改进时序卷积网络(TCN)的轻量级日志异常检测模型LLAD。日志预处理后提取语义特征并表征单词与日志事件的关系;在异常检测阶段,采用深度可分离卷积操作实现一维卷积运算,并使用全局平均池化替换全连接层以减少标准TCN的参数数量和计算量。在HDFS和BGL数据集上的实验结果表明,LLAD与基准模型相比,所需内存和FLOP至少减少80%,且检测性能指标F1值有所提升。 展开更多
关键词 边缘设备 日志异常检测 特征提取 语义特征 时序卷积网络 深度可分离卷积 全局平均池化
在线阅读 下载PDF
基于坐标注意力机制的轻量化跨介质高速小目标检测方法 被引量:2
15
作者 董毅 孔筱芳 +3 位作者 罗红娥 弯港 夏言 万敏杰 《兵工学报》 北大核心 2025年第6期178-190,共13页
在高速射弹测试领域,射弹的极高速度使探测技术面临显著挑战,实时检测与定位射弹的能力受限。由于射弹实验布设复杂、成本高昂,引起射弹检测可用数据集的稀缺。针对上述问题,搭建跨介质射弹入水测试系统,使用高速相机捕捉射弹,制作跨介... 在高速射弹测试领域,射弹的极高速度使探测技术面临显著挑战,实时检测与定位射弹的能力受限。由于射弹实验布设复杂、成本高昂,引起射弹检测可用数据集的稀缺。针对上述问题,搭建跨介质射弹入水测试系统,使用高速相机捕捉射弹,制作跨介质射弹数据集并采用数据增强的方法扩充现有数据集。针对射弹入水瞬间检测精度相较于射弹在空气和水中检测精度明显降低的问题,提出一种基于坐标注意力机制的跨介质小目标检测方法。该方法在高精度识别射弹小目标的基础上,替换传统的卷积为深度可分离卷积,在检测精度、速度和模型复杂度之间实现了良好的平衡。实验结果表明,新方法在射弹入水瞬间的检测精度提升了2.68%,召回率提升了7.31%,为跨介质高速小目标检测提供了解决方法。 展开更多
关键词 跨介质高速小目标 目标检测 注意力机制 深度可分离卷积
在线阅读 下载PDF
基于改进YOLO v11的番茄表面缺陷检测方法 被引量:2
16
作者 朱婷婷 滕广 +2 位作者 张亚军 倪超 何惠彬 《农业机械学报》 北大核心 2025年第6期546-553,共8页
传统的番茄缺陷检测主要依赖于人工分拣,存在效率低、漏检率高等问题。为此,提出了一种改进的YOLO v11番茄缺陷检测方法TDD-YOLO(Tomato defect detection YOLO),实现对番茄表面白斑、增生、凹陷、裂口、变质5种缺陷的自动检测。首先,... 传统的番茄缺陷检测主要依赖于人工分拣,存在效率低、漏检率高等问题。为此,提出了一种改进的YOLO v11番茄缺陷检测方法TDD-YOLO(Tomato defect detection YOLO),实现对番茄表面白斑、增生、凹陷、裂口、变质5种缺陷的自动检测。首先,融合小波深度可分离卷积模块构建新的HE-Head层,在保持模型轻量化的同时提升模型对小目标的检测能力(如白斑);其次,使用WC3k2模块替换原有C3k2模块,扩大模型在特征提取阶段的感受野,同时使用动态上采样方法取代原有的上采样,实现对模型推理效率的提升和轻量化;最后,使用自适应阈值焦点损失函数加强对样本的关注度,提高识别精度。设计实验验证所提方法性能,实验结果表明本文所提的TDD-YOLO模型番茄表面缺陷整体识别精度为89.0%、召回率为84.9%、F1分数为86.9%、平均精度均值为88.0%,识别效果明显优于现有的YOLO系列模型以及Faster R-CNN和EfficientDet模型。此外,TDD-YOLO模型检测速度为142.89 f/s,满足实时检测速度要求,为番茄检测规范化和工业化提供重要技术支撑。 展开更多
关键词 番茄 缺陷检测 YOLO v11 小波深度可分离卷积 深度学习
在线阅读 下载PDF
成像制导运动模糊目标检测算法 被引量:1
17
作者 赵春博 莫波 +1 位作者 李大维 赵洁 《兵工学报》 北大核心 2025年第2期265-274,共10页
为提升弹载成像制导中运动模糊图像目标检测的精确性与效率,提出一种轻量化且高效的运动模糊图像目标检测(Lighter and More Effective Motion-blurred Image Object Detection,LEMBD)网络。通过深入分析运动模糊图像的成因,基于成像机... 为提升弹载成像制导中运动模糊图像目标检测的精确性与效率,提出一种轻量化且高效的运动模糊图像目标检测(Lighter and More Effective Motion-blurred Image Object Detection,LEMBD)网络。通过深入分析运动模糊图像的成因,基于成像机理构建了专用的运动模糊图像数据集。在不增加网络参数的前提下,采用共享权重的孪生网络设计,并引入先验知识,将清晰图像的特征学习用于模糊图像的特征提取,以同时实现对清晰与模糊图像的精准检测。此外,设计了部分深度可分离卷积替代普通卷积,显著减少了网络的参数量与计算量,并提升了学习性能。为进一步优化特征融合质量,提出跨层路径聚合特征金字塔网络,有效利用低级特征的细节信息和高级特征的语义信息。实验结果表明,所提LEMBD网络在运动模糊图像目标检测任务中的性能优于传统目标检测方法和主流运动模糊检测算法,能够为精确制导任务提供更精准的目标相对位置信息。 展开更多
关键词 精确目标检测 运动模糊 轻量化 部分深度可分离卷积 跨层路径聚合特征金字塔网络
在线阅读 下载PDF
基于3D融合特征联合神经网络的水声目标识别 被引量:2
18
作者 许玮婷 赵英亮 +2 位作者 冯思奇 韩星程 贾彩琴 《计算机系统应用》 2025年第3期72-84,共13页
面对复杂的海洋环境,利用舰船辐射噪声进行水声目标特征提取与识别具有极大的挑战性.本文首先将船舶音频信号的三维梅尔频率倒谱系数(3D dynamic Mel-frequency cepstrum coefficient,3D-MFCC)特征与三维梅尔谱(3D dynamic Mel-spectrog... 面对复杂的海洋环境,利用舰船辐射噪声进行水声目标特征提取与识别具有极大的挑战性.本文首先将船舶音频信号的三维梅尔频率倒谱系数(3D dynamic Mel-frequency cepstrum coefficient,3D-MFCC)特征与三维梅尔谱(3D dynamic Mel-spectrogram,3D-Mel)特征进行融合作为模型输入,并基于此提出了一种新的水声目标识别深度神经网络模型,该模型在卷积神经网络(convolutional neural network,CNN)和长短期记忆网络(long short-term memory,LSTM)的串行架构基础上,用多尺度深度可分离卷积网络(multi-scale depthwise convolutional network,MSDC),替代了传统的CNN,并增加了多尺度通道注意力机制(multi-scale channel attention,MSCA).实验结果表明,该方法在DeepShip数据集和ShipsEar数据集上的平均识别率分别达到了85.92%和97.32%,展现了良好的分类效果. 展开更多
关键词 舰船辐射噪声 3D特征融合 多尺度深度可分离卷积 多尺度通道注意力机制
在线阅读 下载PDF
卷积增强Vision Mamba模型的构建及其应用 被引量:1
19
作者 俞焕友 范静 黄凡 《计算机技术与发展》 2025年第8期45-52,共8页
针对Vision Mamba(Vim)模型的局限性,该文提出了一种改进的模型——Convolutional Vision Mamba(CvM)。此模型通过摒弃Vim中的图形切割和位置编码机制,转而采用卷积操作进行替代,以实现对全局视觉信息的更高效处理。同时,此模型对Vim模... 针对Vision Mamba(Vim)模型的局限性,该文提出了一种改进的模型——Convolutional Vision Mamba(CvM)。此模型通过摒弃Vim中的图形切割和位置编码机制,转而采用卷积操作进行替代,以实现对全局视觉信息的更高效处理。同时,此模型对Vim模型中的位置嵌入模块进行了优化,以解决其固有的高计算量和内存消耗问题。进而,该文将CvM模型应用于医学图像分类领域,选用了血细胞图像、脑肿瘤图像、胸部CT扫描、病理性近视眼底图像以及肺炎X射线影像等数据集进行实验。实验结果表明,与Vim模型及其他5个神经网络模型相比,CvM模型在准确率上表现更为出色,在内存占用和参数数量方面也展现出明显的优势。消融实验表明,深度可分离卷积比标准卷积使用的参数和显存占用更少,而且在血细胞图像、脑肿瘤图像等医学图像分类上,准确率还有了显著提升。这些结果充分说明了CvM模型的优势和可行性。 展开更多
关键词 深度学习 Vision Mamba 卷积神经网络 深度可分离卷积 医学图像分类
在线阅读 下载PDF
基于轻量融合语义分割的三维断层地震识别方法
20
作者 单慧琳 王兴涛 +3 位作者 徐宜俊 王志浩 黄浩瀚 张银胜 《吉林大学学报(地球科学版)》 北大核心 2025年第3期987-1000,共14页
当前基于深度学习的断层识别方法层出不穷,重点围绕U型网络开展研究,但U型网络使用了大量的常规卷积,在提高提取特征效果的同时忽略了特征冗余和过拟合问题,导致网络复杂度较高。为了在高精度识别的同时减少特征冗余、缓解过拟合问题,... 当前基于深度学习的断层识别方法层出不穷,重点围绕U型网络开展研究,但U型网络使用了大量的常规卷积,在提高提取特征效果的同时忽略了特征冗余和过拟合问题,导致网络复杂度较高。为了在高精度识别的同时减少特征冗余、缓解过拟合问题,本文提出一种轻量型融合语义分割网络(lightweight fusion semantic segmentation network,LF-SeNet)用于三维断层识别。相较于传统的断层识别网络,LF-SeNet将跳跃连接思想和特征融合相结合,其中,轻量型特征融合模块包含三维可分离卷积、SimAM(simple attention module)、Dropout层和有限矩阵乘积操作,有效地保证了特征提取的效果。为了有效降低网络的复杂度,本文将空洞卷积和轻量型特征融合模块相结合,一方面降低了网络的计算量,另一方面减少了常规卷积带来的特征冗余问题。除此之外,本文采用Dropout层和数据增强手段,提高了网络的泛化能力,缓解了过拟合问题。将该方法在FaultSeg3D数据集上进行实验,结果表明,LF-SeNet的参数量为2.56M,浮点运算次数相较于传统的U型网络降低了95.59G,交并比提升了2%。最后,本文使用三维数据合成技术将断层识别图进行可视化操作,实验结果显示LF-SeNet识别出的断层连续且清晰,说明该网络具有较好的泛化能力,证明了LF-SeNet在断层识别问题中的有效性。 展开更多
关键词 语义分割 SimAM 三维深度可分离卷积 断层识别
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部