期刊文献+
共找到208篇文章
< 1 2 11 >
每页显示 20 50 100
基于注意力和Conv2Former的激光雷达三维目标检测算法
1
作者 杨若楠 闫梓涵 +2 位作者 冯嘉强 关丽敏 张玉杰 《现代电子技术》 北大核心 2026年第3期137-144,共8页
针对点云稀疏性导致现有三维目标检测模型在特征提取方面表现不足的问题,文中在PointPillars基础上提出一种融合注意力和Conv2Former的三维目标检测模型。在体柱特征编码网络中,设计了堆叠式多重注意力模块,融合点级、通道级和体柱级注... 针对点云稀疏性导致现有三维目标检测模型在特征提取方面表现不足的问题,文中在PointPillars基础上提出一种融合注意力和Conv2Former的三维目标检测模型。在体柱特征编码网络中,设计了堆叠式多重注意力模块,融合点级、通道级和体柱级注意力有效增强点云局部特征表达能力,从而提升小目标检测精度;在特征融合网络中引入Conv2Former模块,通过卷积调制机制提高模型的全局上下文感知能力,进一步增强特征提取能力。在KITTI三维目标检测数据集上的实验结果表明:所提模型在车辆、行人和骑行者的3D检测精度较原始PointPillars模型分别提高了2.12%、3.56%和2.65%;此外,所提模型的执行速度达到38.46 f/s,完全满足实时处理的需求。上述结果验证了该模型在提升点云三维目标检测精度和实时性能方面的有效性与可行性。 展开更多
关键词 辅助驾驶 激光雷达 目标检测 PointPillars 注意力机制 conv2Former
在线阅读 下载PDF
基于改进VMD及ConvNeXt的小电流接地系统单相接地故障选线方法 被引量:2
2
作者 张浩 张大海 +2 位作者 刘乃毓 吴奎忠 侍哲 《高电压技术》 北大核心 2025年第2期730-741,I0021,共13页
对于小电流接地系统的单相接地故障选线,传统方法普遍采用基于一维信号的选线模型,存在选线准确率低、抗噪性弱等问题。为此提出一种改进的变分模态分解及Conv Ne Xt的小电流接地系统单相接地故障选线方法。首先引入蚁狮算法优化变分模... 对于小电流接地系统的单相接地故障选线,传统方法普遍采用基于一维信号的选线模型,存在选线准确率低、抗噪性弱等问题。为此提出一种改进的变分模态分解及Conv Ne Xt的小电流接地系统单相接地故障选线方法。首先引入蚁狮算法优化变分模态分解算法,通过蚁狮算法自动寻优选取合适的分解次数和惩罚因子,计算分解得到的各分量的分布熵,将其中的噪声分量筛选去除,将其余有效分量进行线性重构得到降噪后的零序电流信号;其次,将经过降噪处理后的一维零序电流信号经格拉姆角场转换为二维图像,制备故障选线数据集;然后,引入预训练的ConvNeXt模型,根据该研究数据模型特征,在其已有权重基础上对模型参数进行对应微调,从而提高模型精度并形成最终的选线模型;最后引入绝对平均误差、均方根误差作为评价指标验证所提降噪算法有效性。分别在加入噪声与否的前提下,将所提模型与3种选线模型相比较。实验结果表明该模型的准确率最高、抗噪性方面更好,其中该研究算法准确率达到了99.82%并且在不同噪声条件下都能维持91%以上的准确率,高于其他选线模型,克服了传统故障选线方法准确率低、抗噪性差的问题。 展开更多
关键词 故障选线 蚁狮优化算法 变分模态分解 分布熵 格拉姆角场 conv Ne Xt
原文传递
基于改进YOLOv8的化工厂安全装置检测算法
3
作者 曹鑫泉 李海涛 张俊虎 《计算机测量与控制》 2026年第2期57-64,共8页
针对工厂工业安全检测场景安全装置目标检测存在的漏检与误检问题,提出了SAG-YOLOv8改进架构;通过移位卷积替换原C2f模块中的常规卷积构建C2f-SWC新模块以增强多尺度特征表达能力;采用AIFI模块替代传统空间池化金字塔结构来强化图像语... 针对工厂工业安全检测场景安全装置目标检测存在的漏检与误检问题,提出了SAG-YOLOv8改进架构;通过移位卷积替换原C2f模块中的常规卷积构建C2f-SWC新模块以增强多尺度特征表达能力;采用AIFI模块替代传统空间池化金字塔结构来强化图像语义理解能力;引入GFPN网络架构通过增强跨层多尺度交互与同层横向连接促进小目标特征传播;实验数据显示SAG-YOLOv8算法mAP@0.5指标较原始YOLOv8提升了3.4%,精确度和召回率也有一定提升;该方法显著提高了化工厂安全装置中目标检测的精准度和稳定性,为其安全运行提供了有力的技术保障。 展开更多
关键词 工业安全检测 YOLOv8 shift-wise conv AIFI GFPN
在线阅读 下载PDF
基于Swin-Conv-Unet的核磁共振成像
4
作者 郭丙彬 韩增文 +1 位作者 张延军 杨海庆 《河北师范大学学报(自然科学版)》 2025年第4期339-347,共9页
研究计算成像与核磁共振成像的结合,旨在解决核磁共振成像中的逆成像问题.提出了一种改进的Swin-Conv-UNet算法,该方法融合了卷积神经网络和采用结构状态空间建模的Swin-Mamba结构的优势.该模型利用UNet的编码器-解码器结构,并结合Swin-... 研究计算成像与核磁共振成像的结合,旨在解决核磁共振成像中的逆成像问题.提出了一种改进的Swin-Conv-UNet算法,该方法融合了卷积神经网络和采用结构状态空间建模的Swin-Mamba结构的优势.该模型利用UNet的编码器-解码器结构,并结合Swin-Mamba模块的多尺度特征提取与长程依赖建模能力,在图像重建中取得了显著提升.实验基于fastMRI数据集开展,结果显示该模型在图像重建质量和噪声抑制方面表现优异.具体而言,Swin-Conv-UNet在信噪比和结构相似性方面分别达到了23.5152dB和0.8863,均优于ADMM、PnPADMM及MambaRecon等对比方法,同时保持了较优的重建时间.研究表明,Swin-Conv-UNet不仅提升了图像的清晰度和结构保真度,也为医学图像处理提供了一种高效可靠的新途径.未来工作将进一步优化该模型结构,并探索其在其他医学成像领域的拓展应用. 展开更多
关键词 计算成像 核磁共振成像 Swin-conv-UNet 图像重建
在线阅读 下载PDF
结合Conv2Former和CycleGAN的雪景风格迁移
5
作者 吴蓥 姚娅川 庞尚珍 《四川轻化工大学学报(自然科学版)》 2025年第6期29-38,共10页
针对无人机视觉着陆过程中定位跑道时出现的跑道数据集样本单一、数量不足等问题,提出了一种面向样本扩充、基于循环一致性生成对抗网络(CycleGAN)的图像风格迁移方法U-Net-Conv2Former-SENet CycleGAN(UCS-CycleGAN)。针对雪景风格迁... 针对无人机视觉着陆过程中定位跑道时出现的跑道数据集样本单一、数量不足等问题,提出了一种面向样本扩充、基于循环一致性生成对抗网络(CycleGAN)的图像风格迁移方法U-Net-Conv2Former-SENet CycleGAN(UCS-CycleGAN)。针对雪景风格迁移效果不佳,所生成图像易产生变形以及模糊、结构失真等问题,在生成器中使用U-Net代替原来的残差网络(ResNet),并加入Convolutional Transformer(Conv2Former)模块;对于风格迁移后的图像色彩失真的问题,在判别器中融入SENet(Squeeze-and-Excitation Networks)注意力机制。采用结构相似度(Structural Similarity Index,SSIM)和核方法感知哈希距离(Kernel Inception Distance,KID)作为客观评价指标。相较于原模型,UCS-CycleGAN算法的SSIM提高了55.08%,KID降低了29.45%,人眼视觉感知效果与其他无监督风格迁移算法相比优势显著。 展开更多
关键词 CycleGAN conv2Former SENet U-Net 图像风格迁移 雪景
在线阅读 下载PDF
基于数据融合-Conv-LSTM的铁路客运目标预测方法研究
6
作者 王凌燕 李燕 +2 位作者 谭思伦 卫铮铮 张旭 《铁道运输与经济》 北大核心 2025年第11期198-206,共9页
客运目标一般包括旅客发送量和客运收入2个指标,为提升对铁路客运目标每日预测的精度,提出一种基于数据融合-Conv-LSTM预测方法。分析客运目标的时间周期性,关联旅客发送量、客运收入和票额能力等业务特征以及融合各车站层的特征,从时... 客运目标一般包括旅客发送量和客运收入2个指标,为提升对铁路客运目标每日预测的精度,提出一种基于数据融合-Conv-LSTM预测方法。分析客运目标的时间周期性,关联旅客发送量、客运收入和票额能力等业务特征以及融合各车站层的特征,从时间和空间2个方面构建数据集,随后引入Conv-LSTM组合模型以充分挖掘时空信息,训练模型并输出预测结果。实例应用表明,数据融合-Conv-LSTM预测误差远低于ARMAR、SVR、BP、XGBOOST、LSTM等预测方法,同时,融合了空间特性数据的模型对于旅客发送量与客运收入的预测性能均优于仅使用一维数据的模型。此外,将每日预测结果汇总至月度指标时,模型仍能保持良好的预测效果,满足实际应用需求。研究提出的方法为铁路局集团公司的客运计划制定提供了科学合理的数据参考。 展开更多
关键词 铁路客运 conv-LSTM 数据融合 旅客发送量 客运收入 时间序列预测
在线阅读 下载PDF
基于残差连接和Conv-LSTM的锂离子电池SOH估算
7
作者 周奔滔 陶吉利 王清松 《电源学报》 北大核心 2025年第5期270-277,共8页
锂离子电池常被用作储能元件以实现电能的存储和使用,精确地估算其健康状态SOH(state-of-health)可以为电池的实际使用提供理论依据。然而,SOH无法被直接测量。为了准确且便捷地估算锂离子电池SOH,从数据驱动法的角度提出1种基于残差连... 锂离子电池常被用作储能元件以实现电能的存储和使用,精确地估算其健康状态SOH(state-of-health)可以为电池的实际使用提供理论依据。然而,SOH无法被直接测量。为了准确且便捷地估算锂离子电池SOH,从数据驱动法的角度提出1种基于残差连接和卷积长短时记忆Conv-LSTM(convolutional long short-term memory)网络的锂离子电池SOH估算模型。该方法基于残差连接、Conv-LSTM和卷积神经网络,利用锂离子电池充电过程中的电压、电流和容量,实现锂离子电池使用周期内的SOH估算。在多个电池测试数据集上的实验结果表明,与多种估算效果较好的现有模型相比,基于残差连接和Conv-LSTM的SOH估算模型具有更精准的估算结果,测试集SOH估算的最大相对误差MAX PE(maximum percentage error)和平均绝对百分比误差MAPE(mean absolute percentage error)分别小于3.3%和1.7%。 展开更多
关键词 锂离子电池 健康状态估算 残差连接 卷积长短时记忆网络
在线阅读 下载PDF
基于改进YOLOv8s的航拍图像小目标检测算法
8
作者 毛昕蓉 徐霄 《微电子学与计算机》 2026年第3期75-87,共13页
针对无人机图像中小目标检测存在的目标尺度变化大、漏检、误检和目标遮挡等问题,提出了一种改进的SDP-YOLOv8s算法。该算法首先在检测头部分引入小目标检测头并移除大目标检测头,在提升小目标检精度的同时减少算法冗余计算量。其次,在... 针对无人机图像中小目标检测存在的目标尺度变化大、漏检、误检和目标遮挡等问题,提出了一种改进的SDP-YOLOv8s算法。该算法首先在检测头部分引入小目标检测头并移除大目标检测头,在提升小目标检精度的同时减少算法冗余计算量。其次,在特征融合层中引入并行位置感知注意力模块PPA,通过捕捉多尺度特征信息提高特征融合能力。设计动态上采样模块X-DySample,进一步优化算法处理不同尺度特征的能力,提升算法的抗干扰能力;并在主干网络中引入SPD-Conv模块,改善卷积过程中特征丢失问题。在公开数据集VisDrone2019上的实验结果表明:相较于YOLOv8s算法,SDP-YOLOv8算法在mAP@0.5和mAP@0.5:0.95上的检测精度分别提升了8.2%和5.8%,算法参数量降低了22.5%。同时,在Tiny-Person数据集上验证了所提出算法的泛化性和有效性。 展开更多
关键词 小目标检测 YOLOv8 航拍图像 动态上采样 SPD-conv
在线阅读 下载PDF
基于改进YOLOv5的砖石建筑裂缝检测方法
9
作者 翁文杏 余兆钗 +2 位作者 李佐勇 李炜 吴景岚 《计算机应用与软件》 北大核心 2026年第2期189-196,222,共9页
砖石建筑极易出现裂缝,严重威胁建筑寿命和人民生命财产安全,因此,裂缝检测是建筑维护的重要基础。为了提升砖石建筑裂缝的检测精度,应用YOLOv5s的改进方法。将SPD-Conv引入到骨干网络中,提高细粒度特征的检测能力;使用BiFPN并结合Coord... 砖石建筑极易出现裂缝,严重威胁建筑寿命和人民生命财产安全,因此,裂缝检测是建筑维护的重要基础。为了提升砖石建筑裂缝的检测精度,应用YOLOv5s的改进方法。将SPD-Conv引入到骨干网络中,提高细粒度特征的检测能力;使用BiFPN并结合Coordinate Attention模块来代替YOLOv5的特征融合网络,提升检测精度;使用SIoU Loss来代替原有损失函数,改善在复杂环境下检测不佳的情况。在砖石建筑裂缝数据集上的实验结果表明,所提方法的平均均值精度(mAP@0.5)达到96.0%,比原YOLOv5s提高了4.0百分点,比2023年提出的YOLOv8s提高了2.0百分点,可以有效地检测砖石建筑裂缝。 展开更多
关键词 砖石建筑 裂缝检测 YOLOv5 SPD-conv BiFPN Coordinate Attention SIoU Loss
在线阅读 下载PDF
基于时空序列的Conv-LSTM航班延误预测模型 被引量:9
10
作者 屈景怡 杨柳 +1 位作者 陈旭阳 王茜 《计算机应用》 CSCD 北大核心 2022年第10期3275-3282,共8页
精准的航班延误预测结果可以为大面积航班延误的预防提供巨大的参考价值。航班延误预测是在特定空间下做时间序列预测,然而目前已有预测方法多为两种或多种算法的结合,存在算法间的融合问题。针对上述问题,提出了一种综合考虑时空序列... 精准的航班延误预测结果可以为大面积航班延误的预防提供巨大的参考价值。航班延误预测是在特定空间下做时间序列预测,然而目前已有预测方法多为两种或多种算法的结合,存在算法间的融合问题。针对上述问题,提出了一种综合考虑时空序列的卷积长短时记忆(Conv-LSTM)网络航班延误预测模型。所提模型在长短时记忆(LSTM)网络提取时间特征的基础上,将网络的输入和权重矩阵进行卷积来提取空间特征,从而充分利用数据集包含的时间和空间信息。实验结果表明,与LSTM、仅考虑空间信息的卷积神经网络(CNN)模型相比,Conv-LSTM模型的准确率分别提高了0.65个百分点和2.36个百分点。由此可见,同时考虑时空特性可以在航班延误问题中获得更精确的预测结果。此外,基于所提模型设计并实现了基于浏览器/服务器(B/S)架构的航班延误分析系统,并且该系统也可以应用于空中交通管理局流量控制中心。 展开更多
关键词 航班延误预测 时空序列 深度学习 卷积长短时记忆网络 气象信息 航班信息
在线阅读 下载PDF
基于Conv-BiLSTM模型的虚拟社区用户生成内容创新价值识别问题研究:交互协同的视角 被引量:1
11
作者 王松 徐雅静 刘新民 《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第4期77-88,共12页
【目的】缓解虚拟社区开放式创新用户生成内容信息过载、处理效率低等问题,优化用户生成内容质量,有效识别并分析用户创新内容,提高虚拟社区协同创新绩效。【方法】基于交互协同视角提出一种用户生成内容创新价值识别方法:一是在创新要... 【目的】缓解虚拟社区开放式创新用户生成内容信息过载、处理效率低等问题,优化用户生成内容质量,有效识别并分析用户创新内容,提高虚拟社区协同创新绩效。【方法】基于交互协同视角提出一种用户生成内容创新价值识别方法:一是在创新要素特征方面,在用户属性和内容属性的基础上,引入创新要素异质性属性;二是在创新过程特征方面,关注交互内容的时序性和协同性。建立融合要素特征和过程特征的卷积-双向长短时记忆网络(Conv-BiLSTM)模型进行用户生成内容的价值识别。【结果】选取典型虚拟社区数据进行实证研究,结果表明:融合要素特征和过程特征模型的准确率为88.65%,过程特征的引入使模型准确率提升14.22个百分点,协同要素异质性属性的引入使模型准确率提升6.48个百分点,较其他基准模型与组合模型均有不同程度提升。【局限】仅针对虚拟社区创新内容识别取得较好的结果,需要提高模型的泛化能力,进而应用于其他类型协同创新识别方面。【结论】将创新交互的过程特征和协同创新要素异质性属性引入虚拟社区用户生成内容识别模型中,有效提升了识别的准确率,可以为社区开放式创新管理提供技术参考。 展开更多
关键词 用户生成内容 交互协同视角 conv-BiLSTM 创新价值识别
原文传递
基于潮涌卷积神经网络的说话人确认
12
作者 陈晨 仪志鑫 +1 位作者 李东源 陈德运 《电子与信息学报》 北大核心 2026年第2期806-817,共12页
近年来,最先进的说话人确认模型大多数以牺牲参数量和计算量的代价来实现感受野的固定获取,然而鉴于语音信号内部蕴含着丰富且多层次的信息,通过高度自主选择的动态感受野来描绘复杂信息是相对未被探索的,更没有直观地解释是什么构成了... 近年来,最先进的说话人确认模型大多数以牺牲参数量和计算量的代价来实现感受野的固定获取,然而鉴于语音信号内部蕴含着丰富且多层次的信息,通过高度自主选择的动态感受野来描绘复杂信息是相对未被探索的,更没有直观地解释是什么构成了关于有效感受野的最佳实践。潮涌现象表现为潮水前端形成陡立水墙并伴随轰鸣声高速推进,受其非线性耦合行为的启发,该文提出潮涌卷积(TR-Conv)“使用潮涌感受野(T-RRF),获得更有效感受野”。首先采用二幂插值操作构建窗口内的主/从感受野,随后分别采用扫描-池化机制聚焦提取窗口外的关键信息、算子机制精细感知窗口内的差异信息,最后融合三重感受野,得到兼具多尺度、动态性、有效性的可变感受野。为全面验证潮涌卷积的表现,该文建立潮涌卷积神经网络(TR-CNN)。另外,针对数据集的错误标签问题,提出动态归一化的非目标(NTDN)损失与具有两个子中心的加性角边距(Sub-Center AAM)损失变体加权融合的总损失,以提升模型性能。实验结果表明,与ECAPA-TDNN(C=512)相比,TR-CNN(C=512, n=1)分别在测试集Vox1-O, Vox1-E, Vox1-H上的等错误率(EER)以及最小检测代价函数(MinDCF)相对降低了4.95%,4.03%和6.03%以及31.55%, 17.14%和17.42%,参数量和乘加累积操作次数相对减少了32.7%,23.5%。进一步,TR-CNN(C=1 024, n=1)的EER/MinDCF分别是0.85%/0.076 2/1.10%/0.104 8/2.05%/0.173 9。本研究代码已开源:https://www.scidb.cn/detail?dataSetId=a232c98b082941c58002958208ef3f43&version=V1&code=j00173。 展开更多
关键词 说话人确认 潮涌卷积 轻量化网络 二幂插值 动态归一化的非目标损失
在线阅读 下载PDF
基于多层次特征融合和注意力机制的无人机图像小目标检测算法
13
作者 张信佳 王芳 《计算机工程》 北大核心 2026年第2期148-157,共10页
无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点,这导致检测过程中容易出现漏检和误检。为应对上述挑战,基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先,引入空间深度转换卷积(SPD-Conv)模块替换... 无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点,这导致检测过程中容易出现漏检和误检。为应对上述挑战,基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先,引入空间深度转换卷积(SPD-Conv)模块替换原模型的跨步卷积层,避免细节信息丢失,增强小目标特征提取能力;其次,设计新型平均快速空间金字塔池化(AGSPPF)模块,引入平均池化操作缓解池化层在提取特征信息的同时会导致部分信息丢失的问题,提升模型的特征提取能力;再次,新增针对小目标的大尺度检测分支,捕捉浅层特征中丰富的细节信息,提升模型对小目标的检测能力;最后,将归一化注意力机制(NAM)嵌入骨干网络,对特征信息进行加权处理,抑制无效的特征信息。在VisDrone2019数据集和NWPU VHR-10数据集上的训练测试结果表明,该算法的均值平均精度(mAP)分别达到了42.3%和96.5%,与基线模型YOLOv5s相比分别提高了8.4和2.6百分点。通过与其他基于深度学习的主流模型对比实验,进一步验证了该模型的鲁棒性和精确性。 展开更多
关键词 YOLOv5s模型 小目标检测 空间深度转换卷积 空间金字塔池化 归一化注意力机制
在线阅读 下载PDF
基于YOLOv8s改进的布匹缺陷检测算法
14
作者 毛佳奇 孙日明 《山西电子技术》 2026年第1期30-33,共4页
为提高布匹缺陷检测的精度和效率,提出了改进的模型FES-YOLOv8s。该算法是以YOLOv8s为基准模型,在网络结构中引入FocalModulation模块替换SPPF模块,加强网络的特征提取能力和自适应能力,使得在特征提取过程中网络能够更加关注缺陷目标... 为提高布匹缺陷检测的精度和效率,提出了改进的模型FES-YOLOv8s。该算法是以YOLOv8s为基准模型,在网络结构中引入FocalModulation模块替换SPPF模块,加强网络的特征提取能力和自适应能力,使得在特征提取过程中网络能够更加关注缺陷目标。为了进一步提升网络的特征提取能力和增强网络学习缺陷目标的信息能力,提出将C2f模块替换为多尺度转换模块Efficient Multi-Scale-Conv,同时减少了模型的参数量。考虑到缺陷样本质量不平衡问题,使用SIoU损失函数,增强缺陷定位准确率,并且提高模型收敛速度和回归精度。改进后的模型在布匹数据集上进行实验,其实验结果表明,改进后的模型的mAP@0.5达到90.5%,相比于基准模型提高了12.2%。与原YOLOv8s算法相比,改进后的网络参数量减少了42.34%,mAP@0.5、精确率分别提高了12.2%、16.8%,充分验证了算法的优势和有效性,改善了布匹表面缺陷检测精度较低的问题。 展开更多
关键词 YOLOv8s算法 FocalModulation Efficient Multi-Scale-conv SIoU 布匹缺陷
在线阅读 下载PDF
TSD-YOLOv8算法在无人机航拍图像小目标检测中的应用
15
作者 缪金钰 孙贤文 +3 位作者 霍瑛 陈烨萱 王召军 周英吉 《工业控制计算机》 2026年第1期70-71,74,共3页
针对无人机航拍图像中小目标检测精度低、漏检率高的问题,提出一种改进的目标检测算法TSD-YOLOv8。在YOLOv8主干网络中引入SE(Squeeze-and-Excitation)注意力机制,通过动态调整通道特征权重,提升模型对小目标特征的提取能力;同时在部分... 针对无人机航拍图像中小目标检测精度低、漏检率高的问题,提出一种改进的目标检测算法TSD-YOLOv8。在YOLOv8主干网络中引入SE(Squeeze-and-Excitation)注意力机制,通过动态调整通道特征权重,提升模型对小目标特征的提取能力;同时在部分卷积模块中加入基于Space-to-Depth操作的SPD-Conv模块,更有效地捕捉图像中的局部细节特征,从而进一步提高检测性能。在VisDrone2019数据集上的实验结果表明,TSD-YOLOv8在精度、召回率和平均精度等指标上相较YOLOv8均有显著提升,特别是在小目标检测的性能上表现出色,相较于原始YOLOv8n模型,m AP50提高了13.7%,达到47.1%。此外,基于PyQt5开发了一个目标检测验证平台,支持模型的实时对比和可视化分析,验证了改进模型的实际应用价值。 展开更多
关键词 小目标检测 YOLOv8 SE注意力机制 SPD-conv 航拍图像
在线阅读 下载PDF
基于g^(n)Conv和GAM的YOLOv5钢管焊接缺陷检测方法 被引量:4
16
作者 周鑫 郝万君 +1 位作者 卞长庚 马文琪 《微电子学与计算机》 2023年第9期29-37,共9页
针对基础yolov5算法检测钢管焊缝缺陷因缺陷目标小、背景复杂造成检测精度不够、特征提取不充分、速度慢的问题,提出了一种改进yolov5检测算法.首先,采用递归门控卷积g^(n)Conv替换网络中普通的卷积层,增强了模型空间交互能力,实现对特... 针对基础yolov5算法检测钢管焊缝缺陷因缺陷目标小、背景复杂造成检测精度不够、特征提取不充分、速度慢的问题,提出了一种改进yolov5检测算法.首先,采用递归门控卷积g^(n)Conv替换网络中普通的卷积层,增强了模型空间交互能力,实现对特征的高效提取,间接提高了检测速度;其次,使用ASPP(Atrous Spatial Pyramid Pooling)模块替换基础算法中使用的SPP模块,在扩大了感受野范围的同时提高了检测速度;最后,在网络的预测端添加全局注意力机制GAM(Global Attention Mechanism)进一步加强特征提取,提高检测的精度.实验结果表明,改进的算法mAP达到了92.7%,比原算法提升了2.1个百分点,速度为50.8 f/s,满足钢管焊接缺陷检测的精度和实时性要求. 展开更多
关键词 钢管焊接缺陷 g^(n)conv ASPP GAM
在线阅读 下载PDF
基于Conv-Involution的红外视频小样本人体行为识别方法 被引量:3
17
作者 姚天 余磊 +3 位作者 崔帅华 周啸辉 熊邦书 欧巧凤 《激光与红外》 CAS CSCD 北大核心 2023年第2期246-252,共7页
红外视频存在颜色信息缺失较为严重、识别区域易与背景混淆等现象,使得现有小样本特征提取网络常常关注无效信息,导致识别精度较低。针对此问题,本文提出一种基于内卷积(Conv-Involution)算子的红外视频小样本人体行为识别方法。首先,通... 红外视频存在颜色信息缺失较为严重、识别区域易与背景混淆等现象,使得现有小样本特征提取网络常常关注无效信息,导致识别精度较低。针对此问题,本文提出一种基于内卷积(Conv-Involution)算子的红外视频小样本人体行为识别方法。首先,通过InstColorization方法恢复红外视频中的颜色信息;其次,基于空间和通道特异性设计Conv-Involution算子,并利用该算子和改进注意力机制设计特征提取网络,分离背景,更有效地关注行为发生区域;最后,结合小样本学习方法ANIL进行人体行为分类。对比实验结果表明,本文所提方法不但识别精度最高,而且具有出色的稳定性。 展开更多
关键词 人体行为识别 conv-Involution算子 小样本学习 红外视频
在线阅读 下载PDF
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离 被引量:1
18
作者 兰朝凤 蒋朋威 +4 位作者 陈欢 赵世龙 郭小霞 韩玉兰 韩闯 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1005-1012,共8页
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型... 目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。 展开更多
关键词 语音分离 视听融合 跨模态注意力 双路径递归网络 conv-TasNet
在线阅读 下载PDF
基于DO-Conv改进的端到端车牌识别算法 被引量:1
19
作者 赖珍向 丁磊 +1 位作者 邓杰航 顾国生 《计算机科学与应用》 2021年第3期588-595,共8页
提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer,DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明... 提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer,DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明:改进后的算法在合成数据集和SYSU数据集上的识别准确率分别为97.42%和95.08%,均优于使用传统卷积的端到端识别算法。 展开更多
关键词 车牌识别 端到端 深度过参数化卷积 DO-conv
在线阅读 下载PDF
基于Conv1D-LSTM混合模型的长时间序列日最高温预测研究 被引量:1
20
作者 杜智勇 杨帆 杨文杰 《北京印刷学院学报》 2024年第9期52-57,共6页
针对传统方法难以处理高维度数据捕捉气温数据中的非线性模式和复杂动态特征的问题,本文提出一种基于卷积神经网络(Conv1D)与长短期记忆网络(LSTM)相结合的混合模型,用于长时间序列高温预测研究。数据集包含北京市2014年至2023年间的气... 针对传统方法难以处理高维度数据捕捉气温数据中的非线性模式和复杂动态特征的问题,本文提出一种基于卷积神经网络(Conv1D)与长短期记忆网络(LSTM)相结合的混合模型,用于长时间序列高温预测研究。数据集包含北京市2014年至2023年间的气象数据,包括天气、日最低温、日最高温、风向等特征。通过特征工程处理,将天气和风向特征编码,并对温度特征归一化。构建的Conv1D-LSTM混合模型创新性地融合Conv1D以捕获时间序列中的局部特征,融合LSTM以学习长期依赖关系。与传统模型相比,该混合模型的均方根误差(RMSE)和平均绝对误差(MAE)分别降低约17.3%和20.5%,同时R2分数提高约1.06%,表明该模型具有更高的预测精度和泛化能力。 展开更多
关键词 日最高温预测 conv1D-LSTM混合模型 长时间序列 预测精度
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部