期刊文献+
共找到192篇文章
< 1 2 10 >
每页显示 20 50 100
基于改进VMD及ConvNeXt的小电流接地系统单相接地故障选线方法 被引量:2
1
作者 张浩 张大海 +2 位作者 刘乃毓 吴奎忠 侍哲 《高电压技术》 北大核心 2025年第2期730-741,I0021,共13页
对于小电流接地系统的单相接地故障选线,传统方法普遍采用基于一维信号的选线模型,存在选线准确率低、抗噪性弱等问题。为此提出一种改进的变分模态分解及Conv Ne Xt的小电流接地系统单相接地故障选线方法。首先引入蚁狮算法优化变分模... 对于小电流接地系统的单相接地故障选线,传统方法普遍采用基于一维信号的选线模型,存在选线准确率低、抗噪性弱等问题。为此提出一种改进的变分模态分解及Conv Ne Xt的小电流接地系统单相接地故障选线方法。首先引入蚁狮算法优化变分模态分解算法,通过蚁狮算法自动寻优选取合适的分解次数和惩罚因子,计算分解得到的各分量的分布熵,将其中的噪声分量筛选去除,将其余有效分量进行线性重构得到降噪后的零序电流信号;其次,将经过降噪处理后的一维零序电流信号经格拉姆角场转换为二维图像,制备故障选线数据集;然后,引入预训练的ConvNeXt模型,根据该研究数据模型特征,在其已有权重基础上对模型参数进行对应微调,从而提高模型精度并形成最终的选线模型;最后引入绝对平均误差、均方根误差作为评价指标验证所提降噪算法有效性。分别在加入噪声与否的前提下,将所提模型与3种选线模型相比较。实验结果表明该模型的准确率最高、抗噪性方面更好,其中该研究算法准确率达到了99.82%并且在不同噪声条件下都能维持91%以上的准确率,高于其他选线模型,克服了传统故障选线方法准确率低、抗噪性差的问题。 展开更多
关键词 故障选线 蚁狮优化算法 变分模态分解 分布熵 格拉姆角场 conv Ne Xt
原文传递
基于Swin-Conv-Unet的核磁共振成像
2
作者 郭丙彬 韩增文 +1 位作者 张延军 杨海庆 《河北师范大学学报(自然科学版)》 2025年第4期339-347,共9页
研究计算成像与核磁共振成像的结合,旨在解决核磁共振成像中的逆成像问题.提出了一种改进的Swin-Conv-UNet算法,该方法融合了卷积神经网络和采用结构状态空间建模的Swin-Mamba结构的优势.该模型利用UNet的编码器-解码器结构,并结合Swin-... 研究计算成像与核磁共振成像的结合,旨在解决核磁共振成像中的逆成像问题.提出了一种改进的Swin-Conv-UNet算法,该方法融合了卷积神经网络和采用结构状态空间建模的Swin-Mamba结构的优势.该模型利用UNet的编码器-解码器结构,并结合Swin-Mamba模块的多尺度特征提取与长程依赖建模能力,在图像重建中取得了显著提升.实验基于fastMRI数据集开展,结果显示该模型在图像重建质量和噪声抑制方面表现优异.具体而言,Swin-Conv-UNet在信噪比和结构相似性方面分别达到了23.5152dB和0.8863,均优于ADMM、PnPADMM及MambaRecon等对比方法,同时保持了较优的重建时间.研究表明,Swin-Conv-UNet不仅提升了图像的清晰度和结构保真度,也为医学图像处理提供了一种高效可靠的新途径.未来工作将进一步优化该模型结构,并探索其在其他医学成像领域的拓展应用. 展开更多
关键词 计算成像 核磁共振成像 Swin-conv-UNet 图像重建
在线阅读 下载PDF
基于数据融合-Conv-LSTM的铁路客运目标预测方法研究
3
作者 王凌燕 李燕 +2 位作者 谭思伦 卫铮铮 张旭 《铁道运输与经济》 北大核心 2025年第11期198-206,共9页
客运目标一般包括旅客发送量和客运收入2个指标,为提升对铁路客运目标每日预测的精度,提出一种基于数据融合-Conv-LSTM预测方法。分析客运目标的时间周期性,关联旅客发送量、客运收入和票额能力等业务特征以及融合各车站层的特征,从时... 客运目标一般包括旅客发送量和客运收入2个指标,为提升对铁路客运目标每日预测的精度,提出一种基于数据融合-Conv-LSTM预测方法。分析客运目标的时间周期性,关联旅客发送量、客运收入和票额能力等业务特征以及融合各车站层的特征,从时间和空间2个方面构建数据集,随后引入Conv-LSTM组合模型以充分挖掘时空信息,训练模型并输出预测结果。实例应用表明,数据融合-Conv-LSTM预测误差远低于ARMAR、SVR、BP、XGBOOST、LSTM等预测方法,同时,融合了空间特性数据的模型对于旅客发送量与客运收入的预测性能均优于仅使用一维数据的模型。此外,将每日预测结果汇总至月度指标时,模型仍能保持良好的预测效果,满足实际应用需求。研究提出的方法为铁路局集团公司的客运计划制定提供了科学合理的数据参考。 展开更多
关键词 铁路客运 conv-LSTM 数据融合 旅客发送量 客运收入 时间序列预测
在线阅读 下载PDF
基于残差连接和Conv-LSTM的锂离子电池SOH估算
4
作者 周奔滔 陶吉利 王清松 《电源学报》 北大核心 2025年第5期270-277,共8页
锂离子电池常被用作储能元件以实现电能的存储和使用,精确地估算其健康状态SOH(state-of-health)可以为电池的实际使用提供理论依据。然而,SOH无法被直接测量。为了准确且便捷地估算锂离子电池SOH,从数据驱动法的角度提出1种基于残差连... 锂离子电池常被用作储能元件以实现电能的存储和使用,精确地估算其健康状态SOH(state-of-health)可以为电池的实际使用提供理论依据。然而,SOH无法被直接测量。为了准确且便捷地估算锂离子电池SOH,从数据驱动法的角度提出1种基于残差连接和卷积长短时记忆Conv-LSTM(convolutional long short-term memory)网络的锂离子电池SOH估算模型。该方法基于残差连接、Conv-LSTM和卷积神经网络,利用锂离子电池充电过程中的电压、电流和容量,实现锂离子电池使用周期内的SOH估算。在多个电池测试数据集上的实验结果表明,与多种估算效果较好的现有模型相比,基于残差连接和Conv-LSTM的SOH估算模型具有更精准的估算结果,测试集SOH估算的最大相对误差MAX PE(maximum percentage error)和平均绝对百分比误差MAPE(mean absolute percentage error)分别小于3.3%和1.7%。 展开更多
关键词 锂离子电池 健康状态估算 残差连接 卷积长短时记忆网络
在线阅读 下载PDF
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离 被引量:1
5
作者 兰朝凤 蒋朋威 +4 位作者 陈欢 赵世龙 郭小霞 韩玉兰 韩闯 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1005-1012,共8页
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型... 目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。 展开更多
关键词 语音分离 视听融合 跨模态注意力 双路径递归网络 conv-TasNet
在线阅读 下载PDF
基于Conv1D-LSTM混合模型的长时间序列日最高温预测研究 被引量:1
6
作者 杜智勇 杨帆 杨文杰 《北京印刷学院学报》 2024年第9期52-57,共6页
针对传统方法难以处理高维度数据捕捉气温数据中的非线性模式和复杂动态特征的问题,本文提出一种基于卷积神经网络(Conv1D)与长短期记忆网络(LSTM)相结合的混合模型,用于长时间序列高温预测研究。数据集包含北京市2014年至2023年间的气... 针对传统方法难以处理高维度数据捕捉气温数据中的非线性模式和复杂动态特征的问题,本文提出一种基于卷积神经网络(Conv1D)与长短期记忆网络(LSTM)相结合的混合模型,用于长时间序列高温预测研究。数据集包含北京市2014年至2023年间的气象数据,包括天气、日最低温、日最高温、风向等特征。通过特征工程处理,将天气和风向特征编码,并对温度特征归一化。构建的Conv1D-LSTM混合模型创新性地融合Conv1D以捕获时间序列中的局部特征,融合LSTM以学习长期依赖关系。与传统模型相比,该混合模型的均方根误差(RMSE)和平均绝对误差(MAE)分别降低约17.3%和20.5%,同时R2分数提高约1.06%,表明该模型具有更高的预测精度和泛化能力。 展开更多
关键词 日最高温预测 conv1D-LSTM混合模型 长时间序列 预测精度
在线阅读 下载PDF
基于SPD-Conv结构和NAM注意力机制的鱼群小目标检测 被引量:3
7
作者 谌雨章 王诗琦 +1 位作者 周雯 周婉婷 《计算机科学》 CSCD 北大核心 2024年第S01期426-432,共7页
为解决因水下成像环境退化导致图像分辨率较低,以及因鱼群目标较小等因素导致的检测精度不高的问题,提出了一种结合SPD-Conv结构和NAM注意力机制的改进YOLOv7检测算法。首先,采用Space-to-Depth(SPD)结构改进头部网络,取代了网络中原有... 为解决因水下成像环境退化导致图像分辨率较低,以及因鱼群目标较小等因素导致的检测精度不高的问题,提出了一种结合SPD-Conv结构和NAM注意力机制的改进YOLOv7检测算法。首先,采用Space-to-Depth(SPD)结构改进头部网络,取代了网络中原有的跨步卷积结构,保留了更多的细粒度信息,提升了特征学习的效率,提高了网络对低分辨率图像的检测效果。然后在网络中引入Normalization-based Attention Module(NAM)注意力机制,采用CBAM的模块集成方式,使用BN缩放因子来计算注意力权重,抑制了不显著的特征,提升了小目标检测的准确率。最后针对水下成像退化,对检测图片做反卷积预处理,减小了水下成像退化因素对检测造成的影响。实验结果显示,在WildFish数据集上模型的整体精度达到97.2%,与YOLOv7算法相比提升了7.6%,准确率提升了8.5%,召回率提升了9.8%,与Efficientdet,SSD,YOLOv5及YOLOv8算法相比,所提模型精度分别提升了12.6%,17.8%,4%及2.9%,在Aquarium数据集上模型的整体精度达到80.5%,相比Efficientdet,SSD,YOLOv5,YOLOv7及YOLOv8分别提升了18.4%,11.6%,6.9%,2.0%及2.7%,可以满足水下鱼群识别的需求。 展开更多
关键词 SPD-conv结构 NAM注意力机制 YOLOv7算法 鱼群检测 目标检测
在线阅读 下载PDF
基于Conv-BiLSTM模型的虚拟社区用户生成内容创新价值识别问题研究:交互协同的视角 被引量:1
8
作者 王松 徐雅静 刘新民 《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第4期77-88,共12页
【目的】缓解虚拟社区开放式创新用户生成内容信息过载、处理效率低等问题,优化用户生成内容质量,有效识别并分析用户创新内容,提高虚拟社区协同创新绩效。【方法】基于交互协同视角提出一种用户生成内容创新价值识别方法:一是在创新要... 【目的】缓解虚拟社区开放式创新用户生成内容信息过载、处理效率低等问题,优化用户生成内容质量,有效识别并分析用户创新内容,提高虚拟社区协同创新绩效。【方法】基于交互协同视角提出一种用户生成内容创新价值识别方法:一是在创新要素特征方面,在用户属性和内容属性的基础上,引入创新要素异质性属性;二是在创新过程特征方面,关注交互内容的时序性和协同性。建立融合要素特征和过程特征的卷积-双向长短时记忆网络(Conv-BiLSTM)模型进行用户生成内容的价值识别。【结果】选取典型虚拟社区数据进行实证研究,结果表明:融合要素特征和过程特征模型的准确率为88.65%,过程特征的引入使模型准确率提升14.22个百分点,协同要素异质性属性的引入使模型准确率提升6.48个百分点,较其他基准模型与组合模型均有不同程度提升。【局限】仅针对虚拟社区创新内容识别取得较好的结果,需要提高模型的泛化能力,进而应用于其他类型协同创新识别方面。【结论】将创新交互的过程特征和协同创新要素异质性属性引入虚拟社区用户生成内容识别模型中,有效提升了识别的准确率,可以为社区开放式创新管理提供技术参考。 展开更多
关键词 用户生成内容 交互协同视角 conv-BiLSTM 创新价值识别
原文传递
基于Conv-Involution的红外视频小样本人体行为识别方法 被引量:3
9
作者 姚天 余磊 +3 位作者 崔帅华 周啸辉 熊邦书 欧巧凤 《激光与红外》 CAS CSCD 北大核心 2023年第2期246-252,共7页
红外视频存在颜色信息缺失较为严重、识别区域易与背景混淆等现象,使得现有小样本特征提取网络常常关注无效信息,导致识别精度较低。针对此问题,本文提出一种基于内卷积(Conv-Involution)算子的红外视频小样本人体行为识别方法。首先,通... 红外视频存在颜色信息缺失较为严重、识别区域易与背景混淆等现象,使得现有小样本特征提取网络常常关注无效信息,导致识别精度较低。针对此问题,本文提出一种基于内卷积(Conv-Involution)算子的红外视频小样本人体行为识别方法。首先,通过InstColorization方法恢复红外视频中的颜色信息;其次,基于空间和通道特异性设计Conv-Involution算子,并利用该算子和改进注意力机制设计特征提取网络,分离背景,更有效地关注行为发生区域;最后,结合小样本学习方法ANIL进行人体行为分类。对比实验结果表明,本文所提方法不但识别精度最高,而且具有出色的稳定性。 展开更多
关键词 人体行为识别 conv-Involution算子 小样本学习 红外视频
在线阅读 下载PDF
基于g^(n)Conv和GAM的YOLOv5钢管焊接缺陷检测方法 被引量:4
10
作者 周鑫 郝万君 +1 位作者 卞长庚 马文琪 《微电子学与计算机》 2023年第9期29-37,共9页
针对基础yolov5算法检测钢管焊缝缺陷因缺陷目标小、背景复杂造成检测精度不够、特征提取不充分、速度慢的问题,提出了一种改进yolov5检测算法.首先,采用递归门控卷积g^(n)Conv替换网络中普通的卷积层,增强了模型空间交互能力,实现对特... 针对基础yolov5算法检测钢管焊缝缺陷因缺陷目标小、背景复杂造成检测精度不够、特征提取不充分、速度慢的问题,提出了一种改进yolov5检测算法.首先,采用递归门控卷积g^(n)Conv替换网络中普通的卷积层,增强了模型空间交互能力,实现对特征的高效提取,间接提高了检测速度;其次,使用ASPP(Atrous Spatial Pyramid Pooling)模块替换基础算法中使用的SPP模块,在扩大了感受野范围的同时提高了检测速度;最后,在网络的预测端添加全局注意力机制GAM(Global Attention Mechanism)进一步加强特征提取,提高检测的精度.实验结果表明,改进的算法mAP达到了92.7%,比原算法提升了2.1个百分点,速度为50.8 f/s,满足钢管焊接缺陷检测的精度和实时性要求. 展开更多
关键词 钢管焊接缺陷 g^(n)conv ASPP GAM
在线阅读 下载PDF
基于时空序列的Conv-LSTM航班延误预测模型 被引量:9
11
作者 屈景怡 杨柳 +1 位作者 陈旭阳 王茜 《计算机应用》 CSCD 北大核心 2022年第10期3275-3282,共8页
精准的航班延误预测结果可以为大面积航班延误的预防提供巨大的参考价值。航班延误预测是在特定空间下做时间序列预测,然而目前已有预测方法多为两种或多种算法的结合,存在算法间的融合问题。针对上述问题,提出了一种综合考虑时空序列... 精准的航班延误预测结果可以为大面积航班延误的预防提供巨大的参考价值。航班延误预测是在特定空间下做时间序列预测,然而目前已有预测方法多为两种或多种算法的结合,存在算法间的融合问题。针对上述问题,提出了一种综合考虑时空序列的卷积长短时记忆(Conv-LSTM)网络航班延误预测模型。所提模型在长短时记忆(LSTM)网络提取时间特征的基础上,将网络的输入和权重矩阵进行卷积来提取空间特征,从而充分利用数据集包含的时间和空间信息。实验结果表明,与LSTM、仅考虑空间信息的卷积神经网络(CNN)模型相比,Conv-LSTM模型的准确率分别提高了0.65个百分点和2.36个百分点。由此可见,同时考虑时空特性可以在航班延误问题中获得更精确的预测结果。此外,基于所提模型设计并实现了基于浏览器/服务器(B/S)架构的航班延误分析系统,并且该系统也可以应用于空中交通管理局流量控制中心。 展开更多
关键词 航班延误预测 时空序列 深度学习 卷积长短时记忆网络 气象信息 航班信息
在线阅读 下载PDF
基于Spark-ML+Conv-LSTM的混合入侵检测系统 被引量:6
12
作者 杨吉鹏 谢辉 《微型电脑应用》 2021年第12期195-197,205,共4页
为了提高网络入侵检测的准确率,提出了基于Spark-ML分类器和卷积LSTM(Conv-LSTM)网络的两阶段混合入侵检测系统(IDS)。采用Spark-ML分类器构建异常流量检测模块,结合Conv-LSTM网络建立恶意攻击检测模块,兼顾了网络流量的特征提取和入侵... 为了提高网络入侵检测的准确率,提出了基于Spark-ML分类器和卷积LSTM(Conv-LSTM)网络的两阶段混合入侵检测系统(IDS)。采用Spark-ML分类器构建异常流量检测模块,结合Conv-LSTM网络建立恶意攻击检测模块,兼顾了网络流量的特征提取和入侵类别的深度分析,实现了全局和局部潜在威胁特征的准确识别。通过ISCX 2012数据集进行验证,验证结果表明:所提出的混合IDS能够在97.29%的情况下准确地识别网络入侵,在10倍交叉验证测试中优于其他检测方法,并且具有较高的精确度和较低的误报率。 展开更多
关键词 入侵检测系统 深度学习 Spark-ML conv-LSTM
在线阅读 下载PDF
一种基于Conv-LSTM的滚动轴承故障诊断方法 被引量:8
13
作者 毕鹏远 《机电工程技术》 2021年第11期113-115,共3页
针对轴承传统的故障诊断方法存在辨别故障类型难和预处理步骤多的问题,提出一种基于Conv-LSTM(卷积长短期记忆网络)的模型。该模型以Conv-LSTM单元模块作为处理层,能自识别和自处理故障特征信息;同时该模型可直接处理切片后的原始信号,... 针对轴承传统的故障诊断方法存在辨别故障类型难和预处理步骤多的问题,提出一种基于Conv-LSTM(卷积长短期记忆网络)的模型。该模型以Conv-LSTM单元模块作为处理层,能自识别和自处理故障特征信息;同时该模型可直接处理切片后的原始信号,通过Conv-LSTM模型的分类结果并结合标签可诊断出滚动轴承的故障类型。对SKF6205型轴承进行实验,实验结果表明相对于LSTM,基于Conv-LSTM的诊断模型具有更好的分类效果和更高的分类准确率,且在迭代过程中准确率在0.96以上,可作为诊断滚动轴承故障类型的一种方法。 展开更多
关键词 conv-LSTM 轴承 故障诊断 分类
在线阅读 下载PDF
基于Conv1D和LSTM组合模型的多步交通流量预测分析 被引量:2
14
作者 赵晓娟 李峰 《微型电脑应用》 2023年第5期1-3,共3页
为了提高交通流预测精度,设计一种Conv1D和LSTM相结合的多步交通流预测模型。用Conv1D获取交通流的时间与周期参数,并测试各外部因素引起的交通流量变化,再利用LSTM序列分析模型,根据上述交通流特征进行预测。研究结果表明:在加入时间... 为了提高交通流预测精度,设计一种Conv1D和LSTM相结合的多步交通流预测模型。用Conv1D获取交通流的时间与周期参数,并测试各外部因素引起的交通流量变化,再利用LSTM序列分析模型,根据上述交通流特征进行预测。研究结果表明:在加入时间信息的条件下,交通流量预测结果与实际结果间存在更大相似度,考虑时间信息影响能够获得更准确的预测结果。经过外部因素提取处理后可以获得更高精度交通流预测结果,采用Conv1D+LSTM模型可以达到比LSTM更高的精度。 展开更多
关键词 一维卷积神经网络(conv1D) 长短期记忆神经网络(LSTM) 交通流量 预测
在线阅读 下载PDF
基于DO-Conv的DBNet文本检测方法研究 被引量:2
15
作者 曾祥福 钟维良 +1 位作者 郑阳超 陈海钦 《工业控制计算机》 2022年第11期100-101,103,共3页
目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处... 目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处理的步骤和预测的时间。DBNet方法提出可学习阈值并设计了一个二值化函数,简化了后处理的步骤,在文本检测任务中取得了很好的效果。随着越来越多的网络被提出并且在计算机视觉中都有不错的效果,针对基于分割方法的后处理复杂和预测速度慢问题,在DBNet方法上应用了较为新的ResNeSt网络,同时引入了DO-Conv卷积方式。实验结果表明,该方法在多个指标上都要优于DBNet方法,有较好的文本检测性能。 展开更多
关键词 文本检测 DBNet ResNeSt DO-conv
在线阅读 下载PDF
基于Conv-LSTM融合模型的空中交通流预测
16
作者 武子琰 杨宏业 +2 位作者 王鸿羽 刘忠辉 孟瑞锋 《信息与电脑》 2023年第6期74-77,共4页
随着民航领域在新常态下的快速恢复,国内空域流量逐渐增加,空中交通智能预测的重要性日益显著。空中交通预测有助于空管部门全面掌握空中交通态势,因此文章将一种结合了卷积神经网络和长短时记忆模型特点的Conv-LSTM融合模型应用于空中... 随着民航领域在新常态下的快速恢复,国内空域流量逐渐增加,空中交通智能预测的重要性日益显著。空中交通预测有助于空管部门全面掌握空中交通态势,因此文章将一种结合了卷积神经网络和长短时记忆模型特点的Conv-LSTM融合模型应用于空中交通预测领域。实验结果表明,该模型能有效捕捉空中交通数据的时间相关性和空间相关性,为智能化空管建设提供了一定的理论参考。 展开更多
关键词 空中交通流 深度学习 时空相关性 conv-LSTM
在线阅读 下载PDF
基于DO-Conv改进的端到端车牌识别算法
17
作者 赖珍向 丁磊 +1 位作者 邓杰航 顾国生 《计算机科学与应用》 2021年第3期588-595,共8页
提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer,DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明... 提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer,DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明:改进后的算法在合成数据集和SYSU数据集上的识别准确率分别为97.42%和95.08%,均优于使用传统卷积的端到端识别算法。 展开更多
关键词 车牌识别 端到端 深度过参数化卷积 DO-conv
在线阅读 下载PDF
Computer vision-based six layered ConvNeural network to recognize sign language for both numeral and alphabet signs 被引量:2
18
作者 Muhammad Aminur Rahaman Kabiratun Ummi Oyshe +3 位作者 Prothoma Khan Chowdhury Tanoy Debnath Anichur Rahman Md.Saikat Islam Khan 《Biomimetic Intelligence & Robotics》 EI 2024年第1期45-58,共14页
People who have trouble communicating verbally are often dependent on sign language,which can be difficult for most people to understand,making interaction with them a difficult endeavor.The Sign Language Recognition(... People who have trouble communicating verbally are often dependent on sign language,which can be difficult for most people to understand,making interaction with them a difficult endeavor.The Sign Language Recognition(SLR)system takes an input expression from a hearing or speaking-impaired person and outputs it in the form of text or voice to a normal person.The existing study related to the Sign Language Recognition system has some drawbacks,such as a lack of large datasets and datasets with a range of backgrounds,skin tones,and ages.This research efficiently focuses on Sign Language Recognition to overcome previous limitations.Most importantly,we use our proposed Convolutional Neural Network(CNN)model,“ConvNeural”,in order to train our dataset.Additionally,we develop our own datasets,“BdSL_OPSA22_STATIC1”and“BdSL_OPSA22_STATIC2”,both of which have ambiguous backgrounds.“BdSL_OPSA22_STATIC1”and“BdSL_OPSA22_STATIC2”both include images of Bangla characters and numerals,a total of 24,615 and 8437 images,respectively.The“ConvNeural”model outperforms the pre-trained models with accuracy of 98.38%for“BdSL_OPSA22_STATIC1”and 92.78%for“BdSL_OPSA22_STATIC2”.For“BdSL_OPSA22_STATIC1”dataset,we get precision,recall,F1-score,sensitivity and specificity of 96%,95%,95%,99.31%,and 95.78%respectively.Moreover,in case of“BdSL_OPSA22_STATIC2”dataset,we achieve precision,recall,F1-score,sensitivity and specificity of 90%,88%,88%,100%,and 100%respectively. 展开更多
关键词 conv NeuralSign language CNN Static Feature extraction convolution2D Fully connected layer DROPOUT
原文传递
基于改进YOLOv7的甘蔗幼苗检测方法试验研究 被引量:1
19
作者 李会 郭家文 +4 位作者 黄世醒 郑丁科 安星宇 郑健林 杨丹彤 《农机化研究》 北大核心 2025年第9期146-154,共9页
查找甘蔗缺苗点是进行甘蔗补苗的重要环节,针对人工查找效率低的问题,提出了一种基于改进YOLOv7的甘蔗幼苗检测方法。田间环境较为复杂,需要考虑拍摄距离、高度、光照、杂草、遮挡和目标物大小不一等因素,对YOLOv7进行改进。在主干网络(... 查找甘蔗缺苗点是进行甘蔗补苗的重要环节,针对人工查找效率低的问题,提出了一种基于改进YOLOv7的甘蔗幼苗检测方法。田间环境较为复杂,需要考虑拍摄距离、高度、光照、杂草、遮挡和目标物大小不一等因素,对YOLOv7进行改进。在主干网络(backbone)中添加了SE注意力机制,解决了甘蔗幼苗大小不一进而导致漏检的问题,并添加SAConv,提高了检测器的性能;在head中引入CoordConv,提高网络对蔗苗位置的感知能力和多尺度检测能力;最后,对模型进行轻量化改进,对原始模型和改进模型进行对比试验和性能评估。试验结果表明:基于YOLOv7-SSC的甘蔗幼苗检测模型准确率达95.1%,召回率为96%,MAP值为94.4%,推理速度为8.79帧/s,内存占用量53.8 MB。相较原模型,准确率提高了4个百分点,召回率提高了1个百分点,MAP值提高了1.4个百分点,性能优于SSD、Faster-RCNN、YOLOv5、YOLOv7等模型。改进YOLOv7甘蔗幼苗检测模型能够在有效抑制田间环境因素干扰下,准确快速地识别到甘蔗苗,可为大田其他作物的检测研究提供参考。 展开更多
关键词 幼苗检测 YOLOv7 SE注意力机制 SAconv Coord conv 轻量化 甘蔗
在线阅读 下载PDF
基于改进YOLOv5的密集行人检测算法 被引量:5
20
作者 胡倩 皮建勇 +2 位作者 胡伟超 黄昆 王娟敏 《计算机工程》 北大核心 2025年第3期216-228,共13页
针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨... 针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积,有效缓解特征信息丢失的问题;其次,针对非相邻特征图不直接融合从而引起特征融合率较低的问题,提出新的双层渐进金字塔网络(DAFPN),提高行人检测的准确性和精度;最后,基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数,以调整和提高帧回归率,促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型,mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点;引入EfficiCIoU_Loss后,模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展,提高了其在实际应用中的性能和效率。 展开更多
关键词 密集行人检测 小目标行人检测 conv-SPD网络 双层渐进特征金字塔网络 EfficiCIoU_Loss损失函数
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部