期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于混合域注意力ResNeSt的结肠息肉分割模型
1
作者 周孟然 刘思怡 +2 位作者 卞凯 王宁 高立鹏 《重庆工商大学学报(自然科学版)》 2025年第1期85-93,共9页
目的针对因息肉大小不一,边界不清,光线影响,在图片中所占比例较小导致的分割精度不高的问题,提出了一种改进的U型结构网络BMR-Net。方法该模型的框架为编码器-解码器形式,在编码器部分采用ResNeSt提取特征,在计算成本增加很少的情况下... 目的针对因息肉大小不一,边界不清,光线影响,在图片中所占比例较小导致的分割精度不高的问题,提出了一种改进的U型结构网络BMR-Net。方法该模型的框架为编码器-解码器形式,在编码器部分采用ResNeSt提取特征,在计算成本增加很少的情况下改善了特征提取效果;在编码器和解码器之间设计边界预测生成模块(BPGM)来聚合高层特征并加入改良空间金字塔池化模块,在其中引入注意力机制,提升多尺度信息融合效果,获得更精确的全局特征图表示;针对不清晰的边缘部分采用反向注意力模块,删除已预测区域,校正边界信息。结果在CVC-ClinicDB、Kvasir-SEG、CVC-ColonDB、ETIS-Larib、EndoScene数据集上进行测试,mDice值分别达到了0.930、0.903、0.743、0.712、0.874。结论该方法分割性能和泛化性能均优于其他的先进方法,并且可以更加精确和完整地分割出小尺寸息肉,可以为结肠息肉患者提供早期预后信息。 展开更多
关键词 图像分割 结肠息肉 resnest 编解码网络 注意力机制
在线阅读 下载PDF
融合ResNeSt和多尺度特征融合的遥感影像道路提取 被引量:3
2
作者 郝明 白鹤 徐婷婷 《光电工程》 北大核心 2025年第1期39-51,共13页
针对高分辨率遥感影像的道路提取存在道路边缘分割不连续、小目标道路分割精度不高和目标道路误分的问题,本文提出了结合ResNeSt和多尺度特征融合的遥感影像道路提取方法用于遥感影像道路提取(ResT-UNet)。参考ResNeSt网络模块构造U型... 针对高分辨率遥感影像的道路提取存在道路边缘分割不连续、小目标道路分割精度不高和目标道路误分的问题,本文提出了结合ResNeSt和多尺度特征融合的遥感影像道路提取方法用于遥感影像道路提取(ResT-UNet)。参考ResNeSt网络模块构造U型网编码器,使前期编码器可以更完整的提取信息,分割目标边缘更加连续;首先在编码器部分引入Triplet Attention注意力机制,抑制无用的特征信息;其次使用卷积块代替最大池化操作,增加特征维度和网络深度,减少道路信息丢失;最后在编码器网络和解码器网络的桥连接部分使用多尺度特征融合模块(multi-acale feature fusion,MSFF),以捕获区域间的远程依赖关系,提高道路的分割效果。实验在Massachusetts道路数据集和DeepGlobe数据集上进行实验,实验结果表明,该方法分别在数据集上IoU达到了64.76%和64.45%,相比于近几年网络MINet模型提高了1.42%和1.74%,表明ResT-UNet网络有效提高遥感影像道路的提取精度,为解译遥感图像语义信息提供一种新思路。 展开更多
关键词 遥感影像 道路提取 resnest网络 多尺度特征融合 注意力机制
在线阅读 下载PDF
基于ResNeSt网络的糖网病及糖尿病黄斑水肿联合分级
3
作者 张爱玲 杨林英 闫士举 《应用科学学报》 北大核心 2025年第5期849-862,共14页
糖网病(diabetic retinopathy, DR)和糖尿病黄斑水肿(diabetic macular edema,DME)是造成人类失明的主要原因。本文基于ResNeSt网络关注DR和DME之间的密切关联以实现两者的联合分级,从而提高分级精度。使用ResNeSt网络的不同层级分别提... 糖网病(diabetic retinopathy, DR)和糖尿病黄斑水肿(diabetic macular edema,DME)是造成人类失明的主要原因。本文基于ResNeSt网络关注DR和DME之间的密切关联以实现两者的联合分级,从而提高分级精度。使用ResNeSt网络的不同层级分别提取DR和DME的共有特征及两者的特有特征,在此基础上利用互关注模块进行特征融合,实现两者的各自分级。在Messidor数据集上,同时使用ResNeSt网络和互关注模块时DR和DME的分级准确率分别为95.6%和95.0%,联合准确率为86.7%;而仅使用ResNeSt网络时两者的分级准确率分别为95.0%和90.8%。在IDRiD数据集上两者的联合准确率为66.3%。数据集的研究结果表明,基于ResNeSt网络对DR和DME进行联合分级可以提高分级精度。 展开更多
关键词 糖网病:黄斑水肿 resnest 注意力机制 联合分级
在线阅读 下载PDF
基于改进ResNeSt50对糖尿病视网膜病变和黄斑水肿的联合分级
4
作者 刘宇轩 顾德 《中国医学物理学杂志》 2025年第6期766-774,共9页
针对糖尿病视网膜病变各等级引发的出血、微动脉瘤和新生血管等病灶形态各异,且易掩盖糖尿病黄斑水肿病灶,导致联合分级困难的问题,提出一种改进ResNeSt50的疾病联合分级网络。首先对ResNeSt50进行改进,将其残差块中的3×3卷积替换... 针对糖尿病视网膜病变各等级引发的出血、微动脉瘤和新生血管等病灶形态各异,且易掩盖糖尿病黄斑水肿病灶,导致联合分级困难的问题,提出一种改进ResNeSt50的疾病联合分级网络。首先对ResNeSt50进行改进,将其残差块中的3×3卷积替换为一种新的卷积:部分卷积。并使用改进后ResNeSt50提取图像特征,以探索糖尿病视网膜病变和黄斑水肿的特异性。然后引入疾病相关性注意力模块,探索糖尿病视网膜病变和黄斑水肿的内在关系。将该算法在Messidor数据集和IDRID数据集上进行实验,其联合准确率分别为83.7%和64.1%。结果表明,所提算法在糖尿病视网膜病变和黄斑水肿的联合分级效果上有较大提升。 展开更多
关键词 糖尿病 视网膜 resnest50 PConv 注意力机制
在线阅读 下载PDF
基于ResNeSt和RPN的绝缘子缺陷检测方法
5
作者 江浩田 任柳清 +3 位作者 潘雄 刘禹 张其鉴 卢锦昌 《中国新技术新产品》 2025年第14期17-20,共4页
在电力巡检过程中,现有的绝缘子缺陷检测技术存在精度低、检测时间长等缺点,因此,本文提出一种基于分割注意力的残差网络(Residual Neural Network with Split-Attention,ResNeSt)和区域候选网络(Region Proposal Network,RPN)的绝缘子... 在电力巡检过程中,现有的绝缘子缺陷检测技术存在精度低、检测时间长等缺点,因此,本文提出一种基于分割注意力的残差网络(Residual Neural Network with Split-Attention,ResNeSt)和区域候选网络(Region Proposal Network,RPN)的绝缘子缺陷检测方法。首先,本文方法基于ResNeSt构建一个新的网络。其次,将RPN加入改进的ResNeSt中进行特征提取,以提高对绝缘子缺陷的检测效率。再次,对数据进行改进处理,并对绝缘子数据集进行标记。最后,进行试验,验证本文方法的性能。试验结果表明,本文方法对绝缘子缺陷检测的平均精度为0.986。 展开更多
关键词 绝缘子 输电线路 resnest RPN
在线阅读 下载PDF
基于ResNeSt网络路面状态识别的主动悬架模型预测控制 被引量:7
6
作者 寇发荣 胡凯仑 +1 位作者 陈若晨 何海洋 《控制与决策》 EI CSCD 北大核心 2024年第6期1849-1858,共10页
为了提升不同运行工况下的路面状态识别精度及主动悬架平顺性控制性能,提出一种基于ResNeSt网络路面状态识别的主动悬架模型预测控制(MPC)方法.首先,搭建基于多路径分散注意力思想的ResNeSt网络架构,建立面向主动悬架实时控制的路面状... 为了提升不同运行工况下的路面状态识别精度及主动悬架平顺性控制性能,提出一种基于ResNeSt网络路面状态识别的主动悬架模型预测控制(MPC)方法.首先,搭建基于多路径分散注意力思想的ResNeSt网络架构,建立面向主动悬架实时控制的路面状态识别算法,采用交叉熵目标损失函数和AdamW梯度下降算法进行网络训练以及测试实验验证;然后,在此基础上设计基于路面状态识别的主动悬架MPC控制算法,根据离散状态空间方程推导悬架系统预测模型,以悬架预测输出和控制力输入为性能指标建立目标函数,并考虑不同路面的控制策略确定加权矩阵取值,在系统约束条件下,将MPC目标函数转化为二次最优规划问题的求解;最后,将所提出控制算法与被动悬架、LQG控制进行对比仿真分析,结果表明:ResNeSt网络可以快速准确地识别多种路面状态,所提出控制算法能够根据路面状态对悬架进行实时瞬态主动控制,簧载质量加速度、悬架动挠度和轮胎动载荷的均方根值平均值相比LQG控制分别降低36.56%、32.99%和36.28%. 展开更多
关键词 路面状态识别 resnest 深度学习 残差卷积神经网络 主动悬架 模型预测控制
原文传递
基于空间注意力增强ResNeSt-101网络和迁移元学习的小样本害虫分类 被引量:5
7
作者 梁炜健 郭庆文 +2 位作者 王春桃 肖德琴 黄琼 《农业工程学报》 EI CAS CSCD 北大核心 2024年第6期285-297,共13页
害虫识别是害虫防治的关键基础,由于较难获得足够的害虫种类图像,如何使用少量标记图像构造害虫分类器是一个富有挑战性的问题。现有研究多采用匹配网络框架来解决这个问题,该框架使用元学习避免重新训练深度网络,然而主干网络的特征提... 害虫识别是害虫防治的关键基础,由于较难获得足够的害虫种类图像,如何使用少量标记图像构造害虫分类器是一个富有挑战性的问题。现有研究多采用匹配网络框架来解决这个问题,该框架使用元学习避免重新训练深度网络,然而主干网络的特征提取能力有限,元学习算法没有提供较好的权重初始化策略,可能导致网络出现梯度消失或者梯度爆炸的情况。为了解决这一问题,该研究提出一种基于空间注意力增强ResNeSt-101和迁移元学习算法的小样本害虫分类器。首先,通过一个空间注意力模块增强ResNeSt-101以更好地提取害虫图像特征,即在ResNeSt-101的第1阶段的最大池化层之前以及在第2~4阶段的末尾分别附加集成空间注意力模块,并通过数值仿真确定空间注意力增强模块的最佳放置位置为第1阶段的最大池化层之前。随后,通过迁移学习策略初始化网络权重,进而通过元学习进行优化。为了避免网络出现梯度消失或者梯度爆炸的情况,在元学习算法中选择归一化的温度缩放交叉熵损失函数代替三元组损失函数。最后,通过计算查询图像和支持图像深度特征之间的相似度实现害虫分类。所提出方法在自建的害虫图像数据集AD0和MIP50上使用N-类K-例准确率和每张图像处理时间(the time of per image processing,TPIP)进行评估。害虫图像数据集的构建方式如下:首先对公共害虫图像数据集IP102和D0进行清洗,以消除由于英文害虫名称导致的歧义类别;然后移除卵、幼虫和蛹阶段的害虫图像,仅保留成虫阶段的图像。考虑到人工和时间成本,从清理后的IP102害虫数据集中选择50个类别构建MIP50害虫图像数据集。随后,通过害虫的拉丁名称从互联网搜索更多的害虫图像,生成AD0害虫图像数据集。自建的MIP50数据集包括来自IP102的50个类别的16424张成虫图像,AD0包含来自D0的所有40个类别的17112张成虫图像。试验结果表明,当测试集中只有少数未知类别的害虫图像时,本文方法在AD0数据集上的5-类10-例评估准确率达到了96.37%,在MIP50数据集上达到了76.91%。当测试集中同时存在几个未知和已知类别的害虫图像时,所提方法在AD0数据集上的5-类10-例设置下的识别准确率达到了93.73%,在MIP50数据集上达到90.60%。同时,本文方法的TPIP大约为0.44 ms,满足大多数场景下的实时害虫识别要求。此外,消融试验结果表明,基于空间注意力增强ResNeSt-101网络和迁移元学习的小样本害虫分类方法在AD0、MIP50数据集上对未知类别害虫图像的5-类10-例的识别准确率分别提升了5和3个百分点以上,具有良好应用前景。但未来研究中还需进一步研究本方法中存在的问题,如通过采用更好地表征支持集样本与查询集样本之间复杂关系的度量优化本工作中用到的度量以解决增加类别数可能导致分类准确率降低的问题,以及将所提方法应用于现实农业场景进行优化改进以更好提升本文方法的实用性。 展开更多
关键词 病虫害 图像处理 小样本分类 元学习 resnest-101 交叉熵损失
在线阅读 下载PDF
基于ResNeSt和改进Transformer的多标签图像分类算法 被引量:2
8
作者 王贺 张震 《测试技术学报》 2024年第1期48-53,共6页
目前,基于深度学习的多标签分类算法还存在一些问题,如标签之间的相关性有待提高,如何解决小目标分类等。为此提出了一种多标签图像分类算法,该算法使用分裂注意力网络ResNeSt进行特征提取,并使用BatchFormerV2与Transformer形成双分支... 目前,基于深度学习的多标签分类算法还存在一些问题,如标签之间的相关性有待提高,如何解决小目标分类等。为此提出了一种多标签图像分类算法,该算法使用分裂注意力网络ResNeSt进行特征提取,并使用BatchFormerV2与Transformer形成双分支网络对特征进行编码,解码阶段使用Transformer Decoder的交叉注意模块来自适应地处理特征以达到更好的分类效果。实验结果表明:该模型在COCO数据集上的mAP为88.4%,在VOC2007数据集上的平均精度为96.0%,一定程度上提高了多标签图像分类的准确率。 展开更多
关键词 深度学习 多标签分类 resnest TRANSFORMER
在线阅读 下载PDF
基于ResNeSt的烟支外观缺陷分类 被引量:17
9
作者 袁国武 刘建成 +2 位作者 刘鸿瑜 瞿睿 周浩 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期464-470,共7页
自动烟支外观缺陷分类是卷烟厂高速流水线上产品质量检测需要解决的问题,是提高卷烟品质和竞争力的有效措施.基于烟草企业的实际需求,提出了一种基于ResNeSt模型的烟支外观缺陷分类方法.首先,针对烟支外观缺陷样本数量不足的问题,采用... 自动烟支外观缺陷分类是卷烟厂高速流水线上产品质量检测需要解决的问题,是提高卷烟品质和竞争力的有效措施.基于烟草企业的实际需求,提出了一种基于ResNeSt模型的烟支外观缺陷分类方法.首先,针对烟支外观缺陷样本数量不足的问题,采用了迁移学习的方法;其次,针对烟支图像的特征,采用多尺度测试,输入不同尺度大小的图片进行训练;最后,为了更好地提取缺陷特征,提高分类准确率,用h-swish替换ReLU激活函数.实验结果显示,准确率达到了92.04%,提出的方法比另外10种主流网络在分类准确率上更高. 展开更多
关键词 烟支 外观缺陷检测 resnest模型 迁移学习 h-swish激活函数
在线阅读 下载PDF
基于ResNeSt网络的音频欺骗检测 被引量:1
10
作者 何信 胡金瑶 +1 位作者 艾斯卡尔·艾木都拉 米吉提·阿不里米提 《现代电子技术》 2022年第23期88-92,共5页
目前最先进的语音合成和语音转换模型能够生成人耳无法区分的虚假语音,这对自动说话人验证(ASV)系统的安全构成巨大威胁。近年来,越来越多抗欺骗对策用于提高ASV系统的可靠性。然而,在实际使用中,在检测未知攻击时遇到困难,特别是,合成... 目前最先进的语音合成和语音转换模型能够生成人耳无法区分的虚假语音,这对自动说话人验证(ASV)系统的安全构成巨大威胁。近年来,越来越多抗欺骗对策用于提高ASV系统的可靠性。然而,在实际使用中,在检测未知攻击时遇到困难,特别是,合成语音欺骗算法的快速发展正在产生越来越强大的未知攻击。在这项工作中,由于ResNeSt网络模型在图像分类和检测任务中取得较好的成绩,因此构建了残差卷积神经网络的变体ResNeSt,使用时域二维特征转换、频域特征等各种特征提取方法(MFCC、LFCC、CQCC)来检测未知的合成语音欺骗攻击。实验结果表明,ResNeSt系统在ASV的逻辑评估集上达到了6.04%的等错误率(EER),相比ASVspoof2019的基线模型提高了25%的性能。 展开更多
关键词 自动说话人验证 resnest模型 语音合成 语音转换 倒谱系数 EER 神经网络
在线阅读 下载PDF
基于反事实注意力学习的ResNeSt网络语种识别 被引量:1
11
作者 陈思竹 龙华 邵玉斌 《中国电子科学研究院学报》 北大核心 2023年第12期1138-1145,共8页
深度学习方法在图像识别领域得到大量研究和应用,也逐渐被应用于语种识别。针对深度学习语种识别模型中所用二维特征图语种间相似度大,容易混淆的问题,提出基于反事实注意力学习的ResNeSt语种识别模型。在建立云南边境语种广播语音数据... 深度学习方法在图像识别领域得到大量研究和应用,也逐渐被应用于语种识别。针对深度学习语种识别模型中所用二维特征图语种间相似度大,容易混淆的问题,提出基于反事实注意力学习的ResNeSt语种识别模型。在建立云南边境语种广播语音数据集的基础上,首先,提取MFCC、Fbank和语谱图作为FcaNet、ResNet和ResNeSt三种网络的输入,对比三种网络下不同信噪比不同语音特征的识别效果,得出在语种识别任务中综合表现最佳的网络模型ResNeSt和语音特征Fbank;接着,在识别效果最佳的ResNeSt网络模型中引入反事实注意力学习模块,利用反事实因果关系来衡量ResNeSt网络中注意力特征的质量,促使网络学习更加有效的注意力特征,以此提高网络训练效果。实验结果表明,加入反事实注意力学习后,Fbank特征语种识别率较基线系统提升1.61%,对于MFCC、Fbank和语谱图三种特征,基于反事实注意力学习的ResNeSt网络较基线ResNeSt网络平均提升1.33%。反事实注意力学习帮助注意力机制关注更多重要语种区分性信息,有效提升了网络模型在语种识别任务中的识别效果。 展开更多
关键词 语种识别 反事实注意力学习 resnest 语音特征
在线阅读 下载PDF
改进ResNeSt网络的拓片甲骨文字识别 被引量:7
12
作者 毛亚菲 毕晓君 《智能系统学报》 CSCD 北大核心 2023年第3期450-458,共9页
目前,拓片甲骨文字的识别方法存在局部细节特征提取能力弱,对部分高相似度的甲骨文字识别率较低的问题。为此,本文提出了一种基于改进ResNeSt网络的甲骨文字识别方法,通过设计跳转连接结构,逐步将网络浅层特征向网络深层传递并进行融合... 目前,拓片甲骨文字的识别方法存在局部细节特征提取能力弱,对部分高相似度的甲骨文字识别率较低的问题。为此,本文提出了一种基于改进ResNeSt网络的甲骨文字识别方法,通过设计跳转连接结构,逐步将网络浅层特征向网络深层传递并进行融合;同时结合甲骨文字“长条形”的特点,引入坐标注意力机制模块,从宽度和高度两个方向上对所得特征进行加权融合;最后通过去掉网络最后一层的激活函数和全连接层以及对最后一个卷积层输出通道数的重新设置,对网络分类器进行了有效优化。实验结果表明,本文提出的改进拓片甲骨文字识别模型在OBC306数据集上识别准确率达到93.53%,取得了目前最好的识别效果。 展开更多
关键词 resnest网络模型 甲骨文字识别 跳转连接 坐标注意力机制 分类器优化 OBC306 深度学习 神经网络
在线阅读 下载PDF
基于FMCW雷达和ResNeSt-GRU的行为识别方法
13
作者 马泽宇 叶宁 +2 位作者 徐康 王甦 王汝传 《计算机与现代化》 2023年第11期101-107,112,共8页
针对FMCW雷达在行为识别方面的应用,提出一种基于分离注意力残差神经网络(ResNeSt)和门控神经单元(GRU)的人体行为识别系统。使用调频连续波(FMCW)雷达采集人体行为数据,之后采用快速傅里叶变换算法(FFT)提取雷达数据每一帧距离、速度... 针对FMCW雷达在行为识别方面的应用,提出一种基于分离注意力残差神经网络(ResNeSt)和门控神经单元(GRU)的人体行为识别系统。使用调频连续波(FMCW)雷达采集人体行为数据,之后采用快速傅里叶变换算法(FFT)提取雷达数据每一帧距离、速度和角度维信息,按照时间维度拼接成距离时间图(RTM)、多普勒时间图(DTM)和角度时间图(ATM),最后以RTM、DTM和ATM作为输入样本,采用三流ResNeSt-GRU模型对不同人体行为进行识别。实验结果表明,三流ResNeSt-GRU模型对8种行为的平均识别准确率达到了98.92%,均高于传统和融合式深度学习模型。此外,采用该模型比传统特征融合之后采用单流网络的识别准确率提高了2.3%。因而该系统可以有效提高人体行为识别系统的识别准确率,为人体行为识别提供新的技术方法。 展开更多
关键词 resnest GRU FMCW雷达 深度学习 行为识别
在线阅读 下载PDF
基于改进ResNeSt的头部姿态估计方法
14
作者 刘东 潘炼 《信息技术》 2023年第5期101-106,114,共7页
针对单目RGB图像进行头部姿态估计精度不高的问题,提出了一种具有尺度平移不变性的改进ResNeSt方法。该方法以卷积神经网络ResNeSt作为主干网络;为增强卷积网络对尺度平移的鲁棒性,参考传统图像处理方法,集成模糊滤波器于卷积网络降采... 针对单目RGB图像进行头部姿态估计精度不高的问题,提出了一种具有尺度平移不变性的改进ResNeSt方法。该方法以卷积神经网络ResNeSt作为主干网络;为增强卷积网络对尺度平移的鲁棒性,参考传统图像处理方法,集成模糊滤波器于卷积网络降采样过程;最后引入多任务学习,将网络提取的特征图输出到混合角度分类分支,提升卷积网络分类精度。在公开数据集验证,结果表明,提出方法的头部姿态估计误差降低了18%,且在CPU上检测速度为0.075秒/张,具备较好的实时检测性能。 展开更多
关键词 头部姿态估计 尺度平移不变性 resnest 模糊滤波器 混合分类分支
在线阅读 下载PDF
Dual Variational Generation Based ResNeSt for Near Infrared-Visible Face Recognition
15
作者 DING Xiangwu LIU Chao QIN Yanxia 《Journal of Donghua University(English Edition)》 CAS 2022年第2期156-162,共7页
Near infrared-visible(NIR-VIS)face recognition is to match an NIR face image to a VIS image.The main challenges of NIR-VIS face recognition are the gap caused by cross-modality and the lack of sufficient paired NIR-VI... Near infrared-visible(NIR-VIS)face recognition is to match an NIR face image to a VIS image.The main challenges of NIR-VIS face recognition are the gap caused by cross-modality and the lack of sufficient paired NIR-VIS face images to train models.This paper focuses on the generation of paired NIR-VIS face images and proposes a dual variational generator based on ResNeSt(RS-DVG).RS-DVG can generate a large number of paired NIR-VIS face images from noise,and these generated NIR-VIS face images can be used as the training set together with the real NIR-VIS face images.In addition,a triplet loss function is introduced and a novel triplet selection method is proposed specifically for the training of the current face recognition model,which maximizes the inter-class distance and minimizes the intra-class distance in the input face images.The method proposed in this paper was evaluated on the datasets CASIA NIR-VIS 2.0 and BUAA-VisNir,and relatively good results were obtained. 展开更多
关键词 near infrared-visible face recognition face image generation resnest triplet loss function attention mechanism
在线阅读 下载PDF
改进Faster R-CNN的输电线路山火图像检测方法
16
作者 黄力 吴珈承 《现代电子技术》 北大核心 2025年第9期173-179,共7页
针对山火严重威胁输电线路安全的问题,提出一种改进Faster R-CNN的输电线路山火图像检测方法。选用ResNeSt50作为主干网络以提升模型性能,同时在主干网络后面加入递归特征金字塔(RFP)以增强模型在多尺度上的特征提取能力。采用CIoU Los... 针对山火严重威胁输电线路安全的问题,提出一种改进Faster R-CNN的输电线路山火图像检测方法。选用ResNeSt50作为主干网络以提升模型性能,同时在主干网络后面加入递归特征金字塔(RFP)以增强模型在多尺度上的特征提取能力。采用CIoU Loss回归损失函数以提高边界框回归速率和定位精度,使用Focal Loss分类损失函数以提高对小目标的烟雾和火焰检测精度。运用Kmeans++聚类算法对烟雾和火焰数据进行anchor尺寸优化,以提高算法的检测准确率。利用数据增强技术来解决图像数量不足和天气环境变化影响检测精度的问题。经过训练和测试,结果显示改进后的Faster RCNN方法在平均精度均值上达到了95.54%,比原模型提高了7.39%,能够有效识别输电线路附近产生的烟雾和火焰,满足山火检测准确性和实时性的要求。 展开更多
关键词 深度学习 山火检测 烟雾检测 Kmeans++ resnest50 CIoU Loss Focal Loss RFP
在线阅读 下载PDF
基于DeepSort的多目标车辆跟踪优化算法 被引量:1
17
作者 余海燕 霍爱清 冯若水 《智能计算机与应用》 2025年第5期68-74,共7页
针对密集交通场景中车辆跟踪所面临的漏检率高、误检频发以及跟踪精度低等问题,提出一种基于DeepSort多目标车辆跟踪优化算法,旨在提升其在复杂环境下的跟踪性能。首先,优化卡尔曼滤波,通过增加自适应调制噪声尺度的机制,动态调整噪声... 针对密集交通场景中车辆跟踪所面临的漏检率高、误检频发以及跟踪精度低等问题,提出一种基于DeepSort多目标车辆跟踪优化算法,旨在提升其在复杂环境下的跟踪性能。首先,优化卡尔曼滤波,通过增加自适应调制噪声尺度的机制,动态调整噪声协方差,更准确地预测目标的运动轨迹,克服因噪声水平波动导致的预测偏差和不稳定现象。随后,采用ResNest50作为主干网络,并结合YOLOv5检测器,对外观特征提取网络进行了改进,增强对车辆外观特征的精细提取能力,达到准确检测跟踪场景中的多个目标车辆的目的。为了全面评估所提算法的性能,基于MOTA、IDSW和MOTP三种指标,进行了综合评估实验并辅以可视化对比实验。经过实验验证,所提算法与其他模型相比在MOTA、MOTP上平均提升了3.460%、3.103%,同时使IDSW平均下降了45.907%,提高了多目标车辆检测的鲁棒性及跟踪精度。 展开更多
关键词 DeepSort NSA卡尔曼滤波 resnest50 密集场景 多目标车辆跟踪 YOLOv5
在线阅读 下载PDF
面向水下目标检测的改进DETR算法
18
作者 张路 魏本昌 +1 位作者 魏鸿奥 周龙刚 《智能计算机与应用》 2025年第10期46-53,共8页
水下的目标检测是当前目标检测的一大热点,针对水下的低能见度和低光照条件带来的挑战,提出了一种改进的DETR算法。首先,使用分散注意力模块的ResNeSt骨干网络,提升了对水下数据特征的提取性能,剔除了冗余的背景信息;其次,引入了多尺度... 水下的目标检测是当前目标检测的一大热点,针对水下的低能见度和低光照条件带来的挑战,提出了一种改进的DETR算法。首先,使用分散注意力模块的ResNeSt骨干网络,提升了对水下数据特征的提取性能,剔除了冗余的背景信息;其次,引入了多尺度可变形注意力编码器,加强了对特征信息的聚合能力,使模型收敛速度更快,同时提高了对小目标的检测性能;然后,使用了Smooth-L1和CIoU结合的损失函数,使模型能够更快地收敛,并且达到更高的精度;最后,在扩充的DUO水下目标检测数据集上进行实验。结果表明所提的改进算法优于其他先进的目标检测算法,所提出的算法可以有效地应用于水下目标检测任务。 展开更多
关键词 计算机视觉 UOD resnest DETR
在线阅读 下载PDF
基于多尺度特征融合的绝缘子缺陷程度检测 被引量:5
19
作者 陈奎 贾立娇 +2 位作者 刘晓 方永丽 赵昌新 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期1889-1899,I0008,共12页
针对绝缘子不同程度缺陷特征相似、像素信息少、不同程度缺陷检测效果不佳的问题,提出了一种基于多尺度特征融合的绝缘子缺陷程度检测网络(multi-scale feature fusion defect degree detection network,MFFD3Net)。该网络采用重构的Res... 针对绝缘子不同程度缺陷特征相似、像素信息少、不同程度缺陷检测效果不佳的问题,提出了一种基于多尺度特征融合的绝缘子缺陷程度检测网络(multi-scale feature fusion defect degree detection network,MFFD3Net)。该网络采用重构的ResNeSt50架构提高了对绝缘子缺陷程度数据集的特征提取能力。设计了基于反卷积的多尺度特征融合模块,丰富了不同尺寸特征图的表达能力,提高了对不同尺度目标的检测性能。同时,在输入检测模块的浅层特征图后增加多感受野的特征提取模块(receptive field block,RFB),使得更多绝缘子缺陷信息进入有效感受野,对最终特征图产生影响,提升不同程度绝缘子缺陷的检测精度。MFFD3Net在绝缘子缺陷程度数据集上的全类平均精度达到85.02%,其中绝缘子轻微破损与绝缘子轻微闪络小目标的检测精度分别为78.37%、79.98%,能够完成不同程度绝缘子缺陷的识别与定位。因此,该文提出的MFFD3Net对于完善电力系统故障预警、保障电网安全稳定运行具有重要意义。 展开更多
关键词 绝缘子 缺陷程度检测 resnest50 特征提取模块 感受野
原文传递
基于改进的Cascade RCNN铸管字符检测算法 被引量:1
20
作者 王宇 徐福丽 +5 位作者 王怀震 崔勇 姜岩 陶晔 王译笙 张琦 《计算机集成制造系统》 EI CSCD 北大核心 2024年第11期3954-3966,共13页
由于工业现场采集的铸管字符图像存在背景模糊、字符区域占比小、刻字位置不固定、油漆遮挡等问题,导致现有模型的检测精度难以满足工业现场的需求。针对上述问题,提出改进的Cascade RCNN铸管字符检测算法。首先对特征金字塔进行改进,... 由于工业现场采集的铸管字符图像存在背景模糊、字符区域占比小、刻字位置不固定、油漆遮挡等问题,导致现有模型的检测精度难以满足工业现场的需求。针对上述问题,提出改进的Cascade RCNN铸管字符检测算法。首先对特征金字塔进行改进,提出融合小目标增强的特征金字塔(STE-FPN),利用多尺度特征融合的特征增强能力丰富铸管小目标字符的特征信息。其次引入自矫正/池化的ResNeSt(SCP-ResNeSt)作为特征提取网络,利用自矫正卷积和池化操作以提升背景复杂的铸管字符特征提取效率。最后对级联结构进行改进,引进Mask分支结构,可以自适应地检测字符区域并去除干扰区域,优化了检测结果。将改进后的算法在铸管数据集上进行测试,其平均检测精度mAP为99.1%,比原Cascade RCNN算法提高了2.3%,得到的精度表明改进后的性能优于原算法。 展开更多
关键词 铸管字符检测 背景模糊 Cascade RCNN resnest
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部