期刊文献+
共找到98篇文章
< 1 2 5 >
每页显示 20 50 100
基于改进Res2Net与迁移学习的水果图像分类 被引量:3
1
作者 吴迪 肖衍 +2 位作者 沈学军 万琴 陈子涵 《电子科技大学学报》 北大核心 2025年第1期62-71,共10页
针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成... 针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成卷积核,利用meta-ACON激活函数优化ReLU激活函数,动态学习激活函数的线性和非线性,自适应选择是否激活神经元;其次,采用基于模型迁移的训练方式进一步提升分类的效率与鲁棒性。实验结果表明,该算法在Fruit-Dataset和Fruits-360数据集上的测试准确率相比Res2Net提升了1.2%和1.0%,召回率相比Res2Net提升了1.13%和0.89%,有效提升了水果图像分类性能。 展开更多
关键词 图像分类 res2net 动态多尺度融合注意力 激活函数 迁移学习
在线阅读 下载PDF
基于Res2Net注意力机制网络智能检测CT肺动脉成像急性肺动脉栓塞
2
作者 李曼 蒋德攀 +5 位作者 王麦林 李艳若 张晗宇 王颖 张岚 黄婷婷 《中国医学影像学杂志》 北大核心 2025年第4期356-361,369,共7页
目的基于Res2Net注意力机制网络实现CT肺动脉成像急性肺动脉栓塞(APE)的智能检测。资料与方法回顾性收集2015年2月—2023年5月河南中医药大学第一附属医院疑似APE行CT肺动脉成像并确诊为APE的患者。按照7∶2∶1将数据随机分为训练集、... 目的基于Res2Net注意力机制网络实现CT肺动脉成像急性肺动脉栓塞(APE)的智能检测。资料与方法回顾性收集2015年2月—2023年5月河南中医药大学第一附属医院疑似APE行CT肺动脉成像并确诊为APE的患者。按照7∶2∶1将数据随机分为训练集、验证集和测试集。基于Res2Net网络框架,结合多孔空间金字塔池化和注意力机制模块训练模型,对模型进行五折交叉内部验证;在测试集上采用受试者工作特征曲线下面积、敏感度、特异度评估模型的诊断效能;同时采用戴斯相似系数、精确率、交集比并集(IOU)评估模型的分割效能并绘制相应曲线。比较该模型与经典的U-Net模型及CE-Net模型的效能。结果最终纳入303例APE患者,训练集212例,验证集61例,测试集30例。模型的曲线下面积为0.95,敏感度为0.90,特异度为1.00;戴斯相似系数为0.86,精确率为0.90,Pos-IOU为0.78,Neg-IOU为1.00。参数曲线图及雷达图显示Res2Net注意力机制网络多项参数均优于U-Net及CE-Net模型。分割对比的可视化结果显示Res2Net注意力机制网络对肺动脉栓子的分割精准度更高。结论Res2Net注意力机制网络模型对APE具有良好的检测性能。 展开更多
关键词 肺栓塞 CT肺动脉成像 体层摄影术 螺旋计算机 深度学习 res2net 注意力机制
在线阅读 下载PDF
基于ASP-SERes2Net的说话人识别算法 被引量:1
3
作者 令晓明 陈鸿雁 +1 位作者 张小玉 张真 《北京工业大学学报》 CAS 北大核心 2025年第1期42-50,共9页
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq... 为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(squeeze-and-excitation,SE)注意力模块;然后,用注意力统计池化(attention statistics pooling,ASP)代替原来的平均池化;最后,采用附加角裕度的Softmax(additive angular margin Softmax,AAM-Softmax)对说话人身份进行分类。通过实验,将ASP-SERes2Net算法与时延神经网络(time delay neural network,TDNN)、ResNet34和Res2Net进行对比,ASP-SERes2Net算法的最小检测代价函数(minimum detection cost function,MinDCF)值为0.0401,等误率(equal error rate,EER)为0.52%,明显优于其他3个模型。结果表明,ASP-SERes2Net算法性能更优,适合应用于噪声环境下的说话人识别。 展开更多
关键词 说话人识别 梅尔语谱图 res2net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax)
在线阅读 下载PDF
融合Res2Net和部分卷积的带钢表面缺陷检测算法 被引量:3
4
作者 胡凯涛 马向华 +1 位作者 孙向宇 刘闯 《计算机工程与应用》 北大核心 2025年第5期334-343,共10页
为提升带钢表面缺陷的层次性特征提取能力和检测效率,提出基于多尺度表征和部分卷积(PConv)的快速检测网络(multi-scale and partially convolutional network,MSPC-Net)。将限制对比度自适应直方图均衡技术(contrast limited adaptive ... 为提升带钢表面缺陷的层次性特征提取能力和检测效率,提出基于多尺度表征和部分卷积(PConv)的快速检测网络(multi-scale and partially convolutional network,MSPC-Net)。将限制对比度自适应直方图均衡技术(contrast limited adaptive histogram equalization,CLAHE)引入到该模型以突出带钢表面的缺陷特征;在YOLOv5s的基础上新增检测层,提高对不同尺寸缺陷目标的检测率;设计了融合Res2Net的多尺度特征提取块并引入ECA注意力机制(BRE-block),既可以获取细粒度层面的特征,同时也增加了模型感受野;通过结合PConv减少了模型计算量(FLOPs),且增强了部分特征信息的聚合。在NEU-DET数据集上的实验结果表明,平均精度均值(mAP@IoU=0.5)达到了80.2%,较原基线网络提高了5.9个百分点;同时改进后网络的FPS达到157,远高于近期应用广泛的目标检测算法,有效提高了带钢表面缺陷的检测效率。 展开更多
关键词 对比度增强 多尺度特征提取 改进res2net 融合PConv 信息聚合
在线阅读 下载PDF
基于BIM-Res2Net-ICA的中药饮片图像识别模型
5
作者 谷瑞 宋翠玲 李元昊 《时珍国医国药》 北大核心 2025年第6期1192-1200,共9页
中药饮片是中医药文化的重要载体,针对现有中药饮片识别模型准确率和泛化能力不足的问题,文章从增强多尺度特征适应性和突出重要特征区域两方面入手,提出一种新的中药饮片图像识别模型BIM-Res2Net-ICA。首先,在Res2Net内部构建双向融合... 中药饮片是中医药文化的重要载体,针对现有中药饮片识别模型准确率和泛化能力不足的问题,文章从增强多尺度特征适应性和突出重要特征区域两方面入手,提出一种新的中药饮片图像识别模型BIM-Res2Net-ICA。首先,在Res2Net内部构建双向融合策略,以提升不同尺度特征融合的有效性,获取更丰富的特征信息;其次,嵌入改进的坐标注意力机制,在空间和通道两个方向上增强模型对目标的方向感知和坐标信息的捕获能力;最后,结合Focal Loss损失函数有效克服样本分布不均的问题,进一步提高分类的准确性。实验表明,该模型在构建的20类中药饮片数据集上的准确率、精确率、召回率、F1-Score分别为97.48%、96.32%、96.92%和97.59%,与其他先进算法相比,具有更低的计算复杂度和更高的准确率,且模型具有较强的泛化能力,能为各种中药识别场景提供准确的算法支持。 展开更多
关键词 中药饮片 BIM-res2net-ICA 多尺度特征 改进的坐标注意力 图像识别
原文传递
基于Res2Net的人脸表情识别方法 被引量:2
6
作者 唐宏伟 丁祥 +3 位作者 邓嘉鑫 高方坤 罗佳强 王军权 《邵阳学院学报(自然科学版)》 2024年第2期28-35,共8页
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据... 为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。 展开更多
关键词 表情识别 Focal Loss函数 广义平均池化模块 res2net50
在线阅读 下载PDF
基于Res2Net-RetinaNet的活性污泥指示性微生物目标检测
7
作者 赵立杰 鲁茜 +1 位作者 黄明忠 王国刚 《化工自动化及仪表》 CAS 2024年第5期785-795,共11页
活性污泥中原生动物、后生动物等指示性微生物是污水处理运行调控的重要指标。针对活性污泥微生物不同种类之间,小目标类微生物体型较小、微生物个体颜色背景和图像颜色背景相似的现象,提出基于Res2Net-RetinaNet的活性污泥指示性微生... 活性污泥中原生动物、后生动物等指示性微生物是污水处理运行调控的重要指标。针对活性污泥微生物不同种类之间,小目标类微生物体型较小、微生物个体颜色背景和图像颜色背景相似的现象,提出基于Res2Net-RetinaNet的活性污泥指示性微生物检测方法。Res2Net-RetinaNet模型采用精度更高的新维度残差块Res2Net模块捕获原有特征的丰富信息。在主干网络输出的第1层引入通道和空间注意力机制CBAM,进一步帮助浅层特征信息在网络中流动。最后,在特征融合模块中引入深度超参数化卷积(Do-Conv),在不增加计算量的前提下持续加快模型的收敛。将所提方法应用于某污水厂采集数据中进行实验,结果表明:所提方法与Fast R-CNN、SSD、YOLOv3、YOLOv4、FCOS、CenterNet及RetinaNet等目标检测模型相比,检测精度最高(92.8%),相对于原始RetinaNet目标检测算法精度提升4.97%。 展开更多
关键词 res2net-RetinaNet 污水处理 微生物 目标检测 res2net模块 CBAM注意力机制 深度超参数化卷积
在线阅读 下载PDF
基于Ghost-SE-Res2Net的多模型融合语音唤醒词检测方法 被引量:2
8
作者 虞秋辰 周若华 袁庆升 《计算机工程》 CAS CSCD 北大核心 2024年第3期52-59,共8页
语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测... 语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测窗,均基于轻量化的挤压与激励残差网络(SE-Res2Net)模块,即GhostSE-Res2Net,SE-Res2Net结构的多尺度机制可显著提升WWD的能力。在Ghost-SE-Res2Net中,首先使用Ghost卷积替换SE-Res2Net中的普通卷积以降低模型参数量,然后使用注意力池化层替换SE-Res2Net中的全局平均池化层进一步提升WWD能力。在实际检测时融合连续3个小检测窗模型的检测结果的最大值和1个大检测窗模型的检测结果,来判断唤醒词是否被触发。在训练时引入困难样本挖掘算法,选择性地学习较难检测的唤醒词信息以提高分类模型的检测性能。在包含2个唤醒词的Mobvoi数据集上评估系统性能,实验结果表明,在每小时0.5次错误唤醒的情况下,该系统在2个唤醒词上的错误拒绝率分别为0.46%和0.43%,实现了与先进基线相似的性能,并且系统参数量比基线少31%。 展开更多
关键词 唤醒词检测 Ghost模块 res2net结构 错误拒绝 多模型融合
在线阅读 下载PDF
Infrared and Visible Image Fusion Based on Res2Net-Transformer Automatic Encoding and Decoding 被引量:2
9
作者 Chunming Wu Wukai Liu Xin Ma 《Computers, Materials & Continua》 SCIE EI 2024年第4期1441-1461,共21页
A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The ne... A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The networkcomprises an encoder module, fusion layer, decoder module, and edge improvementmodule. The encoder moduleutilizes an enhanced Inception module for shallow feature extraction, then combines Res2Net and Transformerto achieve deep-level co-extraction of local and global features from the original picture. An edge enhancementmodule (EEM) is created to extract significant edge features. A modal maximum difference fusion strategy isintroduced to enhance the adaptive representation of information in various regions of the source image, therebyenhancing the contrast of the fused image. The encoder and the EEM module extract features, which are thencombined in the fusion layer to create a fused picture using the decoder. Three datasets were chosen to test thealgorithmproposed in this paper. The results of the experiments demonstrate that the network effectively preservesbackground and detail information in both infrared and visible images, yielding superior outcomes in subjectiveand objective evaluations. 展开更多
关键词 Image fusion res2net-Transformer infrared image visible image
在线阅读 下载PDF
基于Res2Net和递归门控卷积的细粒度图像分类
10
作者 王莹莹 郝潇 《计算机与现代化》 2024年第10期74-79,共6页
提取图像中具有判别性的区域在细粒度图像分类中起着至关重要的作用。现有的细粒度图像分类方法忽视图像多尺度信息以及相邻空间位置信息交互作用,难以准确提取细微特征,并且传统的CNN方法捕捉长距离语义信息不足,提取图像全局信息能力... 提取图像中具有判别性的区域在细粒度图像分类中起着至关重要的作用。现有的细粒度图像分类方法忽视图像多尺度信息以及相邻空间位置信息交互作用,难以准确提取细微特征,并且传统的CNN方法捕捉长距离语义信息不足,提取图像全局信息能力欠缺。针对这些问题设计一种基于Res2Net和递归门控卷积模块的细粒度分类算法。该网络中,使用弱监督数据增强网络(WS-DAN)进行数据扩展防止过拟合,将Res2Net作为特征提取网络,用以提取不同尺度的图像信息,增加网络层的感受野,同时在该网络中引入递归门控卷积模块,用来进一步融合信息并且实现高阶特征交互,提高网络建模能力。该方法分别在CUB-200-2011、Stanford Dogs和FGVC-Aircraft这3个公开数据集上达到了90.36%、93.1%和94.3%的准确率,能够有效地提取图像细微特征并实现分类。 展开更多
关键词 深度学习 细粒度分类 res2net 递归门控卷积
在线阅读 下载PDF
Res2Net融合注意力机制的YOLOv4目标检测算法 被引量:2
11
作者 张翔 刘振凯 +1 位作者 叶娜 赵妍祯 《计算机测量与控制》 2022年第9期213-220,227,共9页
针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一... 针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一个残差块内构造层次化的类残差连接,引入Res2Net替换原YOLOv4主干网络中的ResNet残差网络结构,可以获取到更细小的特征,同时也增加了模型感受野;其次将Res2Net与注意力机制相融合,获取关键特征信息,减轻因优化主干网络带来计算量增加的负担;最后通过改进CIOU损失,降低预测框与真实框之间的误差值,有效的解决因目标过小或者有遮挡时模型出现漏检误检等问题;在公开的PASCAL VOC数据集上进行验证,结果表明:RFAL YOLOv4模型的mAP达到了79.5%,比原模型提升了5.5%,改进后的模型具有较高的鲁棒性。 展开更多
关键词 目标检测 YOLOv4 res2net 注意力机制 CIOU
在线阅读 下载PDF
一种利用SE-Res2Net的合成语音检测系统 被引量:4
12
作者 梁超 高勇 《无线电工程》 北大核心 2022年第9期1560-1565,共6页
传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅... 传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅尔倒谱系数(Mel Frequency Cepstral Coefficients, MFCC)+逆梅尔倒谱系数(Inverse Mel Frequency Cepstral Coefficients, IMFCC)的双通道语音特征作为合成语音检测的前端特征,在后端分类器上串联Res2Net网络和SENet网络组合成SE-Res2Net网络来提升模型的泛化能力。将不同特征与模型的打分结果融合,进一步提高实验性能。在ASVspoof2019数据集上的实验结果表明,该设计的合成语音检测系统能有效检测合成语音,与ASVspoof2019比赛的基线系统相比,融合模型的等错误概率(Equal Error Rate, EER)与串联成本检测函数(tandem Detection Cost Function, t-DCF)分别降低了49%和64%。 展开更多
关键词 合成语音检测 res2net 经验模式分解 SENet 等错误概率 串联成本检测函数
在线阅读 下载PDF
基于CA-Res2Net和可变形卷积的图像去模糊方法 被引量:1
13
作者 李武斌 李春国 杨绿溪 《无线电通信技术》 2022年第5期945-950,共6页
针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时... 针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时CADNet嵌入了细粒度多尺度的残差模块,可以在更细粒度的层次上表示图片的多尺度特征信息,从而可以获得更强的特征表示能力。实验结果表明,CADNet是一种高效的去模糊算法,在获得更高去模糊性能的同时,压制住了计算开销。 展开更多
关键词 图像去模糊 非均匀模糊 可变形卷积 通道注意力 res2net
在线阅读 下载PDF
基于CBAM-Res2Net的人群计数算法 被引量:3
14
作者 陈江川 吴云韬 孔权 《武汉工程大学学报》 CAS 2022年第6期664-669,共6页
针对静态人群图像中背景干扰和尺度变化等问题,采用多尺度特征提取模块(Res2Net)以更细的粒度提取多尺度特征,提高对不同尺寸人头的计数性能;引入卷积注意力模块(CBAM),分别在通道域和空间域上提高人群区域的权重,有效改善了高密度和复... 针对静态人群图像中背景干扰和尺度变化等问题,采用多尺度特征提取模块(Res2Net)以更细的粒度提取多尺度特征,提高对不同尺寸人头的计数性能;引入卷积注意力模块(CBAM),分别在通道域和空间域上提高人群区域的权重,有效改善了高密度和复杂的人群场景下背景干扰等问题。在此基础上,将CBAM模块集成到Res2Net模块中,形成了新的多尺度特征提取模块CBAM-Res2Net。在后端网络中设计了一个扩张模块以提取更深层的特征并进行特征融合回归,从而生成高质量的密度图。并且分别在ShanghaiTech Part A、ShanghaiTech Part B和UCF_CC_50数据集上进行了算法对比实验,本文模型在上述数据集的平均绝对误差和均方根误差分别为61.4、7.3、255.6和98.5、10.8、310.2,综合性能均优于其他算法,验证了模型的准确性和鲁棒性。 展开更多
关键词 人群计数 多尺度特征提取模块 卷积注意力模块 CBAM-res2net 密度图
在线阅读 下载PDF
基于Res2net和金字塔池化的图像去雾算法 被引量:5
15
作者 王贺 韩磊 《测试技术学报》 2023年第5期455-460,共6页
在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过... 在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过使用Res2net模块提取上下文特征,并利用金字塔池化模块融合不同尺度的特征信息。为了得到更好的网络模型,采用RESIDE数据集对提出的模型分别进行训练和测试。结果表明:该模型在主客观评价中都取得了不错的效果,极大地改善了去雾后图片色彩失真和去雾不够彻底的问题。 展开更多
关键词 深度学习 图像去雾 res2net 金字塔池化
在线阅读 下载PDF
FIR-YOLACT:Fusion of ICIoU and Res2Net for YOLACT on Real-Time Vehicle Instance Segmentation 被引量:2
16
作者 Wen Dong Ziyan Liu +1 位作者 Mo Yang Ying Wu 《Computers, Materials & Continua》 SCIE EI 2023年第12期3551-3572,共22页
Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving syst... Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving systems.The vehicle instance segmentation can perform instance-level semantic parsing of vehicle information,which is more accurate and reliable than object detection.However,the existing instance segmentation algorithms still have the problems of poor mask prediction accuracy and low detection speed.Therefore,this paper proposes an advanced real-time instance segmentation model named FIR-YOLACT,which fuses the ICIoU(Improved Complete Intersection over Union)and Res2Net for the YOLACT algorithm.Specifically,the ICIoU function can effectively solve the degradation problem of the original CIoU loss function,and improve the training convergence speed and detection accuracy.The Res2Net module fused with the ECA(Efficient Channel Attention)Net is added to the model’s backbone network,which improves the multi-scale detection capability and mask prediction accuracy.Furthermore,the Cluster NMS(Non-Maximum Suppression)algorithm is introduced in the model’s bounding box regression to enhance the performance of detecting similarly occluded objects.The experimental results demonstrate the superiority of FIR-YOLACT to the based methods and the effectiveness of all components.The processing speed reaches 28 FPS,which meets the demands of real-time vehicle instance segmentation. 展开更多
关键词 Instance segmentation real-time vehicle detection YOLACT res2net ICIoU
在线阅读 下载PDF
基于Res2Net-IDCN-SCF算法的多模态医学图像融合
17
作者 程颖 方贤进 《湖北民族大学学报(自然科学版)》 CAS 2023年第4期499-505,共7页
利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态... 利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态医学图像融合算法。Res2Net的编码器在提取多尺度特征时能保留更多语义信息;交错稠密网络减少了解码器和编码器之间的语义差异,丰富了融合图像的结构和细节信息;掩码鉴别器约束了脑瘤病灶区域,进一步提高了融合图像的质量;特征图通过空间通道融合算法融合减少了多模态图像之间的信息冗余。该算法在信息熵(entropy of information,EN)、互信息(mutual information,MI)、结构相似性(structure similarity index measure,SSIM)、多尺度结构相似性(multi scale structural similarity index measure,MI_SSIM)指标上拥有较高水平的性能表现,EN提高了6%,MI提高了3%。结果显示,所提出的算法在视觉感知和指标评估上达到了较高的融合质量。 展开更多
关键词 多模态医学图像融合 res2net 交错稠密网络 空间融合 通道融合
在线阅读 下载PDF
基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术
18
作者 张海艳 李洁 +2 位作者 张博学 刘静 唐雪蕊 《信息技术》 2022年第5期177-182,共6页
为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。... 为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。利用重新构建的下采样模块,保证了下采样操作后信息的完整性。将密集连接网络与残差连接网络相结合,组建Res-DenseNet网络以改进YOLOv3模型的原有残差连接方式。实验结果表明,该方法的性能明显优于传统YOLOv3算法,适于在临床诊断中普及应用。 展开更多
关键词 SE-res2net网络 宫颈癌超声图像 采样 特征提取 识别性能
在线阅读 下载PDF
融合注意力机制的Res2Net-LSTM声纹识别方法
19
作者 李坤明 《网络安全技术与应用》 2024年第5期58-61,共4页
针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法。通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重... 针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法。通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重进行调整,通过关注重点区域,提高分类性能。在公开的Voxceleb1数据集上进行验证,实验结果表明,相较于ResNetLSTM、Res2Net-LSTM准确率分别提升了10.4%,10.5%,验证了该方法具有更好的性能。 展开更多
关键词 声纹识别 注意力机制 res2net LSTM
原文传递
基于残差网络的有限元分析结果云图的加密方法
20
作者 董正方 代鹏翔 +3 位作者 曾繁凯 康腾奥 李运华 田林杰 《科学技术与工程》 北大核心 2025年第25期10766-10772,共7页
在有限元分析中,提高网格密度能够显著增强仿真结果的准确性,但同时也需要消耗更多的计算资源,为了解决这一矛盾,通过将Res2Net、U-Net、通道注意力机制、几何特征提取融合在一起,对低网格密度的有限元结果云图数据进行学习,预测高网格... 在有限元分析中,提高网格密度能够显著增强仿真结果的准确性,但同时也需要消耗更多的计算资源,为了解决这一矛盾,通过将Res2Net、U-Net、通道注意力机制、几何特征提取融合在一起,对低网格密度的有限元结果云图数据进行学习,预测高网格密度的有限元结果云图,从而在不牺牲精度的前提下,减少所需的计算成本。模型通过在2倍、4倍和8倍等不同尺度条件下进行实验,在测试数据上的均方误差和平均绝对误差都有显著降低,充分证明了模型在数值预测准确性方面的卓越表现,结果表明,在较少的计算资源投入下,在保证输出结果的高精度下,可利用此模型进行有限元结果云图的加密。 展开更多
关键词 有限元分析 结果云图 res2net残差网络 跳跃连接 注意力机制
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部