期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
基于改进Res2Net与迁移学习的水果图像分类 被引量:4
1
作者 吴迪 肖衍 +2 位作者 沈学军 万琴 陈子涵 《电子科技大学学报》 北大核心 2025年第1期62-71,共10页
针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成... 针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成卷积核,利用meta-ACON激活函数优化ReLU激活函数,动态学习激活函数的线性和非线性,自适应选择是否激活神经元;其次,采用基于模型迁移的训练方式进一步提升分类的效率与鲁棒性。实验结果表明,该算法在Fruit-Dataset和Fruits-360数据集上的测试准确率相比Res2Net提升了1.2%和1.0%,召回率相比Res2Net提升了1.13%和0.89%,有效提升了水果图像分类性能。 展开更多
关键词 图像分类 res2Net 动态多尺度融合注意力 激活函数 迁移学习
在线阅读 下载PDF
基于Res2Net注意力机制网络智能检测CT肺动脉成像急性肺动脉栓塞
2
作者 李曼 蒋德攀 +5 位作者 王麦林 李艳若 张晗宇 王颖 张岚 黄婷婷 《中国医学影像学杂志》 北大核心 2025年第4期356-361,369,共7页
目的基于Res2Net注意力机制网络实现CT肺动脉成像急性肺动脉栓塞(APE)的智能检测。资料与方法回顾性收集2015年2月—2023年5月河南中医药大学第一附属医院疑似APE行CT肺动脉成像并确诊为APE的患者。按照7∶2∶1将数据随机分为训练集、... 目的基于Res2Net注意力机制网络实现CT肺动脉成像急性肺动脉栓塞(APE)的智能检测。资料与方法回顾性收集2015年2月—2023年5月河南中医药大学第一附属医院疑似APE行CT肺动脉成像并确诊为APE的患者。按照7∶2∶1将数据随机分为训练集、验证集和测试集。基于Res2Net网络框架,结合多孔空间金字塔池化和注意力机制模块训练模型,对模型进行五折交叉内部验证;在测试集上采用受试者工作特征曲线下面积、敏感度、特异度评估模型的诊断效能;同时采用戴斯相似系数、精确率、交集比并集(IOU)评估模型的分割效能并绘制相应曲线。比较该模型与经典的U-Net模型及CE-Net模型的效能。结果最终纳入303例APE患者,训练集212例,验证集61例,测试集30例。模型的曲线下面积为0.95,敏感度为0.90,特异度为1.00;戴斯相似系数为0.86,精确率为0.90,Pos-IOU为0.78,Neg-IOU为1.00。参数曲线图及雷达图显示Res2Net注意力机制网络多项参数均优于U-Net及CE-Net模型。分割对比的可视化结果显示Res2Net注意力机制网络对肺动脉栓子的分割精准度更高。结论Res2Net注意力机制网络模型对APE具有良好的检测性能。 展开更多
关键词 肺栓塞 CT肺动脉成像 体层摄影术 螺旋计算机 深度学习 res2Net 注意力机制
在线阅读 下载PDF
RES2Dinv反演资料快速成图方法研究
3
作者 张平 《矿产与地质》 2025年第5期1137-1146,共10页
文章提出一种基于GMT平台的自动化图件绘制方法,适用于RES2Dinv反演的三极激电测深数据处理。通过编写Bash脚本程序自动读取RES2Dinv导出的Surfer格式反演数据文件,并结合GMT模块和Linux命令定义和管理绘图参数,利用GMT软件的数据处理模... 文章提出一种基于GMT平台的自动化图件绘制方法,适用于RES2Dinv反演的三极激电测深数据处理。通过编写Bash脚本程序自动读取RES2Dinv导出的Surfer格式反演数据文件,并结合GMT模块和Linux命令定义和管理绘图参数,利用GMT软件的数据处理模块,对数据进行网格化、插值计算。最终,通过GMT绘图模块自动生成高分辨率矢量图件,并以子图形式呈现正向与反向三极实测数据、正演数据及二维反演数据的对比结果。该方法通过标准化流程提高绘图效率和质量,减少人工干预,实现高效、自动化的数据可视化处理,同时增强数据对比分析的直观性,有助于优化异常识别和地质解释。 展开更多
关键词 激发极化法 三极装置 res2Dinv反演资料 成图方法 GMT软件 脚本程序
在线阅读 下载PDF
基于ASP-SERes2Net的说话人识别算法 被引量:1
4
作者 令晓明 陈鸿雁 +1 位作者 张小玉 张真 《北京工业大学学报》 CAS 北大核心 2025年第1期42-50,共9页
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq... 为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(squeeze-and-excitation,SE)注意力模块;然后,用注意力统计池化(attention statistics pooling,ASP)代替原来的平均池化;最后,采用附加角裕度的Softmax(additive angular margin Softmax,AAM-Softmax)对说话人身份进行分类。通过实验,将ASP-SERes2Net算法与时延神经网络(time delay neural network,TDNN)、ResNet34和Res2Net进行对比,ASP-SERes2Net算法的最小检测代价函数(minimum detection cost function,MinDCF)值为0.0401,等误率(equal error rate,EER)为0.52%,明显优于其他3个模型。结果表明,ASP-SERes2Net算法性能更优,适合应用于噪声环境下的说话人识别。 展开更多
关键词 说话人识别 梅尔语谱图 res2Net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax)
在线阅读 下载PDF
融合Res2Net和部分卷积的带钢表面缺陷检测算法 被引量:3
5
作者 胡凯涛 马向华 +1 位作者 孙向宇 刘闯 《计算机工程与应用》 北大核心 2025年第5期334-343,共10页
为提升带钢表面缺陷的层次性特征提取能力和检测效率,提出基于多尺度表征和部分卷积(PConv)的快速检测网络(multi-scale and partially convolutional network,MSPC-Net)。将限制对比度自适应直方图均衡技术(contrast limited adaptive ... 为提升带钢表面缺陷的层次性特征提取能力和检测效率,提出基于多尺度表征和部分卷积(PConv)的快速检测网络(multi-scale and partially convolutional network,MSPC-Net)。将限制对比度自适应直方图均衡技术(contrast limited adaptive histogram equalization,CLAHE)引入到该模型以突出带钢表面的缺陷特征;在YOLOv5s的基础上新增检测层,提高对不同尺寸缺陷目标的检测率;设计了融合Res2Net的多尺度特征提取块并引入ECA注意力机制(BRE-block),既可以获取细粒度层面的特征,同时也增加了模型感受野;通过结合PConv减少了模型计算量(FLOPs),且增强了部分特征信息的聚合。在NEU-DET数据集上的实验结果表明,平均精度均值(mAP@IoU=0.5)达到了80.2%,较原基线网络提高了5.9个百分点;同时改进后网络的FPS达到157,远高于近期应用广泛的目标检测算法,有效提高了带钢表面缺陷的检测效率。 展开更多
关键词 对比度增强 多尺度特征提取 改进res2Net 融合PConv 信息聚合
在线阅读 下载PDF
基于改进Res2Net模型的当归叶片病虫害图像分类研究
6
作者 孔雅利 李佳珍 王联国 《软件工程》 2025年第12期11-15,共5页
为实现当归叶片病虫害检测需求,提出了一种基于改进Res2Net模型的当归叶片病虫害图像识别算法。首先,在骨干网络中引入CBAM(Convolutional Block Attention Module)卷积注意力机制;其次,调整残差块结构,优化数据归一化分布;最后,优化分... 为实现当归叶片病虫害检测需求,提出了一种基于改进Res2Net模型的当归叶片病虫害图像识别算法。首先,在骨干网络中引入CBAM(Convolutional Block Attention Module)卷积注意力机制;其次,调整残差块结构,优化数据归一化分布;最后,优化分类器结构,在全局平均池化层后增加全连接层,提高模型的表达能力。经验证:改进模型的准确率为98.52%,较原Res2Net模型提升1.98个百分点;精确率、召回率和F1值分别提升了2.09%、1.94%和2.01%。研究结果表明,该模型为当归叶片病虫害的精准防控和智能管理提供了技术支撑。 展开更多
关键词 当归病虫害 res2Net 特征提取 注意力机制 图像识别
在线阅读 下载PDF
一种用于中介轴承故障诊断的网络模型Res2APCNN
7
作者 田晶 王敬迪 +2 位作者 丁小飞 林政 高明浩 《仪器仪表学报》 北大核心 2025年第8期49-62,共14页
针对航空发动机中介轴承在强噪声背景下的健康监测问题,提出了一种结合数据融合和自适应注意力机制的多尺度残差神经网络(Res2APCNN)模型。首先,采用格拉姆角差场(GADF)、格拉姆角和场(GASF)以及马尔科夫转移场(MTF)方法,将轴承信号转... 针对航空发动机中介轴承在强噪声背景下的健康监测问题,提出了一种结合数据融合和自适应注意力机制的多尺度残差神经网络(Res2APCNN)模型。首先,采用格拉姆角差场(GADF)、格拉姆角和场(GASF)以及马尔科夫转移场(MTF)方法,将轴承信号转化为二维灰度图像,并将这3种图像分别映射至RGB的3个通道,构建复合彩色图像,从而增强对时间序列信息的捕获能力。其次,引入Res2Net模块,通过并行卷积操作提取不同尺度的信息,过滤噪声干扰并优化信息流动。再次,嵌入自适应并联特征融合模块,对各特征维度的重要性赋予差异化权重,对关键特征信号进行筛选和放大。最后,通过特征提取和分类模块输出中介轴承故障类型。采用意大利都灵理工大学、哈尔滨工业大学轴承数据集和自建试验台数据集对模型进行验证。实验结果表明,所提出的Res2APCNN模型在强噪声环境下表现出优异的故障诊断性能,与当前先进方法相比,在都灵理工大学数据集上,相较于IDRSN方法准确率提升了1.52%;在HIT数据集上,相较于MC-CNN方法准确率提升了6.65%;在自建数据集上,相较于Wen-CNN方法准确率提升了2.35%。此外,该模型的诊断准确率波动最小,稳定性最高。在强噪声条件下,Res2APCNN模型仍能保持较高的识别精度,展现出良好的抗干扰能力。 展开更多
关键词 中介轴承 故障诊断 自适应特征融合 res2Net
原文传递
基于RES2DMOD高密度电阻率法在采空区勘查中的应用 被引量:4
8
作者 王小玉 王璐 崔明飞 《华北地震科学》 2020年第S01期19-23,共5页
采用RES2DMOD高密度电阻率正演软件和RES2DINV高密度电阻率反演软件,选取有限差分法正演和最小二乘法反演的处理方法,对建立的三个不同采空区模型进行正、反演计算,研究地质体(采空区)的电阻率响应,并以在焦家金矿望儿山尾矿库区的具体... 采用RES2DMOD高密度电阻率正演软件和RES2DINV高密度电阻率反演软件,选取有限差分法正演和最小二乘法反演的处理方法,对建立的三个不同采空区模型进行正、反演计算,研究地质体(采空区)的电阻率响应,并以在焦家金矿望儿山尾矿库区的具体应用为例,验证了高密度电阻率法在采空区勘查中的有效性和可靠性,同时对反演结果做出解释和分析,结果表明高密度电阻率法在采空区勘查中具有一定的效果,最小二乘反演效果较好,可以进一步推广和使用。 展开更多
关键词 高密度电阻率法 采空区勘查 res2DMOD res2DINV
在线阅读 下载PDF
Res2-Unet深度学习网络的RGB-高光谱图像重建 被引量:16
9
作者 宋蓓蓓 马穗娜 +1 位作者 何帆 孙文方 《光学精密工程》 EI CAS CSCD 北大核心 2022年第13期1606-1619,共14页
针对高光谱成像设备价格昂贵而难以推广应用的问题,利用深度学习网络从易获得的RGB图像重建高质量的高光谱图像。提出的Res2-Unet深度学习网络以Unet框架为基础,以Res2Net为主要模块构建其骨干网络,可以在更加细粒度级别提取局部和全局... 针对高光谱成像设备价格昂贵而难以推广应用的问题,利用深度学习网络从易获得的RGB图像重建高质量的高光谱图像。提出的Res2-Unet深度学习网络以Unet框架为基础,以Res2Net为主要模块构建其骨干网络,可以在更加细粒度级别提取局部和全局的图像特征。引入通道注意力机制自适应调节通道特征响应,并在编解码间通过跳跃连接以充分融合不同尺度和不同深度的信息。最后在图像恢复与增强新趋势2020年国际挑战赛提供的数据集上进行训练和测试。实验结果表明,与自适应加权注意力机制网络、分层回归网络相比,提出的方法在平均相对绝对误差、均方根误差、峰值信噪比和平均光谱角制图等4种客观评价指标上均获得了最好的结果;在Clean赛道中平均峰值信噪比分别高出0.08 dB和1.73 dB,在Real World赛道中平均峰值信噪比分别高出0.72 dB和0.97 dB。对比高光谱参考图像与重建图像,无论是在图像的低频平坦区还是在图像的高频纹理区,提出方法均获得了更好的主观视觉效果。 展开更多
关键词 深度学习 高光谱图像 图像重建 res2Net 通道注意力机制
在线阅读 下载PDF
Res2Net融合注意力机制的YOLOv4目标检测算法 被引量:2
10
作者 张翔 刘振凯 +1 位作者 叶娜 赵妍祯 《计算机测量与控制》 2022年第9期213-220,227,共9页
针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一... 针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一个残差块内构造层次化的类残差连接,引入Res2Net替换原YOLOv4主干网络中的ResNet残差网络结构,可以获取到更细小的特征,同时也增加了模型感受野;其次将Res2Net与注意力机制相融合,获取关键特征信息,减轻因优化主干网络带来计算量增加的负担;最后通过改进CIOU损失,降低预测框与真实框之间的误差值,有效的解决因目标过小或者有遮挡时模型出现漏检误检等问题;在公开的PASCAL VOC数据集上进行验证,结果表明:RFAL YOLOv4模型的mAP达到了79.5%,比原模型提升了5.5%,改进后的模型具有较高的鲁棒性。 展开更多
关键词 目标检测 YOLOv4 res2Net 注意力机制 CIOU
在线阅读 下载PDF
垂直排列ReS2(1-x)Se2x合金纳米片的控制合成及带隙调控
11
作者 敖伟栋 刘妍 +5 位作者 马青山 刘欢 周斌 郑霄家 于东麒 张文华 《无机材料学报》 SCIE EI CAS CSCD 北大核心 2018年第10期1083-1088,共6页
二维过渡金属硫属化合物具有优异的电学和光学特性,形貌控制及带隙调控对于其在光电子学、光子学、纳米电子学领域中的应用至关重要。研究采用CVD技术在SiO_2/Si衬底上生长了垂直排列ReS_2纳米片材料,硒化处理后得到ReS_(2(1-x))Se_(2x... 二维过渡金属硫属化合物具有优异的电学和光学特性,形貌控制及带隙调控对于其在光电子学、光子学、纳米电子学领域中的应用至关重要。研究采用CVD技术在SiO_2/Si衬底上生长了垂直排列ReS_2纳米片材料,硒化处理后得到ReS_(2(1-x))Se_(2x)合金纳米片,并研究了硒化温度(700、850和920℃)及硒化时间(0.5、1和1.5h)对ReS_(2(1-x))Se_(2x)合金纳米片形貌及组分的影响。XPS元素定量分析及紫外–可见–近红外吸收光谱研究表明ReS_(2(1-x))Se_(2x)样品中Se含量可以在x=0(纯ReS_2)到x=0.86之间调变,相应材料的带隙可从1.55eV(800nm)调变到1.28eV(969 nm)。SEM结果显示ReS_(2(1-x))Se_(2x)纳米片的结构受到硒化温度和硒化时间的影响,硒化温度升高和硒化时间延长会破坏纳米片的垂直结构。上述结果表明本研究成功合成了垂直排列ReS_(2(1-x))Se_(2x)合金纳米片,该材料在电化学催化、功能电子器件和光电子器件方面具有潜在应用价值。 展开更多
关键词 res2(1-x)Se2x res2 硒化 垂直排列 带隙调控
在线阅读 下载PDF
基于Res2Net的人脸表情识别方法 被引量:2
12
作者 唐宏伟 丁祥 +3 位作者 邓嘉鑫 高方坤 罗佳强 王军权 《邵阳学院学报(自然科学版)》 2024年第2期28-35,共8页
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据... 为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。 展开更多
关键词 表情识别 Focal Loss函数 广义平均池化模块 res2Net50
在线阅读 下载PDF
基于Res2-UNet模型的皮带煤量检测
13
作者 成彦颖 白尚旺 《计算机与数字工程》 2023年第7期1635-1639,共5页
为了能够检测煤矿井下的煤量,预测和提高煤的利用率,同时节省电能,减少人力的监管和资源成本。利用煤矿安装的视频监控系统,采用非接触的方式通过Camshift算法对快速运动皮带上的煤量捕捉和跟踪,然后建立Res2-UNet模型来获得显著性信息... 为了能够检测煤矿井下的煤量,预测和提高煤的利用率,同时节省电能,减少人力的监管和资源成本。利用煤矿安装的视频监控系统,采用非接触的方式通过Camshift算法对快速运动皮带上的煤量捕捉和跟踪,然后建立Res2-UNet模型来获得显著性信息,融合灰度、纹理、边缘等特征到单一的网络中,实现了皮带煤量的检测。模型利用U-Net网络的思想以编码器-解码器为架构,编码器以Res2Net网络为骨干网络提取煤流不同层次特征的信息,解码器通过反卷积上采样操作恢复图像尺寸。经过构建皮带数据集训练和测试模型,实验结果表明,提出的方法能够快速准确地检测出皮带上的煤料,精确率达到95.5%,每张图像从输入网络到输出的运行时间为4.8s。表明该方法具有一定的实用性和有效性。 展开更多
关键词 煤量检测 CAMSHIFT算法 编码器-解码器 res2-UNet模型 U-Net网络 res2Net网络
在线阅读 下载PDF
基于Res2Net-RetinaNet的活性污泥指示性微生物目标检测
14
作者 赵立杰 鲁茜 +1 位作者 黄明忠 王国刚 《化工自动化及仪表》 CAS 2024年第5期785-795,共11页
活性污泥中原生动物、后生动物等指示性微生物是污水处理运行调控的重要指标。针对活性污泥微生物不同种类之间,小目标类微生物体型较小、微生物个体颜色背景和图像颜色背景相似的现象,提出基于Res2Net-RetinaNet的活性污泥指示性微生... 活性污泥中原生动物、后生动物等指示性微生物是污水处理运行调控的重要指标。针对活性污泥微生物不同种类之间,小目标类微生物体型较小、微生物个体颜色背景和图像颜色背景相似的现象,提出基于Res2Net-RetinaNet的活性污泥指示性微生物检测方法。Res2Net-RetinaNet模型采用精度更高的新维度残差块Res2Net模块捕获原有特征的丰富信息。在主干网络输出的第1层引入通道和空间注意力机制CBAM,进一步帮助浅层特征信息在网络中流动。最后,在特征融合模块中引入深度超参数化卷积(Do-Conv),在不增加计算量的前提下持续加快模型的收敛。将所提方法应用于某污水厂采集数据中进行实验,结果表明:所提方法与Fast R-CNN、SSD、YOLOv3、YOLOv4、FCOS、CenterNet及RetinaNet等目标检测模型相比,检测精度最高(92.8%),相对于原始RetinaNet目标检测算法精度提升4.97%。 展开更多
关键词 res2Net-RetinaNet 污水处理 微生物 目标检测 res2Net模块 CBAM注意力机制 深度超参数化卷积
在线阅读 下载PDF
RES2DINV在粤北某铅锌矿区激电测深反演中的应用 被引量:15
15
作者 韦乙杰 袁忠明 《物探与化探》 CAS CSCD 2013年第5期827-829,共3页
在粤北某铅锌矿矿区进行的直流激电测深工作中,通过修改激电测量数据格式,用RES2DINV软件进行反演,推测了3个矿体的产状。后经钻探验证,推测结果跟钻探揭露结果基本一致。
关键词 res2DINV 激电测深 二维反演 铅锌矿
在线阅读 下载PDF
RES2DINV在江西清江盆地常规电测深数据反演中的应用 被引量:10
16
作者 刘迁 陈建国 张焱孙 《地球物理学进展》 CSCD 北大核心 2018年第6期2416-2427,共12页
自20世纪60年代起,清江盆地开展了大量常规电测深工作,积累了丰富的资料.如何充分利用这些历史电测深数据开展二次开发以精细化揭示盆地构造是近年地矿工作的重点.为此,本文尝试利用业界成熟的高密度电法反演软件Res2dinv来开展精细化... 自20世纪60年代起,清江盆地开展了大量常规电测深工作,积累了丰富的资料.如何充分利用这些历史电测深数据开展二次开发以精细化揭示盆地构造是近年地矿工作的重点.为此,本文尝试利用业界成熟的高密度电法反演软件Res2dinv来开展精细化反演工作,系统分析了其数据格式与常规电测深数据的异同,研究了常规电测深数据格式转换方法,并对研究区1:20万、1:5万对称四极电测深数据进行了格式转换.通过高密度电法反演软件Res2dinv,对清江盆地不同比例尺的电测深数据进行二维剖面反演及地质解译.结合研究区部分钻孔资料,推测形成于印支—燕山期的临江洋湖凹陷、南部断陷带区内尚可能保存有一定厚度的二迭系地层.根据油气评价的生、储、盖条件可知,中央坳陷带内的临江洋湖凹陷、太平街凹陷依然具有良好的海相生油条件,中新生界地层埋深较大、盖层较厚,临江洋湖深凹陷附近的次级构造如游村、兰溪街隆起、敬礼村构造则可作为良好的储油构造,具有一定的找油气前景,值得进行深入研究探讨. 展开更多
关键词 高密度电法 res2DINV 对称四极电测深 清江盆地 二维反演
原文传递
基于Ghost-SE-Res2Net的多模型融合语音唤醒词检测方法 被引量:2
17
作者 虞秋辰 周若华 袁庆升 《计算机工程》 CAS CSCD 北大核心 2024年第3期52-59,共8页
语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测... 语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测窗,均基于轻量化的挤压与激励残差网络(SE-Res2Net)模块,即GhostSE-Res2Net,SE-Res2Net结构的多尺度机制可显著提升WWD的能力。在Ghost-SE-Res2Net中,首先使用Ghost卷积替换SE-Res2Net中的普通卷积以降低模型参数量,然后使用注意力池化层替换SE-Res2Net中的全局平均池化层进一步提升WWD能力。在实际检测时融合连续3个小检测窗模型的检测结果的最大值和1个大检测窗模型的检测结果,来判断唤醒词是否被触发。在训练时引入困难样本挖掘算法,选择性地学习较难检测的唤醒词信息以提高分类模型的检测性能。在包含2个唤醒词的Mobvoi数据集上评估系统性能,实验结果表明,在每小时0.5次错误唤醒的情况下,该系统在2个唤醒词上的错误拒绝率分别为0.46%和0.43%,实现了与先进基线相似的性能,并且系统参数量比基线少31%。 展开更多
关键词 唤醒词检测 Ghost模块 res2Net结构 错误拒绝 多模型融合
在线阅读 下载PDF
一种利用SE-Res2Net的合成语音检测系统 被引量:4
18
作者 梁超 高勇 《无线电工程》 北大核心 2022年第9期1560-1565,共6页
传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅... 传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅尔倒谱系数(Mel Frequency Cepstral Coefficients, MFCC)+逆梅尔倒谱系数(Inverse Mel Frequency Cepstral Coefficients, IMFCC)的双通道语音特征作为合成语音检测的前端特征,在后端分类器上串联Res2Net网络和SENet网络组合成SE-Res2Net网络来提升模型的泛化能力。将不同特征与模型的打分结果融合,进一步提高实验性能。在ASVspoof2019数据集上的实验结果表明,该设计的合成语音检测系统能有效检测合成语音,与ASVspoof2019比赛的基线系统相比,融合模型的等错误概率(Equal Error Rate, EER)与串联成本检测函数(tandem Detection Cost Function, t-DCF)分别降低了49%和64%。 展开更多
关键词 合成语音检测 res2Net 经验模式分解 SENet 等错误概率 串联成本检测函数
在线阅读 下载PDF
基于CA-Res2Net和可变形卷积的图像去模糊方法 被引量:1
19
作者 李武斌 李春国 杨绿溪 《无线电通信技术》 2022年第5期945-950,共6页
针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时... 针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时CADNet嵌入了细粒度多尺度的残差模块,可以在更细粒度的层次上表示图片的多尺度特征信息,从而可以获得更强的特征表示能力。实验结果表明,CADNet是一种高效的去模糊算法,在获得更高去模糊性能的同时,压制住了计算开销。 展开更多
关键词 图像去模糊 非均匀模糊 可变形卷积 通道注意力 res2Net
在线阅读 下载PDF
RES2DINV在柬埔寨马德望省Phnom Prek金矿区激电测深反演中的应用 被引量:2
20
作者 姜鸿 路利春 +3 位作者 张佩 李陇锋 刘俊先 谢凡 《矿产勘查》 2021年第6期1395-1404,共10页
柬埔寨马德望省Phnom Prek金矿区地质工作程度很低,基础地质资料薄弱,区内农田植被覆盖很大,表生氧化矿民采多年,地下原生矿信息较少。为了快速获取已知几处矿点的激发极化特征并在外围开展成矿预测,本研究在几处金矿点及其外围开展激... 柬埔寨马德望省Phnom Prek金矿区地质工作程度很低,基础地质资料薄弱,区内农田植被覆盖很大,表生氧化矿民采多年,地下原生矿信息较少。为了快速获取已知几处矿点的激发极化特征并在外围开展成矿预测,本研究在几处金矿点及其外围开展激电中梯测量,圈定三处与地表矿(化)关系密切的ηs异常。针对重点异常布设激电测深剖面并采用RES2DINV软件进行二维反演,对测深剖面进行地质解译推断,对矿(化)体在中深部赋存状态进行预测。经硐探工程验证揭示,中深部矿(化)体产态变化较为复杂,与反演结果吻合,取得良好的应用效果,为区内成矿预测奠定良好的基础。 展开更多
关键词 激电测深 反演 res2DINV 金矿
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部