期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于DenseNet和迁移学习的声纹识别方法
1
作者 陈润强 王卫辰 +1 位作者 徐亚博 李烈 《现代电子技术》 北大核心 2026年第2期171-177,共7页
传统的声纹识别方法受环境噪声和个体变化等因素的影响,准确率难以进一步提升。为此,提出一种基于DenseNet和迁移学习的语谱图声纹识别方法,以进一步提高声纹识别系统的性能。使用DenseNet的声纹识别模型对源域语音进行训练;采用迁移学... 传统的声纹识别方法受环境噪声和个体变化等因素的影响,准确率难以进一步提升。为此,提出一种基于DenseNet和迁移学习的语谱图声纹识别方法,以进一步提高声纹识别系统的性能。使用DenseNet的声纹识别模型对源域语音进行训练;采用迁移学习将源域训练的DenseNet模型迁移到目标域训练数据;在目标域测试数据上验证迁移后模型的性能,并对比分析迁移前后DenseNet模型和ResNet模型的声纹识别性能。实验结果表明,与原始ResNet模型、DenseNet模型和经迁移学习的ResNet模型相比,经迁移学习的DenseNet模型的识别准确率分别提高了3.89%、6.67%和3.34%,且具有较快的收敛速度。 展开更多
关键词 声纹识别 DenseNet 迁移学习 语谱图 ResNet 语音信号处理
在线阅读 下载PDF
基于声纹脊线化和元学习的变压器故障诊断方法
2
作者 曲朝阳 刘谊豪 +2 位作者 曲楠 姜涛 徐晓宇 《电力系统保护与控制》 北大核心 2025年第13期163-174,共12页
针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(se... 针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(selective encoder, SE)加深时频与形态表征的关联度,提升模型收敛速度。最后,构造元学习网络评估变压器状态,并引入基于OD-Reptile的一阶梯度更新策略,通过内外循环优化机制增强参数泛化性,从而实现少样本、信息干扰条件下的高精度声纹诊断。相较于R-WDCNN、LSTM、CNN等传统深度学习信号诊断方法,该方法在低样本、高噪声环境下(SNR为-12 dB),收敛轮数减少10轮以上。同时,准确率分别提高6.35%,12.1%和16.93%。实验结果显示,所提方法在准确性、抗噪性、鲁棒性以及泛化性方面均有显著提升。 展开更多
关键词 声纹 小样本 脊线化 时频谱图 选择性编码 元学习 故障诊断
在线阅读 下载PDF
基于深度学习的声纹识别的研究综述 被引量:1
3
作者 陈浩南 王坤赤 汤敏 《智能计算机与应用》 2025年第4期132-138,共7页
声纹识别受到环境噪声、说话人的情绪状态、身体状况等因素影响。为了提高声纹识别的可靠性,利用特征学习的深度学习方法得到广泛关注。深度学习是基于深层神经网络模型和方法的机器学习,在众多领域都展现出了令人瞩目的应用潜力,例如... 声纹识别受到环境噪声、说话人的情绪状态、身体状况等因素影响。为了提高声纹识别的可靠性,利用特征学习的深度学习方法得到广泛关注。深度学习是基于深层神经网络模型和方法的机器学习,在众多领域都展现出了令人瞩目的应用潜力,例如语音识别、语音情感识别、语音分离等。本文聚焦于深度学习在声纹识别领域的应用研究。首先,概述声纹识别研究的基础知识,包括声纹特征提取、准确率的计算方法等。接着,探讨深度学习中基于CNN、RegNet、RNN的各种神经网络框架,并对其当前发展状况进行总结与分析。最后,还对声纹识别的未来发展趋势进行展望,包括语谱图实现和神经网络模型构建。目前,相较于传统的声纹识别,基于深度学习的声纹识别模型在识别准确率上已经获得显著提升,平均准确率能够达到90%以上。 展开更多
关键词 声纹识别 语音特征提取 语谱图 深度学习 神经网络
在线阅读 下载PDF
基于声谱图与改进残差网络的断路器故障诊断研究 被引量:3
4
作者 曹健 陈杉杉 +2 位作者 包锡军 从乐瑶 周菁 《机械与电子》 2025年第3期9-15,共7页
针对传统开关柜故障监测装置效果不显著,难以及时发现设备运行时的缺陷,以及现有声纹识别故障诊断方法应用于断路器故障诊断中存在识别准确率低的问题,提出了基于声谱图特征的SE ResNet深度学习神经网络识别模型。首先对声音信号进行声... 针对传统开关柜故障监测装置效果不显著,难以及时发现设备运行时的缺陷,以及现有声纹识别故障诊断方法应用于断路器故障诊断中存在识别准确率低的问题,提出了基于声谱图特征的SE ResNet深度学习神经网络识别模型。首先对声音信号进行声谱图(Spectrogram)特征提取,保留了声音信号的细节,提取出音频信号中的瞬态特性和非稳态特性。随后通过识别模型进行故障诊断。通过实验,针对不同模型以及不同特征提取方式进行比较,验证了所提方法的有效性和优越性。 展开更多
关键词 断路器 声纹识别 声谱图特征
在线阅读 下载PDF
融合卷积神经网络与线性回归的带式输送机托辊故障音频识别方法
5
作者 陈湘源 秦伟 +1 位作者 刘晏驰 罗明华 《煤炭科学技术》 北大核心 2025年第S1期389-398,共10页
针对煤矿井下带式输送机托辊故障音频识别中存在的声源复杂、特征不显著等问题,提出一种融合卷积神经网络与线性回归的托辊故障音频识别方法。首先通过带式输送机巡检机器人搭载的MEMS拾音器采集托辊沿线音频信号,基于小波自相关去噪技... 针对煤矿井下带式输送机托辊故障音频识别中存在的声源复杂、特征不显著等问题,提出一种融合卷积神经网络与线性回归的托辊故障音频识别方法。首先通过带式输送机巡检机器人搭载的MEMS拾音器采集托辊沿线音频信号,基于小波自相关去噪技术对声音进行预处理,抑制音频信号中的背景噪声信号,优化数据质量。其次利用声纹谱分离技术,采用HPSS(谐波冲击波源分离)方法分离出谐波、冲击波分量,增强托辊故障声音信号特征;基于MFCC(梅尔频率倒谱系数)声纹特征提取方法,解析出谐波-冲击波中托辊声纹特征信息,生成声谱图,提升托辊故障声纹表征能力。最后以声谱图与声品质特征为数据源,融合故障多模态特征,丰富数据维度,基于残差卷积神经网络结构计算图像特征,多元线性回归快速拟合音频基本特征,生成融合卷积神经网络与线性回归的托辊故障音频识别模型进行联合训练,通过Focal Loss损失函数优化模型训练的样本权重,提高模型对托辊故障识别的准确率。用该方法对国能榆林郭家湾煤矿实际采集的带式输送机故障托辊音频信息进行分析验证,结果表明:托辊故障检出率达到95.79%,检出准确率达到95.60%。 展开更多
关键词 托辊故障 音频识别 声纹特征 声谱图 残差卷积神经网络 多元线性回归
在线阅读 下载PDF
DenseNet在声纹识别中的应用研究 被引量:11
6
作者 张玉杰 张赞 《计算机工程与科学》 CSCD 北大核心 2022年第1期132-137,共6页
为了提高声纹识别技术的识别性能,将DenseNet应用于语谱图实现声纹识别,从提高网络的运算效率和增强声纹特征的表征能力2个方面对DenseNet进行优化,提出采用深度可分离卷积来减少网络的参数量,以及增加中心损失函数项来提高声纹特征的... 为了提高声纹识别技术的识别性能,将DenseNet应用于语谱图实现声纹识别,从提高网络的运算效率和增强声纹特征的表征能力2个方面对DenseNet进行优化,提出采用深度可分离卷积来减少网络的参数量,以及增加中心损失函数项来提高声纹特征的表征能力。从训练结果可以看出,通过深度可分离卷积,网络的参数量减少了25.5%,模型大小减少了24.6%;从仿真结果可以看出,中心损失项的增加使声纹特征的聚类效果更加明显,提高了声纹特征的表征能力。因此,改进后的DenseNet在语谱图声纹识别领域取得了好的识别效果。 展开更多
关键词 声纹识别 语谱图 DenseNet 深度可分离卷积 中心损失函数
在线阅读 下载PDF
不同手机及不同通信网络通话录音质量评析 被引量:1
7
作者 申小虎 金恬 +1 位作者 王雷 韩朝阳 《刑事技术》 2021年第6期587-593,共7页
目的为送检手机通话录音质量的审查提供理论依据。方法提出一种定量化的语音检材质量评价标准,并对不同手机及不同通信网络下的录音进行质量评价。该标准基于主流鉴定设备,涵盖了声学语谱图共振峰个数及数值、基频参数、区域平均频谱等... 目的为送检手机通话录音质量的审查提供理论依据。方法提出一种定量化的语音检材质量评价标准,并对不同手机及不同通信网络下的录音进行质量评价。该标准基于主流鉴定设备,涵盖了声学语谱图共振峰个数及数值、基频参数、区域平均频谱等分析方法以及声纹比对测试。结果实验结果显示,不同条件下得到的通话录音质量存在一定的差异性,会对声纹图谱鉴定产生一定影响,但并不会造成本质性差异。结论语音同一认定中,对基于移动通信网络获取的检材录音应考虑到通话语音质量的差异性对检验的影响,并在鉴定分析中加以评估和克服。 展开更多
关键词 移动通信 录音质量 语音同一鉴定 声纹图谱
在线阅读 下载PDF
基于CNN-LSTM网络的声纹识别研究 被引量:21
8
作者 闫河 董莺艳 +2 位作者 王鹏 罗成 李焕 《计算机应用与软件》 北大核心 2019年第4期166-170,共5页
传统声纹识别方法过程复杂,模型识别准确率低,是声纹识别应用发展的关键问题。利用深度学习具有自主特征提取及分类的特点,结合卷积神经网络(CNN)和长短期记忆网络(LSTM),提出一种结合的网络模型学习声纹识别特征及对其进行身份认证。... 传统声纹识别方法过程复杂,模型识别准确率低,是声纹识别应用发展的关键问题。利用深度学习具有自主特征提取及分类的特点,结合卷积神经网络(CNN)和长短期记忆网络(LSTM),提出一种结合的网络模型学习声纹识别特征及对其进行身份认证。将原始语音转换为固定长度语谱图,顺序进入CNN、LSTM,结合网络进行训练以及声纹特征学习。通过对比CNN、LSTM以及DNN网络,验证CNN-LSTM网络在声纹识别中具有较少迭代次数情况下高准确率的特性。经实验结果可以得出,语音空间特征及时序特征均是声纹识别中重要的影响因素,实验中的CNN-LSTM网络模型准确率达到95.42%,损失低值达到0.097 3。该方法有利于实际声纹识别的应用。 展开更多
关键词 声纹识别 CNN-LSTM网络 语谱图 时序特征
在线阅读 下载PDF
基于LSTM神经网络的声纹识别 被引量:19
9
作者 刘晓璇 季怡 刘纯平 《计算机科学》 CSCD 北大核心 2021年第S02期270-274,共5页
声纹识别利用说话人生物特征的个体差异性,通过声音来识别说话人的身份。声纹具有非接触、易采集、特征稳定等特点,应用领域十分广泛。现有的统计模型方法具有提取特征单一、泛化能力不强等局限性。近年来,随着人工智能深度学习的快速发... 声纹识别利用说话人生物特征的个体差异性,通过声音来识别说话人的身份。声纹具有非接触、易采集、特征稳定等特点,应用领域十分广泛。现有的统计模型方法具有提取特征单一、泛化能力不强等局限性。近年来,随着人工智能深度学习的快速发展,神经网络模型在声纹识别领域崭露头角。文中提出基于长短时记忆(Long Short-Term Memory,LSTM)神经网络的声纹识别方法,使用语谱图提取声纹特征作为模型输入,从而实现文本无关的声纹识别。语谱图能够综合表征语音信号在时间方向上的频率和能量信息,表达的声纹特征更加丰富。LSTM神经网络擅长捕捉时序特征,着重考虑了时间维度上的信息,相比其他神经网络模型,更契合语音数据的特点。文中将LSTM神经网络长期学习的优势与声纹语谱图的时序特征有效结合,实验结果表明,在THCHS-30语音数据集上取得了84.31%的识别正确率。在自然环境下,对于3 s的短语音,该方法的识别正确率达96.67%,与现有的高斯混合模型和卷积神经网络方法相比,所提方法的识别性能更优。 展开更多
关键词 声纹识别 长短时记忆 语谱图 神经网络 深度学习
在线阅读 下载PDF
基于卷积神经网络的雄性海南长臂猿声纹识别 被引量:10
10
作者 冯慧敏 金崑 《林业科学》 EI CAS CSCD 北大核心 2023年第1期119-127,共9页
【目的】利用鸣叫声对雄性海南长臂猿个体进行识别,为海南长臂猿种群智能感知和监测及海南热带雨林国家公园智慧保护地建设提供支撑。【方法】许多研究证明某些物种鸣叫的声音具有个体差异,这种差异可以作为一种声音指纹来对物种个体进... 【目的】利用鸣叫声对雄性海南长臂猿个体进行识别,为海南长臂猿种群智能感知和监测及海南热带雨林国家公园智慧保护地建设提供支撑。【方法】许多研究证明某些物种鸣叫的声音具有个体差异,这种差异可以作为一种声音指纹来对物种个体进行识别。本研究基于雄性海南长臂猿鸣叫声谱的特征以及声纹识别的基本原理,提出基于卷积神经网络的声纹识别的方法,通过采用主动声学监测和被动声学监测2种方法收集海南长臂猿鸣叫的原始数据,对原始数据进行预处理,将7只雄性海南长臂猿鸣叫短语中的调频音符组合的声谱图作为输入。通过搭建卷积神经网络和残差卷积神经网络2种模型,7只雄性海南长臂猿鸣叫声谱中提取声纹特征并进行分类,实现个体识别。【结果】通过五折交叉验证得出卷积神经网络模型识别正确率为91.2%,识别效果标准差为4.24%。残差卷积神经网络模型识别正确率为95.04%,识别效果标准差为2.97%。相比卷积神经网络,残差卷积神经网络识别准确率更高,且分类效果更加稳定,但是计算耗时更长。【结论】利用卷积神经网络模型和残差卷积神经网络模型对雄性海南长臂猿鸣叫声谱图进行分类并实现个体识别是可靠的,本方法可以应用于对海南长臂猿的声纹识别。相比卷积神经网络,残差卷积神经网络模型识别的稳定性更好,且分类效果提高3.84%,达到95.04%。但从应用性上而言,对比残差卷积神经网络,卷积神经网络模型训练成本更低,推理计算速度更快,且准确率和预测稳定性达到应用要求。基于卷积神经网络的声纹识别方法克服了许多现有方法中存在的计算和数据集的限制,为将来其他物种的声纹识别研究提供了更好的解决方案。 展开更多
关键词 海南长臂猿 海南热带雨林国家公园 声谱图 卷积神经网络 声纹识别
在线阅读 下载PDF
基于LSTM神经网络的电抗器故障声纹识别方法 被引量:10
11
作者 曹力潭 魏华兵 +1 位作者 黄智 石明垒 《浙江电力》 2023年第4期114-120,共7页
高压电抗器是保障电力系统安全稳定运行的重要设备之一,针对高压电抗器故障难以被准确识别的问题,提出了基于LSTM(长短期记忆)神经网络的高压电抗器故障声纹识别方法。首先对一台高压电抗器运行时产生的声纹信号进行收集,然后将声纹信... 高压电抗器是保障电力系统安全稳定运行的重要设备之一,针对高压电抗器故障难以被准确识别的问题,提出了基于LSTM(长短期记忆)神经网络的高压电抗器故障声纹识别方法。首先对一台高压电抗器运行时产生的声纹信号进行收集,然后将声纹信号分为若干个声纹片段后转换为语谱图,并使用Mel时频谱降维处理,最后采用LSTM网络对语谱图进行高压电抗器故障识别。实验结果表明,所提出的方法实现了高压电抗器故障的智能化诊断,有效提高故障识别的精准度,减少故障检测时所需投入的人力,助推电网安全监测智能化水平的提升。 展开更多
关键词 高压电抗器 长短期记忆网络 声纹识别 故障 语谱图
在线阅读 下载PDF
基于变压器声纹Mel语谱图-ResNet的铁心松动故障诊断 被引量:9
12
作者 何萍 李勇 +3 位作者 陈寿龙 许洪华 朱雷 王凌燕 《电机与控制应用》 2022年第9期75-80,共6页
为实现变压器铁心松动故障的识别,提出基于变压器声纹的ResNet卷积神经网络(CNN)用作铁心松动故障的识别,分别比较了相同卷积神经网络ResNet在交叉熵损失函数(SE-ResNet-Dense)和特征表达的角度空间中最大化分类界限的加性角度裕度损失... 为实现变压器铁心松动故障的识别,提出基于变压器声纹的ResNet卷积神经网络(CNN)用作铁心松动故障的识别,分别比较了相同卷积神经网络ResNet在交叉熵损失函数(SE-ResNet-Dense)和特征表达的角度空间中最大化分类界限的加性角度裕度损失函数(SE-ResNet-ArcLoss)不同表现效果。通过变压器空载试验采集变压器铁心在额定预紧力、松动20%、松动40%时的噪声信号,通过离散傅里叶变换将采集的声纹信号生成时频矩阵,并使用Mel滤波器对时频矩阵降维生成尺寸大大缩小的Mel-语谱图。将采集的噪声信号制作成数据集后输入到两种模型中训练,最终测试集在模型SE-ResNet-Dense上的预测结果为90.753%,在模型SE-ResNet-ArcLoss上的预测结果为97.541%。结果验证SE-ResNet-ArcLoss最适用于变压器铁心松动故障识别。 展开更多
关键词 变压器声纹 铁心松动故障 Mel语谱图 卷积神经网络 故障识别
在线阅读 下载PDF
基于RegNet神经网络的声纹识别 被引量:2
13
作者 黄一舟 崔璨 李增 《智能计算机与应用》 2024年第8期197-202,共6页
通过寻找RegNet神经网络的最佳宽度、神经元权重和偏置等参数的最优组合,将优化后的RegNet神经网络应用于语谱图的识别,实现对语谱图的特征学习和分类,进而达到对声纹进行鉴定。实验结果表明,在使用相同的Thchs-30数据集训练下,RegNet... 通过寻找RegNet神经网络的最佳宽度、神经元权重和偏置等参数的最优组合,将优化后的RegNet神经网络应用于语谱图的识别,实现对语谱图的特征学习和分类,进而达到对声纹进行鉴定。实验结果表明,在使用相同的Thchs-30数据集训练下,RegNet网络与目前主流的卷积神经网络(CNN)和DenseNet识别方法相比,识别率分别高了11.75%和1.93%,并且达到收敛后具有更好的稳定性,相对于DenseNet和传统的CNN有更好的精确度和鲁棒性。 展开更多
关键词 声纹识别 语谱图 RegNet 卷积神经网络
在线阅读 下载PDF
基于分治方法的声纹识别系统模型反演
14
作者 张骏飞 张雄伟 孙蒙 《信息安全研究》 CSCD 北大核心 2024年第2期130-138,共9页
模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及... 模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及误差,采用分治法的思想逐层反演,并通过循环一致性的有效监督,成功重构与说话人身份一致的反演样本;另外,由于语音的特殊性,模型特征层已包含丰富的说话人信息,进一步减弱语义信息相似后,改进的方法显著提高了反演样本的识别准确率,表明反演所得语谱图中已含有有效表示说话人身份的信息.实验结果证明了模型反演在语谱图上的可行性,突出了提取此类语音特征信息的深度网络模型所带来的隐私信息泄露风险. 展开更多
关键词 模型反演 神经网络 声纹识别 语谱图 信息安全
在线阅读 下载PDF
声纹鉴定中鼻塞语声的研究
15
作者 孙戎 戚越峰 《科教文汇》 2012年第28期205-206,共2页
声纹鉴定技术在侦查实践中具有越来越重要的应用价值,而伪装语声鉴定是其重要的研究方向之一。本研究从伪装语声之一的鼻塞语声入手,采集了二十位大学生的鼻塞语声和正常语声作为试验样本,利用俄罗斯圣彼得堡语音中心的(SIS)语音分析系... 声纹鉴定技术在侦查实践中具有越来越重要的应用价值,而伪装语声鉴定是其重要的研究方向之一。本研究从伪装语声之一的鼻塞语声入手,采集了二十位大学生的鼻塞语声和正常语声作为试验样本,利用俄罗斯圣彼得堡语音中心的(SIS)语音分析系统对其语谱图进行比对分析。研究结果表明对于带有鼻音音节的词,正常语声在宽带声纹图中的共振峰的时长比鼻塞语声的共振峰的时长要长。而对于非鼻音音节的词,普通语声和捏鼻语声的共振峰时长在语谱图上基本没有改变。 展开更多
关键词 声纹鉴定 鼻塞语声 语谱图
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部