期刊文献+
共找到386篇文章
< 1 2 20 >
每页显示 20 50 100
A review of research on intelligent fault detection of power equipment based on infrared and voiceprint: methods, applications and challenges
1
作者 Xizhou Du Xing Lei +4 位作者 Ting Ye Yingzhou Sun Zewen Shang Zhiqiang Liu Tianyi Xu 《Global Energy Interconnection》 2025年第5期821-846,共26页
As modern power systems grow in complexity,accurate and efficient fault detection has become increasingly important.While many existing reviews focus on a single modality,this paper presents a comprehensive survey fro... As modern power systems grow in complexity,accurate and efficient fault detection has become increasingly important.While many existing reviews focus on a single modality,this paper presents a comprehensive survey from a dual-modality perspective-infrared imaging and voiceprint analysis-two complementary,non-contact techniques that capture different fault characteristics.Infrared imaging excels at detecting thermal anomalies,while voiceprint signals provide insight into mechanical vibrations and internal discharge phenomena.We review both traditional signal processing and deep learning-based approaches for each modality,categorized by key processing stages such as feature extraction and classification.The paper highlights how these modalities address distinct fault types and how they may be fused to improve robustness and accuracy.Representative datasets are summarized,and practical challenges such as noise interference,limited fault samples,and deployment constraints are discussed.By offering a cross-modal,comparative analysis,this work aims to bridge fragmented research and guide future development in intelligent fault detection systems.The review concludes with research trends including multimodal fusion,lightweight models,and self-supervised learning. 展开更多
关键词 Power equipment fault detection Infrared image voiceprint data Deep learning Traditional image processing voiceprint detection
在线阅读 下载PDF
Online Fault Monitoring of On-Load Tap-Changer Based on Voiceprint Detection 被引量:1
2
作者 Kitwa Henock Bondo 《Journal of Power and Energy Engineering》 2024年第3期48-59,共12页
The continuous operation of On-Load Tap-Changers (OLTC) is essential for maintaining stable voltage levels in power transmission and distribution systems. Timely fault detection in OLTC is essential for preventing maj... The continuous operation of On-Load Tap-Changers (OLTC) is essential for maintaining stable voltage levels in power transmission and distribution systems. Timely fault detection in OLTC is essential for preventing major failures and ensuring the reliability of the electrical grid. This research paper proposes an innovative approach that combines voiceprint detection using MATLAB analysis for online fault monitoring of OLTC. By leveraging advanced signal processing techniques and machine learning algorithms in MATLAB, the proposed method accurately detects faults in OLTC, providing real-time monitoring and proactive maintenance strategies. 展开更多
关键词 Online Fault Monitoring OLTC On-Load Tap Change voiceprint Detection
在线阅读 下载PDF
Adaptive Threshold Estimation of Open Set Voiceprint Recognition Based on OTSU and Deep Learning 被引量:1
3
作者 Xudong Li Xinjia Yang Linhua Zhou 《Journal of Applied Mathematics and Physics》 2020年第11期2671-2682,共12页
Aiming at the problem of open set voiceprint recognition, this paper proposes an adaptive threshold algorithm based on OTSU and deep learning. The bottleneck technology of open set voiceprint recognition lies in the c... Aiming at the problem of open set voiceprint recognition, this paper proposes an adaptive threshold algorithm based on OTSU and deep learning. The bottleneck technology of open set voiceprint recognition lies in the calculation of similarity values and thresholds of speakers inside and outside the set. This paper combines deep learning and machine learning methods, and uses a Deep Belief Network stacked with three layers of Restricted Boltzmann Machines to extract deep voice features from basic acoustic features. And by training the Gaussian Mixture Model, this paper calculates the similarity value of the feature, and further determines the threshold of the similarity value of the feature through OTSU. After experimental testing, the algorithm in this paper has a false rejection rate of 3.00% for specific speakers, a false acceptance rate of 0.35% for internal speakers, and a false acceptance rate of 0 for external speakers. This improves the accuracy of traditional methods in open set voiceprint recognition. This proves that the method is feasible and good recognition effect. 展开更多
关键词 voiceprint Recognition Deep Neural Network (DNN) OTSU Adaptive Threshold
在线阅读 下载PDF
基于深度自适应K-means++算法的电抗器声纹聚类方法 被引量:4
4
作者 闵永智 郝大宇 +2 位作者 王果 何怡刚 贺建山 《电力系统保护与控制》 北大核心 2025年第8期1-13,共13页
在高压并联电抗器声纹信号监测系统中,长时海量无标签声纹的高维非平稳性导致特征提取困难、无监督聚类适应性差。由此提出了一种基于深度自适应K-means++算法(deep adaptive K-means++clustering algorithm,DAKCA)的750 kV电抗器声纹... 在高压并联电抗器声纹信号监测系统中,长时海量无标签声纹的高维非平稳性导致特征提取困难、无监督聚类适应性差。由此提出了一种基于深度自适应K-means++算法(deep adaptive K-means++clustering algorithm,DAKCA)的750 kV电抗器声纹聚类方法。首先通过采用两阶段无监督策略微调的改进堆叠稀疏自编码器(stacked sparse autoencoder,SSAE),对快速傅里叶变换后的归一化频域数据提取电抗器原始声纹32维深度特征。进一步提出了依据最近邻聚类有效性指标(clustering validation index based on nearest neighbors,CVNN)的自适应K-means++聚类算法,构建了能自适应确定最优聚类个数的电抗器声纹聚类模型。最后通过西北地区某750 kV电抗器实测声纹数据集进行了验证。结果表明,DAKCA算法对无标签声纹数据在不同样本均衡程度下能够稳定提取32维深度特征,并实现最优聚类,为直接高效利用电抗器无标签声纹数据提供了参考。 展开更多
关键词 750 kV电抗器 声纹聚类 自适应聚类算法 稀疏自编码器 深度自适应K-means++算法
在线阅读 下载PDF
基于多层次特征图谱的高压并联电抗器声纹识别模型研究 被引量:1
5
作者 王果 贺建山 +2 位作者 闵永智 何怡刚 郝大宇 《高电压技术》 北大核心 2025年第6期3030-3042,I0036-I0037,共15页
在高压并联电抗器声纹在线监测领域,针对长时间序列特性的电抗器声信号复杂度高、数据维度大、能量分散导致声纹识别模型信息利用率低、鲁棒性和识别率不高的问题,提出了一种基于多层次特征图谱的改进ConvNeXt-T网络声纹识别模型。首先... 在高压并联电抗器声纹在线监测领域,针对长时间序列特性的电抗器声信号复杂度高、数据维度大、能量分散导致声纹识别模型信息利用率低、鲁棒性和识别率不高的问题,提出了一种基于多层次特征图谱的改进ConvNeXt-T网络声纹识别模型。首先,声信号通过点对称变换和类Gram矩阵图形化的细化频谱转换为时域、频域特征图谱,基于电抗器声纹特性提出50 Hz Gammatone滤波器组生成能量特征图谱;然后引入轻量级CA注意力机制,作为特征图谱自适应融合模块对ConvNeXt-T网络的输入侧进行改进;最后,结合实测数据验证了模型的优越性,结果表明所提模型在测试集上的平均识别准确率达97.82%,较单域图谱提升3.14%,较FCN、RsNet、ApR-IDRSN等对比模型提升6.51%,同时该模型在高斯白噪声、人声和鸟叫声环境中表现出最佳的抗噪性。该模型综合运用高维度多域特征提取方法和图形化降维表征方法,能显著提高特征丰富度和信息利用率。 展开更多
关键词 高压并联电抗器 声纹识别 特征图谱 ConvNeXt-T网络 抗噪性
原文传递
复杂噪声下基于鲁棒增强TimesNet的换流阀声纹异常检测
6
作者 唐明珠 俞昱 +5 位作者 左佳文 吴华伟 尹琛 魏颖 潘舒妍 熊富强 《南方电网技术》 北大核心 2025年第6期4-13,50,共11页
在电力系统中,实时监测换流阀的健康状态对于确保整个系统的可靠性与安全性至关重要。与传统的振动信号分析、温度监测等检测手段相比,声纹检测具有无接触、低成本等优势,然而在复杂多变的换流阀非本体背景噪声环境下,声纹异常检测模型... 在电力系统中,实时监测换流阀的健康状态对于确保整个系统的可靠性与安全性至关重要。与传统的振动信号分析、温度监测等检测手段相比,声纹检测具有无接触、低成本等优势,然而在复杂多变的换流阀非本体背景噪声环境下,声纹异常检测模型的性能往往达不到工业要求。针对该问题,提出了一种基于鲁棒增强TimesNet(RE-TimesNet)的换流阀声纹异常检测方法。该方法首先提取声纹数据的声学特征及其特征差分。然后,将特征集进行时频域掩码,进一步增强了特征集的鲁棒性。最后,采用基于Huber损失函数结合L2正则项和分组卷积的改进TimesNet异常检测模型识别异常模式。实验结果表明,RE-TimesNet在提高换流阀声纹异常检测的准确性、鲁棒性和运行速度方面具有显著的优势,能够缓解过拟合且轻量化神经网络模型。该方法为噪声环境下的换流阀声纹异常检测提供了有效的解决方案。 展开更多
关键词 换流阀 声纹 异常检测 特征工程 鲁棒性 无监督学习
在线阅读 下载PDF
基于RK3588的嵌入式声纹识别系统设计 被引量:1
7
作者 陈德富 周云龙 +2 位作者 陈国军 宋京洋 林永权 《自动化应用》 2025年第6期18-21,共4页
为了推动声纹识别技术在实时性、准确性和便捷性方面的发展,设计了一种基于RK3588嵌入式开发板的声纹识别系统。该系统使用Pytorch深度学习框架在PC端搭建ResCNN网络进行模型的训练和推理测试,随后通过模型转换将训练好的模型部署至RK3... 为了推动声纹识别技术在实时性、准确性和便捷性方面的发展,设计了一种基于RK3588嵌入式开发板的声纹识别系统。该系统使用Pytorch深度学习框架在PC端搭建ResCNN网络进行模型的训练和推理测试,随后通过模型转换将训练好的模型部署至RK3588平台。界面设计采用了PyQT5,实现了直观的用户操作。实验结果表明,声纹比对推理的准确率达到96%,等错误率(EER)为3.30%,平均每组比对耗时约0.1 s。该系统满足实时性要求,适用于需要快速声纹验证的应用场景。 展开更多
关键词 声纹识别 RK3588 ResCNN 模型部署
在线阅读 下载PDF
基于声纹脊线化和元学习的变压器故障诊断方法
8
作者 曲朝阳 刘谊豪 +2 位作者 曲楠 姜涛 徐晓宇 《电力系统保护与控制》 北大核心 2025年第13期163-174,共12页
针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(se... 针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(selective encoder, SE)加深时频与形态表征的关联度,提升模型收敛速度。最后,构造元学习网络评估变压器状态,并引入基于OD-Reptile的一阶梯度更新策略,通过内外循环优化机制增强参数泛化性,从而实现少样本、信息干扰条件下的高精度声纹诊断。相较于R-WDCNN、LSTM、CNN等传统深度学习信号诊断方法,该方法在低样本、高噪声环境下(SNR为-12 dB),收敛轮数减少10轮以上。同时,准确率分别提高6.35%,12.1%和16.93%。实验结果显示,所提方法在准确性、抗噪性、鲁棒性以及泛化性方面均有显著提升。 展开更多
关键词 声纹 小样本 脊线化 时频谱图 选择性编码 元学习 故障诊断
在线阅读 下载PDF
基于声阵列与SHO-VMD-FastICA的750kV电抗器声纹分离方法研究及应用
9
作者 王果 李宝鹏 +3 位作者 闵永智 何怡刚 贺建山 霍奕辰 《高电压技术》 北大核心 2025年第9期4588-4598,I0013-I0015,共14页
750 kV电抗器实测声纹信号中包含高低频段的干扰噪声,严重影响电抗器声纹识别精度,需要进行电抗器本体声纹分离。首先,采用声阵列采集750 kV电抗器声纹信号,并通过数据一致性检验算法对各阵元进行甄别,筛选有效阵元数据构建观测信号矩阵... 750 kV电抗器实测声纹信号中包含高低频段的干扰噪声,严重影响电抗器声纹识别精度,需要进行电抗器本体声纹分离。首先,采用声阵列采集750 kV电抗器声纹信号,并通过数据一致性检验算法对各阵元进行甄别,筛选有效阵元数据构建观测信号矩阵;然后,利用海马优化算法对变分模态分解算法的分解层数K与惩罚因子α进行寻优,进而根据最优参数组合[K,α]分解观测信号,并选取1 kHz以内的模态分量重构观测信号,实现高频干扰噪声的滤除;最后,采用快速独立成分分析法从多维降噪观测信号中分离出750 kV电抗器本体声纹信号。采用该方法分离所得750 kV电抗器本体声纹信号与对照信号的相似系数为0.954 2,信噪比为10.548 2 dB,与SCA算法相比分别提升6.63%和2.282 7 dB,表明该方法具有更高的适用性和准确性。 展开更多
关键词 750 kV电抗器 声纹分离 声阵列 变分模态分解 盲源分离
原文传递
基于声纹识别的永磁同步电机运行状态监测
10
作者 丁惜瀛 付直刚 马少华 《沈阳工业大学学报》 北大核心 2025年第2期145-151,共7页
【目的】在传统永磁电机故障监测领域,接触式信号虽被广泛使用,但通常只能反映电机的单一运行状态且信息量不足,难以识别永磁同步电机的全面运行状态。为丰富信息量,需要额外增加传感器,但这不仅增加了系统的复杂性,还提高了实际应用难... 【目的】在传统永磁电机故障监测领域,接触式信号虽被广泛使用,但通常只能反映电机的单一运行状态且信息量不足,难以识别永磁同步电机的全面运行状态。为丰富信息量,需要额外增加传感器,但这不仅增加了系统的复杂性,还提高了实际应用难度。因此,提高永磁电机状态监测的精度与便捷性成为重要的研究目标。随着智能化监测技术的发展,非接触式信号的应用越来越受到关注。永磁电机运行时产生的音频信号包含了丰富的状态信息,为故障诊断提供了新的方向。相较于接触式信号,音频信号能实时反映由故障引起的电机振动、噪声等特征,有较大的研究价值。然而这类信号易受环境噪声的干扰,导致信号质量差、特征信息不清晰,不利于永磁同步电机的状态监测。针对上述问题,提出了一种基于声纹识别的永磁同步电机深度学习模型,旨在通过深度学习技术高效地监测和诊断电机运行状态。【方法】采用小波去噪算法减少噪声干扰,提升信号质量,进而提升信噪比,确保模型能够更清晰地提取梅尔谱特征,为故障识别和分类奠定基础。然而,直接使用卷积神经网络提取梅尔谱特征可能会削弱特征间的关联性,影响故障识别的精度。引入空间注意力机制,通过加权增强特征的空间位置相关性,使模型关注最关键的部分,提高特征提取的有效性。为提升模型的识别准确率,对梅尔谱特征进行归一化处理,并采用AAM-softmax损失函数。该函数通过强化类间约束,提高模型在不同类别之间的区分能力,进而提升识别精度和泛化能力并优化训练过程,使模型更好地适应不同工况。【结果】仿真测试结果表明,所提出的模型在训练集上表现出色,能够准确识别电机的不同运行状态,并在测试集上展现出较强的泛化能力。实验结果证实,基于深度学习的声纹识别方法能够有效监测永磁电机的多种运行状态,准确度较高且实用性较强。【结论】基于声纹识别的永磁同步电机深度学习模型能够有效去除噪声并提取关键特征。通过引入空间注意力机制和AAM-softmax损失函数,显著提升了模型的识别精度和泛化能力。该模型具有广阔的发展前景,可广泛应用于永磁电机的状态监测与故障诊断,推动电机智能化维护技术的发展。 展开更多
关键词 电机监测 声纹识别 小波去噪 损失函数 空间注意力机制 永磁同步电机
在线阅读 下载PDF
基于GGD-EfficientNet和声纹识别的风力发电机齿轮箱故障诊断
11
作者 廖力达 陈伟克 +3 位作者 罗晓 舒王咏 张芝铭 代军 《太阳能学报》 北大核心 2025年第4期570-578,共9页
针对风力发电机齿轮箱齿轮故障时的噪声提出一种基于分组全局上下文网络(GE-GCNet)与深度可分离卷积(DSCConv)结合的效率神经网络(GGD-EfficientNet)和声纹识别的齿轮箱故障诊断方法。首先通过实验获取齿轮箱故障齿轮的噪声信号,并根据... 针对风力发电机齿轮箱齿轮故障时的噪声提出一种基于分组全局上下文网络(GE-GCNet)与深度可分离卷积(DSCConv)结合的效率神经网络(GGD-EfficientNet)和声纹识别的齿轮箱故障诊断方法。首先通过实验获取齿轮箱故障齿轮的噪声信号,并根据齿轮状态分为6类。然后,使用Log-Mel谱的方法提取噪声信号语谱图。考虑到效率卷积神经网络(EfficientNet)对齿轮故障语谱图特征提取能力不足等缺点,在EfficientNet的基础上,结合分组卷积改进的GE-GCNet和DSCConv,提出一种高性能的齿轮故障诊断模型GGD-EfficientNet。实验表明:所提方法能在齿轮箱故障齿轮语谱图数据集下准确率达到99.7%。所提模型能从数据集中对故障类型进行有效分类,可有效帮助诊断齿轮箱中齿轮故障。 展开更多
关键词 风力发电机 齿轮 故障检测 GGD-EfficientNet 声纹识别
原文传递
说话人识别综述 被引量:1
12
作者 张葛祥 曾鑫 +3 位作者 姚光乐 杨强 贾勇 朱明 《控制工程》 北大核心 2025年第2期251-264,共14页
说话人识别是一种利用人类语音中存在的与身份相关的特征来识别说话人身份的技术,也称为声纹识别。这项技术既是新一代人工智能的重要研究方向,也是计算机领域的研究热点,吸引了许多学者的关注与研究。首先,在结合以往和当前有关该领域... 说话人识别是一种利用人类语音中存在的与身份相关的特征来识别说话人身份的技术,也称为声纹识别。这项技术既是新一代人工智能的重要研究方向,也是计算机领域的研究热点,吸引了许多学者的关注与研究。首先,在结合以往和当前有关该领域的研究工作基础上,概括性地介绍了说话人识别的重要背景知识;然后,综述了以往工作,并从数据集、评估指标和相关比赛三部分对说话人识别系统性能评估进行了一个详细的梳理和归纳;最后,指出了在当前说话人识别方法中存在的难点与挑战。 展开更多
关键词 说话人识别 声纹识别 说话人欺诈 深度学习
原文传递
基于融合特征和残差神经网络的10 kV高压断路器机械故障声纹识别方法 被引量:4
13
作者 段梵 李先允 +2 位作者 单光瑞 陈兰杭 杨凯 《高压电器》 北大核心 2025年第3期205-213,共9页
针对传统10 kV高压断路器故障诊断方法过于依赖主观经验、准确率不高、泛化能力差的问题。提出了一种基于声学特征的10 kV高压断路器常见机械故障识别方法。首先,以(ZN63)12/630A型高压户内真空断路器为研究对象,设置常见的8种机械故障... 针对传统10 kV高压断路器故障诊断方法过于依赖主观经验、准确率不高、泛化能力差的问题。提出了一种基于声学特征的10 kV高压断路器常见机械故障识别方法。首先,以(ZN63)12/630A型高压户内真空断路器为研究对象,设置常见的8种机械故障,采集其分合闸时的声音作为检测信号;其次,将采集的故障声纹信号进行预处理,提取故障声纹信号的梅尔倒频谱系数(MFCC)特征、色度特征(chroma features)以及一维平均能量和频谱质心,并利用Fisher比舍弃贡献率低的分量,构成融合特征;最后以提取的融合特征作为诊断依据,构建基于残差神经网络的10 kV断路器机械故障诊断模型。结果表明文中方法对10 kV高压断路器常见的8种机械故障诊断识别准确率为99.99%。可作为当前检测手段的有效补充,提高高压断路器综合检测和潜伏性缺陷识别能力。 展开更多
关键词 10 kV高压断路器 声纹识别 融合特征 残差神经网络 故障诊断
在线阅读 下载PDF
基于改进MFCC-OCSVM和贝叶斯优化BiGRU的GIS异常工况声纹识别算法 被引量:4
14
作者 庄小亮 李乾坤 +3 位作者 刘紫罡 张禄亮 季天瑶 张长虹 《南方电网技术》 北大核心 2025年第1期30-40,共11页
为了准确识别气体绝缘开关柜(gas insulated switchgear,GIS)设备的异常工况,提出了一种基于加权梅尔频率谱系数单类支持向量机(Mel frequency cestrum coefficient-one class support vector machine,MFCC-OCSVM)和贝叶斯优化的门控循... 为了准确识别气体绝缘开关柜(gas insulated switchgear,GIS)设备的异常工况,提出了一种基于加权梅尔频率谱系数单类支持向量机(Mel frequency cestrum coefficient-one class support vector machine,MFCC-OCSVM)和贝叶斯优化的门控循环单元(bidirectional gate recurrent unit,BiGRU)声纹识别算法。首先,利用基于F统计量的MFCC对声纹数据进行加权特征提取,突出重要特征并减弱噪声的影响,然后利用OCSVM对加权后的特征进行异常检测并去除异常值,提高数据质量。为解决样本不平衡问题,采用合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)进行声纹样本的均衡。最后,应用基于贝叶斯优化的BiGRU模型进行声纹识别。以某气体绝缘全封闭组合电器(gas insulated switchgear,GIS)为例,采集了20类不同工况下操纵机构的声音样本,与多种经典分类模型进行对比。结果显示,所提算法取得的最高平均识别准确率达到了92.8%,相比于自适应增强、朴素贝叶斯和线性判别分析算法分别提升了30.1%、14.7%和11.5%。通过消融实验进一步评估和验证了所提算法各个流程对声纹识别的实际效果和性能影响,研究成果可为GIS设备异常工况的声纹识别提供高效技术路线。 展开更多
关键词 GIS设备 梅尔频谱倒谱系数 单类支持向量机 双向门控循环单元 声纹识别 贝叶斯优化
在线阅读 下载PDF
含源电网中复合储能式电子变压器声纹机械的协调控制 被引量:2
15
作者 吴海涵 李俊妮 +2 位作者 王维佳 孙飞 宋彦 《储能科学与技术》 北大核心 2025年第2期714-716,共3页
随着电网技术的不断发展,含源电网中复合储能式电力电子变压器的应用日益广泛。然而,在实际运行中,储能式电力电子变压器面临着电网电压跌落或中断等挑战,这对其稳定性和电能质量提出了更高要求。本文综述了基于声纹识别的变压器协调控... 随着电网技术的不断发展,含源电网中复合储能式电力电子变压器的应用日益广泛。然而,在实际运行中,储能式电力电子变压器面临着电网电压跌落或中断等挑战,这对其稳定性和电能质量提出了更高要求。本文综述了基于声纹识别的变压器协调控制以及监控策略,首先分析了复合储能式电子变压器的原理结构组成以及当前环境下的技术特征;然后以此为基础,进一步探讨了声纹识别技术在储能电子变压器的应用实况,最后综述了声纹识别技术下的变压器协调控制与监控策略。希望可以为后续研究提供一定理论借鉴。 展开更多
关键词 含源电网 复合储能式电力电子变压器 声纹识别 协调控制
在线阅读 下载PDF
基于深度学习的声纹识别的研究综述 被引量:1
16
作者 陈浩南 王坤赤 汤敏 《智能计算机与应用》 2025年第4期132-138,共7页
声纹识别受到环境噪声、说话人的情绪状态、身体状况等因素影响。为了提高声纹识别的可靠性,利用特征学习的深度学习方法得到广泛关注。深度学习是基于深层神经网络模型和方法的机器学习,在众多领域都展现出了令人瞩目的应用潜力,例如... 声纹识别受到环境噪声、说话人的情绪状态、身体状况等因素影响。为了提高声纹识别的可靠性,利用特征学习的深度学习方法得到广泛关注。深度学习是基于深层神经网络模型和方法的机器学习,在众多领域都展现出了令人瞩目的应用潜力,例如语音识别、语音情感识别、语音分离等。本文聚焦于深度学习在声纹识别领域的应用研究。首先,概述声纹识别研究的基础知识,包括声纹特征提取、准确率的计算方法等。接着,探讨深度学习中基于CNN、RegNet、RNN的各种神经网络框架,并对其当前发展状况进行总结与分析。最后,还对声纹识别的未来发展趋势进行展望,包括语谱图实现和神经网络模型构建。目前,相较于传统的声纹识别,基于深度学习的声纹识别模型在识别准确率上已经获得显著提升,平均准确率能够达到90%以上。 展开更多
关键词 声纹识别 语音特征提取 语谱图 深度学习 神经网络
在线阅读 下载PDF
基于改进FastICA和多特征融合的10 kV断路器机械故障声纹诊断方法 被引量:2
17
作者 单光瑞 段梵 +1 位作者 李先允 陈兰杭 《测试技术学报》 2025年第1期104-112,共9页
针对基于声纹特征的10 kV断路器机械故障模型易受环境噪声影响,识别准确率低,识别时间过长的问题,提出了一种基于改进FastICA和Bi-LSTM多特征混合的10 kV断路器机械故障声纹诊断方法。首先,采用皮尔逊系数对FastICA算法进行改进,利用改... 针对基于声纹特征的10 kV断路器机械故障模型易受环境噪声影响,识别准确率低,识别时间过长的问题,提出了一种基于改进FastICA和Bi-LSTM多特征混合的10 kV断路器机械故障声纹诊断方法。首先,采用皮尔逊系数对FastICA算法进行改进,利用改进的FastICA算法对采集的声音进行噪声分离,提取纯净的10 kV断路器状态声纹信号;然后,通过傅里叶变换分析10 kV断路器各种状态下频域信息,依据分析结果选取合适的时域、频域、声学特征,并通过差异度分析,选取贡献度大的特征构成一维混合特征;最后,将混合特征作为诊断依据,建立基于Bi-LSTM的故障分类模型。结果表明,该方法能够有效识别出10 kV断路器常见的8种机械故障和正常分合闸,识别准确率可达99.3%,满足电网对电气设备故障诊断的准确性要求。 展开更多
关键词 10 kV断路器 机械故障诊断 声纹识别 噪声分离 双层长短期神经网络(Bi-LSTM)
在线阅读 下载PDF
基于多粒度知识特征和Transformer网络的电力变压器故障声纹辨识方法 被引量:5
18
作者 齐子豪 仝杰 +3 位作者 张中浩 龙天航 唐鹏飞 黄灿 《中国电机工程学报》 北大核心 2025年第4期1311-1322,I0008,共13页
变压器在机械故障发生时伴随异常声响,基于声纹的机械故障辨识因其准确率高、发现及时和非侵入性等优势,成为当前研究热点。然而声纹信号易受噪声影响,分析处理速度慢且故障数据较难获取,因此如何在强干扰、小样本的情况下实现对机械故... 变压器在机械故障发生时伴随异常声响,基于声纹的机械故障辨识因其准确率高、发现及时和非侵入性等优势,成为当前研究热点。然而声纹信号易受噪声影响,分析处理速度慢且故障数据较难获取,因此如何在强干扰、小样本的情况下实现对机械故障声纹的快速准确辨识,成为当前研究难点。为解决上述问题,该文首先引入物理机理和经验知识,对变压器特征参数进行提取重组,构造多粒度知识特征向量并搭建改进型Transformer网络,大幅提高辨识方法的鲁棒性和抗噪声能力;其次,通过搭建卷积自编码器进行特征降维和模型压缩,缩短模型训练时间,提高机械故障辨识速度;最后,采用跨模态迁移学习技术,在ImageNet-lk数据集上进行预训练并进行知识迁移,解决训练样本不足的问题。相较于传统时序序列深度学习方法,所提方法在高噪声环境下(SNR=−16 dB),准确率均有所提高,实验结果证明,所提方法在准确性、鲁棒性、泛化性等方面均有显著提升,为在复杂环境下基于声纹实现变压器机械故障辨识提供了一种可靠解决方案。 展开更多
关键词 机械故障 故障辨识 声纹识别 自编码器 Transformer
原文传递
孤独症访谈场景下融入角色信息的说话人日志方法
19
作者 王康月 程铭 +2 位作者 谢奕香 邹小兵 李明 《计算机科学》 北大核心 2025年第2期231-241,共11页
说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然... 说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然存在角色信息,以孤独症辅助诊断为例,典型的情境包括医生、家长和接受诊断的孩子这3种明确定义的角色。但在实际对话中,角色和说话人之间的对应关系可能并非一一对应。例如,在孤独症诊断过程中,每次会话仅涉及一个孩子,而医生或家长的数量却是不确定的。文中认为语音片段中隐含的角色信息与声纹信息可以进行有效的互补,进而降低错误率,故提出一种将角色信息引入序列到序列目标说话人语音活动检测(Seq2Seq-TSVAD)中的方法。在CPEP-3数据集上,说话人日志的错误率(DER)为20.61%,相比Seq2Seq-TSVAD方法降低了9.8%,相比模块化说话人日志方法降低了19.3%,表明孤独症访谈场景下角色信息在提升说话人日志性能方面具有明显的作用。 展开更多
关键词 说话人日志 角色分类 特定说话人语音活动检测 声纹特征提取 孤独症谱系障碍
在线阅读 下载PDF
基于WPE-BA-CNN模型的输电线路放电声纹特征识别方法
20
作者 郭建勋 刘晓博 +3 位作者 吕金淼 杨林宁 张雄 万书亭 《智慧电力》 北大核心 2025年第3期92-98,共7页
针对无人机巡检信号声纹特征提取过程受到多种外部环境因素影响的问题,提出一种基于小波包能量(WPE)-蝙蝠算法(BA)-卷积神经网络(CNN)(WPE-BA-CNN)优化模型的输电线路放电声纹特征识别方法。首先,利用小波包变换对采集到的声纹信号进行... 针对无人机巡检信号声纹特征提取过程受到多种外部环境因素影响的问题,提出一种基于小波包能量(WPE)-蝙蝠算法(BA)-卷积神经网络(CNN)(WPE-BA-CNN)优化模型的输电线路放电声纹特征识别方法。首先,利用小波包变换对采集到的声纹信号进行降噪处理,抑制低频噪声和传递路径干扰,提高信号质量并最大限度保留放电特征。然后,采用BA对CNN的卷积核数量超参数进行优化,增强模型的收敛速度和识别准确率。最后,通过实验验证所提方法的故障识别准确率。实验结果表明,与其它常用算法对比,所提方法在输电线路放电声纹识别具有较高的准确率和收敛速度。 展开更多
关键词 输电线路 声纹识别 卷积神经网络 蝙蝠算法 小波包
在线阅读 下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部