期刊文献+
共找到413篇文章
< 1 2 21 >
每页显示 20 50 100
A review of research on intelligent fault detection of power equipment based on infrared and voiceprint: methods, applications and challenges
1
作者 Xizhou Du Xing Lei +4 位作者 Ting Ye Yingzhou Sun Zewen Shang Zhiqiang Liu Tianyi Xu 《Global Energy Interconnection》 2025年第5期821-846,共26页
As modern power systems grow in complexity,accurate and efficient fault detection has become increasingly important.While many existing reviews focus on a single modality,this paper presents a comprehensive survey fro... As modern power systems grow in complexity,accurate and efficient fault detection has become increasingly important.While many existing reviews focus on a single modality,this paper presents a comprehensive survey from a dual-modality perspective-infrared imaging and voiceprint analysis-two complementary,non-contact techniques that capture different fault characteristics.Infrared imaging excels at detecting thermal anomalies,while voiceprint signals provide insight into mechanical vibrations and internal discharge phenomena.We review both traditional signal processing and deep learning-based approaches for each modality,categorized by key processing stages such as feature extraction and classification.The paper highlights how these modalities address distinct fault types and how they may be fused to improve robustness and accuracy.Representative datasets are summarized,and practical challenges such as noise interference,limited fault samples,and deployment constraints are discussed.By offering a cross-modal,comparative analysis,this work aims to bridge fragmented research and guide future development in intelligent fault detection systems.The review concludes with research trends including multimodal fusion,lightweight models,and self-supervised learning. 展开更多
关键词 Power equipment fault detection Infrared image voiceprint data Deep learning Traditional image processing voiceprint detection
在线阅读 下载PDF
Adaptive Threshold Estimation of Open Set Voiceprint Recognition Based on OTSU and Deep Learning 被引量:1
2
作者 Xudong Li Xinjia Yang Linhua Zhou 《Journal of Applied Mathematics and Physics》 2020年第11期2671-2682,共12页
Aiming at the problem of open set voiceprint recognition, this paper proposes an adaptive threshold algorithm based on OTSU and deep learning. The bottleneck technology of open set voiceprint recognition lies in the c... Aiming at the problem of open set voiceprint recognition, this paper proposes an adaptive threshold algorithm based on OTSU and deep learning. The bottleneck technology of open set voiceprint recognition lies in the calculation of similarity values and thresholds of speakers inside and outside the set. This paper combines deep learning and machine learning methods, and uses a Deep Belief Network stacked with three layers of Restricted Boltzmann Machines to extract deep voice features from basic acoustic features. And by training the Gaussian Mixture Model, this paper calculates the similarity value of the feature, and further determines the threshold of the similarity value of the feature through OTSU. After experimental testing, the algorithm in this paper has a false rejection rate of 3.00% for specific speakers, a false acceptance rate of 0.35% for internal speakers, and a false acceptance rate of 0 for external speakers. This improves the accuracy of traditional methods in open set voiceprint recognition. This proves that the method is feasible and good recognition effect. 展开更多
关键词 voiceprint Recognition Deep Neural Network (DNN) OTSU Adaptive Threshold
在线阅读 下载PDF
Online Fault Monitoring of On-Load Tap-Changer Based on Voiceprint Detection 被引量:1
3
作者 Kitwa Henock Bondo 《Journal of Power and Energy Engineering》 2024年第3期48-59,共12页
The continuous operation of On-Load Tap-Changers (OLTC) is essential for maintaining stable voltage levels in power transmission and distribution systems. Timely fault detection in OLTC is essential for preventing maj... The continuous operation of On-Load Tap-Changers (OLTC) is essential for maintaining stable voltage levels in power transmission and distribution systems. Timely fault detection in OLTC is essential for preventing major failures and ensuring the reliability of the electrical grid. This research paper proposes an innovative approach that combines voiceprint detection using MATLAB analysis for online fault monitoring of OLTC. By leveraging advanced signal processing techniques and machine learning algorithms in MATLAB, the proposed method accurately detects faults in OLTC, providing real-time monitoring and proactive maintenance strategies. 展开更多
关键词 Online Fault Monitoring OLTC On-Load Tap Change voiceprint Detection
在线阅读 下载PDF
面向克隆语音的目标说话人鉴别方法
4
作者 苏兆品 魏玉洋 +2 位作者 张国富 廉晨思 岳峰 《中国图象图形学报》 北大核心 2026年第1期167-176,共10页
目的随着文本到语音(text to speech,TTS)、语音转换(voice conversion,VC)等克隆语音技术的快速发展,如何在司法实践中准确识别克隆语音,即克隆语音是否来源于目标说话人特征,成为一个极具挑战性的难题。虽然现有说话人识别技术可以通... 目的随着文本到语音(text to speech,TTS)、语音转换(voice conversion,VC)等克隆语音技术的快速发展,如何在司法实践中准确识别克隆语音,即克隆语音是否来源于目标说话人特征,成为一个极具挑战性的难题。虽然现有说话人识别技术可以通过声纹特征比对确认自然语音的说话人身份,但由于克隆语音不仅与目标说话人音色相似,且又包含源说话人的特点,使得传统说话人识别技术难以去除源说话人音色的干扰,难以直接应用于深度克隆语音。基于此,研究了一种面向克隆语音的目标说话人鉴别方法。方法基于Res2Block设计组渐进信道融合模块(group progressive channel fusion,GPCF),以有效提取自然语音与克隆语音之间的公共有效声纹特征信息;采用基于K独立的动态全局滤波器(dynamic global filter,DGF),以有效抑制源说话人的影响,提高模型表征和泛化能力;利用基于多尺度层注意力的特征融合机制,以有效融合不同层次GPCF模块和DGF模块的深浅层特征;使用注意力统计池(attentive statistics pooling,ASP)层,进一步增强表示特征张量中的目标说话人信息。结果在所设计的数据集上与3种较新的方法进行实验比较,相对于其他3种方法,本文方法等错误率(equal error rate,EER)分别降低了1.38%、0.92%和0.61%,最小检测代价函数(minimum detection cast function,minDCF)分别降低了0.0125、0.0067和0.0445。结论在FastSpeech2(fast and high-quality end-to-end text to speech)、TriAANVC(triple adaptive attention normalization for any-to-any voice conversion)、FreeVC(high-quality text-free one-shot voice conversion)和KnnVC(nearest neighbors voice conversion)共4种语音克隆数据集上的对比实验结果表明,所提方法在处理面向克隆语音的声纹认定任务时更具有优势,可以有效提取克隆语音中的目标说话人特征,为克隆语音的声纹认定提供方法指导。 展开更多
关键词 克隆语音 声纹认定 组渐进信道融合(GPCF) 动态全局滤波器(DGF) 多尺度层注意力机制
原文传递
基于PNCC声纹特征提取技术和POA-KNN算法的齿轮箱声纹识别故障诊断
5
作者 廖力达 赵阁阳 +1 位作者 魏诚 刘川江 《机电工程》 北大核心 2026年第1期24-33,共10页
风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因... 风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因此,提出了一种基于功率正则化倒谱系数(PNCC)声纹特征提取技术,以及行星优化算法与K近邻算法(POA-KNN)模型的风力机齿轮箱声纹识别故障诊断方法。首先,采用LMS噪声采集仪采集了6种不同状态下的风力机齿轮箱噪声数据;然后,使用了PNCC声纹特征提取的方法,提取了齿轮箱噪声信号的声纹图谱;在KNN的基础上加入行星优化算法(POA)优化了K值,提出了性能较高的POA-KNN分类模型;最后,根据6类不同状态下的齿轮数据集,采用对比试验和消融实验验证了模型性能。研究结果表明:POA-KNN模型对齿轮箱的PNCC声纹图分类准确率达到99.4%,比KNN基线模型提升了1.9%。POA-KNN分类模型能很好地对数据集中不同状态下的齿轮箱进行分类,更高效地针对风力机齿轮箱中存在的故障进行诊断。 展开更多
关键词 齿轮箱 功率正则化倒谱系数 声纹识别 声纹特征图谱 行星优化算法与K近邻算法 分类模型
在线阅读 下载PDF
自然人声音权益二元分层动态保护研究
6
作者 李彤 《科技与法律(中英文)》 2026年第1期121-133,共13页
数字时代带来的巨变凸显保护自然人声音与声纹信息范式的无力,欲探寻自然人声音权益的二元保护规则,首应厘清自然人声音人格权益、声纹信息权益及双重侵权场景。前者聚焦声音可识别性承载的人格利益侵害,后者注重声纹信息的安全风险。... 数字时代带来的巨变凸显保护自然人声音与声纹信息范式的无力,欲探寻自然人声音权益的二元保护规则,首应厘清自然人声音人格权益、声纹信息权益及双重侵权场景。前者聚焦声音可识别性承载的人格利益侵害,后者注重声纹信息的安全风险。经剖析欧美二元保护模式,在新科技背景下,我国应遵循发展保护并重、风险预防优先、场景化分层保护的理念,设置以《民法典》为核心,明确财产及精神损害后果的认定标准、厘清责任承担主体的声音人格权益保护规则;以《个人信息保护法》为基础,构建“场景特性为依据、风险分级为核心、技术安全为支撑”的保护声纹信息权益的二元分层框架,协调自然人声音权益的规则适用,实现科技发展与保护自然人声音权益的动态平衡。 展开更多
关键词 自然人声音人格权益 声纹信息权益 场景化 分层保护
在线阅读 下载PDF
基于DenseNet和迁移学习的声纹识别方法
7
作者 陈润强 王卫辰 +1 位作者 徐亚博 李烈 《现代电子技术》 北大核心 2026年第2期171-177,共7页
传统的声纹识别方法受环境噪声和个体变化等因素的影响,准确率难以进一步提升。为此,提出一种基于DenseNet和迁移学习的语谱图声纹识别方法,以进一步提高声纹识别系统的性能。使用DenseNet的声纹识别模型对源域语音进行训练;采用迁移学... 传统的声纹识别方法受环境噪声和个体变化等因素的影响,准确率难以进一步提升。为此,提出一种基于DenseNet和迁移学习的语谱图声纹识别方法,以进一步提高声纹识别系统的性能。使用DenseNet的声纹识别模型对源域语音进行训练;采用迁移学习将源域训练的DenseNet模型迁移到目标域训练数据;在目标域测试数据上验证迁移后模型的性能,并对比分析迁移前后DenseNet模型和ResNet模型的声纹识别性能。实验结果表明,与原始ResNet模型、DenseNet模型和经迁移学习的ResNet模型相比,经迁移学习的DenseNet模型的识别准确率分别提高了3.89%、6.67%和3.34%,且具有较快的收敛速度。 展开更多
关键词 声纹识别 DenseNet 迁移学习 语谱图 ResNet 语音信号处理
在线阅读 下载PDF
GMM-HMM下风电机组齿轮箱和偏航机构声纹检测
8
作者 王海龙 肖正江 +2 位作者 王大元 陈鹏飞 曹宏 《大电机技术》 2026年第1期105-111,共7页
在风电机组齿轮箱和偏航机构声纹检测的过程中,将采集到的声纹信号进行频谱分析,并建立相应的检测阈值,受到微弱信号的影响,齿轮箱和偏航机构的声纹数据存在缺失,随着均方根误差(RMSE)值不断增加,导致检测结果失准。因此,设计了高斯混... 在风电机组齿轮箱和偏航机构声纹检测的过程中,将采集到的声纹信号进行频谱分析,并建立相应的检测阈值,受到微弱信号的影响,齿轮箱和偏航机构的声纹数据存在缺失,随着均方根误差(RMSE)值不断增加,导致检测结果失准。因此,设计了高斯混合模型-隐马尔可夫模型(GMM-HMM)下的风电机组齿轮箱和偏航机构声纹检测方法。将声纹信号输入到一阶滤波器中增强高频信号,根据输入过程相关系数(INPCC),提取风电机组齿轮箱和偏航机构声纹频谱特征。调整单高斯模型参数与加权系数,近似地表达声纹频谱的分布特征,并将声纹频谱特征中存在的微弱信号看作隐藏信号,基于GMM-HMM增强机组声纹频谱来检测微弱信号。根据声纹信号的局部运动情况,建立齿轮箱和偏航机构声纹信号检测阈值,从而实现对风电机组齿轮箱和偏航机构声纹的精准检测。最终的检测结果显示,在数据缺失率为0.1~0.5时,RMSE值始终低于0.1,检测结果较为准确,该方法对于提升风电机组的监测质量具有重要作用。 展开更多
关键词 GMM-HMM 风电机组 齿轮箱 偏航机构 声纹检测方法
在线阅读 下载PDF
基于声纹识别的变频设备齿轮箱故障检测方法
9
作者 廖嘉亨 郑锴 黄中 《自动化应用》 2026年第2期48-50,54,共4页
提出一种变频设备齿轮箱故障智能检测方法。在得到基本的声纹时频域特征后,采用双样本Z检验方法,选择更多的判别特征,形成新的声纹特征数据集。以特征序列段为单元,利用双向长短期记忆网络(BiLSTM)模型对故障进行分类,并利用改进粒子群... 提出一种变频设备齿轮箱故障智能检测方法。在得到基本的声纹时频域特征后,采用双样本Z检验方法,选择更多的判别特征,形成新的声纹特征数据集。以特征序列段为单元,利用双向长短期记忆网络(BiLSTM)模型对故障进行分类,并利用改进粒子群优化(PSO)算法寻找BiLSTM的最佳参数组合。实验表明,该方法能准确地对不同工况下的各种故障进行分类,有效地克服了局部故障特征序列混叠的问题。 展开更多
关键词 变频设备齿轮箱 故障检测 双向长短期记忆网络 粒子群优化 声纹识别 双样本Z检验
在线阅读 下载PDF
基于改进VMD算法的10kV高压断路器声纹监测
10
作者 王德全 吴绍武 刘成 《信息技术》 2026年第1期27-32,共6页
在10kV高压断路器的工作环境中,常常伴随着各种类型的噪声干扰,如电磁干扰、设备振动和温度变化等。这些噪声可能会混入声纹信号中,文中干扰信号的特征提取和声纹状态的准确判断。为此,提出基于改进VMD算法的10kV高压断路器声纹监测方... 在10kV高压断路器的工作环境中,常常伴随着各种类型的噪声干扰,如电磁干扰、设备振动和温度变化等。这些噪声可能会混入声纹信号中,文中干扰信号的特征提取和声纹状态的准确判断。为此,提出基于改进VMD算法的10kV高压断路器声纹监测方法。调整阈值门限,改进VMD算法,对10kV高压断路器声纹信号去噪。基于此,将10kV高压断路器声纹信号切分为等长的声纹信号,选择Softmax函数对其进行分类,利用LSTM(Long Short-Term Memory)对10kV高压断路器声纹完成监测。实验结果表明:研究方法的去噪效果更优,且对10kV高压断路器声纹监测的准确率始终高于97%。 展开更多
关键词 改进VMD算法 10kV高压断路器 声纹监测
在线阅读 下载PDF
基于空时域联合匹配的水轮发电机故障声纹识别方法
11
作者 罗明兴 毕光均 +3 位作者 龙世兴 刘敏 韩浩 胡飞 《机械制造与自动化》 2026年第1期271-276,282,共7页
水轮发电机故障发生时会产生复杂机械振动和噪声,且干扰信号来自不同方向,故障特征容易被噪声掩盖,影响故障识别的准确性与可靠性。因此,提出基于空时域联合匹配的水轮发电机故障声纹识别方法。通过空时域联合匹配方式从空间域和时间域... 水轮发电机故障发生时会产生复杂机械振动和噪声,且干扰信号来自不同方向,故障特征容易被噪声掩盖,影响故障识别的准确性与可靠性。因此,提出基于空时域联合匹配的水轮发电机故障声纹识别方法。通过空时域联合匹配方式从空间域和时间域两方面进行声音信号处理,并利用波束形成技术强化目标方向信号,减少噪声对故障特征的干扰和掩盖。采用梅尔频率倒谱系数对增强后的信号进行声纹特征提取,将得到的特征作为卷积神经网络的输入,通过卷积层和Softmax分类器自动学习并区分正常运行状态与故障状态下声纹差异。实验结果表明:所提方法在面对不同的水轮发电机故障时均能表现出有效的识别能力,且能够保持较低的损失函数值(约为0.04),这充分说明了该方法具有较高的准确性和鲁棒性,为水电站设备的智能维护提供了新的技术途径。 展开更多
关键词 水轮发电机 故障识别 空时域处理 声纹特征 卷积神经网络
在线阅读 下载PDF
基于深度自适应K-means++算法的电抗器声纹聚类方法 被引量:5
12
作者 闵永智 郝大宇 +2 位作者 王果 何怡刚 贺建山 《电力系统保护与控制》 北大核心 2025年第8期1-13,共13页
在高压并联电抗器声纹信号监测系统中,长时海量无标签声纹的高维非平稳性导致特征提取困难、无监督聚类适应性差。由此提出了一种基于深度自适应K-means++算法(deep adaptive K-means++clustering algorithm,DAKCA)的750 kV电抗器声纹... 在高压并联电抗器声纹信号监测系统中,长时海量无标签声纹的高维非平稳性导致特征提取困难、无监督聚类适应性差。由此提出了一种基于深度自适应K-means++算法(deep adaptive K-means++clustering algorithm,DAKCA)的750 kV电抗器声纹聚类方法。首先通过采用两阶段无监督策略微调的改进堆叠稀疏自编码器(stacked sparse autoencoder,SSAE),对快速傅里叶变换后的归一化频域数据提取电抗器原始声纹32维深度特征。进一步提出了依据最近邻聚类有效性指标(clustering validation index based on nearest neighbors,CVNN)的自适应K-means++聚类算法,构建了能自适应确定最优聚类个数的电抗器声纹聚类模型。最后通过西北地区某750 kV电抗器实测声纹数据集进行了验证。结果表明,DAKCA算法对无标签声纹数据在不同样本均衡程度下能够稳定提取32维深度特征,并实现最优聚类,为直接高效利用电抗器无标签声纹数据提供了参考。 展开更多
关键词 750 kV电抗器 声纹聚类 自适应聚类算法 稀疏自编码器 深度自适应K-means++算法
在线阅读 下载PDF
基于声纹识别的永磁同步电机运行状态监测 被引量:2
13
作者 丁惜瀛 付直刚 马少华 《沈阳工业大学学报》 北大核心 2025年第2期145-151,共7页
【目的】在传统永磁电机故障监测领域,接触式信号虽被广泛使用,但通常只能反映电机的单一运行状态且信息量不足,难以识别永磁同步电机的全面运行状态。为丰富信息量,需要额外增加传感器,但这不仅增加了系统的复杂性,还提高了实际应用难... 【目的】在传统永磁电机故障监测领域,接触式信号虽被广泛使用,但通常只能反映电机的单一运行状态且信息量不足,难以识别永磁同步电机的全面运行状态。为丰富信息量,需要额外增加传感器,但这不仅增加了系统的复杂性,还提高了实际应用难度。因此,提高永磁电机状态监测的精度与便捷性成为重要的研究目标。随着智能化监测技术的发展,非接触式信号的应用越来越受到关注。永磁电机运行时产生的音频信号包含了丰富的状态信息,为故障诊断提供了新的方向。相较于接触式信号,音频信号能实时反映由故障引起的电机振动、噪声等特征,有较大的研究价值。然而这类信号易受环境噪声的干扰,导致信号质量差、特征信息不清晰,不利于永磁同步电机的状态监测。针对上述问题,提出了一种基于声纹识别的永磁同步电机深度学习模型,旨在通过深度学习技术高效地监测和诊断电机运行状态。【方法】采用小波去噪算法减少噪声干扰,提升信号质量,进而提升信噪比,确保模型能够更清晰地提取梅尔谱特征,为故障识别和分类奠定基础。然而,直接使用卷积神经网络提取梅尔谱特征可能会削弱特征间的关联性,影响故障识别的精度。引入空间注意力机制,通过加权增强特征的空间位置相关性,使模型关注最关键的部分,提高特征提取的有效性。为提升模型的识别准确率,对梅尔谱特征进行归一化处理,并采用AAM-softmax损失函数。该函数通过强化类间约束,提高模型在不同类别之间的区分能力,进而提升识别精度和泛化能力并优化训练过程,使模型更好地适应不同工况。【结果】仿真测试结果表明,所提出的模型在训练集上表现出色,能够准确识别电机的不同运行状态,并在测试集上展现出较强的泛化能力。实验结果证实,基于深度学习的声纹识别方法能够有效监测永磁电机的多种运行状态,准确度较高且实用性较强。【结论】基于声纹识别的永磁同步电机深度学习模型能够有效去除噪声并提取关键特征。通过引入空间注意力机制和AAM-softmax损失函数,显著提升了模型的识别精度和泛化能力。该模型具有广阔的发展前景,可广泛应用于永磁电机的状态监测与故障诊断,推动电机智能化维护技术的发展。 展开更多
关键词 电机监测 声纹识别 小波去噪 损失函数 空间注意力机制 永磁同步电机
在线阅读 下载PDF
基于多层次特征图谱的高压并联电抗器声纹识别模型研究 被引量:1
14
作者 王果 贺建山 +2 位作者 闵永智 何怡刚 郝大宇 《高电压技术》 北大核心 2025年第6期3030-3042,I0036-I0037,共15页
在高压并联电抗器声纹在线监测领域,针对长时间序列特性的电抗器声信号复杂度高、数据维度大、能量分散导致声纹识别模型信息利用率低、鲁棒性和识别率不高的问题,提出了一种基于多层次特征图谱的改进ConvNeXt-T网络声纹识别模型。首先... 在高压并联电抗器声纹在线监测领域,针对长时间序列特性的电抗器声信号复杂度高、数据维度大、能量分散导致声纹识别模型信息利用率低、鲁棒性和识别率不高的问题,提出了一种基于多层次特征图谱的改进ConvNeXt-T网络声纹识别模型。首先,声信号通过点对称变换和类Gram矩阵图形化的细化频谱转换为时域、频域特征图谱,基于电抗器声纹特性提出50 Hz Gammatone滤波器组生成能量特征图谱;然后引入轻量级CA注意力机制,作为特征图谱自适应融合模块对ConvNeXt-T网络的输入侧进行改进;最后,结合实测数据验证了模型的优越性,结果表明所提模型在测试集上的平均识别准确率达97.82%,较单域图谱提升3.14%,较FCN、RsNet、ApR-IDRSN等对比模型提升6.51%,同时该模型在高斯白噪声、人声和鸟叫声环境中表现出最佳的抗噪性。该模型综合运用高维度多域特征提取方法和图形化降维表征方法,能显著提高特征丰富度和信息利用率。 展开更多
关键词 高压并联电抗器 声纹识别 特征图谱 ConvNeXt-T网络 抗噪性
原文传递
基于GGD-EfficientNet和声纹识别的风力发电机齿轮箱故障诊断 被引量:1
15
作者 廖力达 陈伟克 +3 位作者 罗晓 舒王咏 张芝铭 代军 《太阳能学报》 北大核心 2025年第4期570-578,共9页
针对风力发电机齿轮箱齿轮故障时的噪声提出一种基于分组全局上下文网络(GE-GCNet)与深度可分离卷积(DSCConv)结合的效率神经网络(GGD-EfficientNet)和声纹识别的齿轮箱故障诊断方法。首先通过实验获取齿轮箱故障齿轮的噪声信号,并根据... 针对风力发电机齿轮箱齿轮故障时的噪声提出一种基于分组全局上下文网络(GE-GCNet)与深度可分离卷积(DSCConv)结合的效率神经网络(GGD-EfficientNet)和声纹识别的齿轮箱故障诊断方法。首先通过实验获取齿轮箱故障齿轮的噪声信号,并根据齿轮状态分为6类。然后,使用Log-Mel谱的方法提取噪声信号语谱图。考虑到效率卷积神经网络(EfficientNet)对齿轮故障语谱图特征提取能力不足等缺点,在EfficientNet的基础上,结合分组卷积改进的GE-GCNet和DSCConv,提出一种高性能的齿轮故障诊断模型GGD-EfficientNet。实验表明:所提方法能在齿轮箱故障齿轮语谱图数据集下准确率达到99.7%。所提模型能从数据集中对故障类型进行有效分类,可有效帮助诊断齿轮箱中齿轮故障。 展开更多
关键词 风力发电机 齿轮 故障检测 GGD-EfficientNet 声纹识别
原文传递
基于RK3588的嵌入式声纹识别系统设计 被引量:2
16
作者 陈德富 周云龙 +2 位作者 陈国军 宋京洋 林永权 《自动化应用》 2025年第6期18-21,共4页
为了推动声纹识别技术在实时性、准确性和便捷性方面的发展,设计了一种基于RK3588嵌入式开发板的声纹识别系统。该系统使用Pytorch深度学习框架在PC端搭建ResCNN网络进行模型的训练和推理测试,随后通过模型转换将训练好的模型部署至RK3... 为了推动声纹识别技术在实时性、准确性和便捷性方面的发展,设计了一种基于RK3588嵌入式开发板的声纹识别系统。该系统使用Pytorch深度学习框架在PC端搭建ResCNN网络进行模型的训练和推理测试,随后通过模型转换将训练好的模型部署至RK3588平台。界面设计采用了PyQT5,实现了直观的用户操作。实验结果表明,声纹比对推理的准确率达到96%,等错误率(EER)为3.30%,平均每组比对耗时约0.1 s。该系统满足实时性要求,适用于需要快速声纹验证的应用场景。 展开更多
关键词 声纹识别 RK3588 ResCNN 模型部署
在线阅读 下载PDF
复杂噪声下基于鲁棒增强TimesNet的换流阀声纹异常检测
17
作者 唐明珠 俞昱 +5 位作者 左佳文 吴华伟 尹琛 魏颖 潘舒妍 熊富强 《南方电网技术》 北大核心 2025年第6期4-13,50,共11页
在电力系统中,实时监测换流阀的健康状态对于确保整个系统的可靠性与安全性至关重要。与传统的振动信号分析、温度监测等检测手段相比,声纹检测具有无接触、低成本等优势,然而在复杂多变的换流阀非本体背景噪声环境下,声纹异常检测模型... 在电力系统中,实时监测换流阀的健康状态对于确保整个系统的可靠性与安全性至关重要。与传统的振动信号分析、温度监测等检测手段相比,声纹检测具有无接触、低成本等优势,然而在复杂多变的换流阀非本体背景噪声环境下,声纹异常检测模型的性能往往达不到工业要求。针对该问题,提出了一种基于鲁棒增强TimesNet(RE-TimesNet)的换流阀声纹异常检测方法。该方法首先提取声纹数据的声学特征及其特征差分。然后,将特征集进行时频域掩码,进一步增强了特征集的鲁棒性。最后,采用基于Huber损失函数结合L2正则项和分组卷积的改进TimesNet异常检测模型识别异常模式。实验结果表明,RE-TimesNet在提高换流阀声纹异常检测的准确性、鲁棒性和运行速度方面具有显著的优势,能够缓解过拟合且轻量化神经网络模型。该方法为噪声环境下的换流阀声纹异常检测提供了有效的解决方案。 展开更多
关键词 换流阀 声纹 异常检测 特征工程 鲁棒性 无监督学习
在线阅读 下载PDF
基于声纹脊线化和元学习的变压器故障诊断方法
18
作者 曲朝阳 刘谊豪 +2 位作者 曲楠 姜涛 徐晓宇 《电力系统保护与控制》 北大核心 2025年第13期163-174,共12页
针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(se... 针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(selective encoder, SE)加深时频与形态表征的关联度,提升模型收敛速度。最后,构造元学习网络评估变压器状态,并引入基于OD-Reptile的一阶梯度更新策略,通过内外循环优化机制增强参数泛化性,从而实现少样本、信息干扰条件下的高精度声纹诊断。相较于R-WDCNN、LSTM、CNN等传统深度学习信号诊断方法,该方法在低样本、高噪声环境下(SNR为-12 dB),收敛轮数减少10轮以上。同时,准确率分别提高6.35%,12.1%和16.93%。实验结果显示,所提方法在准确性、抗噪性、鲁棒性以及泛化性方面均有显著提升。 展开更多
关键词 声纹 小样本 脊线化 时频谱图 选择性编码 元学习 故障诊断
在线阅读 下载PDF
基于声阵列与SHO-VMD-FastICA的750kV电抗器声纹分离方法研究及应用
19
作者 王果 李宝鹏 +3 位作者 闵永智 何怡刚 贺建山 霍奕辰 《高电压技术》 北大核心 2025年第9期4588-4598,I0013-I0015,共14页
750 kV电抗器实测声纹信号中包含高低频段的干扰噪声,严重影响电抗器声纹识别精度,需要进行电抗器本体声纹分离。首先,采用声阵列采集750 kV电抗器声纹信号,并通过数据一致性检验算法对各阵元进行甄别,筛选有效阵元数据构建观测信号矩阵... 750 kV电抗器实测声纹信号中包含高低频段的干扰噪声,严重影响电抗器声纹识别精度,需要进行电抗器本体声纹分离。首先,采用声阵列采集750 kV电抗器声纹信号,并通过数据一致性检验算法对各阵元进行甄别,筛选有效阵元数据构建观测信号矩阵;然后,利用海马优化算法对变分模态分解算法的分解层数K与惩罚因子α进行寻优,进而根据最优参数组合[K,α]分解观测信号,并选取1 kHz以内的模态分量重构观测信号,实现高频干扰噪声的滤除;最后,采用快速独立成分分析法从多维降噪观测信号中分离出750 kV电抗器本体声纹信号。采用该方法分离所得750 kV电抗器本体声纹信号与对照信号的相似系数为0.954 2,信噪比为10.548 2 dB,与SCA算法相比分别提升6.63%和2.282 7 dB,表明该方法具有更高的适用性和准确性。 展开更多
关键词 750 kV电抗器 声纹分离 声阵列 变分模态分解 盲源分离
原文传递
武夷山国家公园两栖动物鸣声分析与声纹识别技术
20
作者 朱弼成 郭雨鹃 +3 位作者 雷蕾 钱天宇 崔建国 江建平 《国家公园(中英文)》 2025年第10期605-614,共10页
近年来,生物多样性日益成为全球关注的环境与发展议题。生物多样性调查是摸清我国生物多样性资源本底、监测生物多样性动态变化的有效途径。然而,传统的生物多样性调查方法耗时耗力,受到时间和空间上的诸多限制。蛙类、昆虫和鸟类等动... 近年来,生物多样性日益成为全球关注的环境与发展议题。生物多样性调查是摸清我国生物多样性资源本底、监测生物多样性动态变化的有效途径。然而,传统的生物多样性调查方法耗时耗力,受到时间和空间上的诸多限制。蛙类、昆虫和鸟类等动物十分依赖鸣声通讯,基于动物鸣声的生物多样性监测可以克服传统调查方法的诸多困难。在武夷山国家公园开展多年两栖动物多样性调查,录制、分析代表性物种的鸣声特征,尝试使用人工智能技术进行两栖动物声纹的自动识别。结果显示,武夷山国家公园已记录无尾两栖类37种,数据库收录了81.1%物种的鸣声;声纹识别模型能够对数据库中的30个物种实现超过80%的识别准确率。基于声纹识别的两栖动物多样性监测技术是实现动物多样性智慧监测的有效方案,声纹数据的人工智能识别技术未来将在生物多样性监测与保护中发挥重要作用。 展开更多
关键词 生物多样性 声纹识别 人工智能 两栖动物 武夷山国家公园
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部