期刊文献+
共找到469篇文章
< 1 2 24 >
每页显示 20 50 100
基于MFCCs滤波的电话语音识别的通道补偿方法 被引量:5
1
作者 韩纪庆 高文 《计算机学报》 EI CSCD 北大核心 1998年第12期1125-1130,共6页
本文提出一种基于MFCCs滤波的通道补偿方法RMFCC.它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价.RMFCC的性能也优于CMS和二级CMS.通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证... 本文提出一种基于MFCCs滤波的通道补偿方法RMFCC.它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价.RMFCC的性能也优于CMS和二级CMS.通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证实了抑制非常低的调制频率是进行顽健的电话语音识别的有效途径. 展开更多
关键词 语音识别 mfccs滤波 电话语音识别 通道补偿
在线阅读 下载PDF
改进的MFCCs电话语音识别方法
2
作者 刘洋 贺前华 黄海 《计算机工程》 CAS CSCD 北大核心 2002年第10期67-68,共2页
为了提高电话语音识别系统在环境和信道等噪声下的鲁棒性,文章针对电话语音MFCC特征的低阶系数最易受到污染的特点,通过舍弃最易受污染的低阶MFCC系数,并结合RASTA滤波来去除卷积信道噪声,使系统的识别性能和抗噪性能有了明显的改善。
关键词 mfccs 电话语音识别 语音识别 带通滤波器 鲁棒性 语音信号
在线阅读 下载PDF
A Comparison of Classifiers in Performing Speaker Accent Recognition Using MFCCs
3
作者 Zichen Ma Ernest Fokoué 《Open Journal of Statistics》 2014年第4期258-266,共9页
An algorithm involving Mel-Frequency Cepstral Coefficients (MFCCs) is provided to perform signal feature extraction for the task of speaker accent recognition. Then different classifiers are compared based on the MFCC... An algorithm involving Mel-Frequency Cepstral Coefficients (MFCCs) is provided to perform signal feature extraction for the task of speaker accent recognition. Then different classifiers are compared based on the MFCC feature. For each signal, the mean vector of MFCC matrix is used as an input vector for pattern recognition. A sample of 330 signals, containing 165 US voice and 165 non-US voice, is analyzed. By comparison, k-nearest neighbors yield the highest average test accuracy, after using a cross-validation of size 500, and least time being used in the computation. 展开更多
关键词 SPEAKER ACCENT RECOGNITION Mel-Frequency Cepstral Coefficients (mfccs) DISCRIMINANT Analysis Support Vector Machines (SVMs) k-Nearest NEIGHBORS
暂未订购
基于GMM和改进MFCCs的电机轴承故障诊断方法研究 被引量:1
4
作者 单帅杰 刘建宝 李厚朴 《舰船电子工程》 2023年第10期156-161,共6页
针对电机系统振动信号的采集对传感器安装精度要求较高,以及时频域特征不能完全表征轴承故障特征的问题。论文提出一种基于高斯混合模型(Gaussian mixture model,GMM)和改进梅尔频率倒谱系数(Mel frequency cepstrum co-efficients,MFC... 针对电机系统振动信号的采集对传感器安装精度要求较高,以及时频域特征不能完全表征轴承故障特征的问题。论文提出一种基于高斯混合模型(Gaussian mixture model,GMM)和改进梅尔频率倒谱系数(Mel frequency cepstrum co-efficients,MFCCs)的轴承故障识别方法。该方法通过PCA降维获取改进的MFCCs声纹特征,借助GMM模型对MFCCs特征参数分布拟合,构造了电机轴承故障分类模型,实现了对轴承故障状态的识别。仿真实验结果表明:所得到的MFCCs特征向量能准确表征轴承的不同故障类型;改进MFCCs特征具有识别准确率高和识别速度快的特点;并且基于GMM模型的识别结果与真实故障类型吻合良好。研究结果为电机轴承故障诊断研究提供了一种新思路。 展开更多
关键词 轴承 噪声信号 故障诊断 声纹特征 MFCC GMM
在线阅读 下载PDF
基于CLSRIME-XGBOOST的带式输送机托辊故障诊断方法
5
作者 江帆 程舒曼 +4 位作者 朱真才 周公博 李强 刘全辉 宋鸿炎 《振动.测试与诊断》 北大核心 2025年第4期666-673,840,共9页
针对声音信号分析在诊断带式输送机托辊故障中的高维特征存在信息冗余、计算量大和诊断效果不理想等问题,笔者构建了声音信号特征精简策略,基于Circle混沌映射、Levy飞行策略和正弦因子改进了霜冰优化算法(rime optimization algorithm... 针对声音信号分析在诊断带式输送机托辊故障中的高维特征存在信息冗余、计算量大和诊断效果不理想等问题,笔者构建了声音信号特征精简策略,基于Circle混沌映射、Levy飞行策略和正弦因子改进了霜冰优化算法(rime optimization algorithm,简称RIME),记作CLSRIME。再结合极致梯度提升模型(extreme gradient boosting,简称XGBOOST),构建了CLSRIME-XGBOOST带式输送机托辊轴承故障诊断方法。首先,利用梅尔倒谱系数(Melscale frequency cepstral coefficient,简称MFCC)融合方法提取信号关键特征,并通过t-分布领域嵌入算法(t-distributed stochastic neighbor embedding,简称tSNE)进行降维,构建了基于MFCC和tSNE的精简特征提取策略;其次,针对RIME存在初始种群分布不均、霜冰粒子搜索能力弱、收敛速度较慢的问题,引入Circle混沌映射、Levy飞行策略和正弦因子,设计了CLSRIME;最后,利用CLSRIME优化XGBOOST中树的深度、迭代次数及学习率等参数,构建了基于CLSRIME-XGBOOST的诊断模型。结果表明,所提方法能够精简表征托辊轴承故障状态的特性信息,改善了RIME的优化性能,提高了传统XGBOOST诊断模型的准确率,为带式输送机托辊故障诊断提供了新思路。 展开更多
关键词 带式输送机 改进RIME算法 MFCC XGBOOST 故障诊断
在线阅读 下载PDF
基于声音信号的转辙机故障诊断研究 被引量:1
6
作者 梁续继 戴胜华 《铁道标准设计》 北大核心 2025年第2期183-190,共8页
铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会... 铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会影响声音信号的常见机械故障。然后,根据声音诊断在特征提取方面的不同路线,采用3种技术方案。端到端方案通过wav2vec2.0语音识别框架直接进行训练和识别;特征矩阵方案提取声音信号的梅尔倒谱系数(MFCC),通过主成分分析(PCA)得到固定尺寸的特征矩阵,由多分类支持向量机(SVM)进行故障分类;声音图像化方案生成声音信号的语谱图,同时建立卷积神经网络VGG16的轻量化改进模型,将语谱图输入至该模型中进行训练和识别。实验结果表明,3种技术方案均能有效地对包括正常工作和6种故障类型的7种工作状态实现诊断,准确率分别为99.8%、94.2%和96.6%。验证了基于声音进行转辙机故障诊断的3种技术方案的可行性,并体现了语音领域技术在转辙机故障诊断中的应用价值。 展开更多
关键词 转辙机 故障诊断 声音信号 特征提取 wav2vec2.0 MFCC 语谱图
在线阅读 下载PDF
儿童异常肺音识别的时序优化神经网络模型
7
作者 张龙基 魏云龙 +2 位作者 郑晓明 俞英健 熊丽君 《声学技术》 北大核心 2025年第5期730-737,共8页
异常肺音听诊识别是儿童支气管肺部疾病诊断的一种重要手段。针对儿童异常肺音分类研究常用的声谱图图像识别方法计算资源大、识别率不高等问题,提出了一种结合梅尔倒谱系数(Mel frequency cepstral coefficients,MFCC)特征、卷积神经网... 异常肺音听诊识别是儿童支气管肺部疾病诊断的一种重要手段。针对儿童异常肺音分类研究常用的声谱图图像识别方法计算资源大、识别率不高等问题,提出了一种结合梅尔倒谱系数(Mel frequency cepstral coefficients,MFCC)特征、卷积神经网络(convolutional neural network,CNN)与双向长短时记忆网络(bidirectional long short-term memory,BiLSTM)的混合模型,用于儿童异常肺音的分类方法。该方法通过CNN对MFCC特征进行空间特性提取,利用BiLSTM对MFCC音频特征进行时序特性提取,建立了BCNnet(BILSTM CNN network)模型。文章收集并建立了一个儿童肺音数据集,在该数据集上,所提方法平均准确率可达75.3%,与以声谱图为输入的CNN(并行池化)模型相比,准确率提高了3.7个百分点,且在模型大小和识别速度上均有改善。 展开更多
关键词 异常肺音 MFCC特征 卷积神经网络 双向长短时记忆网络 BCNnet模型
在线阅读 下载PDF
基于改进迁移学习的煤矿井下设备音频信号故障诊断方法 被引量:2
8
作者 邱吉尔 王琪 王鹏 《工矿自动化》 北大核心 2025年第2期91-99,共9页
煤矿井下生产运行环境恶劣,其关键设备如瓦斯泵、通风机、采煤机等长期处于启动状态,易产生缺陷性故障。目前端到端音频数据故障诊断方法的模型训练与更新高度依赖于数据标注,尽管可以获取海量原始数据,但这些数据通常未经标注,难以直... 煤矿井下生产运行环境恶劣,其关键设备如瓦斯泵、通风机、采煤机等长期处于启动状态,易产生缺陷性故障。目前端到端音频数据故障诊断方法的模型训练与更新高度依赖于数据标注,尽管可以获取海量原始数据,但这些数据通常未经标注,难以直接用于模型训练,设备运行工况的突变和设备重组等因素可能导致数据分布发生变化,从而引起模型性能下降。针对上述问题,提出了一种基于改进迁移学习的煤矿井下设备音频信号故障诊断方法。首先,对煤矿设备音频信号进行梅尔频率倒谱系数(MFCC)特征提取,捕捉设备运行状态中的关键信息,得到故障特征二维系数图。然后,构建基于改进迁移学习的故障诊断网络模型,以改进最大均值差异,即多核联合最大均值差异作为度量标准,借助伪标签计算联合分布距离,将标签信息通过多重线性映射进行特征匹配,以减少数据分布差异,实现边缘分布和条件分布同时对齐。实验结果表明:所提方法在无标签条件下能够实现高精度的故障诊断,准确率达到96.99%,标准差为0.014;在模型抗噪性能实验中,基于改进迁移学习的故障诊断模型在低信噪比(如10 dB)条件下仍能保持80%的故障诊断准确率,展现出较强的抗噪鲁棒性。 展开更多
关键词 煤矿井下设备 音频信号 故障诊断 迁移学习 梅尔频率倒谱系数 MFCC 最大均值差异 多核联合最大均值差异 源域 目标域
在线阅读 下载PDF
基于噪声指纹的无人机检测与识别
9
作者 刘涛 刘宇畅 +1 位作者 刘昕卓 黄林 《电子科技大学学报》 北大核心 2025年第4期546-553,共8页
现有的无人机检测和识别方案在面对小型、低空、低速或悬停无人机时存在精度不够高、鲁棒性差、数据处理复杂和容易受环境影响等问题。因此,提出了一种基于无人机噪声特征指纹的无人机检测和识别系统。在数据预处理阶段,该系统首先去掉... 现有的无人机检测和识别方案在面对小型、低空、低速或悬停无人机时存在精度不够高、鲁棒性差、数据处理复杂和容易受环境影响等问题。因此,提出了一种基于无人机噪声特征指纹的无人机检测和识别系统。在数据预处理阶段,该系统首先去掉环境噪声的干扰,并对训练音频数据进行数据增强从而丰富训练数据集的多样性,适应无人机在不同操作条件下的噪声特征。特征提取模块通过设计时域峰值归一化算法和特征向量重缩放算法,从而降低系统在提取特征时因信号强度或距离的变化而导致特征的不稳定性,提高系统的距离鲁棒性。最后,构建一种新的基于多个KNN分类器的无人机识别算法,实现对无人机型号的识别。实验结果表明,该系统能够在多种不同环境和距离条件下实现对无人机的准确检测与识别。 展开更多
关键词 无人机检测 无人机识别 声纹提取 噪声识别 MFCC特征
在线阅读 下载PDF
毫米波雷达风力机叶片覆冰检测方法
10
作者 张自豪 王志春 《电力工程技术》 北大核心 2025年第5期79-89,共11页
风能作为可再生能源,凭借其可靠性和成本优势成为新能源领域的主要竞争者。在气候寒冷的高湿度地区,叶片结冰对风力机性能和耐久性构成严重威胁。基于雷达的材料检测技术因其具有可穿透非极化材料以及不受光照和天气影响的传感能力,可... 风能作为可再生能源,凭借其可靠性和成本优势成为新能源领域的主要竞争者。在气候寒冷的高湿度地区,叶片结冰对风力机性能和耐久性构成严重威胁。基于雷达的材料检测技术因其具有可穿透非极化材料以及不受光照和天气影响的传感能力,可以提供表面状态及深入信息,近年来备受关注。文中提出使用77 GHz毫米波雷达实时检测风机叶片覆冰状态的方法,从原始中频信号提取梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)融合一维卷积神经网络(one-dimensional convolutional neural network,1D-CNN)对叶片覆冰类型进行分类识别。通过实验在可控距离和方向变化中验证文中所提方法的有效性。实验结果表明,该方法可以精准识别4种覆冰类型及不同厚度覆冰,识别率可达94%,且在风力发电机叶片覆光滑薄冰阶段即可识别,进行预警。 展开更多
关键词 风能 毫米波雷达 一维卷积神经网络(1D-CNN) 梅尔频率倒谱系数(MFCC) 叶片覆冰 分类识别
在线阅读 下载PDF
基于改进MFCC特征提取和DNN网络的机器人语音识别方法研究 被引量:2
11
作者 秦垲忻 王炜昕 王砚生 《计算机测量与控制》 2025年第2期246-253,共8页
为了实现机器人语音控制,并避免环境噪音的干扰,研究提出了基于改进MFCC特征提取和深度神经网络的机器人语音控制指令识别方法;该方法利用线性判别分析、最大似然线性变换和说话人自适应变换对MFCC特征进行处理,获得了新的语音特征;同... 为了实现机器人语音控制,并避免环境噪音的干扰,研究提出了基于改进MFCC特征提取和深度神经网络的机器人语音控制指令识别方法;该方法利用线性判别分析、最大似然线性变换和说话人自适应变换对MFCC特征进行处理,获得了新的语音特征;同时通过深度玻尔兹曼机对声学模型进行了改进,并利用深度神经网络和谐波增强技术构建了语音增强方法;实验结果显示,研究提出的基于改进Mel频率倒谱系数特征能显著降低语音识别的字错误率,通过辅以改进深度神经网络-隐马尔科夫模型能进一步降低字错误率;在20 dB条件下,该特征和改进深度神经网络-隐马尔科夫模型的平均字错误率分别为24.9%和22.1%,均低于其他方法;上述结果表明,研究提出的语音识别方法能实现带噪声语音的准确识别,提高机器人的语音控制指令识别能力。 展开更多
关键词 语音识别 语音增强 声学模型 MFCC特征 DNN
在线阅读 下载PDF
基于音频的多特征融合低慢小目标探测研究
12
作者 王拓 张成 +3 位作者 祁万龙 苏照兵 齐志强 隋振雨 《现代电子技术》 北大核心 2025年第11期61-68,共8页
无人机逐渐成为现代战争的重要侦察与打击手段,对于低慢小目标的探测与识别变得越来越重要。音频作为一种重要的感知模态,在目标探测中具有独特的优势,特别是在无线电频谱资源受限或图像信息不可用的情况下。针对该问题,文中提出一种基... 无人机逐渐成为现代战争的重要侦察与打击手段,对于低慢小目标的探测与识别变得越来越重要。音频作为一种重要的感知模态,在目标探测中具有独特的优势,特别是在无线电频谱资源受限或图像信息不可用的情况下。针对该问题,文中提出一种基于音频的多特征融合方法用于对低慢小目标进行探测。模型采用两分支结构:第一个分支通过在音频数据的梅尔语谱图上提取特征,设计一种全新的LLSIncepNeXt模块,通过并行的卷积核提取时间与频率两个维度的信息;另一个分支将音频的MFCC特征直接输入到双向GRU提取时序特征,随后将两个分支提取到的特征进行融合,并通过多头注意力机制强化重点特征,区别不同特征的贡献程度。通过在Drone Detection以及UrbanSound8K数据集上的结果显示,提出的多特征融合网络相较于使用单一特征的方法有了很大的提升,并且在对无人机音频的分类上相较其他方法取得了更好的效果。 展开更多
关键词 低慢小目标 音频感知 多特征融合 目标探测 深度学习 GRU InceptionNeXt MFCC
在线阅读 下载PDF
基于卷积自编码器的煤矿带式输送机异常声音检测方法
13
作者 申龙 单浩然 +2 位作者 裴文良 杨贵翔 王永利 《工矿自动化》 北大核心 2025年第2期100-105,共6页
针对煤矿带式输送机异常声音样本缺少导致训练模型难以进行异常识别的问题,提出一种基于卷积自编码器(CAE)的煤矿带式输送机异常声音检测方法。首先,采集煤矿带式输送机托辊、减速机、电动机正常运行的声音信号,通过WebRTC降噪算法过滤... 针对煤矿带式输送机异常声音样本缺少导致训练模型难以进行异常识别的问题,提出一种基于卷积自编码器(CAE)的煤矿带式输送机异常声音检测方法。首先,采集煤矿带式输送机托辊、减速机、电动机正常运行的声音信号,通过WebRTC降噪算法过滤信号中的背景噪声,计算降噪后信号的梅尔频率倒谱系数(MFCC),获得设备正常运行的音频特征并输入到CAE中进行训练,得到训练好的CAE及重构的正常运行音频特征。其次,将正常运行音频特征和重构的正常运行音频特征输入均方损失函数(MSELoss),得到重构误差,并取重构误差最大值作为正常运行音频特征的重构阈值。然后,采集待检测的煤矿带式输送机托辊、减速机、电动机运行的声音信号,经WebRTC降噪、MFCC特征提取后输入到训练好的CAE,获得重构的待检测音频特征,将待检测音频特征与重构的待检测音频特征输入MSELoss,得到待检测音频的重构误差。最后,将待检测音频的重构误差与正常运行音频特征的重构阈值进行比较,若前者大于后者,则判断煤矿带式输送机存在异常。实验结果表明:在没有异常声音样本参与训练的情况下,该方法在带式输送机托辊、减速机、电动机运行声音数据集上的检测精确率分别达92.55%,94.98%,93.60%,单组声音检测时间为1.230 s,实现了检测精度和检测速度之间的平衡。 展开更多
关键词 煤矿带式输送机 故障诊断 异常声音检测 卷积自编码器 MFCC
在线阅读 下载PDF
基于梅尔谱特征和改进ResNet网络的室内跌倒检测方法
14
作者 杨松铭 王玫 《桂林理工大学学报》 北大核心 2025年第2期251-259,共9页
为了解决现有的老年人跌倒事件识别方法存在的相关局限性,提出一种利用声音信号来进行跌倒检测的方法。该方法在声学特征提取阶段,从时间维度对梅尔谱特征进行补充,将梅尔谱及其一阶、二阶差分系数构建为类似图片的三维特征,使用卷积神... 为了解决现有的老年人跌倒事件识别方法存在的相关局限性,提出一种利用声音信号来进行跌倒检测的方法。该方法在声学特征提取阶段,从时间维度对梅尔谱特征进行补充,将梅尔谱及其一阶、二阶差分系数构建为类似图片的三维特征,使用卷积神经网络进行分类,提高了室内跌倒事件识别的抗噪性能。通过SimAM注意力、特征金字塔(FPN)以及动态区域感知卷积(DRConv)来改进网络结构。实验结果表明,在不同数据集下,该方法比传统识别方法性能更优。改进后的网络模型在A3FALL数据集上的查准率、召回率和F1-Score分别达到了98.43%、98.21%和98.32%;对于人类跌倒的声音识别,其F1-Score达到了96.45%,相较于其他传统网络模型都具有更好的表现。 展开更多
关键词 跌倒检测 SimAM 卷积神经网络 特征金字塔 动态区域感知卷积 梅尔频率倒谱系数(MFCC)
在线阅读 下载PDF
基于MFCC的越剧念白相似度比较
15
作者 陈圣宣 林捷 徐维阳 《信息化研究》 2025年第4期1-4,26,共5页
本研究基于梅尔倒谱系数对越剧念白声学特征进行余弦相似度比较。结果表明,不同演员对同一念白的演绎呈现分区分布特征,其中相似度大于0.8的个体被认为具有高度相似的念白演唱风格。值得注意的是,谢群英在不同文本中的念白相似度高达0.... 本研究基于梅尔倒谱系数对越剧念白声学特征进行余弦相似度比较。结果表明,不同演员对同一念白的演绎呈现分区分布特征,其中相似度大于0.8的个体被认为具有高度相似的念白演唱风格。值得注意的是,谢群英在不同文本中的念白相似度高达0.85,表明其演唱风格具有较强的稳定性,可作为特定流派的念白演唱参考样本。进一步的声学分析表明,越剧念白在不同演员之间表现出一定程度的趋同性,反映出该艺术形式在传承过程中可能受到严格的模仿训练。本研究提出的基于MFCC的念白分析方法,为越剧乃至其他戏曲剧种的数字化传承提供了一种可量化的研究路径,并对非物质文化遗产的保护与创新具有一定的实践价值。 展开更多
关键词 越剧念白 MFCC 相似度比较 非遗传承
在线阅读 下载PDF
基于时频融合的生物哈希密文音频认证
16
作者 张帅 张园 +1 位作者 刘月 王金龙 《中国电子科学研究院学报》 2025年第3期304-313,共10页
现有的音频哈希认证在哈希构造的过程中容易造成音频数据和音频特征的泄露,且单一音频特征容易造成区分性和鲁棒性较差进而导致认证性能低下。为了解决上述问题,文中提出了一种基于时频特征融合的生物哈希密文音频认证。在注册阶段中,首... 现有的音频哈希认证在哈希构造的过程中容易造成音频数据和音频特征的泄露,且单一音频特征容易造成区分性和鲁棒性较差进而导致认证性能低下。为了解决上述问题,文中提出了一种基于时频特征融合的生物哈希密文音频认证。在注册阶段中,首先,对原始音频采用混沌置乱-移位加密构建密文音频库;然后,密文音频分别提取频域和时域的余弦MFCC特征和TEOCC特征并进行融合处理;最后,将融合特征与密钥控制正交矩阵内积构造特征安全模板,并量化处理构造生物哈希。在认证阶段,将认证用户密文音频的生物哈希与注册阶段生物哈希计算汉明距离进行认证并将认证结果返回给认证用户。实验结果表明:文中提出的时频融合特征方法提高了认证系统的区分性和鲁棒性,并且认证系统在不同的噪声环境下具有较好的认证通过率。采用的混沌置乱-移位加密算法对密钥较敏感并能有效抵抗统计攻击。同时,本文的安全模板具有较好的可撤销性。 展开更多
关键词 MFCC TEOCC 混沌置乱-移位加密 生物哈希 安全模板
在线阅读 下载PDF
水声目标识别中的多尺度特征提取方法研究
17
作者 孙旦 《现代信息科技》 2025年第16期8-14,共7页
水声目标识别是水声信息处理领域的重要研究课题,其特征提取与识别面临着水声环境复杂、目标特征多变等挑战。文章深入分析了基于Mel频率倒谱系数(MFCC)和希尔伯特-黄变换(HHT)的两种多尺度特征提取方法的理论基础、算法实现和性能特点... 水声目标识别是水声信息处理领域的重要研究课题,其特征提取与识别面临着水声环境复杂、目标特征多变等挑战。文章深入分析了基于Mel频率倒谱系数(MFCC)和希尔伯特-黄变换(HHT)的两种多尺度特征提取方法的理论基础、算法实现和性能特点。研究表明,MFCC方法通过基于Mel频率尺度的听觉感知特性和短时傅里叶变换实现非线性映射,有效表达了水声信号的频谱特征;HHT方法基于自适应分解框架,能够准确捕捉水声目标的动态特征。针对水声目标识别的特殊需求,文章提出了基于时频分辨率权衡的参数优化和基于能量-频率分布的分量筛选等优化策略,并从计算复杂度、特征表达能力和环境适应性三个维度建立了系统的对比分析框架,为实际应用中的方法选择提供了理论依据。 展开更多
关键词 水声目标识别 特征提取 MFCC HHT 多尺度分析
在线阅读 下载PDF
基于语音活动检测的阵列信号测向研究
18
作者 李纪元 田益民 +1 位作者 赵乾曜 孙兆永 《计算机科学与应用》 2025年第4期394-405,共12页
为研究长时信号中对具有特定特征的声音来源方向进行检测的问题,本课题提出一种基于多特征自适应的语音信号活动检测对长时阵列信号进行检测,将结合多子空间拟合(MUSIC)算法与语音活动检测(VAD)技术,提出一种新型的信号处理方法,旨在提... 为研究长时信号中对具有特定特征的声音来源方向进行检测的问题,本课题提出一种基于多特征自适应的语音信号活动检测对长时阵列信号进行检测,将结合多子空间拟合(MUSIC)算法与语音活动检测(VAD)技术,提出一种新型的信号处理方法,旨在提高对特征明显且目标具有特定属性的信号源的检测精度和定位准确性。通过语音信号MFCC特征和语音信号能量特征来设置自适应阈值,对特定声源的特征进行语音活动检测,以提高语音活动检测的准确性。再通过检测到的语音信号活动片段进行阵列信号测向,通过MUSIC算法实现对长时信号中不同时段不同来源方向的特定声源进行检测。To investigate the problem of detecting the direction of sound sources with specific features in long-term signals, this project proposes a voice signal activity detection method based on multi feature adaptation for detecting long-term array signals. By combining the Multi Subspace Fitting (MUSIC) algorithm with Voice Activity Detection (VAD) technology, a new signal processing method is proposed to improve the detection and localization accuracy of signal sources with obvious features and specific target attributes. By setting adaptive thresholds based on the MFCC features and energy features of voice signals, voice activity detection can be performed on specific sound source features to improve the accuracy of voice activity detection. Then, the direction of arrival is determined by detecting active voice signal segments, and the MUSIC algorithm is used to detect specific sound sources in different time periods and source directions in long-term signals. 展开更多
关键词 语音活动检测 阵列信号测向 MUSIC算法 MFCC
在线阅读 下载PDF
音频比对监测在中波转播台的应用分析
19
作者 普布 《中国科技纵横》 2025年第13期83-85,共3页
为研究音频比对监测技术在中波转播台中的应用,本文分析当前中波转播台面临的信号传输稳定性、设备老化和监测手段落后等问题,研究音频比对监测的功能和工作原理,重点介绍其在提高自动化监控水平、实现精确音频比对、提升广播质量、优... 为研究音频比对监测技术在中波转播台中的应用,本文分析当前中波转播台面临的信号传输稳定性、设备老化和监测手段落后等问题,研究音频比对监测的功能和工作原理,重点介绍其在提高自动化监控水平、实现精确音频比对、提升广播质量、优化听众体验以及实现故障预防和快速诊断等方面的应用,旨在通过引入先进的音频比对监测技术,提升中波转播台的信号质量和运营效率,保障广播系统的可靠性,促进广播事业的持续发展。 展开更多
关键词 中波转播台 音频比对监测 MFCC算法 自动化监控 信号质量
在线阅读 下载PDF
自动改卷中语音答题的特征提取与处理
20
作者 朱家全 韦海清 《电声技术》 2025年第4期76-78,共3页
针对英语口语评分的自动化需求,利用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)方法对英语语音信号进行特征提取,从中提取能有效表征语音质量的特征向量;然后,基于门控循环单元(Gated Recurrent Unit,GRU)的深度学习... 针对英语口语评分的自动化需求,利用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)方法对英语语音信号进行特征提取,从中提取能有效表征语音质量的特征向量;然后,基于门控循环单元(Gated Recurrent Unit,GRU)的深度学习模型分析提取的特征向量,实现评分。实验结果表明,该方法在准确率方面表现出良好的水平。 展开更多
关键词 自动评分 语音分析 梅尔频率倒谱系数(MFCC) 门控循环单元(GRU)
在线阅读 下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部