基于MFCC和加权动态特征组合的环境音分类被引量：4

Environmental Sounds Classification Using MFCC Combined with Weighted Dynamic Features

下载PDF

导出

摘要提出了基于Mel倒谱系数和加权的一阶、二阶差分Mel倒谱系数特征参数组合的环境音分类,实验结果表明以MFCC+αΔMFCC+βΔΔMFCC为特征参数的分类正确率明显高于MFCC、MFCC+ΔMFCC和MFCC+ΔMFCC+ΔΔMFCC。 This paper presents environmental sounds classification using MFCC combined with weighted delta Mel-Frequeney Cepstrum Coefficient （△MFCC） and double delta Mel-Frequeney Cepstrum Coefficient（△△MFCC）. Experiment results show that MFCC＋α△MFCC-β△△MFCC yields higher recognition accuracy for environmental sounds.

作者魏丹芳李应

机构地区福州大学数学与计算机科学学院

出处《计算机与数字工程》 2010年第2期7-10,共4页 Computer & Digital Engineering

基金福建省教育厅项目(编号:JA09021)资助

关键词 MEL倒谱系数差分Mel倒谱系数环境音分类 mel-frequency cepstrum coefficient, delta mel-frequency cepstrum coefficient, environmental sounds classificaition

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1Zhang T, Kuo C C C. Audio content analysis for online audiovisual data segmentation and classification [J]. IEEE Transactions on Speech and Audio Processing, 2001,9(4) : 441-458.
2Kim K M, Kim S Y, Jeon J K, et al. Quick audio retrieval using multiple feature vectors[J]. IEEE Trans. on Consumer Electronics, 2006,52 (1) : 200-205.
3Kiranyaz S, Qureshi A F, Gabbouj M A generic audioctassification and segmentation approach for multimedia indexing and retrieval[J]. IEEE Trans. on Audio, Speech and Language Processing,2006,14(3):1062-1081.
4Ying Li. A Quick Classification for Area Environmental Audio Data Based on Local Search Tree[J]. ESIAT 2009.
5江星华,李应.基于LPCMCC的音频数据检索方法[J].计算机工程,2009,35(11):246-247. 被引量：5
6于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14

二级参考文献9

1张成,蒋皓石,林嘉宇.基于16位单片机的语音电子门锁系统[J].电子技术应用,2005,31(7):18-21. 被引量：9
2Wold E, Blum T, Keislar D, et al. Content-based Classification, Serarch, and Retrieval of Audio[J]. IEEE Multimedia, 1996, 3(3): 27-36.
3Li S Z. Content-based Classification and Retrieval of Audio Using the Nearest Feature Line Method[J]. IEEE Trans. on Speech and Audio Processing, 2000, 8(5): 619-625.
4Kim K M, Kim S Y, Jeon J K, et al. Quick Audio Retrieval Using Multiple Feature Vectors[J]. IEEE Trans. on Consumer Electronics, 2006, 52(1): 200-205.
5Zhang Xueying, Guo Yueling, Hou Xuemei. A Speech Recognition Method of Isolated Words Based on Modified LPC Cepstrum[C]//Proc. of GrC'07. California, USA: IEEE Press, 2007.
6何英何强.MATLAB扩展编程[M].北京：清华大学出版社,2002..
7FAKOTAKIS N,SIRIGOS J.A high performance text-independent speaker identification system based on vowel spotting and neural nets[A].Proceedings of IEEE Int Conf on Acoustics,Speech and Signal Processing[C].Atlanta,GA,USA,1996.
8林宝成,陈永彬.基于ARMA模型的汉语讲话者识别[J].声学学报,1998,23(3):229-234. 被引量：6
9付强,易克初,田斌,田红心.一种采用余弦镶边临界带滤波器组的弯折谱失真测度[J].西安电子科技大学学报,1999,26(6):823-827. 被引量：6

共引文献17

1王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J].河北工业大学学报,2010,39(4):14-18. 被引量：11
2余建潮,张瑞林.基于MFCC和LPCC的说话人识别[J].计算机工程与设计,2009,30(5):1189-1191. 被引量：49
3刘力维,袁高高,潘志刚,董俊.基于GMM和枪声的军事环境判别[J].舰船电子工程,2009,29(6):103-105. 被引量：3
4俞利强,马道钧.用于神经网络说话人识别的PCA-GA研究[J].计算机工程与设计,2009,30(19):4503-4505. 被引量：2
5齐晓倩,陈鸿昶,黄海.基于K-L距离的两步固定音频检索方法[J].计算机工程,2011,37(19):160-162. 被引量：8
6莫丽花,周孝进,张晓俊,陶智,赵鹤鸣,顾济华.基于LPCC和MFCC参数的病理嗓音识别研究[J].通信技术,2012,45(1):87-89. 被引量：3
7胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：23
8章宗标.一种基于PCA-BP 神经网络的示例优选方法[J].计算机工程与应用,2013,49(19):108-111. 被引量：5
9曹文明,王耀南.基于音频识别的无人值守变电站设备在线监测[J].湖南大学学报（自然科学版）,2013,40(9):48-55. 被引量：12
10金国平,余宗桥,郭延文,蒋和.基于GPU加速的音频检索技术[J].计算机工程,2014,40(5):266-269.

同被引文献42

1章熙春,曹燕,张军,韦岗.语音MFCC特征计算的改进算法[J].数据采集与处理,2005,20(2):161-165. 被引量：7
2郭春霞,裘雪红.基于MFCC的说话人识别系统[J].电子科技,2005,18(11):53-56. 被引量：19
3陈芬菲.基于GMM的说话人识别系统[J].微处理机,2006,27(4):76-77. 被引量：3
4Twang Y, Li B, Jiang X Q, et al. Speaker Recognition Based on Dynamic MFCC Parameters[ C ]//International Conferenceon Image Analysis and Signal Processing. [ s. 1. ] : [ s. n. ], 2009:406-409.
5l_,ai Y P, Siu M H, Mark B. Joint Optimization of the Frequency Domain and Time-domain Transformation in Deriving Gener- allized Static and Dynamic MFCCs [ J ]. IEEE Signal Process- ing Letters ,2006,13 ( 11 ) :707-710.
6Wang C, Miao Z J, Meng X. Differential MFCC and Vector Quantization Used for Real-time Speaker Recognition System [ J ]. Congress on Image and Signal Processing,2008 (5) :319 -323.
7Dempster A, Laird N, Rubin D. Maximum likelihood from in- complete data via the EM algorithm [ J ]. J Royal Stat Soc, 1977,39( 1 ) : 1-38.
8Choi W-H, Kim S-I, Keum M-S, et al. Acoustic and visu- al signal based context awareness system for mobile appli- cation[ J ]. IEEE Transactions on Consumer Electronics, 2011,57(2) :738-746.
9Ma Ling, Milner B, Smith D. Acoustic environment classi- fication[ J ]. ACM Transactions on Speech and Language Processing, 2006,3 (2).
10Wichern G, Xue Jiachen, Thornburg H, et al. Segmenta- tion, indexing, and retrieval for environmental and natural sounds [ J ]. IEEE Transactions on Audio, Speech, and Language Processing, 2010,18 (3) :688-707.

引证文献4

1赵青,成谢锋,朱冬梅.基于改进MFCC和短时能量的咳嗽音身份识别[J].计算机技术与发展,2012,22(6):82-84.
2李玲俐.基于MFCC-SVM和交叉验证方法的环境音分类[J].计算机与现代化,2016(8):36-39. 被引量：8
3张朝柱,黄妤宁.基于自编码器的飞机类型识别方法[J].无线电工程,2019,49(7):601-605. 被引量：1
4王家盛,郭其威,吴松,马建敏.基于特征相对贡献度对加权Mel倒谱的改进[J].声学技术,2021,40(3):408-414. 被引量：7

二级引证文献16

1韩鹏飞,陈晓.基于MFCC-IMFCC和GA-SVM的鸟声识别[J].计算机系统应用,2022,31(11):393-399. 被引量：12
2孟含,高述勇,符朝兴,沈威,闫福珍.基于分块分割GA-SVM算法的汽车侧面轮廓提取[J].青岛大学学报（工程技术版）,2019,34(3):59-63.
3秦鹏霄.基于Kriging模型的铁路棚架结构失效预测[J].计算机与现代化,2019,0(12):6-9. 被引量：1
4王天锐,鲍骞月,秦品乐.基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法[J].计算机应用,2019,39(12):3515-3521. 被引量：5
5王伟东.声音的特征分类在新能源汽车主动发声设计中的应用[J].上海汽车,2020(3):6-9. 被引量：2
6吴昊,张莹,杨嘉乐,杨元元.基于机器学习的影视音效识别分类研究[J].电声技术,2020,44(7):30-34.
7杨磊,赵红东.基于注意力模型的卷积循环神经网络城市声音识别[J].科学技术与工程,2020,20(33):13757-13761. 被引量：5
8邬友朋,赵金龙,贾中营.一种基于KNN/CNN的供热客服音频分类方法[J].电力大数据,2021,24(7):56-66. 被引量：1
9王学松,王世刚,郭毅峰.基于EEMD的融安方言语音合成算法研究[J].传感器世界,2022,28(6):25-29. 被引量：1
10汤文博,王方刚,刘钰,王宏宇.基于软信息的CCSDS标准RS码识别算法[J].无线电工程,2023,53(3):577-583.

1张小梅,杨鼎才.基于支持向量机模型的环境音分类研究[J].电子测量技术,2008,31(9):121-123. 被引量：4
2杨鸿武,赵涛涛.一种基于加权Mel倒谱的语音信号共振峰提取算法[J].西北师范大学学报（自然科学版）,2014,50(1):53-57. 被引量：6
3姚军财.一种基于DFT的数字图像压缩算法[J].陕西理工学院学报（自然科学版）,2012,28(3):22-26. 被引量：4
4徐国鑫,张建华,罗强,张平.OFDMA下行链路的延迟加权动态子载波分配算法[J].北京邮电大学学报,2005,28(5):70-73. 被引量：1
5赵丽华,王鹏宇.基于Matlab的非时域端点检测算法的实现与分析[J].科学技术与工程,2010,10(35):8822-8825.
6张燕,唐振民,李燕萍,邹益.基于MFCC和HMM的音乐分类方法研究[J].南京师范大学学报（工程技术版）,2008,8(4):112-114. 被引量：9
7王康,叶伟,劳国超,胡楷钰.基于稀疏系数特征的压缩感知信号检测算法[J].电子信息对抗技术,2015,30(2):26-29. 被引量：5
8张震,王化清.语音信号特征提取中Mel倒谱系MFCC的改进算法[J].计算机工程与应用,2008,44(22):54-55. 被引量：29
9庞陟儒,张雪英,刘晓峰.基于PCA-MFCC支持向量机快速语音识别[J].科学技术与工程,2013,21(4):1034-1036. 被引量：1
10李健,戴天虹.说话人识别特征提取中改进算法的研究[J].森林工程,2009,25(2):38-40. 被引量：3

计算机与数字工程

2010年第2期

浏览历史

内容加载中请稍等...

基于MFCC和加权动态特征组合的环境音分类被引量：4

参考文献6

二级参考文献9

共引文献17

同被引文献42

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于MFCC和加权动态特征组合的环境音分类 被引量：4

参考文献6

二级参考文献9

共引文献17

同被引文献42

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于MFCC和加权动态特征组合的环境音分类被引量：4