噪声环境下法庭语音证据量化评价方法被引量：3

QUANTITATIVE EVALUATION METHOD OF COURT VOICE EVIDENCE IN NOISE ENVIRONMENT

下载PDF

导出

摘要针对说话人自动识别系统的性能与稳定性在高噪声环境下会严重下降,人耳却能捕捉高噪声环境中的目标语音的问题。提出使用能模拟耳蜗听觉特性的GFCC(Gammatone Frequency Cepstral Coefficient)特征与主成分分析(Principal Component Analysis,PCA)相结合的方法,以提高识别系统的鲁棒性。在不同程度信噪比的真实语音案件噪声条件下,对国际上最认可的基于似然比证据评估体系的法庭自动说话人识别系统的准确性和稳定性进行测试。实验结果显示:GFCC特征在多个程度的信噪比条件下,甚至信噪比为-20 dB的条件下,依然能保持较高的识别准确度和良好的稳定性,并能够提供可量化、可重复的证据强度值。 The performance and stability of speaker automatic recognition system are seriously degraded in high noise environment, but the human ear can capture target speech. In order to improve the robustness of the recognition system, we proposed a combination of gammatone frequency cepstral coefficients(GFCC) features and principal component analysis(PCA), which could simulate the cochlear auditory characteristics. The accuracy and stability of the most internationally recognized court automatic speaker recognition system based on likelihood ratio evidences evaluation system were tested under the conditions of different SNR of real voice cases. The experimental results show that the GFCC features can maintain high recognition accuracy and good stability, and can provide quantifiable and repeatable evidence strength values under various SNR conditions, even under the condition of SNR -20 dB.

作者王华朋姜囡晁亚东刘恩 Wang Huapeng;Jiang Nan;Chao Yadong;Liu En(Department of Video and Audio Materior Examination,Criminal Investigation Police University of China,Shenyang 110854,Liaoning,China)

机构地区中国刑事警察学院声像资料检验技术系

出处《计算机应用与软件》北大核心 2019年第7期65-68,98,共5页 Computer Applications and Software

基金 2016国家社会科学基金重点项目(16AYY015) 辽宁省重点研发计划项目(2017231006,2017231004) 公安部公安理论及软科学项目(2017LLYJXJXY040)

关键词 GFCC 似然比证据强度科学证据 PCA GFCC Likelihood ratio Evidence strength Scientific evidence PCA

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1王华朋,许锋.论法庭证据评估体系的发展[J].证据科学,2014,22(1):56-63. 被引量：14
2陈世雄,宫琴,金慧君.用Gammatone滤波器组仿真人耳基底膜的特性[J].清华大学学报（自然科学版）,2008,48(6):1044-1048. 被引量：33
3王华朋.基于听觉模型的法庭语音证据特征量化[J].中国刑警学院学报,2018(1):119-122. 被引量：6
4茅正冲,王正创,黄芳.基于GFCC与RLS的说话人识别抗噪系统研究[J].计算机工程与应用,2015,51(10):215-218. 被引量：5
5熊冰峰,曾以成,谢小娟.一种改进的听觉特征参数应用于说话人识别[J].计算机应用,2016,36(A01):82-85. 被引量：6
6王晓兰,王蓓,顾为一.基于稀疏核主成分分析的语音情感识别研究[J].信息化研究,2014,40(1):36-39. 被引量：1

二级参考文献47

1肖哲.基于Matlab的RLS自适应语音噪声对消系统的设计与实现[J].长沙大学学报,2006,20(2):83-86. 被引量：4
2von Bekesy G. Concerning the pleasures of observing, and the mechanics of the inner ear pC]// Nobel Lectures in Physiology or Medicine. Amsterdam, Netherlands: Elsevier Science, 1964: 722-746.
3Lyon R F, Mead C. An analog electronic cochlea [J]. Acoustics, Speech, and Signal Processing, 1988, 36(7) : 1119- 1134.
4Patterson R D, Moore B C J. Auditory filters and excitation patterns as representations of frequency resolution [C]// Frequency Selectivity in Hearing. London: Academic Press, 1986: 123- 177.
5Johannesma P I M. The pre-response stimulus ensemble of neurons in the cochlear nucleus [C]//Proc of the Symposium on Hearing Theory. Eindhoven, Netherlands : IPO, 1972: 58 - 69.
6Glasberg B R, Moore B C J. Derivation of auditory filter shapes from notched noise data [J]. Hearing Research, 1990, 47(1): 103- 108.
7Martin C. Modelling auditory processing and organisation [D]. Sheffield, Britain: University of Sheffield, 1991.
8Greenwood D D. A Cochlear frequency-position function for several species-29 years later [J]. J Acoust Soc Am, 1990, 87(6): 2592- 2605.
9Burkhardt F, Paeschke A, Rolfes M, et al. A database ofgerman emotiorml speechEC3//Proceedings of interspeech 2005. Portu- gal: Lizbon, 2005 : 1517 - 1520.
10Engberg I S, Hansen A V. Center forperson kommunikation: Documentation of the danish emotional speech database(DES) [R].Denmark:Intemal AAU report,1996.

共引文献53

1贾瑞,李冬梅.实时的Gammatone听感知滤波器组的FPGA实现[J].微电子学与计算机,2015,32(1):35-39. 被引量：1
2李允公,张金萍,戴丽,张占一,刘杰.基于听觉模型ZCPA的故障诊断特征提取方法研究[J].中国机械工程,2009(24):2988-2992. 被引量：9
3蒋毅,梁维谦,周宏,冯振明.低信噪比下二值掩蔽算法性能分析[J].清华大学学报（自然科学版）,2012,52(5):636-641. 被引量：3
4吴丽进,李应.一种基于消除能量偏差的双层环境声识别模型[J].计算机应用与软件,2012,29(6):11-13.
5李允公,戴丽,张金萍.一种双耳听觉模型及其在轴心轨迹分析中的应用[J].振动与冲击,2012,31(18):46-49. 被引量：3
6罗元,陈君,张毅,童开国.基于耳蜗基底膜特性的语音特征提取方法及在智能轮椅上的应用[J].计算机应用研究,2012,29(10):3765-3768. 被引量：2
7谭晓衡,许可,秦基伟.基于听觉感知特性的语音质量客观评价方法[J].西南交通大学学报,2013,48(4):756-760. 被引量：6
8张毅,邢武超,罗元,何春江.基于耳蜗核模型改进双耳时间差的声源定位[J].计算机应用,2013,33(11):3280-3283. 被引量：1
9钱思冲,向阳,肖小勇,王校青.基于Gammatone滤波器组的内燃机气缸盖振动特性研究[J].内燃机工程,2013,34(6):36-42. 被引量：4
10张琳,王珊,秦晓瑜,陈海霞,王连明.基于听觉仿生模型的乐器识别[J].东北师大学报（自然科学版）,2014,46(1):75-79. 被引量：5

同被引文献18

1张红兵.不同信道语音差异的实验研究[J].中国刑警学院学报,2009(4):52-54. 被引量：2
2王英利,潘自勤,蓝常山.声纹鉴定中的音强特征研究[J].中国司法鉴定,2011(5):19-22. 被引量：7
3李会雅,苑林,门晋喜,韩晓霞.低复杂度的基音检测算法[J].河北大学学报（自然科学版）,2013,33(5):548-553. 被引量：1
4韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：176
5曹洪林,丁铁珍.京沪穗深津渝六市法院声纹鉴定证据应用的实证研究[J].证据科学,2018,26(5):622-638. 被引量：7
6茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
7邵兵,杜鹏飞.基于卷积神经网络的语音情感识别方法[J].科技创新导报,2016,13(6):87-90. 被引量：6
8任浩,叶亮,李月,沙学军.基于多级SVM分类的语音情感识别算法[J].计算机应用研究,2017,34(6):1682-1684. 被引量：26
9孙念,张毅,林海波,黄超.基于多特征i-vector的短语音说话人识别算法[J].计算机应用,2018,38(10):2839-2843. 被引量：7
10周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：47

引证文献3

1郭卉,姜囡,任杰.基于MFCC和GFCC混合特征的语音情感识别研究[J].光电技术应用,2019,34(6):34-39. 被引量：12
2杨英仓.录制方式变化对法庭说话人识别的影响[J].清远职业技术学院学报,2021,14(5):47-57. 被引量：2
3杨爽,马佰超,杨宇,陈丹.辅助短语音条件下说话人确认系统的seq2seq模型[J].计算机应用与软件,2025,42(4):223-228.

二级引证文献14

1毛文青,管业鹏.基于LPBMFCC的文本无关说话人识别[J].电子测量技术,2020,43(19):169-176. 被引量：2
2龙英潮,丁美荣,林桂锦,刘鸿业,曾碧卿.基于视听觉感知系统的多模态情感识别[J].计算机系统应用,2021,30(12):218-225. 被引量：4
3翟永杰,彭雅妮,杨旭,胡东阳,王新颖.融合MFCC和IMFCC特征的电厂设备声音识别算法[J].现代电子技术,2022,45(8):6-12. 被引量：8
4张敏,贾海蓉,张刚敏,王素英.结合自适应软掩模和混合特征的语音增强[J].西安电子科技大学学报,2022,49(2):108-115.
5王赵国,韦存海,彭雅妮,武明路,李军彬,翟永杰.基于GFCC-SVM-RFE的电力设备声音特征提取方法[J].电力信息与通信技术,2022,20(9):34-42. 被引量：3
6邓鑫,杨超,王岩松,郭辉.基于VMD和ReliefF算法的汽车鸣笛声识别方法[J].电子设计工程,2023,31(10):54-58. 被引量：1
7郑晨颖,马建芬,张朝霞.基于多特征融合的参数再合成语音增强算法[J].计算机工程与设计,2023,44(8):2367-2373. 被引量：3
8李牧,杨宇恒,柯熙政.基于混合特征提取与跨模态特征预测融合的情感识别模型[J].计算机应用,2024,44(1):86-93. 被引量：6
9孙洪涛,刘春防,李望荣.一种基于K210的声音采集与识别系统设计[J].计算机应用文摘,2024,40(8):99-101. 被引量：1
10吴婷,刘琼,郭慧茹.基于鲁棒纹理特征的环境声音事件检测方法[J].电子器件,2024,47(2):530-535. 被引量：1

1王华朋,姜囡,刘恩,晁亚东.法庭语音比对中话者自身变化性建模方法研究[J].计算机工程与应用,2019,55(8):110-115. 被引量：2
2王凯莉,章轶立,谢雁鸣,魏戌,姜俊杰,安一方.针刺治疗绝经后骨质疏松症有效性及安全性的系统评价和Meta分析[J].中国骨质疏松杂志,2019,0(4):452-460. 被引量：21
3曹丽娟,于玲,孙静,田洪昭,周亚滨.养心汤治疗病毒性心肌炎Meta分析[J].河南中医,2019,39(5):701-705. 被引量：3
4周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：47
5数字[J].新疆农垦科技,2019,42(2).
6沈敦璞,王猛,于海峰,郭兴家.手印显现的对比度量化研究[J].辽宁大学学报（自然科学版）,2019,46(1):79-84. 被引量：7
7陈瑜.电子设备“六性”质量监督研究[J].舰船电子工程,2019,39(6):17-21. 被引量：2
8程小伟,王健,曾庆宁,谢先明,龙超.噪声环境下稳健的说话人识别特征研究[J].声学技术,2017,36(5):479-483. 被引量：8
9魏锦强,陈汉旭,周俊德,张昌林,李晓君,林颖.穴位埋线治疗慢性荨麻疹疗效与安全性的系统评价[J].广州中医药大学学报,2019,36(6):861-868. 被引量：17
10王荣辉,谢丽萍,苏朝东,谢永祥,史伟,刘少会,杜少鹏.疏血通注射液联合ACEI/ARB类药物治疗糖尿病肾病的Meta分析[J].辽宁中医杂志,2019,46(2):225-230. 被引量：1

计算机应用与软件

2019年第7期

浏览历史

内容加载中请稍等...

噪声环境下法庭语音证据量化评价方法被引量：3

参考文献6

二级参考文献47

共引文献53

同被引文献18

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

噪声环境下法庭语音证据量化评价方法 被引量：3

参考文献6

二级参考文献47

共引文献53

同被引文献18

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

噪声环境下法庭语音证据量化评价方法被引量：3