基于分频带自相关函数的混叠语音基频分离提取新算法被引量：1

Pitch Extracting New Method for Mixed Speeches Based on Multi-band Autocorrelation Function

下载PDF

导出

摘要混叠语音的基频分离提取问题是听觉场景分析系统的重要一环。以往的分频带自相关函数的混叠语音基频分离提取方法都是基于频带只受混叠信号之一支配的假设,而事实上,频带常常同时受两个信号影响,为此,本文提出了一种混叠语音基频分离提取新算法,算法在寻找可能的频带组时采用了闭环自适应频带选取模块,根据频带组的基频及其周期度确定两个潜在基频,提高了搜索潜在基频的鲁棒性;利用两个潜在基频重新判断频带的归属来分离信号提取基频,提高了提取基频的精度。实验结果证明新算法具有较高的有效基频提取精度。 Extracting pitches from mixed speech is an important part in auditory scene analysis. The former mixed speech pitch extracting method using multi-band autocorrelation function is based on the assumption that frequency channel is dominated by one of the mixed signal, but actually, frequency channel is often dominated by both of the two signals. This paper presents a new bitch extraction method, which uses close-loop adaptive frequencies picking block to pick out the possible frequencies group, selects the two potential pitches base on the frequencies groups pitches and the relation between their periodicity so as to improve the robustness of finding potential pitches. By separating all the frequency channels according to the two potential pitches, the accuracy of the extracted pitch is improved. Experiments show that the new method has higher pitch accuracy than former method.

作者黄秀轩季飞韦岗

机构地区华南理工大学电子与通信工程系

出处《信号处理》 CSCD 2004年第5期490-493,共4页 Journal of Signal Processing

基金国家自然科学基金资助课题(69871011 60172048)

关键词混叠语音基频分频频带听觉场景分析自相关函数信号新算法鲁棒性搜索 autocorrelation function multi-band pitch

分类号 TP391 [自动化与计算机技术—计算机应用技术] TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1Bergman A.S. Auditory Scene Analysis: The Perceptual Organization of Sound. The MIT Press, 1990.
2Cooke M, Ellis D P W. The auditory organization of speech and other sources in listeners and computational models. Speech Communication, 2001, 35(3-4): 141-177.
3Me~ddis R, O'Mard L. PsychophysicaUy Faithful Methods for Extracting Pitch. In Computational Auditory Scene Analysis (eds: D.Rosenthal & H. Okuno). Lawrence Erlbaum, 1998: 43-58.
4赵鹤鸣,舒春燕,周旭东.基于SHS的重叠语音基音分离检测方法[J].信号处理,2000,16(1):63-67. 被引量：4
5L.R. Rabiner and R.W. Schafer, Digital Processing of Speech Signals, Englewood Cliffs, NJ: Prentice-Hall.1987.
6Meddis R, Hewitt M J. V'muM pitch and phase sensitivity of a computer model of the auditory periphery I: Pitch identification. J. Acoust. Soc. Am., 1991, 89(6): 2866-2882.

二级参考文献6

1汪军,何振亚.瞬时混叠信号盲分离[J].电子学报,1997,25(4):1-5. 被引量：11
2周旭东赵鹤鸣.基于谐波搜索和跟踪的基音提取方法.1997中国神经计算科学会议论文集[M].,1997.725-728.
3周旭东，1997中国神经计算科学会议论文集，1997年，725页
4杨行峻，语音信号数字处理，1995年
5Luo H Y，博士学位论文，1994年
6Yen K C，ICASSP 97，859页

共引文献3

1黄秀轩,韦岗.一种混叠语音清浊音判断方法[J].计算机工程,2004,30(18):29-30.
2周超,洪弘.汉语普通话双基频检测[J].声学学报,2011,36(2):239-243. 被引量：1
3魏金太,高穹.基于深度学习的对话重叠语音片段检测[J].中北大学学报（自然科学版）,2021,42(1):34-39. 被引量：2

同被引文献73

1赵鹤鸣,葛良,陈雪勤,俞一彪.基于声音定位和听觉掩蔽效应的语音分离研究[J].电子学报,2005,33(1):158-160. 被引量：16
2汪军,何振亚.瞬时混叠信号盲分离[J].电子学报,1997,25(4):1-5. 被引量：11
3Bregman A S. Auditory scene analysis: the perceptual organization of sound[M]. Cambridge, MA: The MIT Press, 1990.
4Brown G J, Cooke M. Computational auditory scene analysis[J]. Computer Speech and Language, 1994, (8): 297- 336.
5Common P. Independent component analysis, a new concept[J]. Signal Processing, 1994, (36): 287-314.
6ffers M. T. M. Sifting vowels: auditory pitch analysis sound segregation[D]. University of Gronigen, 1983.
7Weintraub M. A theory and computational model of auditory monaural sound separation[D]. E. E, Department, Stanford University, 1985.
8Mellinger D K. Event formation and separation in musical soundeD]. CCRMA, Stanford, 1991.
9Meddis R, Hewitt M. J. Modeling the identification of co ncurrent vowels with different fundamental frequencies [J]. Acoustic Society of America, 1991, 89 (6): 2866- 2882.
10Cooke M P. Modeling auditory processing and organization[D]. CS Dept, Univ. of Sheffield, 1991.

引证文献1

1李从清,孙立新,龙东,任晓光.语音分离技术的研究现状与展望[J].声学技术,2008,27(5):779-787. 被引量：10

二级引证文献10

1郑燕琳,杨晓炯,许星宇.电话语音中基于多说话人的声纹识别系统[J].电信科学,2010,26(S2):105-108.
2李从清,孙立新,戴士杰,武方.声源定位分离技术在机器人领域的应用[J].电声技术,2010,34(1):49-53. 被引量：2
3张学良,刘文举,李鹏,徐波.改进谐波组织规则的单通道浊语音分离系统[J].声学学报,2011,36(1):88-96. 被引量：7
4李鸿燕,屈俊玲,张雪英.基于信号能量的浊语音盲信号分离算法[J].吉林大学学报（工学版）,2015,45(5):1665-1670. 被引量：2
5张毅,黎小松,罗元,吴承军.基于人耳听觉特性的语音识别预处理研究[J].计算机仿真,2015,32(12):322-326. 被引量：11
6叶于林,莫建华,刘夏.多说话人环境下目标说话人语音提取方案[J].计算机系统应用,2016,25(4):8-15. 被引量：1
7王凯龙,张二华,曹冠彬.基于计算听觉场景分析的单通道信噪分离方法[J].计算机与数字工程,2019,47(5):1049-1054. 被引量：1
8徐庆达,张二华.基于计算听觉场景分析的单通道语音分离方法[J].计算机与数字工程,2022,50(3):597-602.
9张新,付中华.鲁棒的特定人语音分离算法[J].计算机应用研究,2022,39(6):1749-1752. 被引量：1
10张晗,张二华,姜珊.基于听觉场景分析的单声道双人混合语音浊音分离[J].计算机与数字工程,2022,50(11):2461-2466. 被引量：3

1黄秀轩,韦岗.一种混叠语音清浊音判断方法[J].计算机工程,2004,30(18):29-30.
2王想实.听觉场景分析简析[J].技术与市场,2011,18(6):222-222.
3郭水旺,吕凤英,陶玉福.欠通道混叠语音盲分离算法[J].河南科学,2010,28(4):440-443. 被引量：1
4杜军.基于稀疏编码和ICA的带噪混叠语音盲分离[J].山东师范大学学报（自然科学版）,2008,23(4):136-138.
5王想实,刘培林.计算听觉场景的算法研究[J].电脑与电信,2010(1):41-43.
6张海英,赵军,潘永湘.一种基于小波变换的混叠语音基音提取方法[J].西安理工大学学报,2005,21(2):200-203.
7吴迪,陶智,张晓俊,周燕,潘欣裕,肖仲喆,赵鹤鸣.感知听觉场景分析的说话人识别[J].声学学报,2016,41(2):260-272. 被引量：4
8康文雄,邓飞其.利用模板和邻域信息的静脉骨架提取新算法[J].中国图象图形学报,2010,15(3):378-384. 被引量：10
9赵彩华,刘琚,孙建德,闫华.基于小波变换和独立分量分析的含噪混叠语音盲分离[J].电子与信息学报,2006,28(9):1565-1568. 被引量：14
10王卫华,黄凤岗.基于计算听觉场景分析的语音盲分离方法[J].哈尔滨工程大学学报,2008,29(4):395-399. 被引量：1

信号处理

2004年第5期

浏览历史

内容加载中请稍等...

基于分频带自相关函数的混叠语音基频分离提取新算法被引量：1

参考文献6

二级参考文献6

共引文献3

同被引文献73

引证文献1

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于分频带自相关函数的混叠语音基频分离提取新算法 被引量：1

参考文献6

二级参考文献6

共引文献3

同被引文献73

引证文献1

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于分频带自相关函数的混叠语音基频分离提取新算法被引量：1