结合主分量分析与DOA估计的语音盲分离

Blind speech separation combining with principal component analysis and DOA estimation

下载PDF

导出

摘要在欠定语音盲分离中,W-分离正交性假设通常使问题简化,但这种简化是以降低分离性能为代价。在语音信号满足近似W-分离正交性的假设下,提出利用主分量分析(PCA)检测只有一个源信号存在的时频点,检测出的时频点均满足W-分离正交性,因此提高了混合矩阵的估计精度。通过从混合矩阵中估计源信号的波达方向,可以较好地解决置换模糊问题。仿真结果表明,提出的方法与经典的DUET方法相比具有更优的性能,平均信干比提高了2.77dB。 The assumption of W-disjoint orthogonality （W-DO） can simplify the problem of blind separation for under-determined mixed speech signals at the cost of decreasing the separation performance. A method based on principal component analysis （PCA） is proposed to detect the timefrequency cells where only one source exists, under the assumption of approximate W-DO of speech signal. All the detected time frequency cells satisfy the W-DO, so that the estimation precision of the mixing matrix is improved. The direction of arrival （DOA） of sources is estimated from the mixing matrix and is exploited to solve the permutation ambiguity problem. Simulation results demonstrate that the proposed method outperforms the typical DUET method, the average signal to interference （SIR） is improved by 2.77dB.

作者王国鹏刘郁林罗颖光

机构地区重庆通信学院DSP研究室

出处《声学技术》 CSCD 2009年第5期624-628,共5页 Technical Acoustics

基金国家自然科学基金(60672157 60672158) 重庆市自然科学基金(CSTC2005BB4219)

关键词语音盲分离主分量分析波达方向混合矩阵估计 blind speech separation PCA DOA mixing matrix estimation

分类号 TN911.7 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1Hyvarinen A, Karhunen J, Oja E. Independent component analy sis[M]. New York ,John Wiley & Sons, 2001.
2Makino S, Lee T W, Sawada H. Blind speech separation[M]. Springer Netherlands, 2007: 47-78.
3苗浩,李晓东,田静.一种用于语音增强的频域盲信号分离算法[J].声学技术,2007,26(3):431-434. 被引量：4
4Yilmaz O, Rickard S. Blind separation of speech mixtures via time-frequency masking[J]. Signal Processing, IEEE Transactions on, 2004, 52(7): 1830-1847.
5Rickard S, Yilmaz Z. On the approximate W-disjoint orthogonality of speech[A]. ICASSP '02[C]. 2002, 1: 529-532.
6孙即祥.现代模式识别[M].长沙:国防科技大学出版社,2001.
7徐舜,陈绍荣,刘郁林.基于非线性时频掩蔽的语音盲分离方法[J].声学学报,2007,32(4):375-381. 被引量：9
8Bofill P, Zibulevsky M. Underdetermined blind source separation using sparse representations[J]. Signal Processing, 2001, 81(11): 2353-2362.
9Theis F J, Langa E W, Puntonet C G. A geometric algorithm for overcomplete linear ICA[J]. Neurocomputing, 2004, 56: 381-398.

二级参考文献19

1谢志文,尹俊勋,饶丹.空间掩蔽效应的实验研究[J].声学学报,2006,31(4):363-369. 被引量：10
2Siow Yong Low,and Sven Nordholm.Convolutive Blind Source Separation With Post-Processing[J].IEEE Trans.Speech,Audio Processing,2004,12(5):539-547.
3S.Ikeda,N.Murata.A method of ICA in time-frequency domain[c],in Int.Conf.ICA and Signal Separation,Aussois,France.1999,1:365-371.
4F.Asano,S.Ikeda,M.Ogawa,H.Asoh,N.Kitawaki.Combined Approach of Array Processing and Independence Component Analysis for Blind Separation of Acoustic Signals[J].IEEE trans.Speech,Audio Processing,2003,11(5):204-215.
5A.J.Bell,T.J.Sejnowski.An information-maximization approach to blind separation and blind deconvolution[J].Neural Computation,1995,7(6):1129-1159.
6Hiroshi Sawada,Ryo Mukai.A Robust Approach To The Permutation Problem Of Frequency-Domain Blind Source Separation[J].IEEE trans.Speech,Audio Processing,2004,12(9):530-538.
7Kostas Kokkinakis,Asoke K.Nandi.Multichannel Blind Deconvolution for Source Separation in Convolutive Mixtures of Speec[J].IEEE trans.Speech,Audio Processing,2006,14(1):200-212.
8Sawada H,Mukai R et al.Real-time blind extraction of dominant target sources from many background interference sources.In:Proc.IWAENC2005,2005:73-76.
9Araki S,Mukai R et al.The fundamental limitation of frequency domain blind source separation for convolutive mixtures of speech.IEEE Trans.Speech Audio Processing,2003; 11(2):109-116.
10Haykin S.Unsupervised adaptive filtering,volume 1:blind source separation.John Wiley & Sons Canada,Ltd.2000.

共引文献35

1刘俊华,颜运昌,荆琦.遗传算法与神经网络在语音识别中的应用[J].机电工程,2007,24(12):20-21. 被引量：6
2韩绍卿,李夕海,宋仔标,刘代志.基于模糊C-均值的原型模式选择及其在核爆地震识别中的应用[J].核电子学与探测技术,2007,27(5):820-824. 被引量：3
3李营,王儒敬,王大为,魏保子.基于用户兴趣的搜索结果动态聚类算法[J].计算机工程与应用,2008,44(4):187-189. 被引量：2
4李卿,狄文辉,楼新远.两种提高决策树性能的算法研究[J].计算机工程与设计,2008,29(15):3989-3990. 被引量：2
5朱坚坚,王惠刚,李虎雄.基于阵元接收信号幅度信息的频域盲分离排序算法[J].声学技术,2008,27(4):593-596. 被引量：3
6俞飞,关胜晓.机器人全向视觉定位系统的建模与应用[J].计算机应用与软件,2008,25(11):160-162.
7章文,郑烇,帅建梅,陈超.基于关联规则的未知恶意程序检测技术[J].计算机工程,2008,34(24):172-174. 被引量：3
8俞雪平,胡云安,郑致刚.基于分层决策的模拟电路故障诊断技术研究[J].计算机测量与控制,2009,17(2):304-306. 被引量：4
9张华,冯大政,庞继勇.卷积混迭语音信号的联合块对角化盲分离方法[J].声学学报,2009,34(2):167-174. 被引量：7
10汪彦,阳爱民,涂立,邱密.一种快速的图像区域分割算法[J].计算机应用与软件,2009,26(5):70-73. 被引量：4

1王国鹏,刘郁林,罗颖光.弱稀疏性下的欠定语音盲分离方法[J].计算机工程,2009,35(18):246-248. 被引量：2
2王国鹏,刘郁林,罗颖光.弱时频正交性条件下的混合矩阵盲估计[J].数据采集与处理,2010,25(1):18-22. 被引量：4
3乔永凤,王凯.基于时-频分析的语音盲分离算法[J].计算机时代,2009(5):28-30.
4刘伯权,曾以成,邬鑫锋.独立分量分析与时频掩蔽结合的语音盲分离[J].计算机工程与应用,2010,46(32):130-132.
5付卫红,杨帅,熊超,刘乃安.一种改进的欠定混合矩阵估计算法[J].华中科技大学学报（自然科学版）,2016,44(8):71-74. 被引量：2
6黄翔东,靳旭康.基于谐波提取的欠定语音盲分离方法[J].信号处理,2016,32(11):1369-1376.
7陈永强,王宏霞.一种强鲁棒性的盲分离混合矩阵估计方法[J].电子与信息学报,2012,34(9):2039-2044. 被引量：5
8张剑,陈豪.一种欠定盲源分离中混合矩阵的估计方法[J].信息与电子工程,2011,9(6):759-764.
9徐春云.一种频率域的盲源分离算法[J].压电与声光,2004,26(3):242-244. 被引量：1
10职振华,马建芬,张雪英.一种新的用于语音分离的盲源分离算法[J].计算机工程与应用,2007,43(30):77-78.

声学技术

2009年第5期

浏览历史

内容加载中请稍等...

结合主分量分析与DOA估计的语音盲分离

参考文献9

二级参考文献19

共引文献35

相关作者

相关机构

相关主题

浏览历史