人脸语音动画中语音特征参数提取算法研究被引量：1

Algorithm of Speech Feature Extraction in Facial Speech Animation

下载PDF

导出

摘要人脸语音动画是虚拟现实领域的热点,语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数,在小波变换的理论基础上,借鉴MFCC特征参数的提取方法,运用表征语音动态特征的特征差分算法,提出了一种基于离散小波变换的语音特征参数(DWTMFCC)提取方法,并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别,可以得到组合特征参数的识别率较高。 Facial speech animation is a popular issue in the area of virtual reality. The speech feature extraction is the premise and key to realize the speech synchronous animation. In order to extract the pronunciation feature parameters whose robustness is better, on the basis of wavelet transform theory and the extraction method of MFCC reference of characteristic parameters, a phonetic feature parameter extraction method based on discrete wavelet transform is proposed by the aid of a feature difference algorithm which characters the speech dynamic features. It combines the prosodic parameter which reflects the characteristics of speech emotion and acquires high recognition rate of mixed characteristic parameter. The speaker＇s voice recognition is implemented with the VQ model based on LGB algorithm.

作者林睿樊养余

机构地区西北工业大学电子信息学院

出处《现代电子技术》 2011年第6期74-77,共4页 Modern Electronics Technique

基金国家"863"高技术研究发展计划(2007AA01Z324)

关键词人脸语音动画语音特征提取小波变换动态特征组合特征参数 facial speech animation extraction of speech feature wavelet transform dynamic feature mixed characteristic parameter

分类号 TN919-34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1贾熹滨,尹宝才,李敬华.语音同步的可视语音合成技术研究[J].北京工业大学学报,2005,31(6):656-661. 被引量：6
2陈益强,高文,王兆其,姜大龙.基于机器学习的语音驱动人脸动画方法[J].软件学报,2003,14(2):215-221. 被引量：20
3黄德智,杨鸿武,蔡莲红.语音信号的加权mel倒谱分析[J].信号处理,2006,22(6):840-843. 被引量：4
4王金明,张雄伟.话者识别系统中语音特征参数的研究与仿真[J].系统仿真学报,2003,15(9):1276-1278. 被引量：17
5叶静,董兰芳,王洵.用于语音动画合成的语音特征提取和聚类技术[J].微型机与应用,2004,23(8):47-49. 被引量：4
6刘颖,王成儒.用于人脸动画的语音特征提取算法研究[J].电声技术,2008,32(12):49-53. 被引量：2

二级参考文献49

1叶静,董兰芳,王洵.用于语音动画合成的语音特征提取和聚类技术[J].微型机与应用,2004,23(8):47-49. 被引量：4
2李战明,王贞.基于小波包分析特征参数的说话人识别系统[J].电声技术,2005,29(6):46-49. 被引量：5
3贾熹滨,尹宝才,李敬华.语音同步的可视语音合成技术研究[J].北京工业大学学报,2005,31(6):656-661. 被引量：6
4尹宝才,李敬华,贾熹滨,孙艳丰.基于两层隐马尔可夫模型的可视语音合成[J].北京工业大学学报,2006,32(5):416-418. 被引量：4
5[1]Beskow J. Rule-Based visual speech synthesis. In: Proceedings of the 4th European Conference on Speech Communication and Technology. 1995. 299～302. http://www.speech.kth.se/～beskow/papers/es95rul.pdf.
6[2]Waters K, Levergood, TM. DECface : an automatic lip-synchronization algorithm for synthetic face. Technical Report, CRL 93-4, Digital Equipment Corporation, Cambridge Research Laboratory, 1993. ftp://crl.dec.com/pub/DEC/CRL/tech-reports/93.4.ps.Z.
7[3]Hong PY, Wen Z, Huang TS. IFACE: a 3D synthetic talking face. International Journal of Image and Graphics, 2001,1(1):1～8.
8[4]Ezzat T, Poggio, T. Visual speech synthesis by morphing visemes. International Journal of Computer Vision, 2000,38(1):45～57.
9[5]Yehia H, Kuratate T, Vatikiotis-Bateson E. Using speech acoustics to drive facial motion. In: Proceedings of the 14th international congress of phonetic sciences (ICPhS'99). 1999. 631～634. http://trill.berkeley.edu/ICPhS/frameless/acceptance.html.
10[6]Massaro DW, Beskow J, Cohen MM. Picture my voice: audio to visual speech synthesis using artificial neural networks. In: Proceedings of the 4th Annual Auditory-Visual Speech Processing Conference (AVSP'99). 1999. 105～111. http://mambo.ucsc.edu/ pdf/avsp9922.pdf.

共引文献42

1王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J].河北工业大学学报,2010,39(4):14-18. 被引量：11
2姜大龙,高文,王兆其,陈益强.面向纹理特征的真实感三维人脸动画方法[J].计算机学报,2004,27(6):750-757. 被引量：10
3叶静,董兰芳,王洵.用于语音动画合成的语音特征提取和聚类技术[J].微型机与应用,2004,23(8):47-49. 被引量：4
4陈皓,刘晓平.快速人脸动画方法[J].电脑应用技术,2004(60):30-34.
5叶静,董兰芳,王洵,万寿红.一个基于改进的HMM的人脸语音动画合成系统[J].计算机工程,2005,31(13):165-167.
6刘雅琴,周炜.基于小波变换的说话人语音特征参数提取[J].河南科技大学学报（自然科学版）,2005,26(4):44-46. 被引量：10
7贾熹滨,尹宝才,李敬华.语音同步的可视语音合成技术研究[J].北京工业大学学报,2005,31(6):656-661. 被引量：6
8李仰祝.高校教师人力资源管理应注重“三个转变”[J].人才资源开发,2005(12):30-31.
9郝征科,魏明果.基于小波包变换的说话人语音特征参数的提取[J].三峡大学学报（自然科学版）,2006,28(4):374-376. 被引量：2
10周东生,张强,魏小鹏.人脸动画中语音可视化算法研究进展[J].计算机工程与应用,2007,43(9):36-39. 被引量：3

同被引文献10

1冉启斌,石锋.从音轨方程考察普通话不送气塞音声母的协同发音[J].南开语言学刊,2006(2):45-54. 被引量：7
2费成巍,白广忱,李晓颖.基于过程功率谱熵SVM的转子振动故障诊断方法[J].推进技术,2012,33(2):293-298. 被引量：19
3刘明辉,黄中伟.结合高斯混合模型和VOT特征的音素发音错误检测[J].科学技术与工程,2013,21(7):1789-1793. 被引量：3
4赵力,邹采荣,吴镇扬.基于MQDF的汉语塞音语音识别方法的研究[J].模式识别与人工智能,2000,13(3):342-344. 被引量：2
5冯勇强,严芊,高兴龙,潘复平,邢力力,林春兰,潘接林.成年口吃者流畅朗读中塞音的声学分析[J].声学学报,2013,38(4):509-516. 被引量：4
6李文君,鱼佳欣,周春来.一种快速的支持向量聚类雷达信号分选方法[J].现代电子技术,2013,36(17):65-67. 被引量：2
7蔡明琦,凌震华,戴礼荣.基于隐马尔科夫模型的中文发音动作参数预测方法[J].数据采集与处理,2014,29(2):204-210. 被引量：5
8郭逾,张二华,刘驰,杨子凡.固话信道下语音特征参数影响研究[J].现代电子技术,2015,38(11):73-78. 被引量：3
9胡燕,李元祥,郁文贤.基于多特征决策融合的SAR飞机识别[J].现代电子技术,2016,39(21):50-55. 被引量：3
10邵朝,李强.基于特征加权的多核支持向量机[J].西安邮电大学学报,2017,22(2):84-88. 被引量：7

引证文献1

1冯沛,白静,薛珮芸,张雪英.基于多特征组合的普通话塞音识别[J].现代电子技术,2019,42(8):159-163. 被引量：3

二级引证文献3

1卓嘎,边巴旺堆.一种藏语连续语音声学特征参数提取算法研究[J].通信技术,2019,52(8):1865-1870. 被引量：3
2牟俊杰,姚刚,孙涛.基于CNN-LSTM神经网络的声纹识别系统设计[J].电子技术应用,2021,47(3):75-78. 被引量：11
3余礼根,杜天天,于沁杨,刘同海,孟蕊,李奇峰.基于多特征融合的蛋鸡发声识别方法研究[J].农业机械学报,2022,53(3):259-265. 被引量：4

1刘丽伟,张瑶,赵孔新,钱锋.基于HHT的语音特征参数提取及其在说话人识别中的应用[J].长春工业大学学报,2009,30(6):696-701. 被引量：3
2薛凌云,夏国荣.基于小波变换的语音特征参数提取[J].电子世界,2014(2):99-100. 被引量：2
3刘颖,王成儒.用于人脸动画的语音特征提取算法研究[J].电声技术,2008,32(12):49-53. 被引量：2
4HUMAX LGB-26TPVR液晶电视[J].世界发明,2005(11):12-12.
5戚龙.基于组合特征参数的说话人识别系统设计[J].信息与电脑（理论版）,2014,0(10):158-158. 被引量：1
6陈杰,张玲华.说话人识别中语音特征参数的研究[J].信息技术,2006,30(11):88-89. 被引量：6
7刘雅琴,周炜.基于小波变换的说话人语音特征参数提取[J].河南科技大学学报（自然科学版）,2005,26(4):44-46. 被引量：10
8王华,樊养余.人脸语音动画中基于PSOLA的情感语音合成系统[J].计算机应用研究,2012,29(3):1002-1004.
9王旭,韩志艳,王健,薛丽芳.基于动静态组合特征参数的语音识别[J].计算机科学,2008,35(7):129-132. 被引量：3
10李津涛.语音特征参数提取的仿真研究[J].中国新通信,2009,11(9):52-54. 被引量：2

现代电子技术

2011年第6期

浏览历史

内容加载中请稍等...

人脸语音动画中语音特征参数提取算法研究被引量：1

参考文献6

二级参考文献49

共引文献42

同被引文献10

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

人脸语音动画中语音特征参数提取算法研究 被引量：1

参考文献6

二级参考文献49

共引文献42

同被引文献10

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

人脸语音动画中语音特征参数提取算法研究被引量：1