特征融合的VAD方法在语音识别系统中的应用被引量：2

Speech recognition system with combined features of voice activity detection

导出

摘要近年来,孤立词语音识别技术由于其对计算量存储量要求低和灵活性高的特性而备受关注。但由于当今生活环境的复杂性和不确定性,使得孤立词语音识别技术在实时性和准确性方面仍面临着巨大的挑战。为此,以非特定人孤立词语音识别为研究对象,将改进的过门限率、子带谱熵及Teager能量算子(TED)相融合进行语音的端点检测,以找出合理的语音起始点,并将其应用在基于隐马尔可夫模型的语音识别系统中,通过直观的语音识别正确率来验证该方法的优越性。通过实验仿真,与其他的传统方法进行对比,所提方法可使得语音识别系统满足一定的实时性要求,且在孤立词识别的准确性和稳定性上占一定优势。 In recent years, speech recognition technology has been highly developed and widely used, Among them, the isolated-word speech recognition technology has attracted much attention due to its low requirements and high flexibility for the amount of computational storage. However, the isolated-word speech recognition still faces great challenges both in real-time recognize and accuracy. This paper takes the non-specific human isolated-words speech recognition as the research object, combines Subband spectral entropy with Teager energy operator to detect the endpoint of speech signals, and applied it to speech recognition system based on hidden markov model. The experiment results shows that the proposed method can meet the real-time recognize requirements, and has a better effect of isolated-words speech recognition in accuracy rate and stability.

作者卢洵波李昕 Lu Xunbo;Li Xin(School of Mechatronic Engineering and Automation,Shanghai University,Shanghai 200444,China)

机构地区上海大学机电工程与自动化学院

出处《电子测量技术》 2020年第7期129-136,共8页 Electronic Measurement Technology

关键词孤立词识别子带谱熵 Teager能熵比过门限率 isolated-word speech recognition subband spectral entropy Teager energy operator threshod-crossing rate

分类号 TN912.35 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献18

1张芝旖,姚恩涛,石玉.小波分析和MFCC融合的声音信号端点检测算法[J].电子测量技术,2016,39(7):62-66. 被引量：8
2李乐,王玉英,李小霞.一种改进的小波能量熵语音端点检测算法[J].计算机工程,2017,34(5):268-274. 被引量：9
3朱春利,李昕.基于LMS减噪与改进的双门限语音端点检测方法[J].系统仿真学报,2017,29(9):1950-1959. 被引量：14
4王晓华,屈雷.基于时频参数融合的自适应语音端点检测算法[J].计算机工程与应用,2015,51(20):203-207. 被引量：7
5李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：15
6卢志茂,金辉,张春祥,任明溪.基于HHT和OSF的复杂环境语音端点检测[J].电子与信息学报,2012,34(1):213-217. 被引量：12
7王民,孙广,沈利荣,刘利.基于对数能量倒谱特征的端点检测算法[J].计算机工程与应用,2014,50(16):198-201. 被引量：11
8李杰,周萍,杜志然.短时TEO能量在带噪语音端点检测中的应用[J].计算机工程与应用,2013,49(12):144-147. 被引量：14
9王茂蓉,周萍,景新幸,杨青.基于Mel-TEO的带噪语音端点检测算法[J].微电子学与计算机,2016,33(4):46-49. 被引量：5
10杨海燕,吴雷,周萍.基于压缩感知和MFCC的语音端点检测算法[J].测控技术,2019,38(5):88-93. 被引量：2

二级参考文献163

1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
2张汝波,刘冠群,吴俊伟,吕西宝.移动机器人语音控制技术研究与实现[J].华中科技大学学报（自然科学版）,2013,41(S1):348-351. 被引量：8
3肖述才,王作英.端点检测中的一种新的对数能量特征[J].电声技术,2004,28(6):37-41. 被引量：12
4刘雅琴,周炜.基于小波变换的说话人语音特征参数提取[J].河南科技大学学报（自然科学版）,2005,26(4):44-46. 被引量：10
5李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
6王博,郭英,李宏伟,韩立峰.基于倒谱距离的语音端点检测改进算法[J].空军工程大学学报（自然科学版）,2006,7(1):59-63. 被引量：10
7张志敏,郭英,王博.一种基于倒谱特征的语音端点检测改进算法[J].电声技术,2006,30(4):39-42. 被引量：8
8江官星,王建英.一种改进的检测语音端点的方法[J].微计算机信息,2006,22(05S):138-139. 被引量：27
9张惠云.多速率数字信号处理及其研究现状[J].军民两用技术与产品,2006(5):39-41. 被引量：2
10王月,曲百达,李金宝,等.一种改进的基于频带方差的端点检测算法[C].无锡:中国控制与决策学术年会,2007:301-303.

共引文献118

1朱梦帆,汪志成,戴诗柏.基于语谱图与稠密卷积神经网络的性别与年龄识别研究[J].仪表技术,2022(1):66-70. 被引量：5
2邓鑫,王岩松,杨超,郭辉.基于融合特征的汽车鸣笛声识别方法[J].智能计算机与应用,2021,11(12):197-200. 被引量：1
3徐岩,李洋洋.基于分数阶域的语音活动性检测算法研究[J].兰州交通大学学报,2012,31(6):83-86. 被引量：2
4林建粦,平西建,马德宝.采用DBT的漂移扫描星图小目标检测方法[J].红外与激光工程,2013,42(12):3440-3446. 被引量：1
5王玉静,康守强,张云,刘学,姜义成,Mikulovich V I.基于集合经验模态分解敏感固有模态函数选择算法的滚动轴承状态识别方法[J].电子与信息学报,2014,36(3):595-600. 被引量：34
6毛启容,白李娟,王丽,詹永照.基于情感上下文的语音情感推理算法[J].模式识别与人工智能,2014,27(9):826-834. 被引量：2
7韦国刚,周萍,杨青.一种简单的噪声鲁棒性语音端点检测方法[J].测控技术,2015,34(2):31-34. 被引量：9
8吴伟,李艳雄,王梓里,陈祝允.基于语速差异的新闻发布会中首要说话人检测[J].计算机工程与应用,2015,51(4):222-225.
9王明合,张二华,唐振民,许昊.基于Fisher线性判别分析的语音信号端点检测方法[J].电子与信息学报,2015,37(6):1343-1349. 被引量：20
10梁冠豪,罗庆生.应用小波能量熵的人体活动时序自动标记方法[J].北京理工大学学报,2019,39(2):147-154. 被引量：1

同被引文献18

1孙伟,宋如意,王宇航.视觉/惯性组合导航中的SWF与MSCKF对比研究[J].中国矿业大学学报,2020,49(1):198-204. 被引量：5
2沈宏余,李英.语音端点检测方法的研究[J].科学技术与工程,2008,8(15):4396-4397. 被引量：6
3薛胜尧.基于改进型双门限语音端点检测算法的研究[J].电子设计工程,2015,23(4):78-81. 被引量：21
4蔡萍.一种强噪声环境下的语音端点检测算法[J].盐城工学院学报（自然科学版）,2015,28(3):44-46. 被引量：1
5陈华华,徐萍.基于谱减法和短时能量的声音端点检测方法[J].机械制造与自动化,2016,45(3):191-192. 被引量：6
6刘玉珍,田金波.基于语音增强的双门限语音端点检测算法[J].测控技术,2016,35(11):33-35. 被引量：6
7宋广虎,冯全,海洋,王书志.采用深度学习法优化的葡萄园行间路径检测[J].林业机械与木工设备,2019,47(7):23-27. 被引量：8
8王毅,刘波,熊龙烨,王卓,杨长辉.基于深度学习的果园道路导航线生成算法研究[J].湖南农业大学学报（自然科学版）,2019,45(6):674-678. 被引量：16
9刘娟宏,胡彧,黄鹤宇.端到端的深度卷积神经网络语音识别[J].计算机应用与软件,2020,37(4):192-196. 被引量：32
10张瑞珍,韩跃平,张晓通.基于深度LSTM的端到端的语音识别[J].中北大学学报（自然科学版）,2020,41(3):244-248. 被引量：15

引证文献2

1周妙琪,方福海,李婷,李军成.声源定位中的一种含噪语音端点检测算法[J].电子元器件与信息技术,2021,5(10):14-16.
2张海民,程菲.深度学习下盲人避撞路径导航方法研究[J].南京信息工程大学学报（自然科学版）,2022,14(2):220-226. 被引量：3

二级引证文献3

1郭占苗,王波.多功能智能盲人导航系统的仿真与实验研究[J].工业控制计算机,2023,36(11):166-169. 被引量：1
2张海民.基于深度学习模型的疲劳驾驶行为识别算法[J].汽车安全与节能学报,2024,15(1):121-128. 被引量：5
3张海民,刘训星.图像特征点匹配算法下车辆行驶主动防撞预警[J].安全与环境学报,2025,25(1):41-49.

1林浩文,张正道,张明馨,高超宏.一种婴儿哭声识别优化算法的研究[J].测控技术,2019,38(12):46-51. 被引量：2
2侯俊龙,潘文林,王璐,何翠玲,王翠.基于剪枝AlexNet的普米语孤立词识别[J].云南民族大学学报（自然科学版）,2020,29(4):382-389. 被引量：2
3王玉春.少先队工作在小学德育中的功能及实践探究[J].精品,2020(14):074-074.
4阎燕.语音识别技术在客服行业中的应用分析[J].中国集体经济,2020(20):161-162. 被引量：1
5王翠,王璐,解雪琴,杨建香,和丽华,侯俊龙,潘文林.基于MAML方法的佤语孤立词分类[J].云南民族大学学报（自然科学版）,2020,29(4):376-381. 被引量：2
6黄凯荣.语音控制智能小车的设计[J].电子制作,2020,28(15):41-44. 被引量：3
7蒋正锋,黄勇萍.基于多参数融合优化的隐马尔科夫模型的设计[J].现代计算机,2020,26(18):28-32. 被引量：1
8陈艺.室内三麦克风树的声音定位数学模型[J].电子世界,2020(13):89-92. 被引量：4
9孙坤伦,夏秀渝,孙文慧.基于听觉掩蔽效应的改进型维纳滤波算法[J].计算机与网络,2020,46(13):68-71. 被引量：6
10郑舒曼,关仕明,黄柳珊,许逸戈,张秀莲,史蕾.初中化学(科学)启蒙教材中“实验”“插图”“科普知识”的比较分析[J].化学教育（中英文）,2020,41(15):1-8. 被引量：7

电子测量技术

2020年第7期

浏览历史

内容加载中请稍等...

特征融合的VAD方法在语音识别系统中的应用被引量：2

参考文献18

二级参考文献163

共引文献118

同被引文献18

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

特征融合的VAD方法在语音识别系统中的应用 被引量：2

参考文献18

二级参考文献163

共引文献118

同被引文献18

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

特征融合的VAD方法在语音识别系统中的应用被引量：2