语音人机界面标引系统的实现被引量：9

The Implement of Speech Man-Machine Interface and Note System

下载PDF

导出

摘要本文实现了一个媒体资产管理中的语音人机界面标引系统。系统以连续混合高斯隐马尔可夫模型为基础,采用分层构筑维特比算法进行训练和识别。为实现标引的实时性,采用实时计算的方法。为了减少计算量,并没有将状态持续时间分布引入Viterbi译码,而是将其作为后处理部分。对于数字识别,以声调作为辅助判决。以此做了一个体育赛事的词库,测试表明,标引系统首选识别率达到93.5%,前五选识别率达到98%。 In this paper a speech man-machine interface used in media asset management (MAM) is developed. Based on the continuous Gaussian Mixture HMM, the system adopts Level-Building Viterbi searching algorithm to train and spot. To have a real-time performance, the recording and the calculating is working simultaneously. The state duration distribution is employed as second part other than joining Viterbi for less calculation .For connected digit recognition ,we proposed the pitch of speech as a additional judgement. Then we make a word library about sports. The experiments show that the system has a recognition accuracy of the top one candidate is 93.5 % ,and the recognition accuracy of the top five candidates is 98 %.

作者毕文军高健

机构地区上海大学机电工程与自动化学院

出处《微计算机信息》北大核心 2005年第4期232-233,共2页 Control & Automation

关键词人机界面语音识别实时算法 Man-Machine Interface Speech recognition Real-time algorithm

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1李虎生,刘加,刘润生.高性能汉语数码串语音识别[J].电子学报,2001,29(5):595-599. 被引量：9

二级参考文献3

1李虎生,杨明杰,刘润生.汉语数码语音识别自适应算法[J].电路与系统学报,1999,4(2):1-6. 被引量：4
2李虎生,刘加,刘润生.高性能汉语数码语音识别算法[J].清华大学学报（自然科学版）,2000,40(1):32-34. 被引量：20
3赵庆卫,肖熙,王作英.段长信息在连续语音识别中的应用研究[J].声学学报,2000,25(2):175-181. 被引量：5

共引文献8

1丁昊,姚天任.基于mel标度频谱和音素分割的汉语语音单词端点检测方法[J].计算机与数字工程,2005,33(3):57-59. 被引量：3
2唐赟,刘文举,徐波.基于后验概率解码段模型的汉语语音数字串识别[J].计算机学报,2006,29(4):635-641. 被引量：12
3张培玲,王福忠,刘群坡.连续数码串语音识别系统的MATLAB实现[J].河南理工大学学报（自然科学版）,2009,28(2):211-216.
4汤霖,蔡莲红.基于层级策略的连续数字串识别的研究[J].计算机工程与应用,2003,39(21):83-86.
5邓伟,赵翊兰.一种基于HMM的动态语音模式时间归一化方法[J].数据采集与处理,2003,18(3):277-281. 被引量：2
6汤霖,蔡莲红.训练方法对汉语数字串识别率影响的研究[J].湘潭大学自然科学学报,2003,25(3):16-20.
7张翼燕,刘文举,徐波.分段模型在解码假设检验中的应用[J].中文信息学报,2004,18(1):70-77.
8黄秋安,姜波,汪秉文.基于有限状态机的汉语数字语音端点检测[J].湖北大学学报（自然科学版）,2004,26(1):35-38. 被引量：4

同被引文献10

1张龙,卓柳迎,王立平.网上阅卷计算机网络系统构建的实例分析[J].泉州师范学院学报,2004,22(4):45-48. 被引量：7
2石秀金,龚静.基于语音的计算机应用辅助系统的研究[J].微计算机信息,2006,22(05X):292-294. 被引量：3
3都志辉.JAVA3D编程实践[M].北京:清华大学出版社,2002..
4陈向群,王雷,马洪兵,向勇等.Windows CE.NET系统分析及试验教程.北京:机械工业出版社,2003
5谢宋和．甘勇．单片机模糊控制系统设计与应用设计[M]．北京：电子工业出版社，1999
6F. K. Soong , E.F.Huang, A Tree-Trellis Based Fast Search for Finding the N Best Sentence Hypothesis in Continuous Speech Recognition.Proceedings IEEE International Conference on Acoustics, Speech and Signal Processing 1991, pp.705-708,Toronto,May. 1991.
7Ney,H.,Ortmanns,S.,1999.Dynamic progranming search for continuous speech recognition[J].IEEE Signal Process.16 (5),64-83.
8A.Lee,T.Kawahara,and S Doshita.An Efficient Two-Pass Search Algorithm using Word Trellis Index.Proc[J].ICSLP,1998,pp 1831-1834.
9S.Young,D.Kershaw,J.Odell,etc.The HTK Book (for HTK Version 3.0).2000.
10刘君华等.虚拟仪器图形化编程语言LabVIEW教程[M]西安电子科技大学出版社,2001.

引证文献9

1魏晨.透过澳洲电信看电信投资管理[J].信息网络,2005(12):5-6. 被引量：1
2曾武,舒万能.网上阅卷平台中的VLAN技术研究与应用[J].微计算机信息,2005,21(12X):113-115. 被引量：3
3宋健,王直杰,张珏.基于Windows CE.NET下的GPRS模块的研究与开发[J].微计算机信息,2006,22(02Z):86-88. 被引量：3
4危水根,陈震,杨声云.基于SPCE061A的发酵罐内温度控制[J].微计算机信息,2006(03Z):39-40. 被引量：2
5毛建东.基于LabVIEW的单片机数据采集系统的设计[J].微计算机信息,2006(03Z):41-42. 被引量：24
6朱志伟,周志光,刘定良.设计基于TMS320LF2407的低功耗中文人机界面[J].微计算机信息,2006(04Z):124-126. 被引量：1
7王兴斌,王炳锡.一种有效的N-Best算法及其在中文语音识别中的应用[J].微计算机信息,2006,22(06X):301-303.
8付跃文,仲伟波.基于多词汇树的对话语音识别搜索策略[J].微计算机信息,2007(03X):262-264.
9金珠,马小平,阚宏伟.基于JSAPI与Java3D的语音交互式场景漫游[J].微计算机信息,2007(36):178-179. 被引量：1

二级引证文献35

1顾启民,高琴妹,谢启,季绍陵,张水平.基于LabVIEW的智能控制器自动测试系统的研制[J].微计算机信息,2007,23(10):171-172. 被引量：10
2宋德杰.交流伺服电机的多波形旋转控制系统研究[J].微计算机信息,2007,23(10):178-179. 被引量：2
3任丽丽,张志杰.基于LABVIEW的串口数据采集系统[J].微计算机信息,2008,24(7):56-57. 被引量：30
4顾启民,涂水林,谢启,季绍陵.万能式断路器电参量测量功能校验系统设计[J].低压电器,2008(15):12-15. 被引量：2
5沈垚,赵林度.Web Services在中小型企业电子商务上的应用[J].微计算机信息,2006,22(02X):140-142. 被引量：14
6党兰学,郑逢斌,杜莹,梁文娟.基于规则的网上审批系统的设计与实现[J].微计算机信息,2006,22(02X):143-145. 被引量：2
7习升鸿,戴瑜兴,李展翅.基于LabVIEW的远程监控系统设计与实现[J].低压电器,2007(7):18-20. 被引量：14
8余志超,刘小俊,涂春霞,单联海.家庭无线通信网络平台的研究[J].微计算机信息,2007(04X):121-123.
9谢婕,杨波,何强.基于VI的数字万用表四通道切换系统[J].微计算机信息,2007,23(06S):152-154.
10杨峰,杨勇.YZ袖珍式心电记录器的研制[J].微计算机信息,2007,23(20):78-79. 被引量：2

1毕文军,高健.关键词语音标引系统的实现[J].微计算机信息,2005,21(3):220-221. 被引量：6
2夏勇,何晶.融合网络下的媒体内容推送播存方法研究[J].世界宽带网络,2011,18(3):38-40.
3郭炎生.标引和检索是媒体资产管理的关键所在[J].中国传媒科技,2005(8):52-52.
4龚卓.基于DM642的运动目标检测系统设计与实现[J].电子技术（上海）,2010(8):22-23.
5周利清.非特定人的语音数字识别硬件系统[J].电信科学,1991,7(3):36-40. 被引量：1
6付强,肖怀铁,马君国.时延神经网络目标识别实时算法软件开发研究[J].微电子学与计算机,2002,19(4):36-39. 被引量：1
7邓伟.媒体数据的处理与管理[J].现代电视技术,2002,0(5):12-14.
8苗圃.广播节目数字化存档项目的技术要求[J].广播电视信息,2010,17(9):97-99.
9钱峰,胡光岷.基于滑动时窗的小波变换实时算法[J].信号处理,2007,23(3):361-364. 被引量：9
10何晶,夏勇,任宁宁,段凯.融合网络中的内容标引应用方法研究[J].世界宽带网络,2010(8):72-76.

微计算机信息

2005年第4期

浏览历史

内容加载中请稍等...

语音人机界面标引系统的实现被引量：9

参考文献1

二级参考文献3

共引文献8

同被引文献10

引证文献9

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

语音人机界面标引系统的实现 被引量：9

参考文献1

二级参考文献3

共引文献8

同被引文献10

引证文献9

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

语音人机界面标引系统的实现被引量：9