内窥镜自动定位语音识别系统被引量：2

Speech recognition for endoscopic automatic positioning system

下载PDF

导出

摘要提出一种基于特定人的内窥镜自动定位语音识别系统,通过识别特定医生的语音控制口令实现内窥镜的定位,为手持内窥镜操作提供更加智能化的解决方案。在识别算法上提出了参考模板归一化平均的动态时间规划(Normalized Average-Dynamic Time Warping,NA-DTW)算法,可获得更高的识别率,系统以片上Windows CE操作系统和ARM作为系统的软硬件平台。实验通过对10个不同测试人的共1 250组测试数据进行识别检测,NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469 ms缩短到241 ms。验证了NA-DTW算法可以完成基于特定人、孤立词的语音识别功能,并满足嵌入式系统中的实时检测条件。 A novel system for minimally invasive surgery is presented in this paper. The system utilizes an Endoscopic Automatic Positioner（EAP）controlled by speech recognition engine to implement the clamping and dynamical positioning of the laparoscope. The motion instructions of the EAP are transformed from voice commands of specific doctor recog-nized by speaker dependent speech recognition algorithm named Dynamic Time Warping（DTW）. The DTW recognizes particular commands and rejects irrelevant items by enhancing the performance of the reference template. An ARM-core embedded platform is designed to run the DTW on Windows CE operating system. And on that basis, the performance of DTW is demonstrated by 1250 groups of experiments from 10 individual speakers. Compared with the traditional algo-rithm, the enhanced algorithm can improve the recognition rate by 3.16%and shorten the time of calculation by 51%. The results demonstrate the availability of the enhanced algorithm and its ability to satisfy the real time requirement in embed-ded system.

作者马宁陈晓冬李亚楠尹青云汪毅郁道银

机构地区天津大学精密仪器与光电子工程学院

出处《计算机工程与应用》 CSCD 2014年第8期207-210,共4页 Computer Engineering and Applications

基金国家自然科学基金仪器专项(No.60827005)

关键词内窥镜动态时间规整参考模板特定人嵌入式系统 endoscopic dynamic time warping reference template speaker dependent embedded system

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Schuller B, Can S, Feussner H, et al.Speech control in surgery: a field analysis and strategies[C]//Proc ICME, 2009: 1214-1217.
2Zhang Yuxin, Miyanaga Y.An improved dynamic time warp- ing algorithm employing nonlinear median filtering[C]// IEEE Conferences on Communications and Information Technologies(ISCIT), Hangzhou, 2011 : 439-442.
3Zaharia T, Segarceanu S, Cotescu M, et al.Quantized Dynamic Time Warping (DTW) algorithm[C]//The 8th International Conference on Communications(COMM), Bucharest, 2010: 91-94.
4Myers C, Rabinar L R, Rosenberg A E.Performance trade- offs in dynamic time warping algorithm for isolated word recognition[J].IEEE Transactions on Acoustics, Speech and Signal Processing, 1980,28 : 623-635.
5Abdulla W, Chow D, Sin G.Cross-words reference tem- plate for DTW-based speech recognition systems[C]// IEEE TENCON, Conferences on Convergent Technolo- gies for Asia-Pacific Region,Bangalore,2003:1576-1579.
6汪兵李存斌陈鹏.EVC高级编程及其应用开发[M].北京:中国水利水电出版社,2005..
7李振静,王国胤,杨勇,罗飞.基于谱熵噪声估计的改进减谱法[J].计算机工程,2009,35(18):164-166. 被引量：5
8张震,王化清.语音信号特征提取中Mel倒谱系MFCC的改进算法[J].计算机工程与应用,2008,44(22):54-55. 被引量：29

二级参考文献8

1张雄伟,陈亮,杨吉斌.现代语音技术及应用[M].北京:机械工业出版社.2003.
2Fakhr W,Salam A A,Hamdy N.Enhancement of mismatched conditions in speaker recognition for multimedia applications [J].IEEE International Conference on Acoustics,Speech,and Signal Processing, 2004.
3Shen Jialin, Jeihweih H, Linshan L. Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments[C]//Proc. of ICSLP'98. Sydney, Australia: ASSTA, 1998.
4Kitaoka N, Yamamoto K, Kusmizu T, et al. Development of VAD Evaluation Framework CENSREC-I-C and Investigation of Relationship between VAD and Speech Recognition Performance[C]//Proc. of ASRU'07. Kyoto, Japan: IEEE Signal Processing Society, 2007.
5中国科学院自动化所.CASIA汉语情感语料库[Z].http://www.chineseldc.org.2005.
6王炳锡,屈丹,彭煊.实用语音识别基础[M].北京:国防工业出版社,2004:264-286.
7马义德,邱秀清,陈昱莅,刘映杰,朱敬锋.改进的基于听觉掩蔽特性的语音增强[J].电子科技大学学报,2008,37(2):255-257. 被引量：8
8邵央,刘丙哲,李宗葛.基于MFCC和加权矢量量化的说话人识别系统[J].计算机工程与应用,2002,38(5):127-128. 被引量：34

共引文献189

1艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：14
2周辉,杨乾堂,孙斌.自适应抵消与谱相减结合的单通道语音消噪算法[J].装甲兵工程学院学报,2010,24(2):53-56. 被引量：1
3王大巍.基于Windows CE的语音口令识别系统的设计[J].电子技术（上海）,2010(11):40-41.
4黄磊.基于PDA的核数据采集系统的研究[J].现代电子技术,2005,28(18):38-39.
5陈春玲,卜喆,许童羽,李征明,孙晓丽.基于嵌入式GIS的电力巡检系统的研究[J].沈阳农业大学学报,2005,36(6):671-674. 被引量：5
6郭玉珍,唐诗华,张向伟,罗伟国.基于EVC的PDA与全站仪数据通讯[J].西部探矿工程,2006,18(10):256-258. 被引量：2
7许康平,陈建元,韦海锋.基于EP9315的嵌入式实验系统[J].电气电子教学学报,2006,28(4):76-80. 被引量：2
8王鸿鹏,闫晓伟,杨孝宗.基于CDMA1X的远程心电监护系统的研究与设计[J].计算机工程与设计,2006,27(18):3324-3327. 被引量：13
9王鸿鹏,闫晓伟,杨孝宗,戴博,张帆.基于CDMA1X的远程心电监护系统的研制[J].北京生物医学工程,2006,25(5):513-516. 被引量：3
10李寒生,陈晓辉,陆启帅.Windows CE.net的串口通讯类设计[J].陕西理工学院学报（自然科学版）,2006,22(4):55-57. 被引量：1

同被引文献16

1严家明,李永恒.EMD-SDC方法在机载连接词语音识别系统中的应用[J].计算机工程与应用,2012,48(8):137-140. 被引量：1
2赵海涛,李相莲,李阳.改进的Fisher准则及其在语音聚类中的应用[J].指挥控制与仿真,2013,35(2):118-120. 被引量：2
3高忠生,高红琴.计算机语音识别系统的架构设计[J].信息记录材料,2013,14(3):50-53. 被引量：2
4周萍,李晓盼,李杰,景新幸.混合MFCC特征参数应用于语音情感识别[J].计算机测量与控制,2013,21(7):1966-1968. 被引量：19
5刘万凤,胡军,袁伟伟.陆空通话标准用语(英语)的语音指令识别技术研究[J].计算机科学,2013,40(7):131-137. 被引量：9
6崔金钟,周远彬,陈雷霆.基于DHMM的嵌入式语音识别系统的实现与优化[J].电子科技大学学报,2013,42(6):930-934. 被引量：7
7刘江华.“语音识别”在中职英语口语教学中的应用[J].江苏教育（职业教育）,2013(10):48-50. 被引量：1
8鲜晓东,樊宇星.基于Fisher比的梅尔倒谱系数混合特征提取方法[J].计算机应用,2014,34(2):558-561. 被引量：18
9王赫楠,燕燕,王甜宇,王和禹.DTW算法在嵌入式语音识别系统中的应用研究[J].科技创新导报,2014,11(8):71-71. 被引量：2
10倪曼蒂,李彪,邹丽萍,张楚才.基于空间增强和谱减法的语音识别系统[J].晓庄学院自然科学学报,2014,37(3):63-68. 被引量：2

引证文献2

1周晓武.嵌入式实时英语语音识别系统的设计与研究[J].电子设计工程,2017,25(8):187-190. 被引量：13
2赵鑫,陈晓冬,常昕,齐麟,汪毅,郁道银.基于Multi-Fisher准则的语音混合特征提取和特征增强方法[J].纳米技术与精密工程,2017,15(4):317-322. 被引量：3

二级引证文献16

1孙晓杰.嵌入式语音识别技术实现[J].信息记录材料,2018,19(8):118-119. 被引量：6
2龙卓群,雷日兴.履带式行走机器人避障自动控制系统设计[J].自动化与仪器仪表,2018,0(8):68-70. 被引量：7
3张岳琢.记忆辅助型长字符英语自动翻译系统设计[J].自动化与仪器仪表,2018,0(10):116-118. 被引量：3
4苏倩,杜堃.基于英语语音识别的水稻收割机控制系统设计[J].农机化研究,2019,41(6):237-240. 被引量：11
5米婧.英语语音优化识别建模仿真分析[J].信息技术,2019,43(6):91-95. 被引量：6
6李蓉.基于语音信号识别技术的智能发音练习系统[J].电子设计工程,2019,27(15):56-60. 被引量：3
7宋春丽.基于LabVIEW系统的语言增强去噪仿真设计[J].宁夏师范学院学报,2019,40(7):79-83. 被引量：1
8张春宇.数字指令驱动电路测试方法研究[J].微处理机,2020,41(2):15-18.
9许学添.静息脑电信号频域不对称指数特征识别算法[J].电子设计工程,2020,28(9):67-71. 被引量：1
10董银英.基于DSP嵌入式英语识别系统开发研究[J].现代科学仪器,2020,37(1):39-43. 被引量：1

1杨润辉,吴清江.基于步态的身份识别综述[J].电脑开发与应用,2007,20(9):30-32. 被引量：1
2吴新榕,曾剑铭,沈海斌.基于优化GDTW-SVM算法的联机手写识别[J].电子技术（上海）,2012,39(2):61-64.
3刘敬伟,程乾生.基于动态时间规划的基因芯片数据识别[J].北京大学学报（自然科学版）,2002,38(5):611-615. 被引量：1
4吴进,张青.一种改进的孤立词语音识别系统设计[J].西安邮电大学学报,2016,21(1):76-80. 被引量：4
5魏星,周萍.改进型蚁群算法的语音动态规划研究[J].计算机仿真,2011,28(5):402-405. 被引量：7
6张丽娟,王申良.基于STM32的语音识别系统的设计与实现[J].黑龙江科技信息,2011(2):21-21. 被引量：2
7陈玲,杨天奇.基于质心和轮廓关键点的步态识别[J].计算机工程与应用,2015,51(19):173-177. 被引量：3
8朱春媚,黎萍.基于支持向量机的咳嗽自动识别[J].计算机与现代化,2016(7):111-114.
9王一梅,贾克斌,庄新月.一种基于动态时间规划的视频特征检索改进算法[J].高技术通讯,2007,17(5):464-469. 被引量：1
10李海涛.基于DTW约束的动作行为识别[J].计算机仿真,2014,31(11):227-230. 被引量：4

计算机工程与应用

2014年第8期

浏览历史

内容加载中请稍等...

内窥镜自动定位语音识别系统被引量：2

参考文献8

二级参考文献8

共引文献189

同被引文献16

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

内窥镜自动定位语音识别系统 被引量：2

参考文献8

二级参考文献8

共引文献189

同被引文献16

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

内窥镜自动定位语音识别系统被引量：2