基于语音识别的英语翻译终端设计被引量：1

The Design of the English Translation Terminal Based on Speech Recognition

导出

摘要针对传统的英语翻译系统存在无法准确识别说话者语音和语气的问题。设计一个基于语音识别和语气语音合成的英语翻译系统,该系统终端主要包括语音识别、语言翻译、语气识别、语气转换和语气语音合成模块。基于CVAE语气语音合成模型对语音识别和语言翻译的英语语句进行语气语音合成,以进行便携式英语翻译终端设计与实现。实验表明,基于CVAE的语气语音合成模型合成语气语音的基频曲线与原始语音间的误差仅为0.02,两者基频曲线十分接近。且在主观评价方面,本模型的语音合成自然度MOS评分为3.84分,方差仅为0.004;情感语气一致性平均打分为 3.72,方差为 0.002 。综合分析可知,本模型可取得较好的语音生成效果,生成语音具备多样性和准确性。系统应用发现,本模型在系统中可提升英语翻译系统终端的语音识别和语气语音合成效果,系统性能优越。 In view of the traditional English translation system, there is the problem of low speech recognition accuracy, flat output speech and intonation, which cannot accurately express the tone of the speaker. An English translation system based on speech recognition and tone speech synthesis is proposed. The system terminal mainly includes speech recognition, language translation, tone recognition, tone conversion and tone speech synthesis module. Based on the conditional variational autoencoder (CVAE) tone speech synthesis model for speech recognition and language translation, in order to design and realize the portable English translation terminal. The experiment shows that the error between the base frequency curve and the original speech based on CVAE is only 0.02, and the two base frequency curves are very close. For subjective evaluation, the MOS score of speech synthesis is 3.84, and the variance is only 0.004;the average score is 3.72, and the variance is 0.002. Comprehensive analysis shows that this model can achieve good speech generation effect, and generate speech with diversity and accuracy. The system application shows that this model can improve the speech recognition and tone speech synthesis effect of the English translation system terminal, and the system performance is superior.

作者涂琼引成南 TU Qiongyin;CHENG Nan(Chongqing Vocational College of Light Industry,Chongqing 401329,China)

机构地区重庆轻工职业学院

出处《自动化与仪器仪表》 2023年第1期251-256,共6页 Automation & Instrumentation

基金《新时代高职院校教师教学能力提升途径研究》(203767) 《“提质培优”背景下高职公共英语课程思政教学改革的研究》(22SKGH607)。

关键词语音识别英语翻译 CVAE 系统终端语气语音合成 speech recognition English translation CVAE system terminal tone voice synthesis

分类号 TP392 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1唐海桃,薛嘉宾,韩纪庆.一种多尺度前向注意力模型的语音识别方法[J].电子学报,2020,48(7):1255-1260. 被引量：21
2牛潇,秦健.基于App Inventor的语音识别与文本翻译器App的设计与调试[J].电脑知识与技术,2020,16(22):20-22. 被引量：1
3黄清,方木云.一种基于HMM算法改进的语音识别系统[J].重庆工商大学学报（自然科学版）,2022,39(5):56-61. 被引量：15
4周浩,李毅,张浩,陈鸿,任磊生.基于CVAE的超高速碰撞碎片云运动过程的快速预测技术[J].实验流体力学,2021,35(5):40-46. 被引量：2
5赵立铉,杨鉴.基于BERT预训练语言模型的印尼语语音合成[J].云南大学学报（自然科学版）,2021,43(6):1086-1095. 被引量：2
6孙志宏,叶焱,刘太君,许高明.基于迁移学习的自适应语音合成[J].数据通信,2021(5):47-51. 被引量：4
7姑丽斯坦·奥布力喀斯木,帕力旦·吐尔逊,艾斯卡尔·艾木都拉.不同粒度嵌入单元的端到端语音合成技术研究[J].现代计算机,2021,27(24):14-20. 被引量：1
8高欣,纪维佳,赵兵,贾欣,黄子健,任昺.不平衡数据集下基于CVAE-CNN模型的智能电表故障多分类方法[J].电网技术,2021,45(8):3052-3060. 被引量：24
9郑艳鹏,苏东.基于离线语音识别的灯光控制智能家居系统[J].海南师范大学学报（自然科学版）,2021,34(2):185-194. 被引量：10
10李建文,王咿卜.多项式函数拟合实现汉语声调的语音合成[J].西安科技大学学报,2021,41(3):506-515. 被引量：2

二级参考文献120

1周楠,艾剑良.基于HMM和RNN的无人机语音控制方案与仿真研究[J].系统仿真学报,2020,32(3):464-471. 被引量：14
2薛健,蔡莲红.一种基于声调规范模型的声调变换方法[J].计算机工程与应用,2005,41(10):40-43. 被引量：2
3李锦,何培宇.一种改进的基于小波去噪HMM非特定人语音识别算法[J].四川大学学报（自然科学版）,2007,44(1):69-72. 被引量：12
4王剑辉,姜龙滨,穆宝良.关于MEDLINE-Abstracts文献的语法规则的构建与实现[J].西安科技大学学报,2007,27(1):111-114. 被引量：1
5CAO Wenming,HE Tiancheng.The Multi-Weight Neuron with Geometry Algorithm and Its Application[J].Chinese Journal of Electronics,2008,17(2):261-264. 被引量：4
6宋刚,姚艳红.用于汉语单音节声调识别的基频轨迹拟合方法[J].计算机工程与应用,2008,44(29):239-240. 被引量：6
7张涛,马宏伟,郭长立,张永元,杨华平.传输矩阵法研究薄膜体声波谐振器[J].西安科技大学学报,2010,30(2):251-254. 被引量：3
8马效敏,郑文思,陈琪.自相关基频提取算法的MATLAB实现[J].西北民族大学学报（自然科学版）,2010,31(4):54-58. 被引量：8
9胡郁,凌震华,王仁华,戴礼荣.基于声学统计建模的语音合成技术研究[J].中文信息学报,2011,25(6):127-136. 被引量：9
10金鑫,田犇,阙大顺.基于LD3320的语音控制系统设计实现[J].电脑与信息技术,2011,19(6):22-25. 被引量：57

共引文献112

1张金光,孔江平.基于wav2vec2的普通话音素识别分析[J].中国语音学报,2023(2):159-166.
2王娣.人工智能抢救濒危满语的研究与探索[J].边疆经济与文化,2022(11):49-53.
3乔元健.基于人工智能的机器人音乐类型识别[J].变频器世界,2020(10):71-74.
4乔思波,庞善臣,王敏,翟雪,于世行,丁桐.基于残差混合注意力机制的脑部CT图像分类卷积神经网络模型[J].电子学报,2021,49(5):984-991. 被引量：20
5李涛,王子豪,王庸道,毛麟峰,吴振升,董伟男,范德玲.基于深度残差网络的油纸绝缘老化状态识别策略研究[J].广西科技大学学报,2022,33(1):39-45. 被引量：2
6华春梦,臧艳辉,马伙财.一种基于CRNN的车牌识别算法研究与应用[J].现代信息科技,2021,5(20):78-81. 被引量：5
7刘文婷,卢新明.基于计算机视觉的Transformer研究进展[J].计算机工程与应用,2022,58(6):1-16. 被引量：100
8张凌明,赵悦,李鹏程,刘洋,高陈强.基于局部注意力机制的三维牙齿模型分割网络[J].电子学报,2022,50(3):681-690. 被引量：6
9付敏.基于特征提取的英汉机器自动转换翻译系统设计[J].自动化与仪器仪表,2022(5):166-169. 被引量：1
10赵力瑾,高攀.基于连续隐马尔科夫模型的英语翻译机器人语音识别系统[J].自动化与仪器仪表,2022(6):191-194. 被引量：10

同被引文献6

1孙丹,何骅.基于Android的应用英语移动学习软件的设计与实现[J].计算机时代,2014(11):24-26. 被引量：15
2周少波.基于Android平台的英语词汇学习工具设计与实现[J].电脑编程技巧与维护,2014(24):80-80. 被引量：6
3郭能辉.移动APP在成人英语教学中的应用研究[J].西北成人教育学院学报,2016(6):18-20. 被引量：8
4龚朝花,曾雪庆.基于PACTS模型的教育APP质量评价指标体系研究[J].现代教育技术,2018,28(1):45-51. 被引量：12
5苏倩,杜堃.基于英语语音识别的水稻收割机控制系统设计[J].农机化研究,2019,41(6):237-240. 被引量：11
6温湛靓.基于智能算法的英语翻译器语音识别方法[J].自动化与仪器仪表,2022(12):162-165. 被引量：2

引证文献1

1刘艺菲,褚治广,李启龙.基于音频分析和自然语义分析的英语听说读写训练系统设计[J].辽宁工业大学学报(自然科学版),2024,44(6):399-403. 被引量：1

二级引证文献1

1周晓庆.5G时代初中英语沉浸式听说教学模式的构建探索[J].中国新通信,2025,27(15):194-196. 被引量：1

1万兴凤.初中英语教学中的阅读教学策略[J].爱情婚姻家庭（下旬）,2020(4):0063-0064.
2薛松,赵珂瑶,林春雨.基于生成对抗网络的极坐标域自监督径向畸变校正算法[J].北京交通大学学报,2022,46(5):74-83. 被引量：3
3张桂花.初中英语词汇教学优化策略探析[J].今天,2022(23):159-160.
4杨峰,蒋勇,吴茂杰,罗率,蒋赟,王国敏.水化硅酸钙早强剂的晶种诱导高效合成及其应用[J].四川水泥,2022(8):1-4. 被引量：3
5龚桂芳,冯源恒,罗群凤,杨章旗.马尾松树高生长性状显著关联基因挖掘[J].广西林业科学,2022,51(2):180-183. 被引量：2
6韩飞.从《源氏物语》“夕颜”篇看爱与翻译[J].时代人物,2023(2):247-249.
7侯阳飞,陈俊平,王彬,王解先.基于Lomb-Scargle谱分析的分析中心GPS精密产品特性分析及修正[J].东南大学学报（自然科学版）,2020,50(5):950-958. 被引量：1
8庄雅妗.黄嘉谟译介美国文学中闽南方言的适应与选择[J].韩山师范学院学报,2022,43(2):97-102. 被引量：1

自动化与仪器仪表

2023年第1期

浏览历史

内容加载中请稍等...

基于语音识别的英语翻译终端设计被引量：1

参考文献16

二级参考文献120

共引文献112

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语音识别的英语翻译终端设计 被引量：1

参考文献16

二级参考文献120

共引文献112

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语音识别的英语翻译终端设计被引量：1