改进黑翅鸢算法的LSTM永嘉方言识别策略

Yongjia Dialect Recognition Strategy of LSTM Optimized by Improved Black-winged Kite Algorithm

下载PDF

导出

摘要针对永嘉方言的口音及音调的特点,本文提出一种基于改进黑翅鸢优化算法的LSTM语音识别模型。首先,针对传统黑翅鸢优化算法的缺陷,引入Chebyshev混沌序列优化黑翅鸢种群初始化流程;并在位置更新过程中,结合透镜反向学习策略平衡算法的全局寻优与局部勘探能力;提高算法的收敛精度和收敛速度,为防止算法早熟收敛,通过加入改进高斯变异因子,以引入适当扰动的方式帮助算法跳出局部最优。其次,将改进后的黑翅鸢算法与LSTM网络结合,搭建IBKA-LSTM语音识别模型。最后,通过梅尔倒谱系数对特征方言进行提取,并通过IBKA-LSTM模型进行识别。 Aiming at the accent and tonal characteristics of the Yongjia dialect,this paper proposes a Long Short-Term Memory(LSTM)speech recognition model based on an Improved Black-winged Kite Optimization Algorithm(IBKA).Firstly,to address the shortcomings of the traditional Black-winged Kite Optimization Algorithm(BKA),the improved algorithm introduces the Chebyshev chaotic sequence to optimize its population initialization process.During the position update phase,it incorporates a lens oppositionbased learning strategy to balance the algorithm's global exploration and local exploitation capabilities,thereby enhancing its convergence accuracy and speed.To prevent premature convergence,an improved Gaussian mutation factor is added to introduce appropriate perturbations,helping the algorithm escape from local optima.Secondly,the improved Black-winged Kite Algorithm is integrated with the LSTM network to construct an IBKA-LSTM speech recognition model.Finally,Mel-Frequency Cepstral Coefficients(MFCC)are used to extract features from the characteristic dialect speech,and recognition is performed by the IBKALSTM model.

作者张志强杨振梅 Zhang Zhiqiang;Yang Zhenmei(School of Artificial Intelligence,Zhejiang Dongfang Polytechnic,Wenzhou,Zhejiang 325000,China;Wenzhou Polytechnic)

机构地区浙江东方职业技术学院人工智能学院温州职业技术学院

出处《计算机时代》 2025年第10期44-50,共7页 Computer Era

基金 2024年度温州市科协服务科技创新项目:基于ResCNN-BiGRU的永嘉方言语音识别技术研究(项目编号:KJFW2024-038)。

关键词黑翅鸢算法 Chebyshev混沌序列透镜反向学习语音识别 LSTM网络 Black-winged Kite Algorithm Chebyshev Chaotic Sequence Lens Opposition-Based Learning Speech Recognition LSTM Network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1王华朋,冯嘉琪.基于深度学习的语音增强方法综述[J].科学技术与工程,2025,25(20):8331-8346. 被引量：2
2胡恒博,牛铜,何振华.改进Transformer解码器的端到端语音识别[J].计算机应用,2025,45(S1):95-100. 被引量：1
3王詠森,刘倩,刘立波.ACGFN:基于非对称卷积和门控前馈神经网络的语音识别模型[J].中文信息学报,2025,39(1):167-174. 被引量：2
4孙杰,王斌,王宏,吾守尔·斯拉木.基于小波特征的维吾尔语方言识别[J].实验室研究与探索,2023,42(4):148-152. 被引量：1
5梁小林,沈湘菲,梁曌,邱海琳.基于CTC-GRU模型的长沙方言识别[J].吉首大学学报（自然科学版）,2022,43(2):45-52. 被引量：1
6叶蕾,王婷婷,郭海燕,陈雪红,杨震.一种基于图信号处理的BP神经网络语音识别方案[J].南京邮电大学学报（自然科学版）,2023,43(5):1-8. 被引量：6
7张昱,李鸿燕,邢璐,任健.基于双路卷积神经网络的中文语音识别[J].计算机工程与设计,2023,44(3):880-886. 被引量：5
8朱学超,张飞,高鹭,任晓颖,郝斌.基于残差网络和门控卷积网络的语音识别研究[J].计算机工程与应用,2022,58(7):185-191. 被引量：12
9王子龙,李俊峰,张劭韡,王宏岩,王思杰.基于递归神经网络的端到端语音识别[J].计算机与数字工程,2019,47(12):3099-3106. 被引量：6
10王先欢,孙自强.基于QRNN-CTC的中文语音识别声学模型[J].计算机应用与软件,2023,40(12):184-188. 被引量：6

二级参考文献68

1赵正平.GaN微电子学的新进展(续)[J].半导体技术,2020,0(2):89-98. 被引量：1
2钱盛友,许慧燕.基于动态时间规整和神经网络的方言辨识研究[J].计算机工程与应用,2008,44(10):211-213. 被引量：9
3王岐学,钱盛友,赵新民.基于差分特征和高斯混合模型的湖南方言识别[J].计算机工程与应用,2009,45(35):129-131. 被引量：4
4曹雪琳,李京华.基于小波包提取特征的声纹识别[J].计算机仿真,2010,27(11):324-327. 被引量：4
5栗志意,何亮,张卫强,刘加.基于鉴别性i-vector局部距离保持映射的说话人识别[J].清华大学学报（自然科学版）,2012,52(5):598-601. 被引量：11
6王立,张谧.基于LSTM的POI个性化推荐框架[J].计算机系统应用,2018,27(12):56-61. 被引量：6
7张小强,韩宪军,孟晓欢.基于随机场和Monte-Carlo法的随机有限元分析[J].洛阳理工学院学报（自然科学版）,2014,24(4):27-30. 被引量：1
8陆真,裴东兴,刘莉,白茹.基于改进小波阈值函数和PSO的语音增强算法[J].激光杂志,2016,37(2):141-145. 被引量：7
9刘凤山,吕钊,张超,吴小培.改进小波阈值函数的语音增强算法研究[J].信号处理,2016,32(2):203-213. 被引量：15
10吴秋玲,吴蒙.基于小波变换的语音信息隐藏新方法[J].电子与信息学报,2016,38(4):834-840. 被引量：17

共引文献32

1金乐.基于双向长短期记忆网络的高压输电线路短路故障识别方法[J].内蒙古电力技术,2021,39(2):66-72. 被引量：6
2陈晓红,滕华.基于深度机器学习的英语语音识别研究[J].贵阳学院学报（自然科学版）,2021,16(3):1-4. 被引量：3
3杨乐,马驰,胡辉,黄冬.基于改进LSTMs模型的区域中长期气温预测方法研究[J].惠州学院学报,2021,41(6):75-79. 被引量：1
4刘诗仪,刘改,吴峰.基于深度神经网络的字典学习[J].计算机系统应用,2022,31(8):292-297.
5陶华,庄友谊,戴欢.基于卷积神经网络的居民用电异常检测方法[J].科学技术创新,2022(34):92-98. 被引量：4
6陈戈,谢旭康,孙俊,陈祺东.使用Conformer增强的混合CTC/Attention端到端中文语音识别[J].计算机工程与应用,2023,59(4):97-103. 被引量：11
7滕思航,王烈,李雅,蓝峥杰.自适应独立性假设的非自回归Transformer语音识别[J].微电子学与计算机,2023,40(5):29-38. 被引量：3
8柳永利,张绍阳,王裕恒,解熠.基于多任务损失附加语言模型的语音识别方法[J].江苏大学学报（自然科学版）,2023,44(5):564-569. 被引量：5
9马志举,杜庆治,龙华,邵玉斌.基于改进语谱图的深度学习说话人识别[J].现代电子技术,2023,46(21):32-38. 被引量：7
10刘育坤,郑霖,黎塔,张鹏远.多声学场景下端到端语音识别声学编码器的自适应[J].声学学报,2023,48(6):1260-1268. 被引量：5

1杨聪聪,姜金华,蒋志成.混合多策略改进的海鸥优化算法[J].机电工程,2025,42(10):1970-1980. 被引量：2
2张胜利,陈淼,季坚莞.基于GMM-SVM的声纹识别方法分析[J].集成电路应用,2025,42(5):19-21.
3张敬超,胡皓,李晨辉,宋金华,江国乾,李英伟.基于MFCC-LSTM的低速齿轮故障诊断方法研究[J].燕山大学学报,2025,49(5):404-413.
4李沛功,宣颖,冯晨轩,赵鑫瑞,肖国锐.利用GNSS质量控制的城市环境下GNSS/视觉/惯性组合定位方法[J].导航定位与授时,2025,12(4):64-74.
5黄继翔.基于知识蒸馏的轻量级钢琴单音识别方案[J].信息技术与信息化,2025(10):27-31.
6魏倩楠,张志华,纪雨欣,李佳硕,刘洪源,全尧.基于深度学习模型的鸟类保护研究[J].计算机科学与应用,2025,15(9):115-122.
7胡忠前,周伟,杨雅琪,王魁涛,张悦.基于贝叶斯优化-高斯过程回归的应变测量非线性校正[J].石油化工自动化,2025,61(5):7-12.
8彭鑫,李铁威,袁曾家,刘胤.基于自适应差分进化的云边协同卸载策略[J].湖南理工学院学报(自然科学版),2025,38(3):14-17.
9张龙基,魏云龙,郑晓明,俞英健,熊丽君.儿童异常肺音识别的时序优化神经网络模型[J].声学技术,2025,44(5):730-737.
10余兴国,袁涛,王国义.基于改进高斯近似消息传递的卫星通信OTFS信号检测[J].新乡学院学报,2025,42(9):56-60.

计算机时代

2025年第10期

浏览历史

内容加载中请稍等...

改进黑翅鸢算法的LSTM永嘉方言识别策略

参考文献11

二级参考文献68

共引文献32

相关作者

相关机构

相关主题

浏览历史