结合差分演化和逻辑回归的构音障碍自动识别方法被引量：1

Automatic Recognition of Dysarthria Based on Differential Evolution and Logistic Regression

下载PDF

导出

摘要针对传统的构音障碍诊断方法存在耗时高、成本高等问题,提出一种构音障碍语音的计算机自动识别方法。结合Gammatone频率倒谱系数(Gammatone Frequency Cepstrum Coefficients, GFCC)与常用声学特征形成组合声学特征,应用差分演化算法进行特征选择,并使用逻辑回归分类器对构音障碍语音进行识别。将Torgo构音障碍语音数据库分成3个语音子集,分别是非词、短词语、限制句子集,提取24维GFCC和37维常用的声学特征构成组合声学特征,最后使用差分演化算法和逻辑回归分类器进行分类识别。实验表明:使用差分演化算法可以有效选择出具有更佳识别能力的特征,从而显著提高构音障碍识别率。在非词子集上的实验准确率达到98.18%,召回率为98.3%,精确率为98.3%。 Aiming at the problems of high time consuming and cost in traditional diagnosis of dysarthria speech, a computer automatic recognition method for dysarthria is proposed. Combining the Gammatone Frequency Cepstrum Coefficients (GFCC) with the common acoustic features to form a combined acoustic feature, a differential evolution algorithm is applied for feature selection, and a logistic regression classifier is used to identify the dysarthria speech. The Torgo database is divided into three subsets, which are non-words, short words, restricted sentence. 24-dimensional GFCC and 37-dimensional commonly used acoustic features are extracted to form combined acoustic features. Finally, differential evolution algorithm and logistic regression classifier are used for identificaiton of dysarthria. Experiments show that the differential evolution algorithm can effectively select feature subsets with better ability to distinguish dysarthria and healthy speech, which can significantly improve performance in the classification of dysarthria. The experiment on non-word subsets achieves 98.18% of accuracy, 98.3% of recall, and 98.3% of precision.

作者黎雨星梁正友孙宇 LI Yu-xing;LIANG Zheng-you;SUN Yu(School of Computer and Electronics Information, Guangxi University, Nanning 530004, China)

机构地区广西大学计算机与电子信息学院

出处《计算机与现代化》 2019年第8期1-5,共5页 Computer and Modernization

基金国家自然科学基金资助项目(61763002)

关键词 GFCC 差分演化算法逻辑回归构音障碍识别 GFCC differential evolution algorithm logistic regression dysarthria recognition

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1邵明强,徐志京.基于改进MFCC特征的语音识别算法[J].微型机与应用,2017,36(21):48-50. 被引量：10
2宋静,张雪英,孙颖,张卫.基于PAD情绪模型的情感语音识别[J].微电子学与计算机,2016,33(9):128-131. 被引量：10
3纪正飚,王吉林,赵力.基于模糊K近邻的语音情感识别[J].微电子学与计算机,2015,32(3):59-62. 被引量：11
4胡峰松,曹孝玉.基于Gammatone滤波器组的听觉特征提取[J].计算机工程,2012,38(21):168-170. 被引量：30
5张晓丹,黄丽霞,张雪英.关于在噪声环境下语音识别优化研究[J].计算机仿真,2016,33(8):172-176. 被引量：17
6熊冰峰,曾以成,谢小娟.一种改进的听觉特征参数应用于说话人识别[J].计算机应用,2016,36(A01):82-85. 被引量：6
7程小伟,王健,曾庆宁,谢先明,龙超.噪声环境下稳健的说话人识别特征研究[J].声学技术,2017,36(5):479-483. 被引量：8
8黄永望,傅德慧.嗓音的声学分析[J].中国听力语言康复科学杂志,2016,0(5):351-355. 被引量：11
9孔祥勇,高立群,欧阳海滨,葛延峰.无参数变异的二进制差分进化算法[J].东北大学学报（自然科学版）,2014,35(4):484-488. 被引量：10
10吴炜,封兴华,毛天球,魏建华.腭裂患者术后语音障碍影响因素Logistic回归分析[J].口腔颌面外科杂志,2005,15(3):271-274. 被引量：7

二级参考文献90

1吴忆来,王国民,蒋莉萍,陈阳,张勇.先天性腭咽闭合功能不全的语音清晰度评价[J].口腔颌面外科杂志,2004,14(4):329-331. 被引量：16
2李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22
3Baylon H. Clinical management of cleft lip and palate in university hospital of Montpellier [J]. Ann Chir Plast Esthet, 2002,47(2):143-149.
4Coston GN, Hagerty RF, Jannarone RJ,et al. Levator muscle reconstruction: resulting velopharyngeal competencea preliminary report[J]. Plast Reconstr Surg, 1986,77(6):911-916.
5Marrinan EM, LaBrie RA, Mulliken JB. Velopharyngeal function in nonsyndromic cleft palate: relevance of surgical technique, age at repair, and cleft type[J]. Cleft Palate Craniofac, 1998,35(2):95-100.
6Kuehn DP, Henne LJ. Speech evaluation and treatment for patients with cleft palate [J]. Am J Speech Lang Pathol,2003,12(1):103-109.
7Pamplona MC, Ysunza A, Uriostegui C. Linguistic interaction: the active role of parents in speech therapy for cleft palate patients[J]. Int J Pediatr Otorhinolaryngol, 1996,37(1):17-27.
8Laitinen J, Schonweiler B, Schmelzeisen R.Associations between dental occlusion and misarticulations of Finnish dental consonants in cleft lip/palate children[J]. Eur J Oral Sci, 1999,107(2):109-113.
9Irino T, Patterson R D. A Dynamic Compressive Gammachirp Auditory Filterbank[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2006, 14(6): 2222-2232.
10Lyon R F, Katsiamis A G, Drakakiss E M. History and Future of Auditory Filter Models[C]//Proc. of ISCAS'10. Paris, France: Is. n.], 2010: 3809-3812.

共引文献107

1张小红,仲维彬.一种基于信息融合的目标识别算法[J].无线通信技术,2020(1):43-47.
2李大红,赵云峰.言语障碍116例的康复治疗体会[J].广东医学院学报,2006,24(5):503-504.
3李大红,赵云峰.言语及发声障碍患者矫治效果分析[J].听力学及言语疾病杂志,2006,14(6):465-466.
4翟慧强,张金萍,王丹,赵艳春.听觉模型综述[J].机械工程师,2014(3):19-22. 被引量：5
5茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
6丁晓阳,李嵩华.一种改进的差分进化算法[J].陕西师范大学学报（自然科学版）,2016,44(1):1-6. 被引量：3
7张扬,杨建华,侯宏.基于EK-NN的水声目标识别算法研究[J].声学技术,2016,35(1):15-19. 被引量：3
8钱淑渠,叶永强,武慧虹.贪婪封装二进制差分进化算法求解高维背包问题[J].控制与决策,2016,31(5):817-822. 被引量：2
9茅正冲,龚熙.基于EMD与RLS的说话人识别抗噪算法[J].计算机应用与软件,2016,33(5):231-234.
10熊冰峰,曾以成,谢小娟.一种改进的听觉特征参数应用于说话人识别[J].计算机应用,2016,36(A01):82-85. 被引量：6

同被引文献15

1李胜利,孙喜斌,王荫华,王荃桂,张庆苏,赵智慧,冯兰云,黄臻,赵翠娥,袁永学,于美霞,毛红霞,李雪娜,王彬,李社芳.第二次全国残疾人抽样调查言语残疾标准研究[J].中国康复理论与实践,2007,13(9):801-803. 被引量：24
2周静,王治华,方灿,张晓晓.脑卒中后痉挛型构音障碍患者与正常人群声学/电声门图参数的比较[J].浙江医学,2016,38(18):1537-1538. 被引量：5
3许颖,杨坚,李洪丽,丁珊珊,杨震亚.成人听力言语康复系统用于脑卒中后构音障碍患者言语训练的效果观察[J].现代医学,2017,45(10):1446-1449. 被引量：12
4何苗.语言康复护理联合针刺疗法对脑卒中痉挛型构音障碍患者的影响[J].光明中医,2018,33(2):276-277. 被引量：7
5陈敏军.词联导航训练法联合针灸、环喉按摩对老年病人脑卒中构音障碍的护理观察[J].全科护理,2018,16(12):1501-1503. 被引量：3
6何怡,庞子建,李胜利.运动性构音障碍的发声空气动力学检查及疗效[J].中国康复理论与实践,2018,24(10):1187-1194. 被引量：8
7无,王陇德.《中国脑卒中防治报告2019》概要[J].中国脑血管病杂志,2020,17(5):272-280. 被引量：1462
8李咏雪,谭茗丹,范豪,李婧婷,徐智勤,卞瑞豪,陈曦.励-协夫曼言语治疗对中国帕金森病患者言语功能的影响[J].中华物理医学与康复杂志,2020,42(3):245-248. 被引量：23
9谢倩文,肖晶旻,刘少南,杨丽虹,陈毅,刘映芬,杨海芳,郭新峰.卒中后构音障碍随机对照试验结局指标的系统评价[J].中国循证医学杂志,2020,20(6):708-712. 被引量：8
10刘玉凤,林珑,陈小霞,周剑英,李鹏程,顾立华.坐式呼吸八段锦对脑卒中运动型构音障碍的影响[J].按摩与康复医学,2020,11(24):38-40. 被引量：2

引证文献1

1韦添元,杜晓霞.卒中后构音障碍康复评估及治疗的研究进展[J].中华老年医学杂志,2022,41(12):1518-1524. 被引量：3

二级引证文献3

1王璐,何蕾,柴双双,冯宝玉,黄秀颖,田雨鑫,张冉,徐文,高磊.老年前循环和后循环脑梗死构音障碍患者的声学特征分析[J].中华老年医学杂志,2024,43(12):1568-1574. 被引量：4
2燕桢,刘学勇.脑卒中后言语障碍治疗方法的临床应用和研究进展[J].中华物理医学与康复杂志,2025,47(3):274-278. 被引量：2
3孙也,黎明全.脑卒中后构音障碍诊疗的研究进展[J].中国医学创新,2025,22(36):161-166.

1王华朋,姜囡,刘恩,晁亚东.法庭语音比对中话者自身变化性建模方法研究[J].计算机工程与应用,2019,55(8):110-115. 被引量：2
2王华朋,姜囡,晁亚东,刘恩.噪声环境下法庭语音证据量化评价方法[J].计算机应用与软件,2019,36(7):65-68. 被引量：3
3周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：47
4杜非霏.基于权值合理分配的电子音乐智能分类模型[J].现代电子技术,2018,41(13):168-171. 被引量：1
5易文周.基于差分演化和粒子群优化的改进WSN覆盖算法[J].计算机与现代化,2019,0(8):33-38. 被引量：4
6周雪珍,叶素贞,陈传帮.肌内效贴治疗急性脑卒中患者吞咽障碍的疗效观察[J].重庆医学,2019,48(14):2423-2426. 被引量：9
7黄海燕.广西听障儿童构音习得发展特征个案研究[J].教育观察,2019,8(9):141-144.
8白瑞雪.董事会断裂带研究综述[J].财讯,2019,0(16):186-186.
9李如玮,张永亚,潘冬梅,杨登才.噪声环境下基于信噪比的多通道自适应频响补偿算法[J].北京生物医学工程,2019,38(1):42-51. 被引量：1
10厉建宾,张旭东,吴彬彬,窦智,李豪杰.结合深度神经网络和多阈值软切分的电能表示数自动识别方法[J].计算机应用,2019,39(A01):223-227. 被引量：5

计算机与现代化

2019年第8期

浏览历史

内容加载中请稍等...

结合差分演化和逻辑回归的构音障碍自动识别方法被引量：1

参考文献10

二级参考文献90

共引文献107

同被引文献15

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

结合差分演化和逻辑回归的构音障碍自动识别方法 被引量：1

参考文献10

二级参考文献90

共引文献107

同被引文献15

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

结合差分演化和逻辑回归的构音障碍自动识别方法被引量：1