基于改进SlowFast的连续手语识别研究

Research on Continuous Sign Language Recognition Based on Improved SlowFast

下载PDF

导出

摘要为协助听障人士改善日常沟通状况,提出了一种基于改进SlowFast架构的连续手语识别模型.该模型通过慢速路径和快速路径分别提取手语视频的空间特征和动作特征,并引入双向特征融合加强两个路径的信息交互.此外,利用动作参数A和移动参数M捕获手势变化幅度和频率,优化模型性能.实验结果表明,所提方法在PHOENIX2014和CSL-Daily测试集上的WER分别为18.8%和28.2%,相比其他方法在手语识别的准确率上有明显改进. In order to improve daily communication for the deaf,a continuous sign language recognition model based on improved SlowFast architecture is proposed.The model extracts spatial and temporal features from sign language videos through the slow and fast pathways.The bidirectional feature fusion is introduced to enhance information interaction between the two paths.Additionally,motion parameter A and mobility parameter M are utilized to capture gesture amplitude and frequency,further optimizing model performance.Experimental results demonstrate that the proposed method achieves WER of 18.8%and 28.2%on the PHOENIX14 and CSL-Daily test datasets,significantly outperforming existing approaches in continuous sign language recognition.

作者蒋敏敏 JIANG Minmin(Putian University,Putian 351100,China)

机构地区莆田学院计算机与大数据学院

出处《通化师范学院学报》 2025年第10期34-40,共7页 Journal of Tonghua Normal University

基金福建省中青年教师教育科研项目(科技类)(JAT220299)。

关键词连续手语识别 SlowFast 动作参数移动参数 continuous sign language recognition SlowFast motion parameter mobility parameter

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张淑军,王帅,李辉.基于CNN和BLSTM的连续手语识别[J].重庆理工大学学报（自然科学）,2022,36(4):177-186. 被引量：8
2应捷,徐文成,杨海马,刘瑾,郑乐芊.融合自适应图卷积与Transformer序列模型的中文手语翻译方法[J].计算机应用研究,2023,40(5):1589-1594. 被引量：12
3邵舒羽,杜垚,范晓丽.基于Transformer和多模态对齐的非自回归手语翻译技术研究[J].电子与信息学报,2024,46(7):2932-2941. 被引量：5
4钟月凤,黄平.汉语与手语的语序对比研究[J].吉林工程技术师范学院学报,2021,37(9):47-50. 被引量：2
5王志明,张佳,彭江南,刘心志,陈克克,傅冠夷蛮,王绍萌,商飞,狄长安.SlowFast架构下景区异常行为识别算法及预警研究[J].南京理工大学学报,2024,48(3):374-383. 被引量：9

二级参考文献26

1吕会华,高立群.中国手语的关系从句[J].当代语言学,2011,13(2):116-123. 被引量：9
2吕会华,王红英,巩卓.国内外手语语序研究综述[J].中州大学学报,2014,31(3):73-79. 被引量：7
3卢苇,袁芯.浅谈自然手语比较句的句法特征[J].文教资料,2014(35):26-28. 被引量：3
4吕会华.中国手语和汉语句法比较——以两类简单句和关系从句为例[J].北京联合大学学报,2017,31(1):19-24. 被引量：2
5郑良仁,靳宗信,蒋文娟,杨勇.监控场景下视频中全局移动对象的异常行为自动识别[J].科学技术与工程,2017,17(26):81-85. 被引量：8
6金立鑫.汉语语序的类型学特征[J].解放军外国语学院学报,2019,42(4):1-13. 被引量：16
7郝子煜,阿里甫·库尔班,李晓红,依沙·吾阿提别克.基于CapsNet的中国手指语识别[J].计算机应用研究,2019,36(10):3157-3159. 被引量：8
8罗元,李丹,张毅.基于时空注意力网络的中国手语识别[J].半导体光电,2020,41(3):414-419. 被引量：9
9陈燕琴,杨丽云,肖菊英.聋生自然手语句法特点分析——以贵州省A特殊教育学校为例[J].安顺学院学报,2020,22(5):68-73. 被引量：1
10陈琳琳,朱惠娟,朱俊,王晓瞳.基于卷积神经网络的多尺度注意力图像分类模型[J].南京理工大学学报,2020,44(6):669-675. 被引量：16

共引文献30

1应捷,徐文成,杨海马,刘瑾,郑乐芊.融合自适应图卷积与Transformer序列模型的中文手语翻译方法[J].计算机应用研究,2023,40(5):1589-1594. 被引量：12
2闫路,来佳丽,王明辉.多信息融合和自注意力识别新冠磷酸化位点[J].重庆理工大学学报（自然科学）,2023,37(6):242-248.
3娄英丹,杨志辉,赵聪.Bert-DTA:基于混合编码策略的药物靶标亲和力预测[J].运城学院学报,2023,41(3):17-23.
4杨黎霞,夏天,陈仁祥,张晓,邱天然.基于结构重参数化和注意力机制的复杂背景下手势识别[J].重庆理工大学学报（自然科学）,2023,37(12):201-209. 被引量：1
5黄同愿,谭禹,朱金江.基于SlowFast网络的孤立词手语识别算法研究[J].重庆理工大学学报（自然科学）,2023,37(12):267-275. 被引量：4
6白雯.融合跨语言记忆网络与语义信息的神经机器翻译系统架构设计研究[J].自动化与仪器仪表,2024(5):178-181.
7郭浩,宋俊材,陆思良.多通道电流信号深度特征融合的开关磁阻电机故障诊断研究[J].重庆理工大学学报（自然科学）,2024,38(7):211-219. 被引量：2
8孟巾凯,彭健钧,肖智东,郭立,金凯,郑彤.模块化连续手语识别算法及技术综述[J].小型微型计算机系统,2024,45(10):2428-2441. 被引量：1
9方欲晓,何可人.通信网络流量分段隐蔽威胁深度包检测方法[J].现代电子技术,2024,47(21):101-105. 被引量：5
10赵丽萍.聋生手语与汉语的习得异同及对书面语表达教学的启示[J].安徽教育科研,2024(33):14-17. 被引量：1

1于贝贝.家园共育视角下幼儿行为习惯养成的实践路径[J].环球慈善,2025(6):0100-0102.
2郑淇阳,简彩仁.基于多模态的手语视频识别[J].物联网技术,2025,15(23):18-24. 被引量：1
3周胜洁,小康(译).与众不同的酒馆[J].孔子学院(中西文对照版),2025(5):36-39.
4张曦.人工智能对事业单位人事管理的影响[J].商界（下旬刊）,2024(10):196-198.
5王晓路,谭永辉,李晓婷.基于时空特征融合与注意力机制的图卷积动作识别方法[J].电讯技术,2025,65(11):1789-1797.
6方菲,张仁平,周建山.法治护航“无声呼救”[J].方圆,2025(20):42-43.
7张维浩,易彩,闫磊,董威,姜瀚.面向变速工况的Rényi熵驱动自适应字典学习轴承故障诊断方法[J].仪器仪表学报,2025,46(7):271-287.
8梁成武,蒋松琪,杨杰,朱培旺,帖云,高磊,胡伟,郭文博.融合运动领域知识与自适应时空Transformer的人体骨架行为识别[J].计算机研究与发展,2025,62(12):3028-3041. 被引量：1
9李传东,衣然,罗英伟,汪小林,王振林.RISC-V架构下的懒惰影子页表模型[J].软件学报,2025,36(9):3970-3984.

通化师范学院学报

2025年第10期

浏览历史

内容加载中请稍等...

基于改进SlowFast的连续手语识别研究

参考文献5

二级参考文献26

共引文献30

相关作者

相关机构

相关主题

浏览历史