基于R(2+1)D时空特征融合与注意力的行为识别方法

BEHAVIOR RECOGNITION METHOD BASED ON R(2+1)D SPATIO-TEMPORAL FEATURE FUSION WITH ATTENTION

下载PDF

导出

摘要针对3D卷积在人体行为识别任务中,连续视频帧图像的时空信息提取不足且跨通道交互信息关注度不够,导致识别准确率不高的问题,提出一种基于R(2+1)D网络的多分路时空信息融合与注意力的行为识别方法。提取视频帧图像进行数据增强;以R(2+1)D网络为基础框架并融入Inception思想,对输入的视频帧图像进行多路时空特征卷积并融合,利用ECA通道注意力对融合特征筛选跨通道交互信息,以提取更抽象的高层特征;进行分类,输出人体行为识别结果。该方法充分利用视频的时空特征和跨通道交互信息,在UCF101数据集上准确率达到94.71%,比基础R(2+1)D网络提高4.53百分点;且模型参数由原来的33.3×106减小为26.9×10^(6)。实验表明,该方法能有效提高人体行为识别的准确率。 To address the problem of insufficient extraction of Spatio-temporal information from continuous video frame images and insufficient attention to cross-channel interaction information in 3D convolution in a human behavior recognition task,a behavior recognition method based on R(2+1)D network with multi-partition spatio-temporal information fusion and attention is proposed.The video frame images were extracted for data enhancement.The R(2+1)D network was used as the basic framework and incorporated with the Inception idea to convolve and fuse the input video frame images with multiple Spatio-temporal features,and the fused features were screened for cross-channel interaction information using ECA channel attention to extract more abstract high-level features.The classification was performed and the human behavior recognition results were output.The method made full use of the Spatio-temporal features and cross-channel interaction information of the video,and achieved an accuracy of 94.71% on the UCF101 dataset,which was 4.53 percentage points higher than the basic R(2+1)D network;and the model parameters were reduced from 33.3M to 26.9M.Experiments show that the method can effectively improve the accuracy of human behavior recognition.

作者李林玉陈淑荣 Li Linyu;Chen Shurong(College of Information Engineering,Shanghai Maritime University,Shanghai 201306,China)

机构地区上海海事大学信息工程学院

出处《计算机应用与软件》北大核心 2026年第2期248-254,共7页 Computer Applications and Software

关键词 R(2+1)D 时空卷积特征融合高效通道注意力跨通道交互 R(2+1)D Spatio-temporal convolution Feature fusion Efficient channel attention Cross-channel interaction

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献10

1李晨,何明,王勇,罗玲,韩伟.基于深度学习的视频行为识别技术综述[J].计算机应用研究,2022,39(9):2561-2569. 被引量：17
2邓淼磊,高振东,李磊,陈斯.基于深度学习的人体行为识别综述[J].计算机工程与应用,2022,58(13):14-26. 被引量：27
3胡凯,郑翡,卢飞宇,黄昱锟.基于深度学习的行为识别算法综述[J].南京信息工程大学学报（自然科学版）,2021,13(6):730-743. 被引量：16
4郭明祥,宋全军,徐湛楠,董俊,谢成军.基于三维残差稠密网络的人体行为识别算法[J].计算机应用,2019,39(12):3482-3489. 被引量：11
5周云,陈淑荣.基于双流非局部残差网络的行为识别方法[J].计算机应用,2020,40(8):2236-2240. 被引量：8
6王萍,庞文浩.基于视频分段的空时双通道卷积神经网络的行为识别[J].计算机应用,2019,39(7):2081-2086. 被引量：9
7石跃祥,曾智超.基于特征传播的时域分割网络行为识别[J].计算机辅助设计与图形学学报,2020,32(4):582-589. 被引量：11
8吴克伟,高涛,谢昭,郭文斌.Grenander时间结构学习与推理优化下的行为识别[J].软件学报,2022,33(5):1865-1879. 被引量：2
9杨明羽,叶春明.结合Bi-2DPCA与CNN的美式手语识别[J].计算机工程,2021,47(12):278-284. 被引量：3
10丁雪琴,朱轶昇,朱浩华,刘光灿.基于时空异构双流卷积网络的行为识别[J].计算机应用与软件,2022,39(3):154-158. 被引量：13

二级参考文献44

1李文宽,刘培玉,朱振方,刘文锋.基于卷积神经网络和贝叶斯分类器的句子分类模型[J].计算机应用研究,2020,37(2):333-336. 被引量：11
2李英杰,尹怡欣,邓飞.一种有效的行为识别视频特征[J].计算机应用,2011,31(2):406-409. 被引量：10
3李瑞峰,王亮亮,王珂.人体动作行为识别研究综述[J].模式识别与人工智能,2014,27(1):35-48. 被引量：97
4黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：413
5唐超,王文剑,李伟,李国斌,曹峰.基于多学习器协同训练模型的人体行为识别方法[J].软件学报,2015,26(11):2939-2950. 被引量：10
6单言虎,张彰,黄凯奇.人的视觉行为识别研究回顾、现状及展望[J].计算机研究与发展,2016,53(1):93-112. 被引量：49
7朱煜,赵江坤,王逸宁,郑兵兵.基于深度学习的人体行为识别算法综述[J].自动化学报,2016,42(6):848-857. 被引量：135
8张文轩.基于人机交互的智能家居安防系统设计[J].中国新技术新产品,2017(4):129-130. 被引量：2
9任智慧,徐浩煜,封松林,周晗,施俊.基于LSTM网络的序列标注中文分词法[J].计算机应用研究,2017,34(5):1321-1324. 被引量：71
10邓三鸿,傅余洋子,王昊.基于LSTM模型的中文图书多标签分类研究[J].数据分析与知识发现,2017,1(7):52-60. 被引量：30

共引文献101

1池亚平,岳梓岩,赵伦.密码算法识别技术研究进展与展望[J].北京电子科技学院学报,2022,30(4):1-14.
2李志晗,刘银华,谢锐康,单良.基于关节点运动估计的人体行为识别[J].电子测量技术,2022,45(24):153-160. 被引量：12
3钟嶒楒,方志军.基于循环神经网络的人体异常行为识别模型[J].智能计算机与应用,2021,11(11):76-78. 被引量：1
4王鹏.氦氖激光照射耳穴治疗冠心病30例[J].中华理疗杂志,2000,23(2):119-120.
5周云,陈淑荣.基于双流非局部残差网络的行为识别方法[J].计算机应用,2020,40(8):2236-2240. 被引量：8
6王潇齐,刘铭原,孙宜帆,崔钰涵.基于改进稠密轨迹与Fisher向量编码的人体行为识别方法[J].物联网技术,2020,10(9):24-26.
7王小亮,苏新彦,孔庆珊,崔敏,赵飞飞,李剑.基于深度学习的地下震源定位方法[J].单片机与嵌入式系统应用,2020,20(12):45-48.
8胡慧莹,张帆.基于双通道卷积模型对人群的分类[J].汽车实用技术,2020,45(23):238-240.
9张传雷,武大硕,向启怀,陈佳,刘丽欣.基于ResNet-LSTM的具有注意力机制的办公人员行为视频识别[J].天津科技大学学报,2020,35(6):72-80. 被引量：9
10裴永强,王家伟,汤雪芹.基于超限学习机的深度网络时间分组行为识别[J].吉林大学学报（信息科学版）,2020,38(6):702-708.

1蔡佳倜,刘晓岗,秦臻,钟婷.一种渐进提取时空特征的视频息肉分割网络[J].计算机仿真,2025,42(12):461-465.
2杨必胜,蒋捷,俞肇元,钟若飞,张恒才,陈喆.复杂空间场景数字孪生关键技术与应用[J].城市勘测,2026(1):5-11.
3李星星,黄景涛,陆许明,陈翔.基于WiFi的跨环境适应性的人体行为识别算法[J].太赫兹科学与电子信息学报,2026,24(1):73-79.
4邢兵锁,钱强明,高峰.石灰乳化车间无人值守智能化改造[J].自动化应用,2026,67(3):1-4.
5王亚东,葛洪成,刘成文,李薇,荆迪菲.高速公路调头互通路段运行速度特性分析[J].公路,2026,71(1):259-269.
6韩利,曹俊勇.用好“三个课堂”:高校思政课鲜活性教学改革有效路径探索[J].科学咨询,2026(2):157-161.
7姜维,关孟怡,魏富鹏,孙浩宸,孟尧,吴慧欣.基于增强时空图卷积网络的骨架行为识别[J].电子学报,2025,53(10):3692-3704.

计算机应用与软件

2026年第2期

浏览历史

内容加载中请稍等...

基于R(2+1)D时空特征融合与注意力的行为识别方法

参考文献10

二级参考文献44

共引文献101

相关作者

相关机构

相关主题

浏览历史