基于关键帧的轻量化行为识别方法研究被引量：10

Research on lightweight action recognition method based on key frame

导出

摘要针对目前双流卷积神经网络通常使用堆叠RGB帧和光流图分别提取视频的表观信息和运动信息,存在信息冗余和计算复杂度高的问题,基于时域分割网络提出了一种结合光流图、差分图像和并行卷积神经网络的行为识别算法。首先通过分析行为视频中存在的运动模糊现象,设计了一种基于图像特征量的关键帧选取算法,同时构建了一个包含表观信息流和运动信息流的改进时域分割网络,将关键帧RGB图像、非关键帧光流图像和差分图像并行地输入特征提取网络计算分类得分,最后将关键帧与非关键帧的行为类别得分进行平均融合后输入SoftMax层得到视频类别概率。为进一步降低算法的参数量和计算复杂度,设计了一种轻量化卷积神经网络作为特征提取网络。本文算法在UCF101数据集的识别准确率为94.7%,在HMDB51数据集的识别准确率为69.3%,推理速度相比于时域分割网络快了45.3%。实验结果表明,该算法能够高效利用视频的表观信息和运动信息,且具有较高的行为识别准确率。 Aiming at the problems that current two stream convolutional neural network usually uses stacked RGB frames and optical flow images to extract the apparent information and motion information of the video, respectively, and there exist information redundancy and high computational complexity, an action recognition algorithm combining optical flow images, differential images and parallel convolutional neural network is proposed based on temporal segment network. Firstly, a key frame selection algorithm based on image feature quantity is designed through analyzing the motion blur phenomenon existing in the action video. At the same time, an improved temporal segment network containing apparent information flow and motion information flow of the video is constructed. In order to calculate the action classification score, the RGB images of key frames, the optical flow images and differential images of non-key frames are inputted in parallel to the feature extraction network. Finally, the action category scores of key frames and non-key frames are averaged and fused, which then are inputted into the SoftMax layer to obtain the video category probability. In order to further reduce the amount of parameters and computational complexity of the algorithm, a lightweight convolutional neural network is designed and used as the feature extraction network. The experiments on UCF101 and HMDB51 datasets were conducted, and the recognition accuracies of 94.7% and 69.3% are obtained, respectively, and the inference speed is 45.3% faster compared with temporal segment network. Experiment results indicate that the proposed algorithm can efficiently use the apparent information and motion information of the video, and has a high action recognition accuracy.

作者周育新白宏阳李伟郭宏伟徐啸康 Zhou Yuxin;Bai Hongyang;Li Wei;Guo Hongwei;Xu Xiaokang(College of Energy and Power Engineering,Nanjing University of Science and Technology,Nanjing 210094,China;96037 Troop,People's Liberation Army of China,Baoji 721000,China)

机构地区南京理工大学能源与动力工程学院中国人民解放军

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2020年第7期196-204,共9页 Chinese Journal of Scientific Instrument

基金国家自然科学基金(61603189)项目资助

关键词卷积神经网络行为识别关键帧轻量化 convolutional neural network action recognition key frame light weight

分类号 TH89 [机械工程—精密仪器及机械] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1孟勃,刘雪君,王晓霖.基于四元数时空卷积神经网络的人体行为识别[J].仪器仪表学报,2017,38(11):2643-2650. 被引量：17
2李鸣晓,庚琦川,莫红,吴威,周忠.基于片段关键帧的视频行为识别方法[J].系统仿真学报,2018,30(7):2787-2793. 被引量：10
3蔡家楣,陈洋,陈铁明,张旭东.结合互信息量与模糊聚类的关键帧提取方法[J].计算机系统应用,2010,19(4):73-76. 被引量：6
4曹奎,冯玉才.一种图像检索中的灰色相关反馈算法[J].计算机工程,2004,30(6):18-20. 被引量：13
5李贤阳,阳建中,杨竣辉,陆安山.深度运动图耦合正则化表示的行为识别算法[J].电子测量与仪器学报,2018,32(1):119-128. 被引量：8
6李庆辉,李艾华,王涛,崔智高.结合有序光流图和双流卷积网络的行为识别[J].光学学报,2018,38(6):226-232. 被引量：18

二级参考文献31

1Wu L, Faloutsos C.FALCON: Feedback Adaptive Loop for Contentbased Retrieval. In: Proc. of VLDB, Kairo, Egypt, 2000:297-306.
2MacArthur S D,Brodley C E.Relevance Feedback Decision Trees in Content-based Image Retrieval.In: Proc.of CBAIVL,South Carolina,2000:68-72.
3DEng J.Control Systems of Grey Systems.Systems and Control Letter.1982,5:288-294.
4Deng J .Introduction to Grey System Theory. The Journal of Grey,System, 1989, 1: 1-24.
5Rui Y,Huang T S.A Novel Relevance Feedback Technique in Image Retrieval.In: Proc.of ACM Multimedia 99,Orlando, Florida, 1999:67-70.
6Androutsos D,Plataniotis K N,Venetsanopoulos A N.A Novel Vectorbascd Approach to Color Image Rctricval Using a Vector Angularbased Distance Measttrc.Computer Vision and Image Understanding.1999.75( 1/2): 46-58.
7朱兴全,薛向阳,吴立德.一种自动门限选取的视频Shot分割方法[J].计算机研究与发展,2000,37(1):80-85. 被引量：23
8申晓霞,张桦,高赞,徐光平,薛彦兵.基于Kinect和金字塔特征的行为识别算法[J].光电子．激光,2014,25(2):357-363. 被引量：13
9王竞雪,朱庆,王伟玺,赵丽科.结合边缘编组的Hough变换直线提取[J].遥感学报,2014,18(2):378-389. 被引量：50
10曹奎,冯玉才,曹忠升.基于颜色和形状特征的彩色图像表示与检索技术[J].计算机辅助设计与图形学学报,2001,13(10):906-911. 被引量：15

共引文献63

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：6
2王琦,张静薇,张荣华,薛峰军,李秀艳.基于贝叶斯统计模型的金属缺陷电磁成像方法研究[J].仪器仪表学报,2020,41(1):47-55. 被引量：5
3周宏宇,严春峰,宋旭,刘国英.基于加权三视角运动历史图像与时序分割的动作识别算法[J].电子测量与仪器学报,2020(11):194-203. 被引量：6
4吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157. 被引量：4
5李有花.让课堂教学成为学生发展的主体[J].青海师专学报,2005(S1):89-90.
6屈景怡,史浩山.特征结合和相关反馈技术在医学图像检索中的应用[J].电路与系统学报,2006,11(5):80-83. 被引量：7
7邬长安,江祥奎,原思聪.基于灰色系统理论的相关反馈图像检索算法[J].情报杂志,2006,25(11):114-115. 被引量：3
8黎琳,赵英.基于内容的图像检索反馈技术概述[J].图书情报工作,2006,50(11):95-98. 被引量：3
9江祥奎,原思聪,王发展.基于灰色系统理论的多特征相关反馈图像检索[J].计算机工程,2006,32(23):180-182. 被引量：6
10路瑶,王晶,胡蕾.灰色系统理论在图像处理中的应用综述[J].自动化技术与应用,2007,26(6):49-52. 被引量：3

同被引文献104

1游伟,王雪.人行为骨架特征识别边缘计算方法研究[J].仪器仪表学报,2020(10):156-164. 被引量：12
2张立亚,郝博南,孟庆勇,温良,吴文臻.基于HSV空间改进融合Retinex算法的井下图像增强方法[J].煤炭学报,2020(S01):532-540. 被引量：54
3刘孝军,王飞.基于AI的煤矿视频智能分析技术[J].煤炭科学技术,2022,50(S02):260-264. 被引量：15
4杜鉴豪,许力.基于区域光流特征的异常行为检测[J].浙江大学学报（工学版）,2011,45(7):1161-1166. 被引量：20
5李瑞峰,王亮亮,王珂.人体动作行为识别研究综述[J].模式识别与人工智能,2014,27(1):35-48. 被引量：97
6尚长春,马宏伟,陈妍冰.井下可变光照条件下的图像预处理方法[J].工矿自动化,2014,40(3):79-82. 被引量：6
7张飞燕,李俊峰.基于光流速度分量加权的人体行为识别[J].浙江理工大学学报（自然科学版）,2015,33(1):115-123. 被引量：2
8何鹏,安井然,杨曼.基于区域光流法的人体异常行为检测[J].电视技术,2015,39(7):100-103. 被引量：6
9雷亚国,贾峰,周昕,林京.基于深度学习理论的机械装备大数据健康监测方法[J].机械工程学报,2015,51(21):49-56. 被引量：380
10杨晓倩,刘州杰,冯艾茜.LFMCW雷达距离-速度同步干扰技术[J].电子信息对抗技术,2015,30(6):20-26. 被引量：5

引证文献10

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：6
2郑萌萌,钱慧芳,周璇.基于监控视频的Farneback光流算法的人体异常行为检测[J].国外电子测量技术,2021,40(3):16-22. 被引量：13
3于洋,马军,王晓东,朱江艳,刘桂敏.融合深度可分离小卷积核和CBAM的改进CNN故障诊断模型[J].电子测量技术,2022,45(6):171-178. 被引量：8
4张海超,张闯.融合注意力的轻量级行为识别网络研究[J].电子测量与仪器学报,2022,36(5):173-179. 被引量：13
5张银环.基于IA-Net的人体行为识别方法[J].国外电子测量技术,2022,41(6):52-59. 被引量：2
6许志猛,张钐钐,陈良琴,孙北晨.基于时空域增强微多普勒谱图的行为识别方法[J].电子测量与仪器学报,2022,36(7):144-151. 被引量：4
7康佳慧,纪松,范大昭,储光涵,李林林.基于互信息熵和NetVLAD的视频关键帧提取方法[J].测绘地理信息,2024,49(2):62-67. 被引量：1
8周璇,易剑平.基于优化CBAM改进ResNet50的异常行为识别方法[J].国外电子测量技术,2024,43(5):36-41. 被引量：12
9杨淑佳,张家田.基于维纳滤波的井下视频复原技术[J].工业控制计算机,2025,38(10):79-80.
10付翔,王主丰,秦一凡,闫明,张智星,王然风,贾一帆.基于多模态大模型的井下视频语义提取与描述生成技术[J].煤炭科学技术,2025,53(11):216-228.

二级引证文献56

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：6
2彭道刚,潘俊臻,王丹豪,胡捷.基于改进YOLO v5的电厂管道油液泄漏检测[J].电子测量与仪器学报,2022,36(12):200-209. 被引量：31
3汪志成,王泽旺,朱梦帆,纪荣焕,张斌.基于卷积神经网络的局部放电声音识别研究[J].电子测量技术,2023,46(20):148-155. 被引量：13
4朱望纯,张博.超轻量人脸关键点检测算法[J].电子测量技术,2023,46(5):98-104. 被引量：5
5李志晗,刘银华,谢锐康,单良.基于关节点运动估计的人体行为识别[J].电子测量技术,2022,45(24):153-160. 被引量：12
6栾桂芬.面向航拍图像多运动目标的实时检测与识别[J].计算机测量与控制,2022,30(1):221-228. 被引量：3
7于俊俊,朱立军.基于金字塔 LK 光流法的电梯内异常行为检测[J].物联网技术,2022,12(6):27-30. 被引量：3
8赵杨.基于光流导向的流场可视化算法及视频水彩风格化应用研究[J].电子测试,2022(11):43-46.
9左骥.基于复杂机场监控环境下的行为检测分析[J].科技创新导报,2022,19(6):13-15.
10杨斌,黄琪寅,郭冉,耿贺辉,程育奇,陈锐,王刚,李文龙.基于图像光流法拼接的燃料组件关键几何尺寸的快速检测方法[J].核科学与工程,2022,42(5):1040-1047. 被引量：1

1李建新.基于局部特征共生关系的行为识别算法[J].合肥工业大学学报（自然科学版）,2020,43(11):1500-1505.
2浩仔.边缘计算空间多大在哪些行业?[J].数据中心建设+,2020(9):15-18.
3张鑫鑫,杨超宇,杨成.基于OpenPose的自动扶梯智能监控系统应用研究[J].黑龙江工业学院学报（综合版）,2020,20(10):49-55. 被引量：2
4赵羡波,林国健,林志华,曾文龙,胡正平,包可翔,陈义强,张佩.SBSM对开放环境下多色叶片RGB图像背景的精确分离[J].贵州农业科学,2020,48(11):166-172. 被引量：4
5张锦,刘熔,田森,陈胜,魏建好.面向癫痫脑电的简化深度学习模型[J].国防科技大学学报,2020,42(6):106-111. 被引量：5
6欧阳玉梅.基于稠密光流算法的运动目标检测的Python实现[J].现代电子技术,2021,44(1):78-82. 被引量：12
7宁亚飞,赵英亮,吴美荣,王瑞.时空卷积自编码网络异常行为检测[J].国外电子测量技术,2020,39(10):104-108. 被引量：9
8谭志荣,陈维,王辉,李辉.基于视频识别技术的船舶视觉盲区增强方法研究[J].中国水运,2020(12):108-109. 被引量：1
9杨坚伟,严群,姚剑敏,林志贤.基于深度神经网络的移动端人像分割[J].计算机应用,2020,40(12):3644-3650. 被引量：3
10王霁飞,刘龙权.民用飞机客舱应急撤离仿真算法研究[J].航空工程进展,2020,11(6):781-788. 被引量：4

仪器仪表学报

2020年第7期

浏览历史

内容加载中请稍等...

基于关键帧的轻量化行为识别方法研究被引量：10

参考文献6

二级参考文献31

共引文献63

同被引文献104

引证文献10

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于关键帧的轻量化行为识别方法研究 被引量：10

参考文献6

二级参考文献31

共引文献63

同被引文献104

引证文献10

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于关键帧的轻量化行为识别方法研究被引量：10