-
题名结合扩张卷积与多尺度融合的实时时空动作检测
- 1
-
-
作者
程勇
高园元
王军
杨玲
许小龙
程遥
张开华
-
机构
南京信息工程大学软件学院
南京信息工程大学计算机学院
-
出处
《中国图象图形学报》
北大核心
2025年第2期406-420,共15页
-
基金
国家自然科学基金项目(41975183,41875184)。
-
文摘
目的时空动作检测任务旨在预测视频片段中所有动作的时空位置及对应类别。然而,现有方法大多关注行动者的视觉和动作特征,忽视与行动者交互的全局上下文信息。针对当前方法的不足,提出一种结合扩张卷积与多尺度融合的高效时空动作检测模型(efficient action detector,EAD)。方法首先,利用轻量级双分支网络同时建模关键帧的静态信息和视频片段的动态时空信息。其次,利用分组思想构建轻量空间扩张增强模块提取全局性的上下文信息。然后,构建多种DO-Conv结构组成的多尺度特征融合单元,实现多尺度特征捕获与融合。最后,将不同层次的特征分别送入预测头中进行检测。结果实验在数据集UCF101-24和AVA(atomic visual actions)中进行,分析了EAD与现有算法之间的检测对比结果。在UCF101-24数据集上的帧平均准确度(frame-mAP)和视频平均准确度(video-mAP)分别为80.93%和50.41%,对于基线方法的漏检、错检现象有所改善;在AVA数据集上的frame-mAP达到15.92%,同时保持较低的计算开销。结论通过与基线及目前主流方法比较,EAD以较低的计算成本建模全局关键信息,提高了实时动作检测准确度。
-
关键词
深度学习
时空动作检测(STAD)
双分支网络
扩张增强模块(dam)
多尺度融合
-
Keywords
deep learning
spatial-temporal action detection(STAD)
two-branch network
dilated augmented module(dam)
multi-scale fusion
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多尺度时空特征融合的视频异常事件检测
被引量:1
- 2
-
-
作者
李歌
肖洪兵
闫善武
王瑜
孙梅
-
机构
北京工商大学计算机与人工智能学院
-
出处
《燕山大学学报》
北大核心
2025年第1期74-82,共9页
-
基金
北京市教育委员会科技计划重点项目(KZ202110011015)。
-
文摘
在视频异常事件检测的问题上,现有的研究方法未充分考虑场景中的背景信息干扰和目标尺度变化,导致检测精度普遍较低。针对此类问题,提出了一种融合多尺度时空信息的异常事件检测方法。首先,应用一种坐标注意力的方法,使模型更多地关注异常事件发生的区域。其次,为了提取到各层次丰富的时空信息,采用空洞卷积网络构建一种多分支多尺度的特征融合模块。最后,考虑到正常事件的多样性,提出一种规则分数,以便在测试阶段进一步更新记忆增强模块中的记忆项,提高对异常事件的检测精度。在CUHK Avenue和ShanghaiTech数据集的相关实验中,提出方法的帧级AUC分别达到了88.7%和77.5%,且满足视频检测的实时性要求,验证了该方法的可行性和有效性。
-
关键词
视频异常检测
无监督学习
空洞卷积
多尺度时空特征融合
记忆增强模块
-
Keywords
video anomaly detection
unsupervised learning
dilated convolution
multi-scaled spatio-temporal features fusion
memory-augmented module
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-