期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
融合2D与3D信息的特定舞蹈姿态识别算法设计
1
作者 顾瑞坤 《电子设计工程》 2025年第9期144-148,共5页
针对舞蹈动作姿态变化快、姿态复杂和遮挡严重导致舞蹈姿态识别率低的问题,提出了一种基于2D姿态估计的特定舞蹈姿态识别算法。以OpenPose采集到的2D图像为原始数据,进行预处理后作为模型训练和测试数据。在进行2D骨骼关键点数据转换为3... 针对舞蹈动作姿态变化快、姿态复杂和遮挡严重导致舞蹈姿态识别率低的问题,提出了一种基于2D姿态估计的特定舞蹈姿态识别算法。以OpenPose采集到的2D图像为原始数据,进行预处理后作为模型训练和测试数据。在进行2D骨骼关键点数据转换为3D骨骼关键点的位置估计时,利用卷积神经网络算法在图像处理方面的优势,将其与双分支孪生监督学习模型相结合。将2D和3D骨骼关键点数据作为改进双分支孪生监督学习模型的输入,通过多特征融合得到最终骨骼关键点估计位置。与基于HMR(Human Mesh Recovery)的姿态估计模型进行的对比实验结果表明,所提技术方案将姿势平均识别准确率提高了0.98%,而姿态特征平均提取时间降低约20.8%。 展开更多
关键词 特定舞蹈动作识别 2d姿态估计 OpenPose 双分支孪生监督学习模型 多特征融合
在线阅读 下载PDF
基于2D-SPWVD与PCA-SSA-RF的超宽带雷达人体跌落动作辨识方法 被引量:1
2
作者 杨桢 段雨昕 +3 位作者 李鑫 吴方泽 纪力文 冯丰 《电子测量与仪器学报》 CSCD 北大核心 2024年第10期147-158,共12页
针对现有超宽带雷达人体姿态识别研究领域缺少对相似动作辨识的问题,提出一种时频分析结合随机森林(RF)的动作辨识模型。提出基于平滑伪维格纳-威利分布(SPWVD)的二维平滑伪维格纳-威利分布(2D-SPWVD)时频分析方法,对预处理后的人体动... 针对现有超宽带雷达人体姿态识别研究领域缺少对相似动作辨识的问题,提出一种时频分析结合随机森林(RF)的动作辨识模型。提出基于平滑伪维格纳-威利分布(SPWVD)的二维平滑伪维格纳-威利分布(2D-SPWVD)时频分析方法,对预处理后的人体动作回波信号进行时频特征提取;利用主成分分析法(PCA)对特征矢量进行降维处理,选择累计贡献率较高的前30个主成分作为新的特征矢量输入到麻雀搜索算法(SSA)优化的RF分类模型中,用于有障碍条件下5种不同人体相似跌落动作辨识。实验结果表明:预处理算法有效地提升了动作回波信号信噪比,PCA-SSA-RF分类模型能有效辨识5种不同人体跌落动作,克服了数据的特殊性以及障碍物的干扰,准确率高达96.6%。在实时数据流中的跌倒检测任务中,模型的分类平均准确率达到了93%,并与RF、PSO-RF等多个不同经典分类模型深入对比,准确率较高且整体所需时间较短,兼具了准确性和分类效率。验证了所提方法的优越性与有效性。 展开更多
关键词 超宽带雷达 动作辨识 时频分析 2d-SPWVD PCA 随机森林
原文传递
Action Recognition Using Multi-Scale Temporal Shift Module and Temporal Feature Difference Extraction Based on 2D CNN
3
作者 Kun-Hsuan Wu Ching-Te Chiu 《Journal of Software Engineering and Applications》 2021年第5期172-188,共17页
<span style="font-family:Verdana;">Convolutional neural networks, which have achieved outstanding performance in image recognition, have been extensively applied to action recognition. The mainstream a... <span style="font-family:Verdana;">Convolutional neural networks, which have achieved outstanding performance in image recognition, have been extensively applied to action recognition. The mainstream approaches to video understanding can be categorized into two-dimensional and three-dimensional convolutional neural networks. Although three-dimensional convolutional filters can learn the temporal correlation between different frames by extracting the features of multiple frames simultaneously, it results in an explosive number of parameters and calculation cost. Methods based on two-dimensional convolutional neural networks use fewer parameters;they often incorporate optical flow to compensate for their inability to learn temporal relationships. However, calculating the corresponding optical flow results in additional calculation cost;further, it necessitates the use of another model to learn the features of optical flow. We proposed an action recognition framework based on the two-dimensional convolutional neural network;therefore, it was necessary to resolve the lack of temporal relationships. To expand the temporal receptive field, we proposed a multi-scale temporal shift module, which was then combined with a temporal feature difference extraction module to extract the difference between the features of different frames. Finally, the model was compressed to make it more compact. We evaluated our method on two major action recognition benchmarks: the HMDB51 and UCF-101 datasets. Before compression, the proposed method achieved an accuracy of 72.83% on the HMDB51 dataset and 96.25% on the UCF-101 dataset. Following compression, the accuracy was still impressive, at 95.57% and 72.19% on each dataset. The final model was more compact than most related works.</span> 展开更多
关键词 action Recognition Convolutional Neural Network 2d CNN Temporal Relationship
在线阅读 下载PDF
投影子空间下人体动作序列预测研究
4
作者 岳晓玉 章璐璐 《现代电子技术》 北大核心 2025年第16期45-49,共5页
为全面提取不同视角下的动作特征,提高对视角变化的鲁棒性,提出一种投影子空间下人体动作序列预测方法。在投影子空间下,将Kinect相机采集的3D人体动作转换成主视图、左视图与俯视图不同视角的2D人体动作序列;所采用的多邻域全局自适应... 为全面提取不同视角下的动作特征,提高对视角变化的鲁棒性,提出一种投影子空间下人体动作序列预测方法。在投影子空间下,将Kinect相机采集的3D人体动作转换成主视图、左视图与俯视图不同视角的2D人体动作序列;所采用的多邻域全局自适应图神经网络以自适应图卷积为编码器,在3个视角的2D人体动作序列内全面提取各视角的2D人体动作序列特征,提高网络对视角变化的鲁棒性;再以基于多邻域全局自适应图卷积的门控循环单元为解码器,结合人体动作序列特征,得到各视角下的人体动作序列预测结果;最后采用融合模块,通过投票融合策略融合各视角的动作序列预测结果,得到最终预测结果。实验结果表明:所提方法可有效转换3D人体动作,得到2D人体动作序列;还能够有效预测人体动作序列,且不同视角下动作序列预测的决定系数均较高,即预测精度较高。 展开更多
关键词 人体动作序列预测 投影子空间 2d动作 特征提取 自适应图卷积 门控循环单元
在线阅读 下载PDF
基于运动规律体系的AIGC技术在二维动画电影产业流程中的应用研究 被引量:1
5
作者 刘琥 田古月 《现代电影技术》 2025年第9期28-35,共8页
随着中国动画产业从传统有纸动画向无纸动画的深刻转型,数字技术的迅猛发展在提升动画制作效率的同时,也引发了动画运动规律程式化的问题。本文深入分析了构建运动规律体系在二维动画产业全流程中的关键作用,从前期构思、中期制作到后... 随着中国动画产业从传统有纸动画向无纸动画的深刻转型,数字技术的迅猛发展在提升动画制作效率的同时,也引发了动画运动规律程式化的问题。本文深入分析了构建运动规律体系在二维动画产业全流程中的关键作用,从前期构思、中期制作到后期合成,系统阐述了运动规律的具体应用及其对动画艺术表现的核心支撑。研究表明,运动规律是动画艺术本质的重要属性,构建完善的运动规律体系是推动中国二维动画产业高质量发展的关键所在;面对生成式人工智能(GAI)等新兴技术的挑战与机遇,应积极推动其与动画生产环节的深度融合,倡导人机协作、以人为本的新型智能化创作,旨在支撑动画电影内容生产、推动电影行业做大做强的同时,发扬中国动画电影独特的艺术风格,使中国动画电影迸发出更强的艺术表现力和感染力。 展开更多
关键词 二维动画 运动规律 动作设计 动画制作流程 AIGC 角色表演
在线阅读 下载PDF
基于2D CNN和Transformer的人体动作识别 被引量:17
6
作者 朱相华 智敏 殷雁君 《电子测量技术》 北大核心 2022年第15期123-129,共7页
人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义。为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2D CNN相结合... 人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义。为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2D CNN相结合用于人体动作识别,以更好地捕获上下文时间信息。首先使用融合通道-空间注意力模块的2D CNN提取强化的帧内空间特征,其次利用Transformer捕捉帧间的时间特征,最后应用MLP Head进行动作分类。实验结果表明在HMDB-51数据集和UCF-101数据集上分别达到了69.4%和95.5%的识别准确度。 展开更多
关键词 人体动作识别 2d CNN 通道-空间注意力模块 TRANSFORMER
原文传递
基于AEI与(2D)^2PCA的行为分类算法
7
作者 林春丽 王科俊 +2 位作者 王克成 夏余 程万胜 《计算机工程》 CAS CSCD 北大核心 2010年第24期145-146,149,共3页
提出一种基于行为能量图像(AEI)和双向二维主成分分析((2D)2PCA)的行为分类算法解决行为分类问题。该算法利用AEI作为识别特征,无需运动周期的分割,运用(2D)2PCA对特征空间降维,用最近邻方法分类。实验结果表明,该算法能以较少的运行时... 提出一种基于行为能量图像(AEI)和双向二维主成分分析((2D)2PCA)的行为分类算法解决行为分类问题。该算法利用AEI作为识别特征,无需运动周期的分割,运用(2D)2PCA对特征空间降维,用最近邻方法分类。实验结果表明,该算法能以较少的运行时间获得较高的分类准确率。 展开更多
关键词 行为识别 智能监控 行为能量图像 双向二维主成分分析
在线阅读 下载PDF
DWT算法在乒乓球动作识别分析中的应用 被引量:1
8
作者 赵莹 《河北北方学院学报(自然科学版)》 2024年第5期34-39,44,共7页
针对传统乒乓球动作识别未考虑动作的时序性和动态特性的问题,研究在二维DWT算法的基础上引入奇异值分解,设计出一种改进DWT算法,以获得乒乓球动作的局部特征,从而提升其识别准确率。实验结果显示:在识别准确率计算中,改进DWT算法的平... 针对传统乒乓球动作识别未考虑动作的时序性和动态特性的问题,研究在二维DWT算法的基础上引入奇异值分解,设计出一种改进DWT算法,以获得乒乓球动作的局部特征,从而提升其识别准确率。实验结果显示:在识别准确率计算中,改进DWT算法的平均识别准确率为97.8%,优于其他算法,表明其识别精度较高;在识别时间计算中,改进DWT算法的识别时间与其他算法相比,均下降了50%左右,表明其识别效率较高。以上结果证明了改进DWT算法的优越性能,为乒乓球的动作识别提供了有效的技术支持。 展开更多
关键词 乒乓球 二维DWT算法 奇异值分解 动作识别
在线阅读 下载PDF
基于多特征融合的人体行为识别 被引量:6
9
作者 吴冬梅 谢金壮 王静 《计算机应用与软件》 CSCD 2015年第11期171-175,共5页
为了提高视频序列中人体行为的识别率和增强在复杂环境下的适用性,通过选取人体行为区分度较高的运动方向特征、形状特征和光流变化特征进行行为描述,提出一种基于运动方向直方图(MOH)特征、2D-SIFT特征和光流方向直方图(HOOF)特征相结... 为了提高视频序列中人体行为的识别率和增强在复杂环境下的适用性,通过选取人体行为区分度较高的运动方向特征、形状特征和光流变化特征进行行为描述,提出一种基于运动方向直方图(MOH)特征、2D-SIFT特征和光流方向直方图(HOOF)特征相结合的人体行为识别方法。改进运动方向直方图特征,使其在有符号梯度空间下对人体全局运动方向具有更为鲁棒的表示。使用视觉词袋模型既解决了不同动作提取的兴趣点点数不同的问题,又实现了局部特征的有效融合。实验在Weizmann数据库和KTH数据库上识别率分别高达97.83%和91.38%,并具有较好的鲁棒性。 展开更多
关键词 行为识别 MOH特征 2d—SIFT特征 HOOF特征 视觉词袋模型
在线阅读 下载PDF
基于深度学习的人体动作识别综述 被引量:38
10
作者 钱慧芳 易剑平 付云虎 《计算机科学与探索》 CSCD 北大核心 2021年第3期438-455,共18页
人体动作识别是视频理解领域的重要课题之一,在视频监控、人机交互、运动分析、视频信息检索等方面有着广泛的应用。根据骨干网络的特点,从2D卷积神经网络、3D卷积神经网络、时空分解网络三个角度介绍了动作识别领域的最新研究成果,并... 人体动作识别是视频理解领域的重要课题之一,在视频监控、人机交互、运动分析、视频信息检索等方面有着广泛的应用。根据骨干网络的特点,从2D卷积神经网络、3D卷积神经网络、时空分解网络三个角度介绍了动作识别领域的最新研究成果,并对三类方法的优缺点进行了定性的分析和比较。然后,从场景相关和时间相关两方面,全面归纳了常用的动作视频数据集,并着重探讨了不同数据集的特点及用法。随后,介绍了动作识别任务中常见的预训练策略,并着重分析了预训练技术对动作识别模型性能的影响。最后,从最新的研究动态出发,从细粒度动作识别、更精简的模型、小样本学习、无监督学习、自适应网络和视频超分辨动作识别六个角度一致探讨了动作识别未来发展的方向。 展开更多
关键词 人体动作识别 2d卷积神经网络(2d CNN) 3D卷积神经网络(3D CNN) 时空分解网络 预训练
在线阅读 下载PDF
底部框架-抗震墙房屋斜交框架的水平地震作用计算
11
作者 张志宏 陈岱林 +2 位作者 金新阳 秦东 边保林 《建筑结构》 CSCD 北大核心 2006年第12期82-84,99,共4页
推导了底部框架-抗震墙房屋沿任意方向地震时,框架承担水平地震作用的计算公式,可用于斜交底部框架-抗震墙房屋二维分析各榀平面框架的水平地震作用。由于正交底部框架-抗震墙房屋只是斜交底部框架-抗震墙房屋的特例,故方法可作为底部框... 推导了底部框架-抗震墙房屋沿任意方向地震时,框架承担水平地震作用的计算公式,可用于斜交底部框架-抗震墙房屋二维分析各榀平面框架的水平地震作用。由于正交底部框架-抗震墙房屋只是斜交底部框架-抗震墙房屋的特例,故方法可作为底部框架-抗震墙房屋二维分析的通用方法。 展开更多
关键词 底部框架-抗震墙房屋 斜交框架 抗震设计 水平地震作用 二维分析
在线阅读 下载PDF
多维特征激励网络用于视频行为识别
12
作者 罗会兰 于亚威 王婵娟 《计算机科学》 CSCD 北大核心 2023年第S02期226-233,共8页
在动作识别任务中,由于视频数据存在内容多样和背景复杂的特性,因此提取有效的时空特征是研究的主要难点。为了利用深度网络学习时空特征,研究者们通常采用双流网络和3D卷积网络。但是,双流网络中光流信息缺乏捕获长距离时间关系的能力... 在动作识别任务中,由于视频数据存在内容多样和背景复杂的特性,因此提取有效的时空特征是研究的主要难点。为了利用深度网络学习时空特征,研究者们通常采用双流网络和3D卷积网络。但是,双流网络中光流信息缺乏捕获长距离时间关系的能力,且光流提取需占用很大的内存和时间;而3D卷积与2D卷积相比,增加了一个数量级的计算成本,容易导致过拟合和收敛缓慢。为解决以上问题,提出了一种基于注意力的多维度特征激励融合网络MFARs(Multi-dimensional Feature Activation Residual networks)用于视频行为识别。MFARs采用2D卷积网络解决时序特征表达学习问题,利用运动补足激励模块建模时序特征,激发时间通道运动信息;同时利用联合特征激励模块,通过时序特征激励通道和空间信息,以学习到更好的时空特征表达。MFARs在行为识别数据集UCF101和HMDB51上的准确度分别达到了96.5%和73.6%。与当前的主流行为识别模型相比,提出的多维特征激励方法能够有效地表达时空特征,更好地平衡复杂度和分类准确率。 展开更多
关键词 行为识别 深度学习 2d卷积网络 注意力机制 视频特征表达
在线阅读 下载PDF
气液快速动作机构设计及其动态特性研究 被引量:2
13
作者 马琳 俞浙青 阮健 《机床与液压》 北大核心 2010年第5期84-86,共3页
快速动作机构是一种重要的装置。设计一种新型的气液混合快速动作机构,它采用2D数字阀控制主阀,使油液快速进入液压缸,实现活塞杆的快速动作,还可实现多级速度控制。建立系统的数学模型,对系统进行仿真和实验。结果表明,该装置具有免维... 快速动作机构是一种重要的装置。设计一种新型的气液混合快速动作机构,它采用2D数字阀控制主阀,使油液快速进入液压缸,实现活塞杆的快速动作,还可实现多级速度控制。建立系统的数学模型,对系统进行仿真和实验。结果表明,该装置具有免维护、动作平稳、可靠等一系列的优点。 展开更多
关键词 气液混合 快速动作机构 2d数字换向阀
在线阅读 下载PDF
用于视频行为识别的高效二维时序建模网络 被引量:5
14
作者 栗志磊 李俊 +2 位作者 施智平 姜那 张永康 《计算机工程与应用》 CSCD 北大核心 2023年第3期127-134,共8页
二维卷积难以对视频数据进行有效的时间信息建模。针对这个问题,提出了一个高效的基于二维卷积的时间建模网络。该网络只需要RGB图像作为输入,避免了复杂的光流计算,在低计算复杂度的前提下,可以在行为识别任务中达到先进的准确性。网... 二维卷积难以对视频数据进行有效的时间信息建模。针对这个问题,提出了一个高效的基于二维卷积的时间建模网络。该网络只需要RGB图像作为输入,避免了复杂的光流计算,在低计算复杂度的前提下,可以在行为识别任务中达到先进的准确性。网络主要由两个部分组成,即运动特征增强模块和时序聚集模块。具体来说,运动特征增强模块主要实现短期时序建模,它利用当前帧与相邻帧的差异信息对当前帧中的运动信息进行自适应性的增强,让网络能够了解图像中的哪一部分将要产生运动。时序聚集模块实现长期的时序建模,主要应用于网络的后期,通过二维卷积对时序上的信息进行信息聚合,让每一帧图像经过网络提取特征后,都能够结合时序上所有帧序列的信息。在三个常见的视频动作识别数据集(UCF101、HMDB51和Something-Something V1)上进行的大量实验表明,与大多数现有方法相比,所提出的时序建模网络可以获得先进的识别性能。 展开更多
关键词 短期运动特征增强 长期时序聚集 时序建模 二维卷积网络 行为识别
在线阅读 下载PDF
时空特征金字塔模块下的视频行为识别 被引量:6
15
作者 龚苏明 陈莹 《计算机科学与探索》 CSCD 北大核心 2022年第9期2061-2067,共7页
目前用于视频行为识别的主流2D卷积神经网络方法无法提取输入帧之间的相关信息,导致网络无法获得输入帧间的时空特征信息进而难以提升识别精度。针对目前主流方法存在的问题,提出了通用的时空特征金字塔模块(STFPM)。STFPM由特征金字塔... 目前用于视频行为识别的主流2D卷积神经网络方法无法提取输入帧之间的相关信息,导致网络无法获得输入帧间的时空特征信息进而难以提升识别精度。针对目前主流方法存在的问题,提出了通用的时空特征金字塔模块(STFPM)。STFPM由特征金字塔和空洞卷积金字塔两部分组成,并能直接嵌入到现有的2D卷积神经网络中构成新的行为识别网络——时空特征金字塔网络(STFP-Net)。针对多帧图像输入,STFP-Net首先提取每帧输入的单独空域特征信息,并将这些特征信息记为原始特征;然后,所设计的STFPM利用矩阵转换操作对原始特征构建特征金字塔;其次,利用空洞卷积金字塔对构建的原始特征金字塔提取具有时空关联性的时序特征;接着,将原始特征与时序特征进行加权融合并传递给后续深层网络;最后,利用全连接对网络输出特征进行分类识别。与Baseline相比,STFP-Net引入了可忽略不计的额外参数和计算量。实验结果表明,与近些年主流方法相比,STFP-Net在主流数据库UCF101和HMDB51上的分类准确度具有明显提升。 展开更多
关键词 行为识别 2d卷积网络 时空特征 特征金字塔 空洞卷积金字塔
在线阅读 下载PDF
基于时空注意力金字塔卷积的动作识别
16
作者 冯雨威 吴丽君 《网络安全与数据治理》 2023年第2期76-82,88,共8页
动作识别算法需要从视频中提取空间和时域特征,对计算存储资源要求较高。基于2D CNN的网络更为轻量,但从视频中提取时域特征的能力较弱,动作识别性能通常受到限制。S-TPNet提出时空金字塔模块以获取图像序列的时间粒度特征,有效提升了基... 动作识别算法需要从视频中提取空间和时域特征,对计算存储资源要求较高。基于2D CNN的网络更为轻量,但从视频中提取时域特征的能力较弱,动作识别性能通常受到限制。S-TPNet提出时空金字塔模块以获取图像序列的时间粒度特征,有效提升了基于2D CNN的动作识别网络的性能。基于S-TPNet,设计了时空注意力模型以凸显空间和时间上的重要特征。为降低输入数据量,通常抽取局部视频帧作为输入,为降低采样帧与整体视频之间的不稳定差异,设计了自适应等间隔采样策略。实验表明,在未预训练的情况下,本网络在UCF-101和HMDB-51数据集上分别将Top-1精度提高了5.1%和3.3%,并且不会大幅增加所需参数。 展开更多
关键词 时空注意力 动作识别 自适应采样 2d CNN 时空金字塔
在线阅读 下载PDF
二维水墨动画结合实拍影像技术创作研究与实践 被引量:2
17
作者 陈鹏 苏姿元 《包装与设计》 2024年第4期148-149,共2页
随着数字化技术不断发展,虚拟与现实相融合,动画和实拍影像相结合,为大众提供了全新的美学体验。本文对二维水墨动画与实拍影像结合的表现形式和技术手段进行探索,将“长安画派”大家康师尧先生的中国画艺术作品的元素融入二维动画中,... 随着数字化技术不断发展,虚拟与现实相融合,动画和实拍影像相结合,为大众提供了全新的美学体验。本文对二维水墨动画与实拍影像结合的表现形式和技术手段进行探索,将“长安画派”大家康师尧先生的中国画艺术作品的元素融入二维动画中,与实拍影像相结合,创作全新的水墨动画作品,以实践检验了水墨画艺术语言用于二维动画与实拍影像结合创作的可行性。研究希望为中国传统艺术文化在新时代的传播与创新发展提供参考。 展开更多
关键词 数字动画 康师尧 二维水墨动画 实拍影像
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部