期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
IoT-Based Real-Time Medical-Related Human Activity Recognition Using Skeletons and Multi-Stage Deep Learning for Healthcare 被引量:1
1
作者 Subrata Kumer Paul Abu Saleh Musa Miah +3 位作者 Rakhi Rani Paul Md.EkramulHamid Jungpil Shin Md Abdur Rahim 《Computers, Materials & Continua》 2025年第8期2513-2530,共18页
The Internet of Things(IoT)and mobile technology have significantly transformed healthcare by enabling real-time monitoring and diagnosis of patients.Recognizing Medical-Related Human Activities(MRHA)is pivotal for he... The Internet of Things(IoT)and mobile technology have significantly transformed healthcare by enabling real-time monitoring and diagnosis of patients.Recognizing Medical-Related Human Activities(MRHA)is pivotal for healthcare systems,particularly for identifying actions critical to patient well-being.However,challenges such as high computational demands,low accuracy,and limited adaptability persist in Human Motion Recognition(HMR).While some studies have integrated HMR with IoT for real-time healthcare applications,limited research has focused on recognizing MRHA as essential for effective patient monitoring.This study proposes a novel HMR method tailored for MRHA detection,leveraging multi-stage deep learning techniques integrated with IoT.The approach employs EfficientNet to extract optimized spatial features from skeleton frame sequences using seven Mobile Inverted Bottleneck Convolutions(MBConv)blocks,followed by Convolutional Long Short Term Memory(ConvLSTM)to capture spatio-temporal patterns.A classification module with global average pooling,a fully connected layer,and a dropout layer generates the final predictions.The model is evaluated on the NTU RGB+D 120 and HMDB51 datasets,focusing on MRHA such as sneezing,falling,walking,sitting,etc.It achieves 94.85%accuracy for cross-subject evaluations and 96.45%for cross-view evaluations on NTU RGB+D 120,along with 89.22%accuracy on HMDB51.Additionally,the system integrates IoT capabilities using a Raspberry Pi and GSM module,delivering real-time alerts via Twilios SMS service to caregivers and patients.This scalable and efficient solution bridges the gap between HMR and IoT,advancing patient monitoring,improving healthcare outcomes,and reducing costs. 展开更多
关键词 Real-time human motion recognition(HMR) ENConvLSTM EfficientNet ConvLSTM skeleton data NTU RGB+D 120 dataset MRHA
在线阅读 下载PDF
融合时空注意力的改进ST-GCN人体动作识别方法研究 被引量:1
2
作者 雷建云 梁钧 +2 位作者 夏梦 张慧丽 田祚汉 《中南民族大学学报(自然科学版)》 2025年第4期526-535,共10页
针对现有的人体骨架动作识别算法不能充分发掘运动的时空特征问题,提出了一种基于融合时空注意力的改进图卷积网络模型.该模型包含空间注意力机制和时间注意力机制,利用时空注意力机制从时间和空间两个维度分别提取动作的全局时空特征.... 针对现有的人体骨架动作识别算法不能充分发掘运动的时空特征问题,提出了一种基于融合时空注意力的改进图卷积网络模型.该模型包含空间注意力机制和时间注意力机制,利用时空注意力机制从时间和空间两个维度分别提取动作的全局时空特征.将这二者融合到统一的时空图卷积网络(ST-GCN)框架中,实现了端到端的训练.在Kinetics和NTU RGB+D两个公开数据集的对比实验证明:改进模型在NTU-RGB+D数据集上的CS标准下取得了82.37%的Top-1精度,在CV标准下取得89.84%的Top-1精度,相比原来的ST-GCN算法,分别提升0.87%的Top-1精度和1.54%的Top-5精度.在Kinetics数据集上,改进模型取得了31.78%的精度,与ST-GCN相比提高了1.08%.由此验证了改进方法的有效性. 展开更多
关键词 图卷积网络 骨架数据 动作识别 时空注意力
在线阅读 下载PDF
基于手部骨架数据的非特定连续手语深度识别
3
作者 李柯景 鲁光男 《计算机仿真》 2025年第3期244-248,共5页
非特定连续手语是指不限定手语类型和手势数量,由于手部骨架数据可能存在遮挡、变形等情况,会导致手部骨架提取和识别精度降低。为了有效提升非特定连续手语深度识别结果的准确性,提出一种基于手部骨架数据的非特定连续手语深度识别方... 非特定连续手语是指不限定手语类型和手势数量,由于手部骨架数据可能存在遮挡、变形等情况,会导致手部骨架提取和识别精度降低。为了有效提升非特定连续手语深度识别结果的准确性,提出一种基于手部骨架数据的非特定连续手语深度识别方法。采用距离场和分水岭算法,获得含有手势骨架的骨架潜在图,通过主动轮廓线模型确定骨架端点,并利用A*算法对其修剪,获取手部骨架特征。将手部骨架特征对应的背景作为负样本,得到手势方向梯度图特征,引入卷积神经网络展开训练,获取非特定连续手语检测分类器,确定目标手势区域,实现非特定连续手语深度识别。实验结果表明,所提方法能够准确提取手部骨架特征,非特定连续手语深度识别准确率在90%以上,且识别时间短。 展开更多
关键词 手部骨架数据 非特定连续手语 深度识别 骨架潜在图
在线阅读 下载PDF
基于骨架和3D热图的注意缺陷多动障碍患者动作识别算法
4
作者 石超 周昱昕 +3 位作者 扶倩 唐万宇 何凌 李元媛 《计算机应用》 北大核心 2025年第9期3036-3044,共9页
注意缺陷多动障碍(ADHD)是一种常见于儿童期的神经发育障碍,以注意力不集中、多动和冲动为主要特征,常表现出特定的动作模式。传统的动作识别算法在处理这些特定动作时存在识别准确率低和响应慢等问题。为解决这些问题,提出基于骨架和3... 注意缺陷多动障碍(ADHD)是一种常见于儿童期的神经发育障碍,以注意力不集中、多动和冲动为主要特征,常表现出特定的动作模式。传统的动作识别算法在处理这些特定动作时存在识别准确率低和响应慢等问题。为解决这些问题,提出基于骨架和3D热图的注意缺陷多动障碍患者动作识别算法,并通过高斯分布精确地表示关节点间的空间关系,以有效地保留时空信息。针对单一模态数据的限制,引入基于骨架和3D热图的多模态集成方法。同时,通过融合Short 3D-CNN(3D Convolutional Neural Network)和自适应图卷积网络(AGCN)的输出特征,充分利用两种模态数据的优势,从而提升动作识别性能。在四川大学华西医院心理卫生中心采集的ADHD患者数据集上的实验结果表明,对于8种不同类型的动作,所提算法的Top-1识别准确率为0.8604,Top-5识别准确率为0.9873。此外,提出基于动作类型的ADHD自动分型算法,该算法将ADHD分型为头面部体动型、躯干体动型和四肢体动型,它的识别准确率为75%,响应时间为5 s。与2s-AGCN(two-stream AGCN)和PoseConv3D相比,所提算法在复杂动作场景下具有更高的识别精度,为ADHD的个性化干预提供了新的技术手段。 展开更多
关键词 注意缺陷多动障碍 动作识别 骨架数据 图卷积网络 3D卷积神经网络
在线阅读 下载PDF
基于深度学习的跳绳姿态评估系统研究
5
作者 丁瀚 孙少明 +2 位作者 孙怡宁 张子康 彭伟 《电子设计工程》 2025年第5期1-7,共7页
为解决青少年日常跳绳中可能存在的问题,规范其训练动作以降低受伤风险,提出了一种跳绳姿态检测与评估系统。该系统包含两个检测评估机制:机制1基于Attention-MLP神经网络模型进行标准化检测评估;机制2则对监测时段内高维跳绳特征数据... 为解决青少年日常跳绳中可能存在的问题,规范其训练动作以降低受伤风险,提出了一种跳绳姿态检测与评估系统。该系统包含两个检测评估机制:机制1基于Attention-MLP神经网络模型进行标准化检测评估;机制2则对监测时段内高维跳绳特征数据进行提取与分析。系统包括数据获取、数据预处理以及跳绳姿态检测与评估。在数据预处理部分,文中进行了3种滤波算法的比较实验,结果表明,卡尔曼滤波对于跳绳的二维骨骼点数据平滑效果更佳。在标准化评估模块中,基于跳绳特征的数据集,搭建了Attention-MLP模型,并将其与常用的识别算法MLP、LSTM、CNN进行了实验对比。实验结果表明,Attention-MLP模型表现更为出色,准确率可达99.38%。 展开更多
关键词 跳绳动作检测评估 骨骼点识别 数据滤波 深度学习
在线阅读 下载PDF
融合时空领域知识与数据驱动的骨架行为识别 被引量:1
6
作者 梁成武 胡伟 +2 位作者 杨杰 蒋松琪 侯宁 《计算机工程与应用》 北大核心 2025年第5期165-176,共12页
基于骨架数据的行为识别由于其数据紧凑性和抗背景干扰性,逐渐引起研究者的关注。现有数据驱动方法对融合骨架行为的时空领域知识尚未充分研究。基于此,提出一种融合人体行为时空领域先验知识与CNN改进网络结构的骨架行为识别方法。基... 基于骨架数据的行为识别由于其数据紧凑性和抗背景干扰性,逐渐引起研究者的关注。现有数据驱动方法对融合骨架行为的时空领域知识尚未充分研究。基于此,提出一种融合人体行为时空领域先验知识与CNN改进网络结构的骨架行为识别方法。基于关键时空特征领域知识提出时通聚焦模块,通过产生聚集系数矩阵引导模型关注鉴别性特征表达。融合长时空跨度领域知识提出多尺度卷积融合模块,沿通道采用分组残差连接方式灵活扩大卷积的时间感受野,在不引入大量参数情况下可获得长时空跨度特征表达能力。该方法在NTU RGB+D、NTU RGB+D 120及FineGYM三个大型数据集上进行性能评估与验证,分别取得96.6%、89.6%、94.1%的识别准确率。实验结果表明,融合时空领域知识与数据驱动可充分挖掘骨架行为时空特征,能够提升骨架行为识别性能并具有跨数据集泛化性。 展开更多
关键词 时空领域知识 数据驱动 骨架行为识别 卷积神经网络 长时空建模
在线阅读 下载PDF
多模跨视图对比记忆增强网络的自监督骨架动作识别
7
作者 白天 高月红 +1 位作者 谢正光 李洪均 《计算机工程与应用》 北大核心 2025年第21期225-233,共9页
近年来,人类骨架动作识别的自监督表示学习取得了显著进展。然而,大多数现有方法主要依赖于骨架关节、骨骼和运动三种模态数据,未能充分利用丰富的骨架信息。此外,大多数研究在骨架序列的深层次特征提取和多样性对比学习方面存在不足。... 近年来,人类骨架动作识别的自监督表示学习取得了显著进展。然而,大多数现有方法主要依赖于骨架关节、骨骼和运动三种模态数据,未能充分利用丰富的骨架信息。此外,大多数研究在骨架序列的深层次特征提取和多样性对比学习方面存在不足。为了解决这些问题,提出了多模跨视图对比记忆增强网络(multimodal cross-view contrastive memory-augmented network,MCCMN)模型。主要由三部分组成:在传统三模态基础上,引入加速度、旋转轴和角速度三种新数据模态,丰富骨架信息的表征。采用图卷积网络模型作为特征编码器,并通过非线性投影层映射高维数据特征,捕捉数据深层次模式与关联以提高模型鲁棒性。提出跨视图对比记忆增强机制,通过动态更新的负样本队列,丰富对比样本的多样性,并利用不同模态视图间的互补信息,增强特征的鲁棒性,实现多模态视图一致性的对比学习。基准数据集上的实验结果表明,MCCMN模型在各项指标上均优于现有方法,证明了其在自监督骨架动作识别任务中的有效性和广泛应用前景。 展开更多
关键词 骨架的动作识别 自监督学习 多模态数据 对比学习
在线阅读 下载PDF
基于骨骼的人体行为识别方法研究综述 被引量:4
8
作者 黄倩 崔静雯 李畅 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期173-194,共22页
人体行为识别在视频理解中发挥了重要作用.近年来,基于骨骼的行为识别方法因其对复杂环境的干扰更具鲁棒性而受到广泛关注.文中共整理了102种基于骨骼的人体行为识别方法,并在9个公开数据集上对其进行了对比分析.按照特征学习方式的不同... 人体行为识别在视频理解中发挥了重要作用.近年来,基于骨骼的行为识别方法因其对复杂环境的干扰更具鲁棒性而受到广泛关注.文中共整理了102种基于骨骼的人体行为识别方法,并在9个公开数据集上对其进行了对比分析.按照特征学习方式的不同,分别介绍了基于手工特征的方法和基于深度学习的方法.其中,基于手工特征的方法按特征描述符的不同分为几何描述符、动力学描述符、统计描述符3个子类;基于深度学习的方法按网络主体的不同分为循环神经网络、卷积神经网络、图卷积网络、Transformer和混合网络5个子类.通过以上分析,不仅阐述了基于骨骼的行为识别方法的发展历程,还剖析了现有方法存在的泛化能力不强、计算成本高等局限.最后,从网络结构设计、相似动作区分、领域数据集拓展、多人交互等方面对未来研究方向进行了展望. 展开更多
关键词 计算机视觉 行为识别 骨骼数据 手工特征 深度学习 神经网络
在线阅读 下载PDF
基于运动特征的骨骼行为识别方法 被引量:3
9
作者 孙浩 何宏 +1 位作者 汪焰兵 朱子豪 《计算机工程与设计》 北大核心 2024年第6期1836-1842,共7页
针对现有的骨骼行为识别方法对人体行为的运动信息利用不足的问题,提出一种基于运动特征的时空注意力图卷积(STA-GCN)行为识别模型。对动作捕捉设备采集到的关节点运动轨迹和速度信息进行建模,在时间和空间构建注意力权重矩阵,结合图卷... 针对现有的骨骼行为识别方法对人体行为的运动信息利用不足的问题,提出一种基于运动特征的时空注意力图卷积(STA-GCN)行为识别模型。对动作捕捉设备采集到的关节点运动轨迹和速度信息进行建模,在时间和空间构建注意力权重矩阵,结合图卷积网络进行特征提取,能够关注到具有判别力的关节点和时间帧。通过在自建动作捕捉数据集和NTU-RGB+D数据集的CS和CV标准上进行实验,其结果表明,该模型增强了对人体骨骼行为信息的理解能力,验证了模型对行为识别的有效性。 展开更多
关键词 行为识别 深度学习 动作捕捉 骨骼信息 特征提取 图卷积 时空注意力
在线阅读 下载PDF
基于多维动态拓扑学习图卷积的骨架动作识别 被引量:3
10
作者 罗会兰 曹立京 《电子学报》 EI CAS CSCD 北大核心 2024年第3期991-1001,共11页
图卷积由于其对图数据的强大表示能力被广泛应用于基于骨架的动作识别任务中.但是现有的图卷积方法在所有帧或通道上都使用共享的图拓扑进行特征聚合,这极大限制了图卷积网络的表示能力.为了解决这些问题,本文提出多维动态拓扑学习图卷... 图卷积由于其对图数据的强大表示能力被广泛应用于基于骨架的动作识别任务中.但是现有的图卷积方法在所有帧或通道上都使用共享的图拓扑进行特征聚合,这极大限制了图卷积网络的表示能力.为了解决这些问题,本文提出多维动态拓扑学习图卷积用于动态建模具有时序与通道特异性的拓扑结构.多维动态拓扑学习图卷积主要包含三个组成部分:纯粹节点拓扑学习图卷积(pure Joint topology learning Graph Convolution,J-GC)、动态时序特异性拓扑学习图卷积(Dynamic Temporal-Wise topology learning Graph Convolution,DTW-GC)和通道特异性拓扑学习图卷积(Channel-Wise topology learning Graph Convolution,CW-GC).特别地,在DTW-GC中使用了动态骨架拓扑建模方法(Dynamic Skeleton Topology Learning,DSTL),以高效地建模富含全局时空拓扑特征的动态骨架拓扑.将多维动态拓扑学习图卷积与多尺度时间卷积(Multi-Scale Temporal Convolution,MS-TC)相结合,本文构建了具有强大建模能力的图卷积网络.此外,为了对骨架数据的空间信息进行补充,本文额外引入了相对节点数据和相对骨骼数据进行多流网络的融合.本文所提出的方法在NTU-RGB+D与NTU-RGB+D 120数据集上分别取得了92.64%和89.29%的准确率,超过了当前最先进方法. 展开更多
关键词 动作识别 深度学习 图卷积 动态骨架拓扑 数据融合
在线阅读 下载PDF
基于双流自适应时空增强图卷积网络的手语识别 被引量:2
11
作者 金彦亮 吴筱溦 《应用科学学报》 CAS CSCD 北大核心 2024年第2期189-199,共11页
针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使... 针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使用人体身体、手部和面部节点作为输入,构造基于人体关节和骨骼的双流结构。通过自适应时空图卷积模块生成不同部位之间的连接,并充分利用其中的位置和方向信息。同时采用残差连接方式设计自适应多尺度时空注意力模块,进一步增强该网络在空域和时域的卷积能力。将双流网络提取到的有效特征进行加权融合,可以分类输出手语词汇。最后在公开的中文手语孤立词数据集上进行实验,在100类词汇和500类词汇分类任务中准确率达到了95.57%和89.62%。 展开更多
关键词 骨架数据 双流结构 自适应时空图卷积模块 自适应多尺度时空注意力模块 特征融合
在线阅读 下载PDF
时空特征校准和相关性解耦的骨架细粒度动作识别模型 被引量:1
12
作者 胡正平 王昕宇 +1 位作者 陈代萍 唐熙珩 《信号处理》 CSCD 北大核心 2024年第12期2178-2192,共15页
针对骨架数据丢弃部分重要信息导致相关动作识别模型较难捕获动作序列的细微变化从而造成对细粒度动作类别识别率不足的问题,本文提出时空特征校准和相关性解耦的骨架细粒度动作识别模型,在主干网络中间层和输出层中分别引入时空特征校... 针对骨架数据丢弃部分重要信息导致相关动作识别模型较难捕获动作序列的细微变化从而造成对细粒度动作类别识别率不足的问题,本文提出时空特征校准和相关性解耦的骨架细粒度动作识别模型,在主干网络中间层和输出层中分别引入时空特征校准模块和相关性解耦模块,提高模型对细粒度动作类别识别能力。首先,为动态校准特征空间中容易被错误分类的样本同时提高模型对时空信息表征能力,引入时空特征校准模块,该模块对特征进行时空解耦以丰富特征空间中的时空信息,并且利用对比学习方法在特征空间中动态发现并纠正被错误分类的细粒度模糊样本;随后,为降低特征相似性对最终分类造成的影响,引入相关性解耦模块,该模块在第一阶段强制所有特征样本彼此远离以达到去相关目的,并且在第二阶段使去相关后的特征与相应类别原型聚合进而使最终分类难度降低。本文所引入对比学习模块仅在模型训练阶段参与计算,不会对测试阶段带来计算负担。为验证模型有效性,本文在大型公开骨架动作识别数据集上进行实验,模型在NTU RGB+D的X-Sub和X-View基准上识别准确率分别达到92.6%和96.8%,在NTU RGB+D 120数据集的X-Sub和X-Set基准上识别准确率分别达到89.2%和90.7%,相比于主流骨架动作识别模型有明显提升,实验结果表明,本方法能够提高模型对细粒度动作类别识别能力,具有一定优势。 展开更多
关键词 对比学习 细粒度分类 动作识别 骨架数据
在线阅读 下载PDF
基于图卷积网络的人体骨架行为识别方法综述 被引量:1
13
作者 吕蕾 庞辰 《山东师范大学学报(自然科学版)》 2024年第3期210-232,共23页
基于骨架数据的人体行为识别已成为计算机视觉领域最热门和最重要的研究课题之一。相较于其他数据类型,人体骨架数据不受光照、背景、视角变化的影响,使得该类行为识别方法具有更强的鲁棒性。此外,骨架数据是以拓扑图结构的形式存在,而... 基于骨架数据的人体行为识别已成为计算机视觉领域最热门和最重要的研究课题之一。相较于其他数据类型,人体骨架数据不受光照、背景、视角变化的影响,使得该类行为识别方法具有更强的鲁棒性。此外,骨架数据是以拓扑图结构的形式存在,而图卷积是一种基于图结构的深度学习方法,能够高效地对人体骨架数据的特征进行提取和分类。因此,基于图卷积的方法已经成为处理骨架数据的主流。针对基于图卷积的行为识别方法的前沿性,对其进行全面和系统的总结和分析具有十分重要的意义。本文主要对基于图卷积方法行为识别技术的最新进展进行全面的综述,对相关方法进行分类与总结,并对基准数据集进行详细研究,最后讨论了未来的研究方向和趋势。 展开更多
关键词 骨架数据 图卷积网络 行为识别
在线阅读 下载PDF
基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别方法 被引量:2
14
作者 胡宏宇 黎烨宸 +3 位作者 张争光 曲优 何磊 高镇海 《汽车工程》 EI CSCD 北大核心 2024年第1期1-8,28,共9页
识别非驾驶行为是提高驾驶安全性的重要手段之一。目前基于骨架序列和图像的融合识别方法具有计算量大和特征融合困难的问题。针对上述问题,本文提出一种基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别模型(skeleton-image base... 识别非驾驶行为是提高驾驶安全性的重要手段之一。目前基于骨架序列和图像的融合识别方法具有计算量大和特征融合困难的问题。针对上述问题,本文提出一种基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别模型(skeleton-image based behavior recognition network,SIBBR-Net)。SIBBR-Net通过基于多尺度图的图卷积网络和基于局部视觉及注意力机制的卷积神经网络,充分提取运动和外观特征,较好地平衡了模型表征能力和计算量间的关系。基于手部运动的特征双向引导学习策略、自适应特征融合模块和静态特征空间上的辅助损失,使运动和外观特征间互相引导更新并实现自适应融合。最终在Drive&Act数据集进行算法测试,SIBBR-Net在动态标签和静态标签条件下的平均正确率分别为61.78%和80.42%,每秒浮点运算次数为25.92G,较最优方法降低了76.96%。 展开更多
关键词 驾驶员行为识别 多尺度骨架图 局部视觉上下文 多模态数据自适应融合
在线阅读 下载PDF
基于改进时空图卷积网络的人员交互行为识别 被引量:1
15
作者 雷静思 刘双广 +1 位作者 刘乔寿 王祥雪 《计算机应用与软件》 北大核心 2024年第4期151-158,共8页
针对人员交互行为识别存在的多模态数据融合方法导致的识别准确率与模型性能无法同时满足的问题,提出一种基于改进时空图卷积网络的人员交互行为识别方法。将单模态骨架数据引入级联的密集时空图卷积块网络中获得丰富的时空特征信息,提... 针对人员交互行为识别存在的多模态数据融合方法导致的识别准确率与模型性能无法同时满足的问题,提出一种基于改进时空图卷积网络的人员交互行为识别方法。将单模态骨架数据引入级联的密集时空图卷积块网络中获得丰富的时空特征信息,提高特征复用率;设计一种增强时空图卷积网络(EST-GCN)单元提高网络对关节点之间的信息表征能力;引入一种运动特征因子衡量肢体不同关节的重要程度,提高模型识别效果。在Kinetics数据集和办案区场景数据集上的实验结果表明,所提出方法在识别效果上具有一定优势,且该方法在模型复杂度及运行效率上具有很好的竞争力。 展开更多
关键词 交互行为 时空图卷积网络 骨架数据 密集
在线阅读 下载PDF
交互关系超图卷积模型的双人交互行为识别 被引量:4
16
作者 代金利 曹江涛 姬晓飞 《智能系统学报》 CSCD 北大核心 2024年第2期316-324,共9页
为提高学校、商场等公共场所的安全性,实现对监控视频中的偷窃、抢劫和打架斗殴等异常双人交互行为的自动识别,针对现有基于关节点数据的行为识别方法在图的创建中忽略了2个人之间的交互信息,且忽略了单人非自然连接关节点间的交互关系... 为提高学校、商场等公共场所的安全性,实现对监控视频中的偷窃、抢劫和打架斗殴等异常双人交互行为的自动识别,针对现有基于关节点数据的行为识别方法在图的创建中忽略了2个人之间的交互信息,且忽略了单人非自然连接关节点间的交互关系的问题,提出一种基于交互关系超图卷积模型用于双人交互行为的建模与识别。首先针对每一帧的关节点数据构建对应的单人超图以及双人交互关系图,其中超图同时使多个非自然连接节点信息互通,交互关系图强调节点间交互强度。将以上构建的图模型送入时空图卷积对空间和时间信息分别建模,最后通过SoftMax分类器得到识别结果。该算法框架的优势是在图的构建过程中加强考虑双人的交互关系、非自然连接点间结构关系以及四肢灵活的运动特征。在NTU数据集上的测试表明,该算法得到了97.36%的正确识别率,该网络模型提高了双人交互行为特征的表征能力,取得了比现有模型更好的识别效果。 展开更多
关键词 双人交互 行为识别 关节点数据 深度学习 时空图卷积网络 超图 图结构 神经网络
在线阅读 下载PDF
Hand-aware graph convolution network for skeleton-based sign language recognition
17
作者 Juan Song Huixuechun Wang +3 位作者 Jianan Li Jian Zheng Zhifu Zhao Qingshan Li 《Journal of Information and Intelligence》 2025年第1期36-50,共15页
Skeleton-based sign language recognition(SLR)is a challenging research area mainly due to the fast and complex hand movement.Currently,graph convolution networks(GCNs)have been employed in skeleton-based SLR and achie... Skeleton-based sign language recognition(SLR)is a challenging research area mainly due to the fast and complex hand movement.Currently,graph convolution networks(GCNs)have been employed in skeleton-based SLR and achieved remarkable performance.However,existing GCN-based SLR methods suffer from a lack of explicit attention to hand topology which plays an important role in the sign language representation.To address this issue,we propose a novel hand-aware graph convolution network(HA-GCN)to focus on hand topological relationships of skeleton graph.Specifically,a hand-aware graph convolution layer is designed to capture both global body and local hand information,in which two sub-graphs are defined and incorporated to represent hand topology information.In addition,in order to eliminate the over-fitting problem,an adaptive DropGraph is designed in construction of hand-aware graph convolution block to remove the spatial and temporal redundancy in the sign language representation.With the aim to further improve the performance,the joints information,bones,together with their motion information are simultaneously modeled in a multi-stream framework.Extensive experiments on the two open-source datasets,AUTSL and INCLUDE,demonstrate that our proposed algorithm outperforms the state-of-the-art with a significant margin.Our code is available at https://github.com/snorlaxse/HA-SLR-GCN. 展开更多
关键词 Sign language recognition Graph convolutional network Hand-aware graphs skeleton data Multi-stream fusion
原文传递
投影子空间下基于骨骼边信息的人体动作识别 被引量:2
18
作者 苏本跃 张鹏 +2 位作者 朱邦国 郭梦娟 盛敏 《系统仿真学报》 CAS CSCD 北大核心 2024年第3期555-563,共9页
近年来,基于骨骼数据的人体动作识别在计算机视觉、人机交互等领域受到了广泛的关注。现有的方法大多关注于在原始的3D坐标空间下对骨骼点进行建模。然而,骨骼点忽略了人体自身的物理链状结构,很难刻画人体运动的局部相关性;此外,由于... 近年来,基于骨骼数据的人体动作识别在计算机视觉、人机交互等领域受到了广泛的关注。现有的方法大多关注于在原始的3D坐标空间下对骨骼点进行建模。然而,骨骼点忽略了人体自身的物理链状结构,很难刻画人体运动的局部相关性;此外,由于相机视角的多样性,在原始的基于点的3D空间下难以探索动作在不同视角下的综合表征。鉴于此,提出了一种投影子空间下基于骨骼边信息的动作识别方法。定义了结合人体自身连接的骨骼边信息,用于捕获动作的空间特性;在骨骼边信息的基础上引入了骨骼边运动的方向与大小信息,用于获取动作的时间特性;采用2D投影子空间的方式在不同的子空间视角下进行动作表征;探索了合适的特征融合策略,通过改进的CNN框架对上述特征进行综合提取。在2个具有挑战性的大型数据集NTU-RGB+D60(评价指标为cross-subject与cross-view)和NTU-RGB+D120(评价指标为cross-subject与cross-set)上的实验结果表明,相比基准方法,所提方法在4个指标下精度分别提升了3.2%、2.4%、3.1%和5.8%。 展开更多
关键词 骨骼数据 骨骼边 边方向 边大小 投影子空间
原文传递
融合球空间下旋转角度编码的人体动作识别 被引量:2
19
作者 苏本跃 朱邦国 +1 位作者 郭梦娟 盛敏 《系统仿真学报》 CAS CSCD 北大核心 2024年第6期1433-1441,共9页
针对现有的人体动作识别方法较多考虑骨架结构的坐标和位移等平移信息,较少关注代表骨架结构的运动趋势以及代表关节、骨骼运动方向的旋转信息,提出一种融合球空间下旋转角度编码的时空卷积神经网络方法。通过人体动作在三维球空间中的... 针对现有的人体动作识别方法较多考虑骨架结构的坐标和位移等平移信息,较少关注代表骨架结构的运动趋势以及代表关节、骨骼运动方向的旋转信息,提出一种融合球空间下旋转角度编码的时空卷积神经网络方法。通过人体动作在三维球空间中的映射,获取具有尺度不变性的角度信息,提取其动态角速度信息作为角度编码,表征动作轨迹中关节点和骨骼边的旋转信息;构建了时空特征提取与共现模块来更好地捕获数据的时空特征;用合适的融合策略对平移特征和旋转特征进行运动特征融合。实验结果证明了旋转角度编码有利于提升运动表征的准确性,以及时空特征提取与共现模块的有效性。 展开更多
关键词 人体动作识别 骨架数据 旋转角度编码 3D球空间 时空特征
原文传递
顺序主导和方向驱动下基于点边特征的人体动作识别方法 被引量:2
20
作者 苏本跃 郭梦娟 +1 位作者 朱邦国 盛敏 《控制与决策》 EI CSCD 北大核心 2024年第9期3090-3098,共9页
人体运动是肢体运动方向、关节活动顺序以及动作幅度相互协调的过程.然而,现有方法往往直接对原始3D骨骼关节点信息进行建模,容易忽略肢体关节活动的顺序关系、运动方向性以及动作幅度变化影响.因此,提出一种顺序主导和方向驱动下基于... 人体运动是肢体运动方向、关节活动顺序以及动作幅度相互协调的过程.然而,现有方法往往直接对原始3D骨骼关节点信息进行建模,容易忽略肢体关节活动的顺序关系、运动方向性以及动作幅度变化影响.因此,提出一种顺序主导和方向驱动下基于点边特征的骨骼卷积神经网络,通过刻画人体关节点运动顺序、帧间距离和骨骼边方向向量等特征对人体动作分类识别.该网络包含顺序主导单元和方向驱动单元.顺序主导单元对骨骼边末端关节点进行建模,利用关节点的排列方式、帧间距离信息对关节活动顺序和肢体变化幅度进行表征.方向驱动单元利用骨骼边方向向量信息表征肢体运动的方向性.最后,将顺序主导单元与方向驱动单元进行特征融合,对人体日常行为动作进行分类识别.实验结果表明,在两个大型数据集NTU-RGB+D60和NTU-RGB+D120上的实验结果分别较基准方法提升了2.6%、3.5%和5.9%、6.1%.因此,所提出方法能有效利用多特征之间的协同互补性对人类日常行为运动进行深层次刻画,提高人体动作识别的精度. 展开更多
关键词 人体动作识别 骨骼数据 骨骼边方向向量 有序关节点 帧间距离 卷积神经网络
原文传递
上一页 1 2 5 下一页 到第
使用帮助 返回顶部