期刊文献+
共找到487篇文章
< 1 2 25 >
每页显示 20 50 100
Using BlazePose on Spatial Temporal Graph Convolutional Networks for Action Recognition 被引量:2
1
作者 Motasem S.Alsawadi El-Sayed M.El-kenawy Miguel Rio 《Computers, Materials & Continua》 SCIE EI 2023年第1期19-36,共18页
The ever-growing available visual data(i.e.,uploaded videos and pictures by internet users)has attracted the research community’s attention in the computer vision field.Therefore,finding efficient solutions to extrac... The ever-growing available visual data(i.e.,uploaded videos and pictures by internet users)has attracted the research community’s attention in the computer vision field.Therefore,finding efficient solutions to extract knowledge from these sources is imperative.Recently,the BlazePose system has been released for skeleton extraction from images oriented to mobile devices.With this skeleton graph representation in place,a Spatial-Temporal Graph Convolutional Network can be implemented to predict the action.We hypothesize that just by changing the skeleton input data for a different set of joints that offers more information about the action of interest,it is possible to increase the performance of the Spatial-Temporal Graph Convolutional Network for HAR tasks.Hence,in this study,we present the first implementation of the BlazePose skeleton topology upon this architecture for action recognition.Moreover,we propose the Enhanced-BlazePose topology that can achieve better results than its predecessor.Additionally,we propose different skeleton detection thresholds that can improve the accuracy performance even further.We reached a top-1 accuracy performance of 40.1%on the Kinetics dataset.For the NTU-RGB+D dataset,we achieved 87.59%and 92.1%accuracy for Cross-Subject and Cross-View evaluation criteria,respectively. 展开更多
关键词 Action recognition BlazePose graph neural network OpenPose SKELETON spatial temporal graph convolution network
在线阅读 下载PDF
Skeleton Split Strategies for Spatial Temporal Graph Convolution Networks
2
作者 Motasem S.Alsawadi Miguel Rio 《Computers, Materials & Continua》 SCIE EI 2022年第6期4643-4658,共16页
Action recognition has been recognized as an activity in which individuals’behaviour can be observed.Assembling profiles of regular activities such as activities of daily living can support identifying trends in the ... Action recognition has been recognized as an activity in which individuals’behaviour can be observed.Assembling profiles of regular activities such as activities of daily living can support identifying trends in the data during critical events.A skeleton representation of the human body has been proven to be effective for this task.The skeletons are presented in graphs form-like.However,the topology of a graph is not structured like Euclideanbased data.Therefore,a new set of methods to perform the convolution operation upon the skeleton graph is proposed.Our proposal is based on the Spatial Temporal-Graph Convolutional Network(ST-GCN)framework.In this study,we proposed an improved set of label mapping methods for the ST-GCN framework.We introduce three split techniques(full distance split,connection split,and index split)as an alternative approach for the convolution operation.The experiments presented in this study have been trained using two benchmark datasets:NTU-RGB+D and Kinetics to evaluate the performance.Our results indicate that our split techniques outperform the previous partition strategies and aremore stable during training without using the edge importance weighting additional training parameter.Therefore,our proposal can provide a more realistic solution for real-time applications centred on daily living recognition systems activities for indoor environments. 展开更多
关键词 Skeleton split strategies spatial temporal graph convolutional neural networks skeleton joints action recognition
在线阅读 下载PDF
Local-global dynamic correlations based spatial-temporal convolutional network for traffic flow forecasting
3
作者 ZHANG Hong GONG Lei +2 位作者 ZHAO Tianxin ZHANG Xijun WANG Hongyan 《High Technology Letters》 EI CAS 2024年第4期370-379,共10页
Traffic flow forecasting plays a crucial role and is the key technology to realize dynamic traffic guidance and active traffic control in intelligent traffic systems(ITS).Aiming at the complex local and global spatial... Traffic flow forecasting plays a crucial role and is the key technology to realize dynamic traffic guidance and active traffic control in intelligent traffic systems(ITS).Aiming at the complex local and global spatial-temporal dynamic characteristics of traffic flow,this paper proposes a new traffic flow forecasting model spatial-temporal attention graph neural network(STA-GNN)by combining at-tention mechanism(AM)and spatial-temporal convolutional network.The model learns the hidden dynamic local spatial correlations of the traffic network by combining the dynamic adjacency matrix constructed by the graph learning layer with the graph convolutional network(GCN).The local tem-poral correlations of traffic flow at different scales are extracted by stacking multiple convolutional kernels in temporal convolutional network(TCN).And the global spatial-temporal dependencies of long-time sequences of traffic flow are captured by the spatial-temporal attention mechanism(STAtt),which enhances the global spatial-temporal modeling and the representational ability of model.The experimental results on two datasets,METR-LA and PEMS-BAY,show the proposed STA-GNN model outperforms the common baseline models in forecasting accuracy. 展开更多
关键词 traffic flow forecasting graph convolutional network(GCN) temporal convolu-tional network(TCN) attention mechanism(AM)
在线阅读 下载PDF
Occluded Gait Emotion Recognition Based on Multi-Scale Suppression Graph Convolutional Network
4
作者 Yuxiang Zou Ning He +2 位作者 Jiwu Sun Xunrui Huang Wenhua Wang 《Computers, Materials & Continua》 SCIE EI 2025年第1期1255-1276,共22页
In recent years,gait-based emotion recognition has been widely applied in the field of computer vision.However,existing gait emotion recognition methods typically rely on complete human skeleton data,and their accurac... In recent years,gait-based emotion recognition has been widely applied in the field of computer vision.However,existing gait emotion recognition methods typically rely on complete human skeleton data,and their accuracy significantly declines when the data is occluded.To enhance the accuracy of gait emotion recognition under occlusion,this paper proposes a Multi-scale Suppression Graph ConvolutionalNetwork(MS-GCN).TheMS-GCN consists of three main components:Joint Interpolation Module(JI Moudle),Multi-scale Temporal Convolution Network(MS-TCN),and Suppression Graph Convolutional Network(SGCN).The JI Module completes the spatially occluded skeletal joints using the(K-Nearest Neighbors)KNN interpolation method.The MS-TCN employs convolutional kernels of various sizes to comprehensively capture the emotional information embedded in the gait,compensating for the temporal occlusion of gait information.The SGCN extracts more non-prominent human gait features by suppressing the extraction of key body part features,thereby reducing the negative impact of occlusion on emotion recognition results.The proposed method is evaluated on two comprehensive datasets:Emotion-Gait,containing 4227 real gaits from sources like BML,ICT-Pollick,and ELMD,and 1000 synthetic gaits generated using STEP-Gen technology,and ELMB,consisting of 3924 gaits,with 1835 labeled with emotions such as“Happy,”“Sad,”“Angry,”and“Neutral.”On the standard datasets Emotion-Gait and ELMB,the proposed method achieved accuracies of 0.900 and 0.896,respectively,attaining performance comparable to other state-ofthe-artmethods.Furthermore,on occlusion datasets,the proposedmethod significantly mitigates the performance degradation caused by occlusion compared to other methods,the accuracy is significantly higher than that of other methods. 展开更多
关键词 KNN interpolation multi-scale temporal convolution suppression graph convolutional network gait emotion recognition human skeleton
在线阅读 下载PDF
Human Motion Prediction Based on Multi-Level Spatial and Temporal Cues Learning
5
作者 Jiayi Geng Yuxuan Wu +5 位作者 Wenbo Lu Pengxiang Su Amel Ksibi Wei Li Zaffar Ahmed Shaikh Di Gai 《Computers, Materials & Continua》 2025年第11期3689-3707,共19页
Predicting human motion based on historical motion sequences is a fundamental problem in computer vision,which is at the core of many applications.Existing approaches primarily focus on encoding spatial dependencies a... Predicting human motion based on historical motion sequences is a fundamental problem in computer vision,which is at the core of many applications.Existing approaches primarily focus on encoding spatial dependencies among human joints while ignoring the temporal cues and the complex relationships across non-consecutive frames.These limitations hinder the model’s ability to generate accurate predictions over longer time horizons and in scenarios with complex motion patterns.To address the above problems,we proposed a novel multi-level spatial and temporal learning model,which consists of a Cross Spatial Dependencies Encoding Module(CSM)and a Dynamic Temporal Connection Encoding Module(DTM).Specifically,the CSM is designed to capture complementary local and global spatial dependent information at both the joint level and the joint pair level.We further present DTM to encode diverse temporal evolution contexts and compress motion features to a deep level,enabling the model to capture both short-term and long-term dependencies efficiently.Extensive experiments conducted on the Human 3.6M and CMU Mocap datasets demonstrate that our model achieves state-of-the-art performance in both short-term and long-term predictions,outperforming existing methods by up to 20.3% in accuracy.Furthermore,ablation studies confirm the significant contributions of the CSM and DTM in enhancing prediction accuracy. 展开更多
关键词 Human motion prediction spatial dependencies learning temporal context learning graph convolutional networks transformer
在线阅读 下载PDF
融合时空注意力的改进ST-GCN人体动作识别方法研究 被引量:1
6
作者 雷建云 梁钧 +2 位作者 夏梦 张慧丽 田祚汉 《中南民族大学学报(自然科学版)》 2025年第4期526-535,共10页
针对现有的人体骨架动作识别算法不能充分发掘运动的时空特征问题,提出了一种基于融合时空注意力的改进图卷积网络模型.该模型包含空间注意力机制和时间注意力机制,利用时空注意力机制从时间和空间两个维度分别提取动作的全局时空特征.... 针对现有的人体骨架动作识别算法不能充分发掘运动的时空特征问题,提出了一种基于融合时空注意力的改进图卷积网络模型.该模型包含空间注意力机制和时间注意力机制,利用时空注意力机制从时间和空间两个维度分别提取动作的全局时空特征.将这二者融合到统一的时空图卷积网络(ST-GCN)框架中,实现了端到端的训练.在Kinetics和NTU RGB+D两个公开数据集的对比实验证明:改进模型在NTU-RGB+D数据集上的CS标准下取得了82.37%的Top-1精度,在CV标准下取得89.84%的Top-1精度,相比原来的ST-GCN算法,分别提升0.87%的Top-1精度和1.54%的Top-5精度.在Kinetics数据集上,改进模型取得了31.78%的精度,与ST-GCN相比提高了1.08%.由此验证了改进方法的有效性. 展开更多
关键词 图卷积网络 骨架数据 动作识别 时空注意力
在线阅读 下载PDF
A Spatio-Temporal Heterogeneity Data Accuracy Detection Method Fused by GCN and TCN
7
作者 Tao Liu Kejia Zhang +4 位作者 Jingsong Yin Yan Zhang Zihao Mu Chunsheng Li Yanan Hu 《Computer Systems Science & Engineering》 SCIE EI 2023年第11期2563-2582,共20页
Spatio-temporal heterogeneous data is the database for decisionmaking in many fields,and checking its accuracy can provide data support for making decisions.Due to the randomness,complexity,global and local correlatio... Spatio-temporal heterogeneous data is the database for decisionmaking in many fields,and checking its accuracy can provide data support for making decisions.Due to the randomness,complexity,global and local correlation of spatiotemporal heterogeneous data in the temporal and spatial dimensions,traditional detection methods can not guarantee both detection speed and accuracy.Therefore,this article proposes a method for detecting the accuracy of spatiotemporal heterogeneous data by fusing graph convolution and temporal convolution networks.Firstly,the geographic weighting function is introduced and improved to quantify the degree of association between nodes and calculate the weighted adjacency value to simplify the complex topology.Secondly,design spatiotemporal convolutional units based on graph convolutional neural networks and temporal convolutional networks to improve detection speed and accuracy.Finally,the proposed method is compared with three methods,ARIMA,T-GCN,and STGCN,in real scenarios to verify its effectiveness in terms of detection speed,detection accuracy and stability.The experimental results show that the RMSE,MAE,and MAPE of this method are the smallest in the cases of simple connectivity and complex connectivity degree,which are 13.82/12.08,2.77/2.41,and 16.70/14.73,respectively.Also,it detects the shortest time of 672.31/887.36,respectively.In addition,the evaluation results are the same under different time periods of processing and complex topology environment,which indicates that the detection accuracy of this method is the highest and has good research value and application prospects. 展开更多
关键词 Spatiotemporal heterogeneity data data accuracy complex topology structure graph convolutional networks temporal convolutional networks
在线阅读 下载PDF
Multi-Polar Evolution of Global Inventive Talent Flow Network-An Endogenous Migration Model and Empirical Analysis
8
作者 Zheng Jianghuai Sun Dongqing +1 位作者 Dai Wei Shi Lei 《China Economist》 2025年第4期80-100,共21页
The global clustering of inventive talent shapes innovation capacity and drives economic growth.For China,this process is especially crucial in sustaining its development momentum.This paper draws on data from the EPO... The global clustering of inventive talent shapes innovation capacity and drives economic growth.For China,this process is especially crucial in sustaining its development momentum.This paper draws on data from the EPO Worldwide Patent Statistical Database(PATSTAT)to extract global inventive talent mobility information and analyzes the spatial structural evolution of the global inventive talent flow network.The study finds that this network is undergoing a multi-polar transformation,characterized by the rising importance of a few central countries-such as the United States,Germany,and China-and the increasing marginalization of many peripheral countries.In response to this typical phenomenon,the paper constructs an endogenous migration model and conducts empirical testing using the Temporal Exponential Random Graph Model(TERGM).The results reveal several endogenous mechanisms driving global inventive talent flows,including reciprocity,path dependence,convergence effects,transitivity,and cyclic structures,all of which contribute to the network’s multi-polar trend.In addition,differences in regional industrial structures significantly influence talent mobility choices and are a decisive factor in the formation of poles within the multi-polar landscape.Based on these findings,it is suggested that efforts be made to foster two-way channels for talent exchange between China and other global innovation hubs,in order to enhance international collaboration and knowledge flow.We should aim to reduce the migration costs and institutional barriers faced by R&D personnel,thereby encouraging greater mobility of high-skilled talent.Furthermore,the government is advised to strategically leverage regional strengths in high-tech industries as a lever to capture competitive advantages in emerging technologies and products,ultimately strengthening the country’s position in the global innovation landscape. 展开更多
关键词 Inventive talent flow network MULTIPOLARITY spatial structural evolution regional industrial structure disparities temporal exponential random graph model(TERGM)
在线阅读 下载PDF
改进ST-GCN的人体跌倒检测
9
作者 王世刚 邓珍妮 饶淼淼 《计算机系统应用》 2025年第8期159-168,共10页
针对ST-GCN算法在动作识别中需要预先定义人体骨架拓扑图及准确率有待提高等问题,提出了基于OpenPose与改进ST-GCN结合的跌倒检测算法.利用OpenPose算法提取人体骨骼关键点数据,将骨骼关键点数据输入改进的ST-GCN算法中进行动作识别.对S... 针对ST-GCN算法在动作识别中需要预先定义人体骨架拓扑图及准确率有待提高等问题,提出了基于OpenPose与改进ST-GCN结合的跌倒检测算法.利用OpenPose算法提取人体骨骼关键点数据,将骨骼关键点数据输入改进的ST-GCN算法中进行动作识别.对ST-GCN算法进行改进,引入自适应图卷积模块,通过动态调整图结构,增强模型对不同动作类型特征提取的灵活性;引入注意力机制模块,进一步提升模型的识别性能.在公开数据集上验证的结果显示,NTU-RGB+D 60数据集上,X-Sub和X-View的top-1准确率与改进前相比分别提高2.2%和2.5%;Kinetics-Skeleton数据集上,top-1和top-5准确率分别提高3.1%和4%.自建数据集上的准确率与改进前相比提高4.7%.实验结果表明,所提出的算法满足实际应用需求. 展开更多
关键词 时空图卷积 人体姿态估计 跌倒检测 计算机视觉
在线阅读 下载PDF
改进的ST-GCN单人姿态估计算法研究
10
作者 史健婷 王印冉 詹怀远 《计算机技术与发展》 2025年第1期61-66,共6页
近年来,单人姿态估计广泛应用在各个领域,降低单人姿态估计算法对标记数据的依赖同时提高其准确率是计算机视觉中一个具有挑战但是十分重要的课题。针对此问题,该文提出一种改进的时空图卷积神经网络(Spatio-Temporal Graph Convolution... 近年来,单人姿态估计广泛应用在各个领域,降低单人姿态估计算法对标记数据的依赖同时提高其准确率是计算机视觉中一个具有挑战但是十分重要的课题。针对此问题,该文提出一种改进的时空图卷积神经网络(Spatio-Temporal Graph Convolutional Networks,ST-GCN)的方法。在原来的ST-GCN的基础上,融合MoveNet轻量级神经网络,利用MoveNet的关键点识别功能,解决ST-GCN需要预先标注关键点数据的问题。引入SimAM注意力机制,解决原来的ST-GCN不能很好地区分通道中重点信息,将所有的信息一视同仁的问题。增加ReLU6-Sigmoid组合激活函数,解决原有的激活函数训练波动,非线性拟合不足的问题。即:在提高了原时空图卷积神经网络的检测精度的同时,减少了应用过程中对于标记数据的依赖,降低了训练时的损失率精确率的波动。对于改进后的时空图卷积神经网络,在FLORENCE 3D ACTIONS数据集上证明了其有效性。结果表明,改进后的时空图卷积神经网络准确率从0.8695提升到0.956521。F1值由0.887566提高到0.965432。 展开更多
关键词 计算机视觉 改进的时空图卷积神经网络 模型融合 SimAM ReLU6-Sigmoid
在线阅读 下载PDF
面向交通流预测的全局-局部时空感知模型
11
作者 潘理虎 尹佳莉 +2 位作者 张睿 谢斌红 张林梁 《计算机工程》 北大核心 2026年第3期392-402,共11页
交通流预测方法是智能交通系统的重要基础,但现有方法在准确捕获交通数据的时空相关性上仍有不足。为挖掘道路网络的复杂时空相关性,提高预测性能,提出一种考虑全局-局部时空感知的时空图注意力网络模型GL-STAGGN。首先对输入数据进行... 交通流预测方法是智能交通系统的重要基础,但现有方法在准确捕获交通数据的时空相关性上仍有不足。为挖掘道路网络的复杂时空相关性,提高预测性能,提出一种考虑全局-局部时空感知的时空图注意力网络模型GL-STAGGN。首先对输入数据进行时空位置嵌入来表征交通流的时空异质性,以增强时空数据的特征表示,其次利用全局-局部时间感知的多头自注意力同步挖掘全局与局部空间范围内的时间动态相关性;然后引入图注意力网络和基于注意力机制的动态图卷积网络分别聚合局部节点特征和动态调整空间相关性强度,以深度捕捉全局与局部空间相关性的内在关联;最后采用编码器-解码器架构将时空组件融合以构成GL-STAGGN模型。在现实世界的高速公路交通数据集PEMS04和PEMS08上的实验结果表明,相比未考虑全局-局部时空关系和忽略空间异质性的先进方法DSTAGNN,GL-STAGGN的平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)平均降低了2.8%、2.3%和3.3%,优于大多数现有基线模型,可更好地为智能交通系统提供支持。 展开更多
关键词 交通流预测 时空相关性 编码器-解码器 注意力机制 动态图卷积网络
在线阅读 下载PDF
基于深度学习的矿工不安全行为监测预警系统
12
作者 姚有利 王冲 +2 位作者 侯艳文 刘怡汝 戴智 《安全与环境学报》 北大核心 2026年第2期674-684,共11页
煤矿事故的根本原因在于作业人员的不安全行为。目前,在井下作业中,对不安全行为的检测仍以人工巡查为主,效率低下且漏检率高。现有研究大多聚焦于单一的不安全装束或行为识别,缺乏对多类不安全行为的综合性研究与实际应用。为此,设计... 煤矿事故的根本原因在于作业人员的不安全行为。目前,在井下作业中,对不安全行为的检测仍以人工巡查为主,效率低下且漏检率高。现有研究大多聚焦于单一的不安全装束或行为识别,缺乏对多类不安全行为的综合性研究与实际应用。为此,设计了一套基于深度学习的矿工不安全行为识别与预警系统。系统将不安全行为划分为静态不安全装束和动态不安全行为两类,并构建了贴合井下环境的专用数据集。静态装束识别部分采用YOLOv8n模型进行目标检测,动态行为识别部分借助OpenPose提取人体骨骼关键点,并结合时空图卷积网络(Spatial Temporal Graph Convolutional Networks,ST-GCN)网络实现高效识别。系统还集成可视化界面,支持实时预警反馈。该系统的研发不仅为煤矿安全生产提供了技术支撑,也为井下不安全行为研究提供了实践基础。 展开更多
关键词 安全工程 YOLOv8n OpenPose 时空图卷积网络 预警系统
原文传递
基于时空动态约束图反馈的交通流预测
13
作者 侯越 张鑫 武月 《吉林大学学报(工学版)》 北大核心 2026年第1期183-198,共16页
针对现有交通流预测研究中对路网节点隐藏空间关联时变特性考虑不充分的问题,提出了一种基于时空动态约束图反馈的交通流预测模型。首先,通过门控循环单元(GRU)提取时序特征,在STC-GCL组件内,利用时空图生成器和时空融合约束矩阵生成表... 针对现有交通流预测研究中对路网节点隐藏空间关联时变特性考虑不充分的问题,提出了一种基于时空动态约束图反馈的交通流预测模型。首先,通过门控循环单元(GRU)提取时序特征,在STC-GCL组件内,利用时空图生成器和时空融合约束矩阵生成表征当前时刻路网邻域关系的动态约束图,再利用多层图结构卷积操作实现空间特征提取。其次,利用多尺度门控卷积单元动态调整重要特征信息流,完成对关键特征的精细化筛选。最后,通过将STCGCL嵌入GRU的方式,实现时空特征的一致性提取。试验在高速路网PeMSD4、PeMSD8、成都-滴滴公开数据集上进行测试,结果表明:与当前主流交通流时空预测方法FGI相比,本文模型的MAE在3个数据集上分别降低了2.69%、1.88%、0.92%。 展开更多
关键词 交通流预测 时空性 动态性 图卷积神经网络
原文传递
人体动作姿态识别方法研究综述
14
作者 梁本来 《信息记录材料》 2026年第1期18-20,26,共4页
人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适... 人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适应性和性能表现(准确性、实时性、鲁棒性等)等方面的特点,揭示了该技术领域面临的三维标注数据获取困难、复杂环境泛化能力不足及实时性与精度难以兼顾等核心挑战。针对未来发展趋势,本文探讨了轻量化模型设计、多模态融合、弱监督与自监督学习、三维时空建模、Transformer架构应用及领域自适应等关键研究方向,旨在为后续相关研究提供思路与借鉴。 展开更多
关键词 人体动作姿态识别 深度学习 计算机视觉 时空图卷积网络
在线阅读 下载PDF
TPA改进GCN⁃LSTM的光伏电站群调群控优化策略研究
15
作者 商立群 王硕 《电气传动》 2026年第3期52-60,共9页
随着光伏装机容量占比逐年提高,准确预测光伏出力,实现光伏群调群控至关重要。提出基于图卷积神经网络(GCN)、长短期记忆网络(LSTM)和时间模式注意力机制(TPA)集成深度融合的多站光伏出力预测方法。首先,以图结构形式转化多站光伏出力... 随着光伏装机容量占比逐年提高,准确预测光伏出力,实现光伏群调群控至关重要。提出基于图卷积神经网络(GCN)、长短期记忆网络(LSTM)和时间模式注意力机制(TPA)集成深度融合的多站光伏出力预测方法。首先,以图结构形式转化多站光伏出力时序曲线及数值天气预报数据的输入特征,建立GCN-LSTM模型,提取光伏集群间隐藏的时空依赖性。其次,引入时间模式注意力机制加权修正输入数据特征,提高关键数据价值。然后,设定反映集群内电压变化的节点为主导节点,基于光伏集群间时空预测结果,将灵敏反映集群电压变化的节点设定为主导节点,建立区域所有节点的电压在安全范围运行和最小系统网损为目标的群间协调优化策略。接着,根据协调优化策略结果构建群内节点电压在安全范围内稳定运行、最小化集群网损的自治优化调控策略,实现分布式光伏最大化就地消纳。最后,实际多站光伏集群出力数据的仿真结果表明,所提方法能够高效提取不同光伏电站间的时空关联性,降低光伏出力预测误差,有效提高光伏集群的安全性和经济性。 展开更多
关键词 光伏出力预测 图卷积神经网络 邻接矩阵自适应 时间模式注意力机制
在线阅读 下载PDF
用于行人轨迹预测的时空多图融合的稀疏图卷积网络
16
作者 习炎 王文格 +1 位作者 彭景阳 韩林慧 《计算机工程与应用》 北大核心 2026年第2期211-219,共9页
在机器人导航和自动驾驶等方面,行人轨迹预测具有重要的研究意义和应用价值。基于图卷积神经网络的轨迹预测方法可以更加直观地模拟行人之间的社会交互,但大多数模型对行人的时空交互定义并不准确。因此,提出了一种时空多图融合的稀疏... 在机器人导航和自动驾驶等方面,行人轨迹预测具有重要的研究意义和应用价值。基于图卷积神经网络的轨迹预测方法可以更加直观地模拟行人之间的社会交互,但大多数模型对行人的时空交互定义并不准确。因此,提出了一种时空多图融合的稀疏图卷积网络(spatial-temporal multi-graph fusion sparse graph convolutional network,STMGF-SGCN)用于行人轨迹预测。通过引入先验信息,总结出影响行人运动轨迹的三个因素:相对距离、相对速率、潜在冲突,并由此建立三个空间图结构。同时,模型融合了时间图以提高对运动趋势的捕捉能力,还采用非对称卷积操作以获取行人间非对称的时空交互信息;引用了稀疏的思想来减少模型建立和多图融合带来的冗余交互。实验结果表明,在公开行人轨迹数据集ETH和UCY上,相比于基线Social-STGCNN和SGCN,模型的平均位移误差(ADE)和最终位移误差(FDE)分别降低了18.2%、20%和2.7%、7.7%。 展开更多
关键词 行人轨迹预测 图卷积网络 多图融合 时空交互
在线阅读 下载PDF
基于新分区策略的ST-GCN人体动作识别 被引量:7
17
作者 杨世强 李卓 +3 位作者 王金华 贺朵 李琦 李德信 《计算机集成制造系统》 EI CSCD 北大核心 2023年第12期4040-4050,共11页
人体动作识别是智能监控、人机交互、机器人等领域的一项重要技术,基于人体骨架序列的动作识别方法在面对复杂背景以及人体尺度、视角和运动速度等变化时具有先天优势。时空图卷积神经网络模型(ST-GCN)在人体行为识别中具有卓越的识别性... 人体动作识别是智能监控、人机交互、机器人等领域的一项重要技术,基于人体骨架序列的动作识别方法在面对复杂背景以及人体尺度、视角和运动速度等变化时具有先天优势。时空图卷积神经网络模型(ST-GCN)在人体行为识别中具有卓越的识别性能,针对ST-GCN网络模型中的分区策略只关注局部动作的问题,设计了一种新的分区策略,通过关联根节点与更远节点,加强身体各部分信息联系和局部运动之间的联系,将根节点的相邻区域划分为根节点本身、向心群、远向心群、离心群和远离心群等5个区域,同时为各区域赋予不同的权重,提升了模型对整体动作的感知能力。最后,分别在公开数据集和真实场景下进行实验测试,结果表明,在大规模数据集Kinetics-skeleton上获得了31.1%的Top-1分类准确率,相比原模型提升了0.4%;在NTU-RGB+D的两个子数据集上分别获得了83.7%和91.6%的Top-1性能指标,相比原模型提升了2.3%和3.3%;在真实场景下,所提模型对动作变化明显且区别大的动作如俯卧撑和慢跑识别率高,对局部运动和动作变化相近的动作如鼓掌和摇头识别率偏低,尚有进一步提高的空间。 展开更多
关键词 动作识别 深度学习 时空图卷积神经网络模型 分区策略 骨架序列
在线阅读 下载PDF
融合时空图信息的配电网故障区段定位及可解释性分析方法
18
作者 刘畅宇 王小君 +3 位作者 张大海 刘曌 尚博阳 窦嘉铭 《电工技术学报》 北大核心 2026年第5期1623-1636,共14页
为提高复杂运行场景下配电网故障定位的准确性与可靠性,该提出一种融合时空图信息的配电网故障区段定位及可解释性分析方法。首先,依托配电网量测信息构建融合时间连续性与空间整体性的时空图结构数据,用于刻画时空特征与故障区段之间... 为提高复杂运行场景下配电网故障定位的准确性与可靠性,该提出一种融合时空图信息的配电网故障区段定位及可解释性分析方法。首先,依托配电网量测信息构建融合时间连续性与空间整体性的时空图结构数据,用于刻画时空特征与故障区段之间的映射关系;其次,从时-空两个维度提取故障特征,建立基于时空图信息的配电网故障区段定位模型;然后,设计可解释性分析模块,对模型决策依据及其内在工作机制进行事后可解释性分析,支撑故障定位结果的可靠性;最后,搭建典型配电系统仿真模型对所提方案进行验证。结果表明,与现有同类方法相比,所提方案具有定位精度高、鲁棒性强的优点,并在分布式电源波动、噪声干扰、数据缺失及拓扑重构场景下保持良好的泛化能力。 展开更多
关键词 配电网 故障定位 拓扑变化 时空图卷积网络 可解释性
在线阅读 下载PDF
基于关联分区和ST-GCN的人体行为识别 被引量:10
19
作者 刘锁兰 顾嘉晖 +1 位作者 王洪元 张云鹏 《计算机工程与应用》 CSCD 北大核心 2021年第13期168-175,共8页
基于骨骼的动作识别因不受人体物理特征的影响,简单清晰地传达了人体行为识别的重要信息而受到广泛关注。传统的应用程序骨架建模通常依赖遍历规则的人为设置而导致表达能力有限和推广困难。因此,在近年来热门的时空图卷积网络(ST-GCN)... 基于骨骼的动作识别因不受人体物理特征的影响,简单清晰地传达了人体行为识别的重要信息而受到广泛关注。传统的应用程序骨架建模通常依赖遍历规则的人为设置而导致表达能力有限和推广困难。因此,在近年来热门的时空图卷积网络(ST-GCN)模型基础上提出了一种新的划分骨架关节点的分区策略。该策略相比于原始分区方法加强了身体相对位置之间的关系,从而有利于提高骨架关节点信息在时间和空间上的关联。与此同时,在训练过程中通过设置不同的迭代学习率以进一步提高识别精度。在两个不同性质的大规模数据集Kinetics和NTURGB+D上与现有方法进行识别效果的比较,实验结果表明了该方法的有效性。 展开更多
关键词 行为识别 关节点 时空图卷积网络(st-gcn) 分区策略 学习率
在线阅读 下载PDF
基于图注意力交互的行人轨迹预测方法
20
作者 刘宏鉴 邹丹平 李萍 《计算机科学》 北大核心 2026年第1期97-103,共7页
行人轨迹预测在自动驾驶领域和智慧交通领域均取得了显著的研究进展。由于行人的行为受到自身和环境因素的双重影响,其轨迹具有不确定性和复杂性,因此准确利用轨迹数据的交互特征生成多模态轨迹仍存在较大挑战。目前,该领域中的主要挑... 行人轨迹预测在自动驾驶领域和智慧交通领域均取得了显著的研究进展。由于行人的行为受到自身和环境因素的双重影响,其轨迹具有不确定性和复杂性,因此准确利用轨迹数据的交互特征生成多模态轨迹仍存在较大挑战。目前,该领域中的主要挑战是准确建模行人之间的时空交互。面对复杂的行人时空交互,提出了一种基于图注意力的时空图神经网络,其量化表示行人之间的空间交互并重点关注关键交互,从而将行人轨迹信息表示为有向时空图,利用图注意力机制提取空间位置特征和交互特征,同时结合自注意力机制在时间维度提取时间特征并融合时空特征信息,最后生成结合历史轨迹和交互信息的多模态未来轨迹。在ETH-UCY数据集上的实验表明,与最佳基线模型相比,所提出的方法在平均位移误差(ADE)和最终位移误差(FDE)方面分别降低3.4%和2.1%,并具有较短的推理时间,确保实现实时推理响应。可视化的结果表明,所提出的方法能够生成具有可接受性的未来行人轨迹,展现了良好的工程应用前景。 展开更多
关键词 轨迹预测 时空图 图神经网络 图注意力 时空交互
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部