期刊文献+
共找到518篇文章
< 1 2 26 >
每页显示 20 50 100
Using BlazePose on Spatial Temporal Graph Convolutional Networks for Action Recognition 被引量:2
1
作者 Motasem S.Alsawadi El-Sayed M.El-kenawy Miguel Rio 《Computers, Materials & Continua》 SCIE EI 2023年第1期19-36,共18页
The ever-growing available visual data(i.e.,uploaded videos and pictures by internet users)has attracted the research community’s attention in the computer vision field.Therefore,finding efficient solutions to extrac... The ever-growing available visual data(i.e.,uploaded videos and pictures by internet users)has attracted the research community’s attention in the computer vision field.Therefore,finding efficient solutions to extract knowledge from these sources is imperative.Recently,the BlazePose system has been released for skeleton extraction from images oriented to mobile devices.With this skeleton graph representation in place,a Spatial-Temporal Graph Convolutional Network can be implemented to predict the action.We hypothesize that just by changing the skeleton input data for a different set of joints that offers more information about the action of interest,it is possible to increase the performance of the Spatial-Temporal Graph Convolutional Network for HAR tasks.Hence,in this study,we present the first implementation of the BlazePose skeleton topology upon this architecture for action recognition.Moreover,we propose the Enhanced-BlazePose topology that can achieve better results than its predecessor.Additionally,we propose different skeleton detection thresholds that can improve the accuracy performance even further.We reached a top-1 accuracy performance of 40.1%on the Kinetics dataset.For the NTU-RGB+D dataset,we achieved 87.59%and 92.1%accuracy for Cross-Subject and Cross-View evaluation criteria,respectively. 展开更多
关键词 Action recognition BlazePose graph neural network OpenPose SKELETON spatial temporal graph convolution network
在线阅读 下载PDF
Occluded Gait Emotion Recognition Based on Multi-Scale Suppression Graph Convolutional Network
2
作者 Yuxiang Zou Ning He +2 位作者 Jiwu Sun Xunrui Huang Wenhua Wang 《Computers, Materials & Continua》 SCIE EI 2025年第1期1255-1276,共22页
In recent years,gait-based emotion recognition has been widely applied in the field of computer vision.However,existing gait emotion recognition methods typically rely on complete human skeleton data,and their accurac... In recent years,gait-based emotion recognition has been widely applied in the field of computer vision.However,existing gait emotion recognition methods typically rely on complete human skeleton data,and their accuracy significantly declines when the data is occluded.To enhance the accuracy of gait emotion recognition under occlusion,this paper proposes a Multi-scale Suppression Graph ConvolutionalNetwork(MS-GCN).TheMS-GCN consists of three main components:Joint Interpolation Module(JI Moudle),Multi-scale Temporal Convolution Network(MS-TCN),and Suppression Graph Convolutional Network(SGCN).The JI Module completes the spatially occluded skeletal joints using the(K-Nearest Neighbors)KNN interpolation method.The MS-TCN employs convolutional kernels of various sizes to comprehensively capture the emotional information embedded in the gait,compensating for the temporal occlusion of gait information.The SGCN extracts more non-prominent human gait features by suppressing the extraction of key body part features,thereby reducing the negative impact of occlusion on emotion recognition results.The proposed method is evaluated on two comprehensive datasets:Emotion-Gait,containing 4227 real gaits from sources like BML,ICT-Pollick,and ELMD,and 1000 synthetic gaits generated using STEP-Gen technology,and ELMB,consisting of 3924 gaits,with 1835 labeled with emotions such as“Happy,”“Sad,”“Angry,”and“Neutral.”On the standard datasets Emotion-Gait and ELMB,the proposed method achieved accuracies of 0.900 and 0.896,respectively,attaining performance comparable to other state-ofthe-artmethods.Furthermore,on occlusion datasets,the proposedmethod significantly mitigates the performance degradation caused by occlusion compared to other methods,the accuracy is significantly higher than that of other methods. 展开更多
关键词 KNN interpolation multi-scale temporal convolution suppression graph convolutional network gait emotion recognition human skeleton
在线阅读 下载PDF
Skeleton Split Strategies for Spatial Temporal Graph Convolution Networks
3
作者 Motasem S.Alsawadi Miguel Rio 《Computers, Materials & Continua》 SCIE EI 2022年第6期4643-4658,共16页
Action recognition has been recognized as an activity in which individuals’behaviour can be observed.Assembling profiles of regular activities such as activities of daily living can support identifying trends in the ... Action recognition has been recognized as an activity in which individuals’behaviour can be observed.Assembling profiles of regular activities such as activities of daily living can support identifying trends in the data during critical events.A skeleton representation of the human body has been proven to be effective for this task.The skeletons are presented in graphs form-like.However,the topology of a graph is not structured like Euclideanbased data.Therefore,a new set of methods to perform the convolution operation upon the skeleton graph is proposed.Our proposal is based on the Spatial Temporal-Graph Convolutional Network(ST-GCN)framework.In this study,we proposed an improved set of label mapping methods for the ST-GCN framework.We introduce three split techniques(full distance split,connection split,and index split)as an alternative approach for the convolution operation.The experiments presented in this study have been trained using two benchmark datasets:NTU-RGB+D and Kinetics to evaluate the performance.Our results indicate that our split techniques outperform the previous partition strategies and aremore stable during training without using the edge importance weighting additional training parameter.Therefore,our proposal can provide a more realistic solution for real-time applications centred on daily living recognition systems activities for indoor environments. 展开更多
关键词 Skeleton split strategies spatial temporal graph convolutional neural networks skeleton joints action recognition
在线阅读 下载PDF
Local-global dynamic correlations based spatial-temporal convolutional network for traffic flow forecasting
4
作者 ZHANG Hong GONG Lei +2 位作者 ZHAO Tianxin ZHANG Xijun WANG Hongyan 《High Technology Letters》 EI CAS 2024年第4期370-379,共10页
Traffic flow forecasting plays a crucial role and is the key technology to realize dynamic traffic guidance and active traffic control in intelligent traffic systems(ITS).Aiming at the complex local and global spatial... Traffic flow forecasting plays a crucial role and is the key technology to realize dynamic traffic guidance and active traffic control in intelligent traffic systems(ITS).Aiming at the complex local and global spatial-temporal dynamic characteristics of traffic flow,this paper proposes a new traffic flow forecasting model spatial-temporal attention graph neural network(STA-GNN)by combining at-tention mechanism(AM)and spatial-temporal convolutional network.The model learns the hidden dynamic local spatial correlations of the traffic network by combining the dynamic adjacency matrix constructed by the graph learning layer with the graph convolutional network(GCN).The local tem-poral correlations of traffic flow at different scales are extracted by stacking multiple convolutional kernels in temporal convolutional network(TCN).And the global spatial-temporal dependencies of long-time sequences of traffic flow are captured by the spatial-temporal attention mechanism(STAtt),which enhances the global spatial-temporal modeling and the representational ability of model.The experimental results on two datasets,METR-LA and PEMS-BAY,show the proposed STA-GNN model outperforms the common baseline models in forecasting accuracy. 展开更多
关键词 traffic flow forecasting graph convolutional network(GCN) temporal convolu-tional network(TCN) attention mechanism(AM)
在线阅读 下载PDF
GT-A^(2)T:Graph Tensor Alliance Attention Network 被引量:1
5
作者 Ling Wang Kechen Liu Ye Yuan 《IEEE/CAA Journal of Automatica Sinica》 2025年第10期2165-2167,共3页
Dear Editor,This letter proposes the graph tensor alliance attention network(GT-A^(2)T)to represent a dynamic graph(DG)precisely.Its main idea includes 1)Establishing a unified spatio-temporal message propagation fram... Dear Editor,This letter proposes the graph tensor alliance attention network(GT-A^(2)T)to represent a dynamic graph(DG)precisely.Its main idea includes 1)Establishing a unified spatio-temporal message propagation framework on a DG via the tensor product for capturing the complex cohesive spatio-temporal interdependencies precisely and 2)Acquiring the alliance attention scores by node features and favorable high-order structural correlations. 展开更多
关键词 spatio temporal message propagation alliance attention scores high order structural correlations graph tensor alliance attention network gt t node features graph tensor dynamic graph alliance attention
在线阅读 下载PDF
Human Motion Prediction Based on Multi-Level Spatial and Temporal Cues Learning
6
作者 Jiayi Geng Yuxuan Wu +5 位作者 Wenbo Lu Pengxiang Su Amel Ksibi Wei Li Zaffar Ahmed Shaikh Di Gai 《Computers, Materials & Continua》 2025年第11期3689-3707,共19页
Predicting human motion based on historical motion sequences is a fundamental problem in computer vision,which is at the core of many applications.Existing approaches primarily focus on encoding spatial dependencies a... Predicting human motion based on historical motion sequences is a fundamental problem in computer vision,which is at the core of many applications.Existing approaches primarily focus on encoding spatial dependencies among human joints while ignoring the temporal cues and the complex relationships across non-consecutive frames.These limitations hinder the model’s ability to generate accurate predictions over longer time horizons and in scenarios with complex motion patterns.To address the above problems,we proposed a novel multi-level spatial and temporal learning model,which consists of a Cross Spatial Dependencies Encoding Module(CSM)and a Dynamic Temporal Connection Encoding Module(DTM).Specifically,the CSM is designed to capture complementary local and global spatial dependent information at both the joint level and the joint pair level.We further present DTM to encode diverse temporal evolution contexts and compress motion features to a deep level,enabling the model to capture both short-term and long-term dependencies efficiently.Extensive experiments conducted on the Human 3.6M and CMU Mocap datasets demonstrate that our model achieves state-of-the-art performance in both short-term and long-term predictions,outperforming existing methods by up to 20.3% in accuracy.Furthermore,ablation studies confirm the significant contributions of the CSM and DTM in enhancing prediction accuracy. 展开更多
关键词 Human motion prediction spatial dependencies learning temporal context learning graph convolutional networks transformer
在线阅读 下载PDF
A Spatio-Temporal Heterogeneity Data Accuracy Detection Method Fused by GCN and TCN
7
作者 Tao Liu Kejia Zhang +4 位作者 Jingsong Yin Yan Zhang Zihao Mu Chunsheng Li Yanan Hu 《Computer Systems Science & Engineering》 SCIE EI 2023年第11期2563-2582,共20页
Spatio-temporal heterogeneous data is the database for decisionmaking in many fields,and checking its accuracy can provide data support for making decisions.Due to the randomness,complexity,global and local correlatio... Spatio-temporal heterogeneous data is the database for decisionmaking in many fields,and checking its accuracy can provide data support for making decisions.Due to the randomness,complexity,global and local correlation of spatiotemporal heterogeneous data in the temporal and spatial dimensions,traditional detection methods can not guarantee both detection speed and accuracy.Therefore,this article proposes a method for detecting the accuracy of spatiotemporal heterogeneous data by fusing graph convolution and temporal convolution networks.Firstly,the geographic weighting function is introduced and improved to quantify the degree of association between nodes and calculate the weighted adjacency value to simplify the complex topology.Secondly,design spatiotemporal convolutional units based on graph convolutional neural networks and temporal convolutional networks to improve detection speed and accuracy.Finally,the proposed method is compared with three methods,ARIMA,T-GCN,and STGCN,in real scenarios to verify its effectiveness in terms of detection speed,detection accuracy and stability.The experimental results show that the RMSE,MAE,and MAPE of this method are the smallest in the cases of simple connectivity and complex connectivity degree,which are 13.82/12.08,2.77/2.41,and 16.70/14.73,respectively.Also,it detects the shortest time of 672.31/887.36,respectively.In addition,the evaluation results are the same under different time periods of processing and complex topology environment,which indicates that the detection accuracy of this method is the highest and has good research value and application prospects. 展开更多
关键词 spatiotemporal heterogeneity data data accuracy complex topology structure graph convolutional networks temporal convolutional networks
在线阅读 下载PDF
Video super-resolution reconstruction based on deep convolutional neural network and spatio-temporal similarity 被引量:1
8
作者 Li Linghui Du Junping +2 位作者 Liang Meiyu Ren Nan Fan Dan 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2016年第5期68-81,共14页
Existing learning-based super-resolution (SR) reconstruction algorithms are mainly designed for single image, which ignore the spatio-temporal relationship between video frames. Aiming at applying the advantages of ... Existing learning-based super-resolution (SR) reconstruction algorithms are mainly designed for single image, which ignore the spatio-temporal relationship between video frames. Aiming at applying the advantages of learning-based algorithms to video SR field, a novel video SR reconstruction algorithm based on deep convolutional neural network (CNN) and spatio-temporal similarity (STCNN-SR) was proposed in this paper. It is a deep learning method for video SR reconstruction, which considers not onlv the mapping relationship among associated low-resolution (LR) and high-resolution (HR) image blocks, but also the spatio-temporal non-local complementary and redundant information between adjacent low-resolution video frames. The reconstruction speed can be improved obviously with the pre-trained end-to-end reconstructed coefficients. Moreover, the performance of video SR will be further improved by the optimization process with spatio-temporal similarity. Experimental results demonstrated that the proposed algorithm achieves a competitive SR quality on both subjective and objective evaluations, when compared to other state-of-the-art algorithms. 展开更多
关键词 video SR reconstruction deep convolutional neural network spatio-temporal siruilarity Zernike moment feature
原文传递
交通预测中的时空图神经网络研究综述:从模型解构到发展路径
9
作者 贾兴利 曲远海 +3 位作者 朱浩然 杨宏志 姚慧 李孟晖 《交通运输工程学报》 北大核心 2026年第1期46-74,共29页
为厘清交通预测模型的发展路径,探索未来交通预测发展方向,通过系统化的文献分析方法确立了以时空图神经网络为主导的技术发展方向;基于时空图神经网络框架特征,构建了从数据预处理、动静态图构建、时空特征提取到特征融合的全流程分析... 为厘清交通预测模型的发展路径,探索未来交通预测发展方向,通过系统化的文献分析方法确立了以时空图神经网络为主导的技术发展方向;基于时空图神经网络框架特征,构建了从数据预处理、动静态图构建、时空特征提取到特征融合的全流程分析体系;系统梳理了典型交通预测任务及其对应的开源数据集;归纳了基于拓扑关系、距离特性、相似度计算等静态图构建方法,以及动态图直接优化与特征优化等前沿图构建技术;从时间与空间两大维度总结分析了当前较新的时间特征建模与空间特征建模方法,并通过Graph WaveNet与DCRNN两大典型案例阐释了时空特征融合机制;针对深层网络训练中的梯度异常和性能衰退问题,总结了通用信息传递的解决方案;探索了对比学习、预训练机制、因果推理、混合专家模型等新兴技术与交通预测的结合路径。研究结果表明:无论是中国还是国外,时空图神经网络在交通预测的应用研究已经逐渐白热化,其中中国在统计中以1 671篇的发文量占据榜首;现有研究主要聚焦于提高模型对于时空特征的记忆能力与构建最优图结构,而这类优化方案已进入模型性能提升与效率提高的平衡期;在时间建模方面,现有研究仍在寻找计算效率与运行性能的平衡点,而空间建模则成为现有模型效率提升的主要阻碍;根据对过去研究的总结梳理,未来的突破方向或将集中于新型预测场景的开拓、模型可解释能力的提升、现实物理约束的添加、新型学习策略的创新以及工业级部署方案的探索,为智慧交通系统建设提供更坚实的技术支撑。 展开更多
关键词 智能交通系统 交通时空预测 综述 时空图神经网络 时空建模 图结构
原文传递
面向交通流预测的全局-局部时空感知模型
10
作者 潘理虎 尹佳莉 +2 位作者 张睿 谢斌红 张林梁 《计算机工程》 北大核心 2026年第3期392-402,共11页
交通流预测方法是智能交通系统的重要基础,但现有方法在准确捕获交通数据的时空相关性上仍有不足。为挖掘道路网络的复杂时空相关性,提高预测性能,提出一种考虑全局-局部时空感知的时空图注意力网络模型GL-STAGGN。首先对输入数据进行... 交通流预测方法是智能交通系统的重要基础,但现有方法在准确捕获交通数据的时空相关性上仍有不足。为挖掘道路网络的复杂时空相关性,提高预测性能,提出一种考虑全局-局部时空感知的时空图注意力网络模型GL-STAGGN。首先对输入数据进行时空位置嵌入来表征交通流的时空异质性,以增强时空数据的特征表示,其次利用全局-局部时间感知的多头自注意力同步挖掘全局与局部空间范围内的时间动态相关性;然后引入图注意力网络和基于注意力机制的动态图卷积网络分别聚合局部节点特征和动态调整空间相关性强度,以深度捕捉全局与局部空间相关性的内在关联;最后采用编码器-解码器架构将时空组件融合以构成GL-STAGGN模型。在现实世界的高速公路交通数据集PEMS04和PEMS08上的实验结果表明,相比未考虑全局-局部时空关系和忽略空间异质性的先进方法DSTAGNN,GL-STAGGN的平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)平均降低了2.8%、2.3%和3.3%,优于大多数现有基线模型,可更好地为智能交通系统提供支持。 展开更多
关键词 交通流预测 时空相关性 编码器-解码器 注意力机制 动态图卷积网络
在线阅读 下载PDF
用于行人轨迹预测的多头注意力增强图网络
11
作者 张霄雁 张萌 +2 位作者 周宗润 孟祥福 方金凤 《计算机科学与探索》 北大核心 2026年第4期1134-1146,共13页
行人轨迹预测对自动驾驶与智能交通系统至关重要,其预测精度受到人类行为的高度随机性、动态交互性及多模态分布等因素的显著影响。为应对上述挑战,提出一种基于多头注意力增强图网络的行人轨迹预测框架,通过动态交互建模与多阶段优化... 行人轨迹预测对自动驾驶与智能交通系统至关重要,其预测精度受到人类行为的高度随机性、动态交互性及多模态分布等因素的显著影响。为应对上述挑战,提出一种基于多头注意力增强图网络的行人轨迹预测框架,通过动态交互建模与多阶段优化实现高精度预测。该方法以构建多关系时空图(MR-Graph)为基础,利用多头注意力机制(MHA)显式分离社交、运动与环境交互特征,从而提升了模型对复杂场景的建模能力。为进一步提高预测的多样性与合理性,设计了一种控制点驱动的高斯剪枝策略,通过混合密度网络生成多模态终点假设,并结合置信度动态剪枝机制,有效抑制了异常行为的影响。此外,轨迹优化被设计为“假设-引导-修正”三阶段轨迹优化机制,融合社交感知插值与时空修正向量场,实现了平滑且符合物理约束的高质量轨迹生成。基于ETH/UCY等公开数据集的实验结果表明,所提方法在建模复杂交互关系和生成符合社会规范的轨迹方面展现出明显优势,特别是在处理密集人群场景和突发行为预测时表现突出,为智能系统的安全决策提供了可靠的技术支持。 展开更多
关键词 多头注意力机制 控制点预测 多关系图卷积网络 轨迹优化 时空修正向量场
在线阅读 下载PDF
一种融合MSC和时空双重注意力的TCN航迹预测方法
12
作者 焦卫东 杨蓓 《北京航空航天大学学报》 北大核心 2026年第1期15-27,共13页
针对现有航迹预测模型难以有效提取多尺度时空特征,导致预测精度受限的问题,提出一种融合多尺度卷积(MSC)网络和时空双重注意力(STDA)的时间卷积网络(TCN)航迹预测方法MDAT-Net。MDAT-Net模型包含MSAT、MTAT航迹预测模块及投票模块。在... 针对现有航迹预测模型难以有效提取多尺度时空特征,导致预测精度受限的问题,提出一种融合多尺度卷积(MSC)网络和时空双重注意力(STDA)的时间卷积网络(TCN)航迹预测方法MDAT-Net。MDAT-Net模型包含MSAT、MTAT航迹预测模块及投票模块。在航迹预测模块中,为优化传统时间卷积网络中卷积核大小固定的问题,搭建由不同尺度卷积核组成的多尺度卷积架构,以更好地提取不同尺度的时空特征;为动态挖掘隐藏特征与目标特征之间的潜在相关性,引入空间注意力机制及时间注意力机制来自适应地关注重要信息,跳过次要信息。在投票模块中,决定各维度使用合适模块进行预测,以融合MSAT、MTAT航迹预测模块的优点,实现高精度的航迹预测。实验结果表明:MDAT-Net模型的均方根误差(RMSE)的改进率最高可达83.33%,平均绝对误差(MAE)的改进率最高可达85.85%,具有较高的准确性和鲁棒性。 展开更多
关键词 航迹预测 多尺度卷积 时间卷积网络 注意力机制 时空特征
原文传递
基于时空动态约束图反馈的交通流预测
13
作者 侯越 张鑫 武月 《吉林大学学报(工学版)》 北大核心 2026年第1期183-198,共16页
针对现有交通流预测研究中对路网节点隐藏空间关联时变特性考虑不充分的问题,提出了一种基于时空动态约束图反馈的交通流预测模型。首先,通过门控循环单元(GRU)提取时序特征,在STC-GCL组件内,利用时空图生成器和时空融合约束矩阵生成表... 针对现有交通流预测研究中对路网节点隐藏空间关联时变特性考虑不充分的问题,提出了一种基于时空动态约束图反馈的交通流预测模型。首先,通过门控循环单元(GRU)提取时序特征,在STC-GCL组件内,利用时空图生成器和时空融合约束矩阵生成表征当前时刻路网邻域关系的动态约束图,再利用多层图结构卷积操作实现空间特征提取。其次,利用多尺度门控卷积单元动态调整重要特征信息流,完成对关键特征的精细化筛选。最后,通过将STCGCL嵌入GRU的方式,实现时空特征的一致性提取。试验在高速路网PeMSD4、PeMSD8、成都-滴滴公开数据集上进行测试,结果表明:与当前主流交通流时空预测方法FGI相比,本文模型的MAE在3个数据集上分别降低了2.69%、1.88%、0.92%。 展开更多
关键词 交通流预测 时空性 动态性 图卷积神经网络
原文传递
基于深度学习的矿工不安全行为监测预警系统
14
作者 姚有利 王冲 +2 位作者 侯艳文 刘怡汝 戴智 《安全与环境学报》 北大核心 2026年第2期674-684,共11页
煤矿事故的根本原因在于作业人员的不安全行为。目前,在井下作业中,对不安全行为的检测仍以人工巡查为主,效率低下且漏检率高。现有研究大多聚焦于单一的不安全装束或行为识别,缺乏对多类不安全行为的综合性研究与实际应用。为此,设计... 煤矿事故的根本原因在于作业人员的不安全行为。目前,在井下作业中,对不安全行为的检测仍以人工巡查为主,效率低下且漏检率高。现有研究大多聚焦于单一的不安全装束或行为识别,缺乏对多类不安全行为的综合性研究与实际应用。为此,设计了一套基于深度学习的矿工不安全行为识别与预警系统。系统将不安全行为划分为静态不安全装束和动态不安全行为两类,并构建了贴合井下环境的专用数据集。静态装束识别部分采用YOLOv8n模型进行目标检测,动态行为识别部分借助OpenPose提取人体骨骼关键点,并结合时空图卷积网络(Spatial Temporal Graph Convolutional Networks,ST-GCN)网络实现高效识别。系统还集成可视化界面,支持实时预警反馈。该系统的研发不仅为煤矿安全生产提供了技术支撑,也为井下不安全行为研究提供了实践基础。 展开更多
关键词 安全工程 YOLOv8n OpenPose 时空图卷积网络 预警系统
原文传递
基于多尺度运动记忆模型的遥感云图预测方法
15
作者 张永宏 孙书林 +2 位作者 龚蒙 王俊飞 马光义 《计算机工程》 北大核心 2026年第3期128-140,共13页
针对现有深度学习模型难以捕获云团运动模式导致云图长期预测结果模糊、准确度低的问题,提出一种基于多尺度运动记忆模型(MSMM_Net)的遥感云图预测方法。该模型采用空间多尺度记忆流和运动差分记忆流相融合的双分支记忆流架构,分别提取... 针对现有深度学习模型难以捕获云团运动模式导致云图长期预测结果模糊、准确度低的问题,提出一种基于多尺度运动记忆模型(MSMM_Net)的遥感云图预测方法。该模型采用空间多尺度记忆流和运动差分记忆流相融合的双分支记忆流架构,分别提取输入图片序列隐含的高低频空间特征和序列运动特征,从而同时获得图片的全局信息、细节信息和运动信息,在预测阶段融合双分支记忆,缓解特征丢失问题并增强模型对云团运动轨迹的预测能力。在此基础上,使用像素损失和边缘损失相结合的融合损失函数指导模型的训练,强化模型对图片边缘细节的关注度,促使模型生成清晰的预测图片。实验结果表明,与基准模型PredRNN相比,MSMM_Net在Moving MNIST数据集上的均方误差(MSE)降低了31.71%,在可学习感知图像块相似性指标(LPIPS)上降低了64.7%,在遥感卫星云图数据集上,峰值信噪比(PSNR)和结构相似性指数(SSIM)指标分别提升了5.51%和5.38%,表明该模型生成的预测图片序列与真实图片序列更加相似,能够有效提升长期预测准确率。 展开更多
关键词 云图预测 时空序列预测 深度学习 循环卷积网络 遥感卫星
在线阅读 下载PDF
面向聚驱井组注采生产指标预测的时空图注意力网络模型研究
16
作者 张强 赵丝蕊 王晨雨 《重庆理工大学学报(自然科学)》 北大核心 2026年第2期160-167,共8页
针对传统聚驱井组注采生产指标预测方法难以捕捉复杂时空依赖关系的问题,提出一种时空图注意力网络的注采生产指标预测模型。该模型首先利用Transformer编码器提取油田生产数据的全局时序特征并将其转换为图结构;其次,采用改进的双通道... 针对传统聚驱井组注采生产指标预测方法难以捕捉复杂时空依赖关系的问题,提出一种时空图注意力网络的注采生产指标预测模型。该模型首先利用Transformer编码器提取油田生产数据的全局时序特征并将其转换为图结构;其次,采用改进的双通道图注意力网络从井网拓扑结构和生产参数相似性2个视角挖掘空间关联特征,通过融合两通道输出,实现对井网节点间复杂空间依赖关系的精准建模;接着,引入融合位置编码的残差连接,增强模型泛化能力;最后,通过交叉注意力机制实现时空特征深度融合并用于预测。选取某油田实际数据进行实验,该模型在产油量和含水率预测中的R2均超过0.90,显著优于对比方法,验证了其有效性和优越性,为聚驱生产指标预测提供了新思路。 展开更多
关键词 聚驱井组 生产指标 双通道图注意力网络 时空特征融合 预测
在线阅读 下载PDF
人体动作姿态识别方法研究综述
17
作者 梁本来 《信息记录材料》 2026年第1期18-20,26,共4页
人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适... 人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适应性和性能表现(准确性、实时性、鲁棒性等)等方面的特点,揭示了该技术领域面临的三维标注数据获取困难、复杂环境泛化能力不足及实时性与精度难以兼顾等核心挑战。针对未来发展趋势,本文探讨了轻量化模型设计、多模态融合、弱监督与自监督学习、三维时空建模、Transformer架构应用及领域自适应等关键研究方向,旨在为后续相关研究提供思路与借鉴。 展开更多
关键词 人体动作姿态识别 深度学习 计算机视觉 时空图卷积网络
在线阅读 下载PDF
TPA改进GCN⁃LSTM的光伏电站群调群控优化策略研究
18
作者 商立群 王硕 《电气传动》 2026年第3期52-60,共9页
随着光伏装机容量占比逐年提高,准确预测光伏出力,实现光伏群调群控至关重要。提出基于图卷积神经网络(GCN)、长短期记忆网络(LSTM)和时间模式注意力机制(TPA)集成深度融合的多站光伏出力预测方法。首先,以图结构形式转化多站光伏出力... 随着光伏装机容量占比逐年提高,准确预测光伏出力,实现光伏群调群控至关重要。提出基于图卷积神经网络(GCN)、长短期记忆网络(LSTM)和时间模式注意力机制(TPA)集成深度融合的多站光伏出力预测方法。首先,以图结构形式转化多站光伏出力时序曲线及数值天气预报数据的输入特征,建立GCN-LSTM模型,提取光伏集群间隐藏的时空依赖性。其次,引入时间模式注意力机制加权修正输入数据特征,提高关键数据价值。然后,设定反映集群内电压变化的节点为主导节点,基于光伏集群间时空预测结果,将灵敏反映集群电压变化的节点设定为主导节点,建立区域所有节点的电压在安全范围运行和最小系统网损为目标的群间协调优化策略。接着,根据协调优化策略结果构建群内节点电压在安全范围内稳定运行、最小化集群网损的自治优化调控策略,实现分布式光伏最大化就地消纳。最后,实际多站光伏集群出力数据的仿真结果表明,所提方法能够高效提取不同光伏电站间的时空关联性,降低光伏出力预测误差,有效提高光伏集群的安全性和经济性。 展开更多
关键词 光伏出力预测 图卷积神经网络 邻接矩阵自适应 时间模式注意力机制
在线阅读 下载PDF
融合时空图信息的配电网故障区段定位及可解释性分析方法
19
作者 刘畅宇 王小君 +3 位作者 张大海 刘曌 尚博阳 窦嘉铭 《电工技术学报》 北大核心 2026年第5期1623-1636,共14页
为提高复杂运行场景下配电网故障定位的准确性与可靠性,该提出一种融合时空图信息的配电网故障区段定位及可解释性分析方法。首先,依托配电网量测信息构建融合时间连续性与空间整体性的时空图结构数据,用于刻画时空特征与故障区段之间... 为提高复杂运行场景下配电网故障定位的准确性与可靠性,该提出一种融合时空图信息的配电网故障区段定位及可解释性分析方法。首先,依托配电网量测信息构建融合时间连续性与空间整体性的时空图结构数据,用于刻画时空特征与故障区段之间的映射关系;其次,从时-空两个维度提取故障特征,建立基于时空图信息的配电网故障区段定位模型;然后,设计可解释性分析模块,对模型决策依据及其内在工作机制进行事后可解释性分析,支撑故障定位结果的可靠性;最后,搭建典型配电系统仿真模型对所提方案进行验证。结果表明,与现有同类方法相比,所提方案具有定位精度高、鲁棒性强的优点,并在分布式电源波动、噪声干扰、数据缺失及拓扑重构场景下保持良好的泛化能力。 展开更多
关键词 配电网 故障定位 拓扑变化 时空图卷积网络 可解释性
在线阅读 下载PDF
用于行人轨迹预测的时空多图融合的稀疏图卷积网络
20
作者 习炎 王文格 +1 位作者 彭景阳 韩林慧 《计算机工程与应用》 北大核心 2026年第2期211-219,共9页
在机器人导航和自动驾驶等方面,行人轨迹预测具有重要的研究意义和应用价值。基于图卷积神经网络的轨迹预测方法可以更加直观地模拟行人之间的社会交互,但大多数模型对行人的时空交互定义并不准确。因此,提出了一种时空多图融合的稀疏... 在机器人导航和自动驾驶等方面,行人轨迹预测具有重要的研究意义和应用价值。基于图卷积神经网络的轨迹预测方法可以更加直观地模拟行人之间的社会交互,但大多数模型对行人的时空交互定义并不准确。因此,提出了一种时空多图融合的稀疏图卷积网络(spatial-temporal multi-graph fusion sparse graph convolutional network,STMGF-SGCN)用于行人轨迹预测。通过引入先验信息,总结出影响行人运动轨迹的三个因素:相对距离、相对速率、潜在冲突,并由此建立三个空间图结构。同时,模型融合了时间图以提高对运动趋势的捕捉能力,还采用非对称卷积操作以获取行人间非对称的时空交互信息;引用了稀疏的思想来减少模型建立和多图融合带来的冗余交互。实验结果表明,在公开行人轨迹数据集ETH和UCY上,相比于基线Social-STGCNN和SGCN,模型的平均位移误差(ADE)和最终位移误差(FDE)分别降低了18.2%、20%和2.7%、7.7%。 展开更多
关键词 行人轨迹预测 图卷积网络 多图融合 时空交互
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部