期刊文献+
共找到551篇文章
< 1 2 28 >
每页显示 20 50 100
Matching spatial relation graphs using a constrained partial permutation strategy
1
作者 徐晓刚 孙正兴 刘文印 《Journal of Southeast University(English Edition)》 EI CAS 2003年第3期236-239,共4页
A constrained partial permutation strategy is proposed for matching spatial relation graph (SRG), which is used in our sketch input and recognition system Smart Sketchpad for representing the spatial relationship amon... A constrained partial permutation strategy is proposed for matching spatial relation graph (SRG), which is used in our sketch input and recognition system Smart Sketchpad for representing the spatial relationship among the components of a graphic object. Using two kinds of matching constraints dynamically generated in the matching process, the proposed approach can prune most improper mappings between SRGs during the matching process. According to our theoretical analysis in this paper, the time complexity of our approach is O(n 2) in the best case, and O(n!) in the worst case, which occurs infrequently. The spatial complexity is always O(n) for all cases. Implemented in Smart Sketchpad, our proposed strategy is of good performance. 展开更多
关键词 spatial relation graph graph matching constrained partial permutation graphics recognition
在线阅读 下载PDF
Using BlazePose on Spatial Temporal Graph Convolutional Networks for Action Recognition 被引量:2
2
作者 Motasem S.Alsawadi El-Sayed M.El-kenawy Miguel Rio 《Computers, Materials & Continua》 SCIE EI 2023年第1期19-36,共18页
The ever-growing available visual data(i.e.,uploaded videos and pictures by internet users)has attracted the research community’s attention in the computer vision field.Therefore,finding efficient solutions to extrac... The ever-growing available visual data(i.e.,uploaded videos and pictures by internet users)has attracted the research community’s attention in the computer vision field.Therefore,finding efficient solutions to extract knowledge from these sources is imperative.Recently,the BlazePose system has been released for skeleton extraction from images oriented to mobile devices.With this skeleton graph representation in place,a Spatial-Temporal Graph Convolutional Network can be implemented to predict the action.We hypothesize that just by changing the skeleton input data for a different set of joints that offers more information about the action of interest,it is possible to increase the performance of the Spatial-Temporal Graph Convolutional Network for HAR tasks.Hence,in this study,we present the first implementation of the BlazePose skeleton topology upon this architecture for action recognition.Moreover,we propose the Enhanced-BlazePose topology that can achieve better results than its predecessor.Additionally,we propose different skeleton detection thresholds that can improve the accuracy performance even further.We reached a top-1 accuracy performance of 40.1%on the Kinetics dataset.For the NTU-RGB+D dataset,we achieved 87.59%and 92.1%accuracy for Cross-Subject and Cross-View evaluation criteria,respectively. 展开更多
关键词 Action recognition BlazePose graph neural network OpenPose SKELETON spatial temporal graph convolution network
在线阅读 下载PDF
Spatial geometric constraints histogram descriptors based on curvature mesh graph for 3D pollen particles recognition 被引量:1
3
作者 谢永华 徐赵飞 Hans Burkhardt 《Chinese Physics B》 SCIE EI CAS CSCD 2014年第6期123-130,共8页
This paper presents one novel spatial geometric constraints histogram descriptors (SGCHD) based on curvature mesh graph for automatic three-dimensional (3D) pollen particles recognition. In order to reduce high di... This paper presents one novel spatial geometric constraints histogram descriptors (SGCHD) based on curvature mesh graph for automatic three-dimensional (3D) pollen particles recognition. In order to reduce high dimensionality and noise disturbance arising from the abnormal record approach under microscopy, the separated surface curvature voxels are ex- tracted as primitive features to represent the original 3D pollen particles, which can also greatly reduce the computation time for later feature extraction process. Due to the good invariance to pollen rotation and scaling transformation, the spatial geometric constraints vectors are calculated to describe the spatial position correlations of the curvature voxels on the 3D curvature mesh graph. For exact similarity evaluation purpose, the bidirectional histogram algorithm is applied to the spatial geometric constraints vectors to obtain the statistical histogram descriptors with fixed dimensionality, which is invariant to the number and the starting position of the curvature voxels. Our experimental results compared with the traditional methods validate the argument that the presented descriptors are invariant to different pollen particles geometric transformations (such as posing change and spatial rotation), and high recognition precision and speed can be obtained simultaneously. 展开更多
关键词 pollen recognition curvature mesh graph spatial geometric constraints bidirectional histogram
原文传递
Skeleton Split Strategies for Spatial Temporal Graph Convolution Networks
4
作者 Motasem S.Alsawadi Miguel Rio 《Computers, Materials & Continua》 SCIE EI 2022年第6期4643-4658,共16页
Action recognition has been recognized as an activity in which individuals’behaviour can be observed.Assembling profiles of regular activities such as activities of daily living can support identifying trends in the ... Action recognition has been recognized as an activity in which individuals’behaviour can be observed.Assembling profiles of regular activities such as activities of daily living can support identifying trends in the data during critical events.A skeleton representation of the human body has been proven to be effective for this task.The skeletons are presented in graphs form-like.However,the topology of a graph is not structured like Euclideanbased data.Therefore,a new set of methods to perform the convolution operation upon the skeleton graph is proposed.Our proposal is based on the Spatial Temporal-Graph Convolutional Network(ST-GCN)framework.In this study,we proposed an improved set of label mapping methods for the ST-GCN framework.We introduce three split techniques(full distance split,connection split,and index split)as an alternative approach for the convolution operation.The experiments presented in this study have been trained using two benchmark datasets:NTU-RGB+D and Kinetics to evaluate the performance.Our results indicate that our split techniques outperform the previous partition strategies and aremore stable during training without using the edge importance weighting additional training parameter.Therefore,our proposal can provide a more realistic solution for real-time applications centred on daily living recognition systems activities for indoor environments. 展开更多
关键词 Skeleton split strategies spatial temporal graph convolutional neural networks skeleton joints action recognition
在线阅读 下载PDF
Travel Attractions Recommendation with Travel Spatial-Temporal Knowledge Graphs 被引量:1
5
作者 Weitao Zhang Tianlong Gu +3 位作者 Wenping Sun Yochum Phatpicha Liang Chang Chenzhong Bin 《国际计算机前沿大会会议论文集》 2018年第2期19-19,共1页
关键词 spatial-temporal KNOWLEDGE graph RECOMMENDATION systemNetwork representation learning
在线阅读 下载PDF
基于深度学习的矿工不安全行为监测预警系统
6
作者 姚有利 王冲 +2 位作者 侯艳文 刘怡汝 戴智 《安全与环境学报》 北大核心 2026年第2期674-684,共11页
煤矿事故的根本原因在于作业人员的不安全行为。目前,在井下作业中,对不安全行为的检测仍以人工巡查为主,效率低下且漏检率高。现有研究大多聚焦于单一的不安全装束或行为识别,缺乏对多类不安全行为的综合性研究与实际应用。为此,设计... 煤矿事故的根本原因在于作业人员的不安全行为。目前,在井下作业中,对不安全行为的检测仍以人工巡查为主,效率低下且漏检率高。现有研究大多聚焦于单一的不安全装束或行为识别,缺乏对多类不安全行为的综合性研究与实际应用。为此,设计了一套基于深度学习的矿工不安全行为识别与预警系统。系统将不安全行为划分为静态不安全装束和动态不安全行为两类,并构建了贴合井下环境的专用数据集。静态装束识别部分采用YOLOv8n模型进行目标检测,动态行为识别部分借助OpenPose提取人体骨骼关键点,并结合时空图卷积网络(Spatial Temporal Graph Convolutional Networks,ST-GCN)网络实现高效识别。系统还集成可视化界面,支持实时预警反馈。该系统的研发不仅为煤矿安全生产提供了技术支撑,也为井下不安全行为研究提供了实践基础。 展开更多
关键词 安全工程 YOLOv8n OpenPose 时空图卷积网络 预警系统
原文传递
智能地图制图思维结构与典型路径
7
作者 任福 盛兆阳 +6 位作者 张琛 朱睿 杜清运 张浡聪 彭博 陈雨杭 黄丽娜 《时空信息学报》 2026年第1期13-23,共11页
以人工智能背景下的地图制图为切入点,系统阐释智能地图制图的思维结构并归纳其典型发展路径。总结人类智能与机器智能在地图设计与编绘、地图阅读及使用中的应用;构建对象维、认知维、ICT维的地图制图思维三维“立方体”结构,从本体论... 以人工智能背景下的地图制图为切入点,系统阐释智能地图制图的思维结构并归纳其典型发展路径。总结人类智能与机器智能在地图设计与编绘、地图阅读及使用中的应用;构建对象维、认知维、ICT维的地图制图思维三维“立方体”结构,从本体论、认识论与方法论层面揭示智能制图的理论内核。进一步地,归纳智能制图四个典型路径,具体而言:与新媒体算法深度融合,实现个性化、场景化的地图生成与服务;构建并夯实垂直领域知识图谱,驱动地图从信息载体向知识引擎转变;广泛嫁接自动驾驶、低空经济等技术链,形成开放多元的地图生态;研制具备认知与决策能力的制图智能体,实现制图与读图的自我学习和提升。研究可为理解和发展智能时代的地图制图方法提供理论视角与实践指引。 展开更多
关键词 智能制图 空间思维 知识图谱 地图智能体
在线阅读 下载PDF
基于LGSA-HFFNet的多尺度特征融合点云配准算法
8
作者 于智龙 高东浦 +2 位作者 黄成 齐丽华 张彪 《仪器仪表学报》 北大核心 2026年第1期353-365,共13页
为了解决基于点云配准的阀门位姿估计工作中点云背景复杂、部分特征被遮挡缺失、噪声干扰等问题,提出了一种轻量化图-空间注意力机制的多尺度特征融合点云配准网络(LGSA-HFFNet)点云配准算法。该方法设计并使用多尺度并行卷积特征提取层... 为了解决基于点云配准的阀门位姿估计工作中点云背景复杂、部分特征被遮挡缺失、噪声干扰等问题,提出了一种轻量化图-空间注意力机制的多尺度特征融合点云配准网络(LGSA-HFFNet)点云配准算法。该方法设计并使用多尺度并行卷积特征提取层,强化模型特征提取,避免模型训练中梯度爆炸问题并加速收敛;其次,设计结合图注意力与空间注意力机制并进行轻量化改进的轻量化图-空间注意力机制(LGSA)模块,解决由点云信息特征的无序性造成的神经网络特征提取困难的问题,使模型能够有效提取点云局部特征;最后,使用设计位姿估计实验验证系统,将模型在实际阀门位姿估计工作中进行实机部署实验。实验结果表明,LGSA-HFFNet算法在阀门点云配准实验中平均相对平移误差低至0.05 m,对旋转误差低至0.984°,且具有良好的鲁棒性,在复杂背景下平移及旋转配准性能仅下降2%、7.5%,配准耗时相较于迭代最近点(ICP)降低80.32%,配准性能远优于ICP和半正定随机化抽样一致(SDRSAC)等传统算法;在ModelNet40对比实验中的旋转、平移误差降低至2.293°和0.006 m,配准旋转误差达到比较先进的水平,平移误差较现有模型有较大优势;在噪声干扰较大的真实场景阀门位姿估计数据集实验中误差降低至2.1757°和0.036 m,相较于现有模型误差至少降低28.98%和17.81%。 展开更多
关键词 点云配准 图注意力 空间注意力 特征融合 轻量化网络
原文传递
结合空间多层图卷积和时序分段Transformer的分心驾驶识别方法
9
作者 葛慧敏 欧阳宁 吴沛桐 《计算机工程与应用》 北大核心 2026年第4期152-167,共16页
识别分心驾驶行为是提升驾驶安全性的重要手段之一。目前基于图卷积的骨架动作识别方法采用单一的骨架图结构而忽略了关节点间的多种交互关系,且对骨架序列局部及全局时间特征提取能力不足。针对上述问题,提出一种结合空间多层图卷积和... 识别分心驾驶行为是提升驾驶安全性的重要手段之一。目前基于图卷积的骨架动作识别方法采用单一的骨架图结构而忽略了关节点间的多种交互关系,且对骨架序列局部及全局时间特征提取能力不足。针对上述问题,提出一种结合空间多层图卷积和时序分段Transformer的分心驾驶识别模型。在空间建模方面,通过多种索引方式构建包含多种空间关系的驾驶员关节点的多层图结构,并引入图注意力机制动态调整图结构中边的连接强度,利用层内与层间图卷积操作提取与融合空间特征。在时间建模方面,对时间序列进行分段处理,并使用Transformer来有效捕捉分段时间的局部特征及跨时段的全局特征。最终在Drive&Act、DAD数据集上对模型进行了性能验证,结果表明,模型相较于现有方法进一步提高了分心驾驶行为识别的准确率。 展开更多
关键词 智能交通 分心驾驶 基于骨架的动作识别 时序Transformer 空间多层图
在线阅读 下载PDF
建筑智能:众脑、同驱、共存
10
作者 袁烽 徐艺蕾 何政承 《当代建筑》 2026年第1期39-45,共7页
在算法、数据与机器人构成的“看不见的基础设施”背景下,建筑设计正从生成单一对象,转向重组人、技、物的关系。生成式人工智能的扩散一方面放大了形式的生产能力,另一方面又加剧了语义失配与知识断裂等问题。为回应这一痛点,本文提出... 在算法、数据与机器人构成的“看不见的基础设施”背景下,建筑设计正从生成单一对象,转向重组人、技、物的关系。生成式人工智能的扩散一方面放大了形式的生产能力,另一方面又加剧了语义失配与知识断裂等问题。为回应这一痛点,本文提出了“众脑、同驱、共存”的建筑智能框架:以空间语义信息模型(SSIM)与建筑知识图谱重构共享认知场,使人类、模型与机器人在同一语义与知识基面上协同;通过FUSense、FUGenerator、FURobot等平台,将感知、生成与建造编织为可追踪的流程闭环;借“过街亭”“数字江海”与威尼斯建筑双年展“共创生”等实践,检验建筑智能在城市基础设施更新、在地材料再生产及具身智能训练中的共存机制。建筑智能的关键不在于单一算法性能,而在于以空间为媒介,设计多样智能与物质世界的协同规则,从而为数字时代的建筑学提供一种面向生产方式与生活世界的重构路径。 展开更多
关键词 建筑智能 空间语义信息模型 建筑知识图谱 智能建构
在线阅读 下载PDF
基于图注意力交互的行人轨迹预测方法
11
作者 刘宏鉴 邹丹平 李萍 《计算机科学》 北大核心 2026年第1期97-103,共7页
行人轨迹预测在自动驾驶领域和智慧交通领域均取得了显著的研究进展。由于行人的行为受到自身和环境因素的双重影响,其轨迹具有不确定性和复杂性,因此准确利用轨迹数据的交互特征生成多模态轨迹仍存在较大挑战。目前,该领域中的主要挑... 行人轨迹预测在自动驾驶领域和智慧交通领域均取得了显著的研究进展。由于行人的行为受到自身和环境因素的双重影响,其轨迹具有不确定性和复杂性,因此准确利用轨迹数据的交互特征生成多模态轨迹仍存在较大挑战。目前,该领域中的主要挑战是准确建模行人之间的时空交互。面对复杂的行人时空交互,提出了一种基于图注意力的时空图神经网络,其量化表示行人之间的空间交互并重点关注关键交互,从而将行人轨迹信息表示为有向时空图,利用图注意力机制提取空间位置特征和交互特征,同时结合自注意力机制在时间维度提取时间特征并融合时空特征信息,最后生成结合历史轨迹和交互信息的多模态未来轨迹。在ETH-UCY数据集上的实验表明,与最佳基线模型相比,所提出的方法在平均位移误差(ADE)和最终位移误差(FDE)方面分别降低3.4%和2.1%,并具有较短的推理时间,确保实现实时推理响应。可视化的结果表明,所提出的方法能够生成具有可接受性的未来行人轨迹,展现了良好的工程应用前景。 展开更多
关键词 轨迹预测 时空图 图神经网络 图注意力 时空交互
在线阅读 下载PDF
基于多模态特征自适应融合与空间关系图网络表达的城市土地利用精细分类方法
12
作者 陈杰 许天一 +4 位作者 张俊 郭亚 李会婷 朱晶茹 赵军 《时空信息学报》 2026年第1期53-67,共15页
土地利用精细分类是支撑城市国土空间规划监管、土地资源优化配置与动态监测的关键。现有研究在面临高密度建成区和功能混合区等地物边界模糊、过渡带语义混淆与斑块尺度较小等情形时,主要采取多源融合策略进行像素级分类,易受时相差异... 土地利用精细分类是支撑城市国土空间规划监管、土地资源优化配置与动态监测的关键。现有研究在面临高密度建成区和功能混合区等地物边界模糊、过渡带语义混淆与斑块尺度较小等情形时,主要采取多源融合策略进行像素级分类,易受时相差异、传感器特性及数据质量不一致等因素干扰,且难以兼顾分类稳定性与空间结构完整性。因此,提出一种基于多模态特征自适应融合与空间关系图网络表达的城市土地利用精细分类方法。引入多时相自编码器进行基于对比学习的时空表征;设计由瓶颈注意力机制与多层感知器构成的自适应融合模块,整合光学影像、SAR数据与关注点等多源信息,提升跨模态语义一致性;进而,基于超像素构建超像素–邻域图结构,并在图神经网络中显式建模空间邻接关系与边界连续性约束。以深圳市为研究案例,结果表明,所提方法在复杂城市场景下优于HRNet、Paraformer等已有先进主流模型,总体精度、Kappa系数结果分别达到90.9%、86.8%,尤其在小斑块保留、过渡带识别及边界连续性等方面具有优势。 展开更多
关键词 多模态 特征融合 空间关系 图神经网络 土地利用分类
在线阅读 下载PDF
基于多步态特征自适应融合的情绪识别
13
作者 付碧超 盛捷 王雷 《计算机工程》 北大核心 2026年第4期82-89,共8页
现有的多数步态情绪识别方法对特征融合研究不够深入,未能充分利用步态的多种特征,导致性能不佳。为此,提出一种基于多步态特征自适应融合的情绪识别方法。首先从步态数据中提取时空特征、重构特征以及基于心理学的情感特征,时空特征捕... 现有的多数步态情绪识别方法对特征融合研究不够深入,未能充分利用步态的多种特征,导致性能不佳。为此,提出一种基于多步态特征自适应融合的情绪识别方法。首先从步态数据中提取时空特征、重构特征以及基于心理学的情感特征,时空特征捕捉步态模式的动态变化,重构特征关注步态的结构性信息,而基于心理学的情感特征则提供个体情感状态的洞察;其次对3个步态特征进行自适应融合,动态权衡3种步态特征的重要性,实现更全面的情感状态表征;最后在包含4类情绪的数据集上进行十折交叉验证,模型在真实的Emotion-Gait数据集上进行训练和测试。实验结果表明,与现有最先进的TAEW方法相比,该模型在多标签分类任务上的均值平均精度(mAP)指标提升了2百分点;与STEP方法相比,在多类别分类任务上的Accuracy指标提升了1.88百分点。该方法能够有效利用行人步态的时空特征、重构特征以及基于心理学的情感特征,提供了一种鲁棒且准确的情绪识别方法。 展开更多
关键词 情绪识别 步态特征 时空图卷积神经网络 自编码器 自适应融合
在线阅读 下载PDF
用于行人轨迹预测的时空多图融合的稀疏图卷积网络
14
作者 习炎 王文格 +1 位作者 彭景阳 韩林慧 《计算机工程与应用》 北大核心 2026年第2期211-219,共9页
在机器人导航和自动驾驶等方面,行人轨迹预测具有重要的研究意义和应用价值。基于图卷积神经网络的轨迹预测方法可以更加直观地模拟行人之间的社会交互,但大多数模型对行人的时空交互定义并不准确。因此,提出了一种时空多图融合的稀疏... 在机器人导航和自动驾驶等方面,行人轨迹预测具有重要的研究意义和应用价值。基于图卷积神经网络的轨迹预测方法可以更加直观地模拟行人之间的社会交互,但大多数模型对行人的时空交互定义并不准确。因此,提出了一种时空多图融合的稀疏图卷积网络(spatial-temporal multi-graph fusion sparse graph convolutional network,STMGF-SGCN)用于行人轨迹预测。通过引入先验信息,总结出影响行人运动轨迹的三个因素:相对距离、相对速率、潜在冲突,并由此建立三个空间图结构。同时,模型融合了时间图以提高对运动趋势的捕捉能力,还采用非对称卷积操作以获取行人间非对称的时空交互信息;引用了稀疏的思想来减少模型建立和多图融合带来的冗余交互。实验结果表明,在公开行人轨迹数据集ETH和UCY上,相比于基线Social-STGCNN和SGCN,模型的平均位移误差(ADE)和最终位移误差(FDE)分别降低了18.2%、20%和2.7%、7.7%。 展开更多
关键词 行人轨迹预测 图卷积网络 多图融合 时空交互
在线阅读 下载PDF
融合欧氏空间邻近与拓扑邻接信息预训练模型的路网网格模式
15
作者 禹文豪 曾子怡 +1 位作者 张一帆 钱海忠 《测绘学报》 北大核心 2026年第3期415-424,共10页
路网网格模式识别是地图学与地理空间信息领域的经典问题,广泛应用于地图综合、空间认知、矢量数据更新等任务中。对路网模式特征的提取与分析,是反映城市景观特征以及实现智能化地图操作的关键步骤。然而现有方法面临两大挑战:一是依... 路网网格模式识别是地图学与地理空间信息领域的经典问题,广泛应用于地图综合、空间认知、矢量数据更新等任务中。对路网模式特征的提取与分析,是反映城市景观特征以及实现智能化地图操作的关键步骤。然而现有方法面临两大挑战:一是依赖大量高质量标注数据,二是对路网空间-拓扑信息的表征不够完整。路网作为典型的非结构化图数据,难以直接应用为规则栅格数据设计的预训练方法。为解决上述问题,本文提出一种融合欧氏空间邻近与拓扑邻接信息的自监督预训练模型。在方法上,一方面通过图卷积核网络对局部路径结构进行编码,增强拓扑感知能力;另一方面设计空间注意力偏置机制,将欧氏距离信息融入图节点表示,实现双重空间信息的有效融合,从而更好地捕捉道路网络的特征。在学习范式上,采用预训练策略,仅利用无标注路网数据学习通用表征,降低对标注数据的依赖。在公开城市路网数据集上的试验结果表明,本文模型在路网模式分类任务中取得显著优势:准确率达到88.03%,相比最优基线方法(CRHD)提升2.29个百分点;精确率、召回率分别达到88.89%和87.47%,分别提升3.19、1.57个百分点;F_(1)值为0.8780,提升了0.0209。本文验证了融合架构与预训练策略的有效性,本文模型可学习到更具泛化性的路网内在表征,为下游任务提供基础模型支持。 展开更多
关键词 路网模式 空间认知 地图分析 图预训练 图结构学习
在线阅读 下载PDF
基于YUV颜色空间和图卷积残差网络的图像去模糊算法
16
作者 张萌 郭一娜 +1 位作者 王海东 上官宏 《控制理论与应用》 北大核心 2026年第3期691-696,共6页
图像去模糊需要在保留空间细节的同时确保高层次的上下文信息的平衡.针对模糊图像中的空间结构破坏,上下文信息扭曲以及RGB图像中的通道间强相关性造成的颜色不平衡等问题,本文提出一种基于YUV颜色空间和图卷积网络(GCN)的图像去模糊算... 图像去模糊需要在保留空间细节的同时确保高层次的上下文信息的平衡.针对模糊图像中的空间结构破坏,上下文信息扭曲以及RGB图像中的通道间强相关性造成的颜色不平衡等问题,本文提出一种基于YUV颜色空间和图卷积网络(GCN)的图像去模糊算法(YUVGCR).首先,设计了用于图像去模糊的YUV与RGB颜色空间转换算法,以解决RGB通道间强相关性的问题.然后,利用GCN可以将特征图转换为预生成图的顶点,对特征图进行图卷积,从而合成构建图结构的数据.通过这样做,可以隐式地将图拉普拉斯正则化应用于特征图,使其更加结构化.实验表明,YUVGCR的峰值信噪比(PSNR)为36.21 dB,比先进算法提高了2.93 d B.可视化去模糊结果可以看出,YUVGCR能产生更清晰的边缘和细节,图像去模糊的整体性能获得较大提升. 展开更多
关键词 图像去模糊 空间结构 YUV颜色空间 图卷积网络(GCN) 图结构 深度学习
在线阅读 下载PDF
非空间配准的多模态目标检测决策融合策略
17
作者 张荣 姚亮 +3 位作者 张奕欣 王翌骏 张传一 刘凡 《中国图象图形学报》 北大核心 2026年第2期541-555,共15页
目的 多模态目标检测通过融合红外与可见光等多源传感器数据,有效提升了模型在复杂环境下的检测精度与鲁棒性。然而,现有方法普遍基于严格配准的多模态数据开展研究,不能直接适配实际应用中不同模态相机得到的非空间配准图像,在图像输... 目的 多模态目标检测通过融合红外与可见光等多源传感器数据,有效提升了模型在复杂环境下的检测精度与鲁棒性。然而,现有方法普遍基于严格配准的多模态数据开展研究,不能直接适配实际应用中不同模态相机得到的非空间配准图像,在图像输入算法前仍需完成配准,这损失了实时性和灵活性。为此,提出一种非空间配准条件下的多模态目标检测任务,并设计了一种非空间配准的多模态目标检测决策融合方法。在数据层面,利用3种公共数据集模拟双光载荷拍摄得到的非空间配准图像对,在不引入额外标注成本的前提下,为新的任务提供了基准数据。在算法层面,设计了一种基于图结构的非空间配准决策融合方法。方法 首先,根据不同模态检测器的检测结果构建带权有向图,实现不同模态目标的图结构化表示;接着,利用图结构中目标间的相对位置关系,实现跨模态目标的自适应匹配;最终,对匹配成功的目标进行决策融合,并设计了模态迁移策略以实现多模态信息的高效互补。结果 在3个数据集上的实验结果表明,本文方法在非空间配准场景下较单模态检测器实现了最大10.03%的漏检率降幅。同时,该方法在配准数据集上同样适用,相较于多光谱行人检测Transformer(multi spectral pedestrian detection Transformer,MS-DETR)、动态自适应多光谱检测Transformer(dynamic adaptive multispectral detection Transformer,DAMSDet)等先进多模态目标检测方法,检测准确率提升了6.8%。结论 本文所提出的非空间配准多模态目标检测决策融合方法,能够很好地适应存在空间差异的实际场景,并且相比其他先进的多模态目标检测模型,有更高的准确率和鲁棒性。相关的代码与数据集将在此仓库公开:https://github.com/1e12Leon/ProbDet。 展开更多
关键词 目标检测 多模态目标检测 有向图 决策融合 非空间配准
原文传递
基于图卷积自编码器的道路网相似度计算方法
18
作者 苏峰山 禄小敏 +1 位作者 叶云会 李静 《武汉大学学报(信息科学版)》 北大核心 2026年第2期391-402,共12页
道路网空间相似关系计算在空间数据匹配与查询、空间数据多尺度表达与评价及地图综合质量评价等领域均有广泛应用。现有方法存在对空间信息利用不足且特征因子权重设定过于主观等问题,因此引入图卷积自编码器,通过自监督训练尽可能实现... 道路网空间相似关系计算在空间数据匹配与查询、空间数据多尺度表达与评价及地图综合质量评价等领域均有广泛应用。现有方法存在对空间信息利用不足且特征因子权重设定过于主观等问题,因此引入图卷积自编码器,通过自监督训练尽可能实现原始输入图的重构,克服传统方法局限,进一步提升相似度计算的准确性。基于图卷积自编码器的道路网相似度计算方法,首先进行道路网图建模及节点特征提取,通过交点转边、边转节点的方式建立道路网的对偶图,在此基础上遵循结构的整体与部分关系原则,从全局、局部及连接特征3个方面将道路网空间特征信息赋予对偶图节点,获取道路网图结构的定量化表达;然后进行图自编码器学习,利用图卷积自编码器对道路网图的节点特征和结构信息进行聚合与更新,形成对道路网的深度认知,进而获取道路网空间信息的特征编码,实现道路网结构的量化表征;最后计算道路网相似度,通过平均池化将复杂的高维度特征空间映射至低维易度量空间,生成一组特征向量,并采用余弦相似度计算其相似性。试验结果表明,所提模型输出的相似度具有较高的敏感性与一致性,与道路网实际变化情况吻合度较好,且其评价结果与人类的空间认知规律较为吻合。 展开更多
关键词 道路网 空间相似性 图卷积自编码器 地图综合
原文传递
LSFormer:用于交通流预测的负载量感知空间异质性变换器
19
作者 李轩 李艳红 +2 位作者 徐昊翔 黄健翔 陈亮亮 《中南民族大学学报(自然科学版)》 2026年第1期86-96,共11页
高精度的交通流预测可以有效缓解智能城市道路的拥堵压力.然而,交通流预测面临着如何有效揭示交通流数据中隐藏的时空依赖关系的挑战.目前大多数方法都是基于图神经网络(GNN)或变压器模型.前者只考虑短程空间信息,无法捕捉长程空间依赖... 高精度的交通流预测可以有效缓解智能城市道路的拥堵压力.然而,交通流预测面临着如何有效揭示交通流数据中隐藏的时空依赖关系的挑战.目前大多数方法都是基于图神经网络(GNN)或变压器模型.前者只考虑短程空间信息,无法捕捉长程空间依赖关系,而后者虽然能够捕捉长程依赖关系,但大多数研究都没有充分挖掘变压器架构的潜力.为此,提出了一种用于交通流预测的新型负载感知空间异质性变换器,即LSFormer.具体来说,为空间自注意力模块设计了相对位置编码以优化空间位置信息感知问题,使模型能更好地捕捉位置信息.然后,引入了负载感知模块,以突出周边交通流对中心点的影响,解决了现有方法对周边区域依赖关系建模不足的问题.在5个真实世界公共交通数据集上的广泛实验结果表明:文中所提模型可以达到先进的性能.此外,还将学习到的空间嵌入可视化,使模型具有可解释性. 展开更多
关键词 交通流预测 时空特征 变换器 图神经网络
在线阅读 下载PDF
基于Oracle Spatial的SVG发布的研究与实现
20
作者 范磬亚 刘利 徐汀荣 《计算机应用与软件》 CSCD 北大核心 2008年第2期126-128,共3页
SVG是一种描述二维图形的语言,其众多的优点受到WebGIS界的广泛关注,然而如何利用空间数据管理引擎来动态发布该格式的图形一直没有得到解决。提出了在Oracle Spatial上发布SVG的解决方案,详细介绍了特殊空间数据对象坐标转换、SDO_GEOM... SVG是一种描述二维图形的语言,其众多的优点受到WebGIS界的广泛关注,然而如何利用空间数据管理引擎来动态发布该格式的图形一直没有得到解决。提出了在Oracle Spatial上发布SVG的解决方案,详细介绍了特殊空间数据对象坐标转换、SDO_GEOMETRY与SVG的对应关系及转换思路、投影坐标与屏幕坐标之间的变换等关键技术。 展开更多
关键词 WEBGIS 矢量图形 SVG ORACLE spatial SDO_GEOMETRY
在线阅读 下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部