期刊文献+
共找到286篇文章
< 1 2 15 >
每页显示 20 50 100
基于运动平均的无地图视觉定位方法
1
作者 刘锦江 欧阳奇 谭文洲 《计算机工程与应用》 北大核心 2026年第5期326-335,共10页
针对基于结构的视觉定位方法中预构建点云地图耗时且受重建误差影响的问题,提出了一种无地图的视觉定位方法,直接从查询图像与数据库图像的匹配对中预测位姿,并利用运动平均对多个预测位姿进行融合优化。结合极线几何误差加权匹配点迭... 针对基于结构的视觉定位方法中预构建点云地图耗时且受重建误差影响的问题,提出了一种无地图的视觉定位方法,直接从查询图像与数据库图像的匹配对中预测位姿,并利用运动平均对多个预测位姿进行融合优化。结合极线几何误差加权匹配点迭代估计基础矩阵;根据基础矩阵和数据库图像位姿计算预测位姿,在李代数空间内采用L1和L2混合优化算法对旋转预测进行平均;在旋转一致性较高的内点上,通过最小化相机中心角度误差的优化平移预测。实验结果表明,该方法能够达到与主流方法接近的精度,并且在室内场景中表现最好。在实际的BishanHall场景中,平均旋转和重投影误差高出同配置对比方法0.02°和1.172 pixel,运行时间缩短约0.442 s,省去预构建点云地图减少约38%的存储空间。 展开更多
关键词 视觉定位 无地图定位 多视图几何 基础矩阵估计 运动平均
在线阅读 下载PDF
基于潜在表示和图学习的无监督特征选择
2
作者 宿熙隆 谢锡炯 《计算机工程与设计》 北大核心 2026年第1期10-18,共9页
为解决多视图无监督特征选择在处理高维数据时面临噪声样本和特征干扰、数据样本互连信息利用不充分等问题,提出了一种基于潜在表示和图学习的鲁棒多视图无监督特征选择方法。通过构建融合多视图信息的低秩共识图以抑制噪声;通过核范数... 为解决多视图无监督特征选择在处理高维数据时面临噪声样本和特征干扰、数据样本互连信息利用不充分等问题,提出了一种基于潜在表示和图学习的鲁棒多视图无监督特征选择方法。通过构建融合多视图信息的低秩共识图以抑制噪声;通过核范数约束捕捉跨视图共性特征;将潜在表示学习嵌入特征选择框架,利用低秩图约束潜在空间的局部结构保持能力;并且设计联合优化模型以实现图学习、潜在表示与特征选择的多任务协同优化。实验结果表明,提出的方法在ACC和NMI上均优于实验对比方法。 展开更多
关键词 跨视图局部性 低秩 共识图 潜在表示学习 图学习 多视图 无监督特征选择
在线阅读 下载PDF
面向动态目标剔除的三维地图构建方法研究
3
作者 马孟星 贾晨 +3 位作者 唐嘉宁 王翠 余婷 王兴 《重庆理工大学学报(自然科学)》 北大核心 2026年第2期175-183,共9页
动态场景中,传统的以静态环境为前提的SLAM算法因动态目标遮挡关键特征易导致数据错误关联,使得智能系统降低了对环境的感知。针对该问题,通过在ORB-SLAM2系统中集成Mask R-CNN的动态掩膜剔除机制,增设动态目标剔除损失分支,并结合多视... 动态场景中,传统的以静态环境为前提的SLAM算法因动态目标遮挡关键特征易导致数据错误关联,使得智能系统降低了对环境的感知。针对该问题,通过在ORB-SLAM2系统中集成Mask R-CNN的动态掩膜剔除机制,增设动态目标剔除损失分支,并结合多视角几何一致性判断实现对动态目标的精准识别与剔除。实验结果表明:基于TUM RGB-D数据集进行动态序列测试,在轨迹估计方面的系统性能相比于原始系统显著提升,特征匹配的帧数增加24.3%,轨迹漂移误差下降41.5%,同真实轨迹的运行时间接近程度提升24.1%,有效提升系统估计精度的同时成功构建无动态目标干扰的三维地图;与YOLO-SLAM、DS-SLAM等主流方法对比,所提出方法在鲁棒性和动态目标剔除方面的性能均有提升,展现出良好的实用价值与应用前景。 展开更多
关键词 同步定位与建图 动态目标剔除 Mask R-CNN网络 多视角几何信息
在线阅读 下载PDF
Adaptive luminance adjustment and neighborhood spreading strength information based view synthesis
4
作者 Zhizhong Fu Xue Wang +2 位作者 Yuan Li Xiaohui Yang Jin Xu 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第3期721-729,共9页
View synthesis is an important building block in three dimension(3D) video processing and communications.Based on one or several views,view synthesis creates other views for the purpose of view prediction(for compr... View synthesis is an important building block in three dimension(3D) video processing and communications.Based on one or several views,view synthesis creates other views for the purpose of view prediction(for compression) or view rendering(for multiview-display).The quality of view synthesis depends on how one fills the occlusion area as well as how the pixels are created.Consequently,luminance adjustment and hole filling are two key issues in view synthesis.In this paper,two views are used to produce an arbitrary virtual synthesized view.One view is merged into another view using a local luminance adjustment method,based on local neighborhood region for the calculation of adjustment coefficient.Moreover,a maximum neighborhood spreading strength hole filling method is presented to deal with the micro texture structure when the hole is being filled.For each pixel at the hole boundary,its neighborhood pixels with the maximum spreading strength direction are selected as candidates;and among them,the pixel with the maximum spreading strength is used to fill the hole from boundary to center.If there still exist disocclusion pixels after once scan,the filling process is repeated until all hole pixels are filled.Simulation results show that the proposed method is efficient,robust and achieves high performance in subjection and objection. 展开更多
关键词 view synthesis three dimension(3D) multiview local luminance correction hole filling maximum spreading strength
在线阅读 下载PDF
基于视觉语言模型的多模态无人机跨视图地理定位 被引量:1
5
作者 陈鹏 陈旭 +1 位作者 罗文 林斌 《机器人》 北大核心 2025年第3期416-426,共11页
无人机跨视图地理定位通过在卫星拒止条件下匹配机载图像与地理参照图像实现自主定位,主要挑战在于跨视图图像间的显著外观差异。现有方法多局限于局部特征提取,缺乏对上下文关联和全局语义的深入挖掘。为此,本文提出了一种基于视觉语... 无人机跨视图地理定位通过在卫星拒止条件下匹配机载图像与地理参照图像实现自主定位,主要挑战在于跨视图图像间的显著外观差异。现有方法多局限于局部特征提取,缺乏对上下文关联和全局语义的深入挖掘。为此,本文提出了一种基于视觉语言模型的多模态无人机跨视图地理定位模型。利用CLIP(contrastive language-image pre-training)模型构造了一个视图文本描述生成模块,将CLIP模型从海量数据集中学习到的图像级视觉概念作为外部知识,引导模型的特征提取过程。采用混合ViT(视觉Transformer)架构作为骨干网络,使模型在提取图像特征时兼顾局部特征与全局上下文特征的提取。此外,为了使模型能够更有效地学习到不同视图间的关联,还引入了基于逻辑得分标准化KL(Kullback-Leibler)散度的互学习损失函数来监督模型的训练过程。实验结果表明,在CLIP模型生成的文本描述结果引导下,所提模型更容易学习到深层语义信息,从而能够更好地应对跨视图地理定位过程中存在的视角差异、拍摄时间差异等挑战。 展开更多
关键词 跨视图地理定位 视觉语言模型 多模态 图像匹配 无人机
原文传递
SolidWorks中生成局部视图的几种方法
6
作者 陈光霞 《机械管理开发》 2025年第5期262-263,266,共3页
SolidWorks软件中没有直接生成局部视图的命令,一般方法是生成完整视图后再修改。生成的完整视图不同、修改方法不同,会导致操作的难易程度不同。通过总结了三种生成局部视图的方法,论述了三种方法的操作过程、技巧及应用场合。设计者... SolidWorks软件中没有直接生成局部视图的命令,一般方法是生成完整视图后再修改。生成的完整视图不同、修改方法不同,会导致操作的难易程度不同。通过总结了三种生成局部视图的方法,论述了三种方法的操作过程、技巧及应用场合。设计者可根据零件的结构特点选择不同的方法,快速生成符合国标的局部视图,提高了设计的效率。 展开更多
关键词 SOLIDWORKS 工程图 局部视图
在线阅读 下载PDF
风景的在地经验:明清武汉私家园林营造中的“山水”借景 被引量:3
7
作者 赵纪军 何家鑫 《中国园林》 北大核心 2025年第4期130-136,共7页
“借景”是中国风景园林理论研究的一个重要话题。以明清武汉私家园林为研究对象,考察其基于本土山水格局的“借景”现象,认为其不仅传承了以《园冶》为代表的造园经验和“借景”传统,更有丰富而生动的“在地经验”:依托本土山形水势的... “借景”是中国风景园林理论研究的一个重要话题。以明清武汉私家园林为研究对象,考察其基于本土山水格局的“借景”现象,认为其不仅传承了以《园冶》为代表的造园经验和“借景”传统,更有丰富而生动的“在地经验”:依托本土山形水势的登眺所观,嵌合江山风景的“入境式”身体参与,追怀三国群雄等本土人文历史的时空观想,以及晚清时局变迁背景下,关联张之洞等特定的人与事、由出世归隐到入世关怀的近代转型。明清武汉私家园林迄今均湮没于历史时空长河之中,然园林不存,风景犹在,其风景的在地经验所承载的文化精神得以存续和传播,提示了如今倡导守护绿水青山的源远流长的历史与人文价值。 展开更多
关键词 风景园林 借景 武汉私家园林 山水风景 在地经验 时空
在线阅读 下载PDF
Quantum Inverse Measurement Theory Contributing to the Birth of Interpretation System of Quantum Mechanics of Local-Realism and Determinism
8
作者 Runsheng Tu 《Journal of Modern Physics》 2017年第8期1398-1469,共72页
The existing interpretation of quantum mechanics is contrary to common sense. The existing quantum mechanical interpretation schemes are puzzling. The confusing theory is unconvincing, and needs to be amended and comp... The existing interpretation of quantum mechanics is contrary to common sense. The existing quantum mechanical interpretation schemes are puzzling. The confusing theory is unconvincing, and needs to be amended and completed. The successful interpretation program of quantum mechanics of local-realism and determinism is undoubtedly the most attractive. Preparing the interpretation program deserves to be chosen as a research goal. It is a very good premise to believe that an object particle consists of light-knot of monochromatic waves. According to this premise, the erroneous recognition about “superposition principle, wave-particle duality and uncertainty principle” can be corrected. Under this premise, above research goal is achieved by establishing, applying quantum mechanics inverse measurement theory, adhering to the principle that there must be a complete empirical chain in the derivation process of experimental conclusion, and using the side effect caused by accompanying-light to explain the diffraction experiment of object particles. Electron secondarily diffraction and other experiments directly prove that there is the measurement (observation) which may not destroy quantum coherence. The diffraction experiments of all kinds of particles show that the Keeping and playing of the coherence of moving particles in the vacuum have nothing to do with their previous experience. These are the existing experiments, to be found, that support the theory of quantum inverse measurements. The verification experiment of quantum inverse measurement is designed. The absolute superiorities of quantum inverse measurement and the new view of measurement of quantum mechanics are listed. These superiorities are that: it has the characteristics of local-realism and determinism;it is not contrary to common sense and there is no confusing place;it can predict several phenomena that cannot be predicted by other theories. A solid theoretical foundation has been laid for “correctly understanding the microscopic world” and establishment of local realism quantum mechanics. 展开更多
关键词 QUANTUM INVERSE MEASUREMENT local REALISM DETERMINISM QUANTUM Entanglement Tu’s MEASUREMENT view of QUANTUM Mechanics Light-Knot Electronic Structure Model
暂未订购
DINO-MSRA:用于无人机与卫星影像跨视角图像检索定位的新型网络架构 被引量:2
9
作者 平一凡 卢俊 +4 位作者 郭海涛 侯青峰 朱坤 桑泽豪 刘彤 《地球信息科学学报》 北大核心 2025年第7期1608-1623,共16页
【目的】跨视角图像地理定位是指通过将待查询影像与不同视角且具备精确位置信息的参考影像进行匹配从而推断其地理位置的一门技术。该技术已经广泛应用于无人机导航、目标定位等现实任务中。当前基于深度学习的无人机-卫星跨视角图像... 【目的】跨视角图像地理定位是指通过将待查询影像与不同视角且具备精确位置信息的参考影像进行匹配从而推断其地理位置的一门技术。该技术已经广泛应用于无人机导航、目标定位等现实任务中。当前基于深度学习的无人机-卫星跨视角图像检索定位方法大多依赖监督学习,但高质量标注样本的稀缺导致监督学习模型的泛化能力受限。同时,由于现有方法对空间布局特征的建模缺失,使得跨视角影像间的显著域差异难以弥补。【方法】针对上述问题,本文提出了一个基于无人机-卫星影像的跨视角图像检索定位新架构——DINO-MSRA,该架构首先利用经Conv-LoRA微调后的Dinov2大模型作为特征编码器,旨在利用较少的参数量增强模型的特征提取能力。其次,设计了一个基于Mamba模块的空间关系感知特征聚合器(MSRA)用于聚合图像特征,通过将空间配置特征嵌入到全局描述符中,为跨视角匹配定位任务带来了显著的性能增益。最后,采用InfoNCE损失函数对模型进行训练。【结果】本文在Univerisity-1652和SUES-200数据集上进行了大量对比实验和消融实验,实验结果表明,当分别面向无人机定位任务和无人机导航任务时,本文方法在Univeirity-1652数据集上的R@1精度达到95.14%、97.29%,相比于目前最优算法CAMP分别提升0.68%、1.14%;在SUES-200数据集上150 m高度的R@1精度分别达到97.2%、98.75%,相较于CAMP提升1.8%、2.5%,并且所需参数量也明显少于现有算法,仅为Sample4Geo的19.2%;【结论】DINO-MSRA在跨视角图像匹配方面优于目前最先进的方法,实现了更高的精度,更快的推理速度,证明了其在具有挑战性的场景中的鲁棒性和实际应用潜力。 展开更多
关键词 跨视角图像定位 视觉基础模型 微调 特征聚合 无人机影像 卫星影像
原文传递
基于改进YOLACT++的语义SLAM系统
10
作者 任伟建 沈文旭 +1 位作者 任璐 张永丰 《吉林大学学报(信息科学版)》 2025年第5期1006-1013,共8页
针对基于静态场景特征进行相机位姿估计的即时定位与地图构建(SLAM:Simultaneous Localization and Mapping)技术,在其前端的特征计算和匹配的过程中易受到动态物体干扰的问题,提出了实例分割结合多视几何约束的方法,以改进视觉SLAM的... 针对基于静态场景特征进行相机位姿估计的即时定位与地图构建(SLAM:Simultaneous Localization and Mapping)技术,在其前端的特征计算和匹配的过程中易受到动态物体干扰的问题,提出了实例分割结合多视几何约束的方法,以改进视觉SLAM的前端特征处理,剔除动态信息的干扰。在ORB-SLAM3(Oriented FAST and Rotated BRIEF-Simultaneous Localization and Mapping3)框架的前端,并行YOLACT++(You Only Look At CoefficienTs++)实例分割线程,将分割后的结果使用多视几何约束的方法补充检验特征点动态一致性;运用EfficientNetV2网络替换YOLACT++原来的主干网络,并使用TensorRT量化实例分割模型,以减轻算法的前端计算压力。经TUM(Technical University of Munich)数据集测试结果表明,该算法在高动态环境下的定位精度较ORB-SLAM3算法平均提升了80.6%。 展开更多
关键词 语义SLAM YOLACT++分割算法 多视几何约束 动态场景
在线阅读 下载PDF
地空跨视角定位研究综述
11
作者 胡迪 袁夏 +1 位作者 徐孝强 赵春霞 《电子与信息学报》 北大核心 2025年第12期5016-5032,共17页
地空跨视角定位指的是利用空中视角图像作为参考,确定待查询的地面传感器位姿的过程。随着无人驾驶汽车、无人机导航等技术的发展,地空跨视角定位技术在智能交通、城市管理等领域扮演着越来越重要的角色。地空跨视角定位技术的发展经历... 地空跨视角定位指的是利用空中视角图像作为参考,确定待查询的地面传感器位姿的过程。随着无人驾驶汽车、无人机导航等技术的发展,地空跨视角定位技术在智能交通、城市管理等领域扮演着越来越重要的角色。地空跨视角定位技术的发展经历了几个阶段:从早期基于人工设计特征的传统方法,到深度学习技术的引入衍生出的度量学习、图像变换及图像生成方法,以及结合距离传感器的定位技术。这些技术的发展标志着从依赖手工特征到自动学习特征表示的转变,以及从单一模态到多模态数据融合的进步。尽管取得了丰富的成果,地空跨视角定位领域仍存在很多挑战,尤其是在处理时空差异导致的定位误差问题上。这些挑战包括季节变化、日夜交替、天气状况差异等时间维度上的差异,以及视角改变、场景布局变化等空间维度上的差异,这些都对算法的鲁棒性和准确性提出了更高的要求。该文聚焦于地空跨视角定位,系统梳理了主要方法、关键数据集和评价方法,并对未来的发展趋势进行了分析。同时,该文首次系统化地整理了结合距离传感器的地空跨视角定位算法,为该领域的研究提供了新的视角和思路。 展开更多
关键词 地空跨视角定位 计算机视觉 深度学习 距离传感器 多模态
在线阅读 下载PDF
GDS:无人机图像引导的跨视角图像地理定位
12
作者 席泽馨 李佳仪 +2 位作者 谢昊 甘文建 周杨 《测绘通报》 北大核心 2025年第7期66-72,共7页
跨视角图像地理定位是指将地理坐标未知的地面视角图像与具有高精度空间坐标信息的基准卫星图像进行检索匹配,从而确定地面视角图像地理坐标的方法。当待定位地面视角图像和基准卫星图像之间的视角差异过大时,会导致检索匹配困难,因此,... 跨视角图像地理定位是指将地理坐标未知的地面视角图像与具有高精度空间坐标信息的基准卫星图像进行检索匹配,从而确定地面视角图像地理坐标的方法。当待定位地面视角图像和基准卫星图像之间的视角差异过大时,会导致检索匹配困难,因此,本文提出了一种无人机图像引导的跨视角图像地理定位方法(GDS)。该方法利用低空无人机倾斜摄影图像作为过渡,首先将待定位的地面视角图像与无人机图像进行检索匹配,然后将检索得到的无人机图像与具有精确地理坐标的卫星图像进行检索匹配,从而确定地面视角图像的地理位置。本文使用了基于卷积神经网络和Vision Transformer的ConvNeXt模型进行图像的特征提取,并通过使用InfoNCE损失作为训练目标进行对比学习,提高了图像查询的精度,同时采用随机采样的策略打乱并随机移除一小部分训练样本,提高了模型的泛化能力。在通用的跨视角数据集University-1652上的试验结果表明,本文方法在召回率指标上优于地面视角图像直接检索卫星图像的方法。本文方法使用地面视角查询无人机视角图像的精度为11.63%Recall@1,使用无人机视角查询卫星视角图像的精度为91.49%Recall@1,综合使用两段式检索方法从地面视角图像查询卫星视角图像的精度达10.64%Recall@1,与地面视角图像直接检索卫星图像的5.23%Recall@1相比,有了较大提升,具有有效性和先进性。 展开更多
关键词 图像地理定位 跨视角 无人机图像 卫星图像 ConvNeXt InfoNCE损失
原文传递
景象匹配无人机视觉定位 被引量:5
13
作者 袁媛 孙柏 刘赶超 《自动化学报》 北大核心 2025年第2期287-311,共25页
无人机因其高度的灵活性,在临地安防、灾后救援、地质勘测、农业植保等领域发挥着重要作用,因此受到越来越多的关注.定位导航作为无人机中的关键技术,对于无人机能否顺利执行任务至关重要.当前主要的定位导航算法包括全球导航卫星系统... 无人机因其高度的灵活性,在临地安防、灾后救援、地质勘测、农业植保等领域发挥着重要作用,因此受到越来越多的关注.定位导航作为无人机中的关键技术,对于无人机能否顺利执行任务至关重要.当前主要的定位导航算法包括全球导航卫星系统、惯性定位以及景象匹配定位导航等.首先,景象匹配定位导航方法利用计算机视觉技术,对无人机飞行时采集的航空影像进行数字化特征编码;随后,通过构建相似性度量与检索模型,将航空影像特征与预先获取的遥感地图库特征进行相似性度量,从而完成景象匹配;最后,根据无人机航空影像与遥感卫星地图的匹配结果,获取相应的地理位置信息,并将其更新为无人机的定位结果.景象匹配定位导航方法摆脱了定位系统对定位信号的依赖,实现了无人机飞行定位的自主化.鉴于此,以景象匹配算法中的特征提取方式为线索,分别针对基于模板匹配、基于手工特征以及基于度量学习的景象匹配,梳理其发展过程,并总结景象匹配定位导航方法中的关键问题.最后,针对景象匹配算法的发展现状,总结无人机景象匹配定位方法中亟待解决的问题. 展开更多
关键词 临地安防 无人机 视觉定位 景象匹配 度量学习 多视角变化
在线阅读 下载PDF
跨视角地理定位中的三维交互机制 被引量:1
14
作者 周博文 李阳 +2 位作者 王家宝 苗壮 张睿 《计算机科学》 北大核心 2025年第3期86-94,共9页
跨视角地理定位是一种图像检索任务,其目的是在不同视角下使用无地理坐标的图像与数据库中有地理坐标的图像进行检索匹配,从而获取目标图像的地理位置信息。然而,现有方法大多忽略了全局位置信息和特征完整性,导致模型无法捕获深层语义... 跨视角地理定位是一种图像检索任务,其目的是在不同视角下使用无地理坐标的图像与数据库中有地理坐标的图像进行检索匹配,从而获取目标图像的地理位置信息。然而,现有方法大多忽略了全局位置信息和特征完整性,导致模型无法捕获深层语义信息;另外,现有的二维交互方式未充分利用维度间关系,导致跨维交互不充分。为解决上述问题,设计了一种跨视角地理定位三维交互机制。该方法利用ConvNeXt作为特征提取网络,随后使用所提出的三维交互机制(Triplet Interaction Mechanism,TIM)进行特征丰富操作,最后利用联合损失函数指导模型训练。所提方法在模型内进行了多次三维交互,缓解了二维特征投影部分信息丢失的问题。同时,所提出的三维交互机制在3个通道中使用不同的注意力,使模型对跨视角图像的平移、缩放、旋转具有鲁棒性。实验结果表明,所提方法在University-1652数据集上针对无人机视角定位和无人机导航两个任务均取得了最优性能。 展开更多
关键词 跨视角 地理定位 交互机制 特征注意力
在线阅读 下载PDF
公园城市建设背景下上海嘉定乡村景观地方特征与优化策略研究 被引量:1
15
作者 龚苏宁 张琳 《园林》 2025年第4期44-54,共11页
挖掘新时期乡村景观地方性特征和价值、推进城乡深度融合发展,对于推动上海公园城市的内涵建设和品质提升具有重要意义。已有研究在基于多源数据融合进行区域尺度乡村景观要素地方特征提取和影响因素评价方面尚有探索空间。以上海市嘉... 挖掘新时期乡村景观地方性特征和价值、推进城乡深度融合发展,对于推动上海公园城市的内涵建设和品质提升具有重要意义。已有研究在基于多源数据融合进行区域尺度乡村景观要素地方特征提取和影响因素评价方面尚有探索空间。以上海市嘉定区为例,通过语义分割方法分析街景图像数据及多重聚类叠加,提取乡村景观多要素的地方性特征,借助地理探测器、随机森林算法测评各类驱动要素与乡村景观特征的关系。结果表明:(1)嘉定乡村景观的环境绿视度、天空开敞度、建筑密集度、道路宽阔度、小品丰富度、场所围合度呈现明显不均衡分布的特征;(2)多重聚类结果显示嘉定乡村景观的穹色空间、绿色空间和灰色空间呈现相互交织分布的格局;(3)多维度因子共同影响乡村景观特征的形成,乡村产业维度的因子交互作用最强,其中GDP与商业活力的交互值最高。基于以上发现提出嘉定区乡村景观地方特征的提升策略,为公园城市背景下乡村景观特征的评价和优化提供新的思路和方法,为提高乡村景观品质和推动公园城市建设提供参考。 展开更多
关键词 视觉景观要素 语义分割 聚类算法 地理探测器 街景图像 地方特征
在线阅读 下载PDF
基于投影转换与道路分割的街景-卫星影像跨视角定位方法
16
作者 甘文建 周杨 +3 位作者 胡校飞 赵璐颖 黄高爽 侯铭波 《测绘学报》 北大核心 2025年第8期1489-1500,共12页
地面街景影像与卫星影像之间巨大的视角差异,使得两者之间的匹配极为困难,这给跨视角图像定位的研究与应用带来巨大挑战。针对街景-卫星影像跨视角定位中视角差异造成的定位困难问题,本文提出了一种基于投影转换与道路分割的跨视角定位... 地面街景影像与卫星影像之间巨大的视角差异,使得两者之间的匹配极为困难,这给跨视角图像定位的研究与应用带来巨大挑战。针对街景-卫星影像跨视角定位中视角差异造成的定位困难问题,本文提出了一种基于投影转换与道路分割的跨视角定位方法。首先,通过在街景影像与卫星影像之间建立投影关系,实现地面图像视角向卫星图像视角之间的转换,以减小地面图像与卫星图像之间的视角差异。同时,为了更好地学习图像中的视点不变性特征,本文从自监督学习范式出发,利用具有强大零样本泛化能力的视觉基础模型进行道路分割,在训练过程中引入道路先验信息的辅助训练分支,从而在不改变模型架构和模型推理速度的情况下提高模型的性能。结合本文方法后,SAFA、GeoDTR、SAIG、TransGeo 4种跨视角定位方法在CVACT数据集上的平均Recall@1精度提升了0.55个百分点,在CVWU数据集上的平均Recall@1提升了2.84个百分点。试验结果表明本文方法可以与其他模型架构进行有机结合,具有很好的适用性。 展开更多
关键词 投影转换 自监督学习 道路分割 辅助训练分支 跨视角图像定位
在线阅读 下载PDF
基于知识感知与交互的多视图蒸馏推荐算法
17
作者 张悦岚 苏静 +1 位作者 赵航宇 杨白利 《计算机应用》 北大核心 2025年第7期2211-2220,共10页
目前,基于协同过滤的图神经网络(GNN)推荐系统存在严重的数据稀疏和冷启动问题。很多相关算法引入项目的外部知识进行补充性扩展使这些问题得以缓解,然而这些算法忽略了稀疏协同信号和冗余补充内容直接结合所导致的信息利用严重不平衡... 目前,基于协同过滤的图神经网络(GNN)推荐系统存在严重的数据稀疏和冷启动问题。很多相关算法引入项目的外部知识进行补充性扩展使这些问题得以缓解,然而这些算法忽略了稀疏协同信号和冗余补充内容直接结合所导致的信息利用严重不平衡以及不同数据之间的共享传递问题。因此,设计一种基于知识感知与交互的多视图蒸馏推荐算法(MKDRec)。首先,针对协同数据的稀疏性,对交互图采用随机丢弃以增强形成的协同视图,再将该视图下的节点表征进行邻域对比学习;其次,关于知识冗余问题,对知识视图中的每种关系的边进行编码,并基于头尾实体和连接关系重构项目知识视图,使信息得到充分利用;最后,基于项目与实体间的等价关系构建具有远程连接的关联视图。至此,对3个视图以不同卷积聚合方式学习图节点表征来提取多种用户与项目的信息,并得出多个用户与项目的嵌入表示。此外,将两两视图的节点特征向量进行知识蒸馏融合以实现信息的共享和传递。MKDRec在数据集Book-Crossing、MovieLens-1M和Last. FM上的实验结果显示,相较于最好的基线方法结果,MKDRec的曲线下面积(AUC)分别提升了2.13%、1.07%和3.44%,而F1分数分别提升了3.56%、1.14%和4.46%。 展开更多
关键词 推荐算法 图神经网络 多视图融合 知识蒸馏 局部增强
在线阅读 下载PDF
跨视角图像地理定位数据集综述 被引量:1
18
作者 张硝 高艺 +1 位作者 夏宇翔 赵春雪 《遥感学报》 北大核心 2025年第8期2511-2530,共20页
跨视角图像地理定位(Cross-view Image Geo-localization)旨在通过不同视角图像间的匹配,检索参考图库中相似度最大的图像,进而利用其GPS标签实现定位功能。传统的单一视角图像地理定位受限于数据集质量、规模以及定位精度等因素,因而... 跨视角图像地理定位(Cross-view Image Geo-localization)旨在通过不同视角图像间的匹配,检索参考图库中相似度最大的图像,进而利用其GPS标签实现定位功能。传统的单一视角图像地理定位受限于数据集质量、规模以及定位精度等因素,因而近年来众多研究人员和机构发布了一系列跨视角地理定位数据集,为提升地理定位精度打下数据基础。然而目前尚缺乏对跨视角图像地理定位数据集的系统性分析。本文首先梳理了跨视角图像地理定位发展以来的32个经典数据集,从视角信息、构建类型、真实程度、时相信息4个维度构建分类体系并对数据集基本信息进行归纳总结;其次从元数据、影响力、关键词、获取来源以及应用领域5个方面对跨视角图像地理定位数据集进行深入分析,整理概括了跨视角图像地理定位目前的主流算法;最后从数据集多模态趋势、大模型方法、图像干扰物处理以及模型优化4个角度探讨了跨视角定位数据集未来的发展方向,可以为相关领域研究人员提供参考。 展开更多
关键词 跨视角 图像地理定位 数据集 深度学习 无人机 图像检索 图像匹配 计算机视觉
原文传递
多视角下多特征融合的三维局部特征描述符
19
作者 郝雯 魏海南 《光学精密工程》 北大核心 2025年第16期2602-2615,共14页
针对目前已有的手工设计描述符对局部曲面几何特征描述不够全面的问题,本文提出了一种高鉴别强鲁棒的多视图几何分布特征描述符(Multi-View Geometric Distribution Signatures,MGDS)。首先,基于关键点及其邻域点构建局部参考框架(Local... 针对目前已有的手工设计描述符对局部曲面几何特征描述不够全面的问题,本文提出了一种高鉴别强鲁棒的多视图几何分布特征描述符(Multi-View Geometric Distribution Signatures,MGDS)。首先,基于关键点及其邻域点构建局部参考框架(Local Reference Frame,LRF),对局部曲面进行体素化,计算三维体素的质心点分布、二维扇区轮廓特征、二维网格点密度分布以及局面曲面深度波动,生成几何特征描述符。接着,基于LRF多次旋转局部曲面,产生新的形状表示,利用质心、轮廓点、密度以及z值波动信息对旋转后的曲面进行编码。通过多个视角获取这些几何特征描述符,将它们串联成一个特征向量,得到最终的多视图几何分布特征描述符MGDS。本文在RandomView,SpaceTime,Kinect以及B3R四个数据集中不同的高斯噪声以及网格分辨率下进行实验,并与目前已有的10种描述符进行比较。与其他描述符相比,MGDS描述符的性能优于已有的局部特征描述符。实验结果表明,本文所提出的MGDS具有较好的描述性与鲁棒性,可用于三维点云的准确配准。 展开更多
关键词 点云 局部特征描述符 多视角特征 多特征融合 特征匹配
在线阅读 下载PDF
GHGeo:基于异构空间对比损失的跨视角对象级地理定位方法
20
作者 桑泽豪 卢俊 +4 位作者 郭海涛 丁磊 朱坤 徐国峻 魏昊麒 《地球信息科学学报》 北大核心 2025年第11期2563-2577,共15页
【目的】跨视角对象级地理定位(CVOGL)旨在卫星影像上精确定位地面街景或无人机影像所观测目标的地理位置。现有方法多聚焦于图像级匹配,通过对整张影像全局处理实现跨视角关联,缺乏对特定目标的位置编码研究,导致无法将模型的注意力引... 【目的】跨视角对象级地理定位(CVOGL)旨在卫星影像上精确定位地面街景或无人机影像所观测目标的地理位置。现有方法多聚焦于图像级匹配,通过对整张影像全局处理实现跨视角关联,缺乏对特定目标的位置编码研究,导致无法将模型的注意力引导到感兴趣目标。并且由于参考图像覆盖范围的变化,查询目标在对应卫星图像中的像素占比极低,精确定位较为困难。【方法】针对以上问题,本文提出了一种基于高斯核函数与异构空间对比损失的跨视角对象级地理定位方法(Cross-View Object-Level Geo-Localization Method with Gaussian Kernel Function and Heterogeneous Spatial Contrastive Loss,GHGeo),用于精确定位感兴趣目标位置。该方法首先通过高斯核函数对查询目标进行精确位置编码,实现了对目标中心点及其分布特征的精细化建模;此外还提出了动态注意力精细化融合模块来动态加权交叉感知全局上下文与局部几何特征的空间相似性,以概率密度预测查询目标在卫星影像中的精确位置;最后通过异构空间对比损失函数来约束其训练过程,缓解跨视角特征差异。【结果】本文在CVOGL数据集进行了实验,实验结果显示:GHGeo在该数据集的“无人机-卫星”任务中,当交并比(IoU)≥25%和≥50%时定位准确率分别达到67.73%和63.00%,相较于基准方法DetGeo分别提升了5.76%和5.34%;在“街景-卫星”定位任务中,对应IoU阈值下的定位准确率分别为48.41%和45.43%的定位准确率,相较于基准方法DetGeo分别提升了2.98%和3.19%。同时与TransGeo,SAFA和VAGeo等方法在CVOGL数据集上进行对比,GHGeo则展现出了更高的定位准确性。【结论】本文方法有效提升了跨视角对象级地理定位方法的精度,为城市规划监测,应急救援调度等应用领域提供关键技术支持和精确位置信息支撑。 展开更多
关键词 遥感影像 跨视角对象级地理定位 对比学习 高斯核编码 动态融合模块 多模态特征提取 深度学习
原文传递
上一页 1 2 15 下一页 到第
使用帮助 返回顶部