期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
无人船视觉场景虚实融合系统设计与实现
1
作者 孙燕 李贞辉 +3 位作者 洪坤龙 王琳博 唐建中 聂勇 《舰船科学技术》 北大核心 2026年第6期31-38,共8页
针对无人船自主航行测试过程中存在的周期长、成本高、试验场景单一等问题,设计并实现一种面向实际场景下无人船自主航行测试的视觉场景虚实融合系统。该系统将构建的虚拟仿真场景,通过位姿映射、虚实配准、融合渲染等技术,将虚拟视觉... 针对无人船自主航行测试过程中存在的周期长、成本高、试验场景单一等问题,设计并实现一种面向实际场景下无人船自主航行测试的视觉场景虚实融合系统。该系统将构建的虚拟仿真场景,通过位姿映射、虚实配准、融合渲染等技术,将虚拟视觉场景融入无人船实际视觉场景,生成具有一致性的融合视觉场景,为无人船航行测试过程提供更加丰富、真实的试验场景。实验结果表明,无人船视觉场景虚实融合系统能够有效实现虚实无人船的姿态同步及其视觉场景融合,且在复杂的海洋环境下,融合效果能够保持较高的真实感。 展开更多
关键词 无人舰船 视觉场景融合 自主航行测试
在线阅读 下载PDF
照度条件自适应的粒度渐进多模态图像融合方法 被引量:3
2
作者 王传云 孙冬冬 +3 位作者 周明奇 王田 高骞 李照奎 《工程科学学报》 北大核心 2025年第6期1257-1271,共15页
为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对... 为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对场景向量进行处理.随后,利用处理后的场景向量对图像重建阶段的图像特征在通道维度上进行调控,使得融合模型能够根据不同的场景光照生成不同风格的融合图像.其次,为了解决现有特征提取模块在特征表达上的不足,本文设计了基于状态空间方程的特征提取模块,以线性复杂度实现全局特征感知,减少了信息传输过程中的信息丢失,提升了融合图像的视觉效果.最后,设计了粒度渐进融合模块,利用状态空间方程对多模态特征进行全局聚合,并引入跨模态坐标注意力机制对聚合后的特征进行精细调优,从而实现多模态特征从全局到局部的多阶段融合,增强了网络的信息整合能力.在训练过程中,本文采用先验知识生成增强图像作为标签,并根据不同环境构建同源与异构的损失函数,以实现场景自适应的多模态图像融合.实验结果显示,本文方法在暗光场景数据集MSRS和LLVIP、混合光照数据集TNO、连续场景数据集RoadScene以及雾霾场景数据集M3FD上的表现均优于11种先进算法,在定量和定性对比中取得了更好的视觉效果和更高的定量指标.所提出的方法在自动驾驶、军事侦察和环境监控等任务中展现出较大的潜力. 展开更多
关键词 视觉感知优化 图像融合 多模态 场景自适应 状态空间模型 跨模态注意力机制
在线阅读 下载PDF
基于多语义关联与融合的视觉问答模型
3
作者 周浩 王超 +1 位作者 崔国恒 罗廷金 《计算机应用》 北大核心 2025年第3期739-745,共7页
弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的... 弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的作用。为解决上述问题,提出一种基于多语义关联与融合的VQA模型以建立问题与图像之间的语义联系。首先,基于场景图生成框架提取图像中的多种语义并把它们进行特征精炼后作为VQA模型的特征输入,从而充分挖掘图像场景中的信息;其次,为提高图像特征的语义价值,设计一个信息过滤器过滤图像特征中的噪声和冗余信息;最后,设计多层注意力融合和推理模块将多种图像语义分别与问题特征进行语义融合,以强化视觉图像重点区域与文本问题之间的语义关联。与BAN(Bilinear Attention Network)和CFR(Coarse-to-Fine Reasoning)模型的对比实验结果表明,所提模型在VQA2.0测试集上的准确率分别提高了2.9和0.4个百分点,在GQA测试集上的准确率分别提高了17.2和0.3个百分点。这表明所提模型能够更好地理解图像场景中的语义并回答组合式视觉问题。 展开更多
关键词 多语义特征融合 视觉问答 场景图 属性注意力 关系注意力
在线阅读 下载PDF
基于自身运动约束的RGB-D动态SLAM算法 被引量:2
4
作者 张志铭 张军 +2 位作者 刘元盛 王子钰 赵玉洁 《计算机工程与应用》 北大核心 2025年第8期173-182,共10页
针对视觉SLAM(simultaneous localization and mapping)算法在动态环境下容易出现重定位失败的问题,提出了一种基于自身运动约束的动态SLAM算法。采用YOLOv5s初步区分前景与背景特征点,仅利用背景特征点进行位姿初始化;利用IMU位姿信息... 针对视觉SLAM(simultaneous localization and mapping)算法在动态环境下容易出现重定位失败的问题,提出了一种基于自身运动约束的动态SLAM算法。采用YOLOv5s初步区分前景与背景特征点,仅利用背景特征点进行位姿初始化;利用IMU位姿信息不受动态环境影响的特性,计算每个特征点的自身运动约束值;根据背景特征点的特征约束结果设计了动态概率模型,自适应确定当前帧特征点约束的动态阈值,去除动态特征点并更新相机位姿。使用仿真数据集和真实环境数据集进行了实验验证。实验结果表明,在仿真数据集中,该方法能去除沿极线运动的特征点,相较于Dyna-SLAM,在均方根误差和标准差两项指标的提升率为87.81%和83.17%,相较于AirDos提升率分别为51.62%和41.91%。真实动态环境中重定位能力强于Dyna-SLAM,较AirDos无明显精度提升但运行速度提升29.48%。 展开更多
关键词 动态环境 视觉SLAM 多传感器融合 IMU预积分
在线阅读 下载PDF
一种道路注记与实景三维模型的融合显示方法 被引量:1
5
作者 钟娜娜 周圣川 +2 位作者 赵军 王海银 乔新 《测绘通报》 北大核心 2025年第1期165-169,共5页
为了提高道路注记在三维地理信息系统中的视觉表现和用户体验,本文提出了一种将道路注记与实景三维模型融合显示的方法。通过道路数据显示规则设计、预处理生成路名注记点、查询服务接口封装、实景三维客户端实时分析融合显示的流程方法... 为了提高道路注记在三维地理信息系统中的视觉表现和用户体验,本文提出了一种将道路注记与实景三维模型融合显示的方法。通过道路数据显示规则设计、预处理生成路名注记点、查询服务接口封装、实景三维客户端实时分析融合显示的流程方法,有效地将文字信息嵌入三维场景中,保证了用户在不同视角和缩放级别下的阅读舒适度和信息获取准确性,具有立体美观、计算高效、不压盖、兼容超大范围实景三维应用等特点,为实景三维补充了重要的语义数据,有效提升了实景三维的应用效果。 展开更多
关键词 实景三维 道路 注记 融合可视化 三维场景
原文传递
适用于导盲场景的多尺度特征融合轻量化道路图像分割算法
6
作者 沙宇洋 陆京涛 +5 位作者 杜浩凡 翟小兵 孟维宇 廉旭 罗刚 李克峰 《计算机工程》 北大核心 2025年第7期314-325,共12页
图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是... 图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示:所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1024×1024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。 展开更多
关键词 道路分割 多尺度模型 视觉导盲系统 深度学习 特征融合 场景理解
在线阅读 下载PDF
基于视觉特征融合的电缆头制作虚拟场景多视图三维重建模型
7
作者 席佳伟 胡静 +1 位作者 蔡伟 豆河伟 《微型电脑应用》 2025年第4期212-215,共4页
电缆头制作虚拟场景多视图三维重建时,若不能完整地提取多视图的特征点,会直接降低电缆头的三维重建效果。为了有效提升电缆头三维重建效果,提出基于视觉特征融合的电缆头制作虚拟场景多视图三维重建模型。该方法首先通过图像采集处理... 电缆头制作虚拟场景多视图三维重建时,若不能完整地提取多视图的特征点,会直接降低电缆头的三维重建效果。为了有效提升电缆头三维重建效果,提出基于视觉特征融合的电缆头制作虚拟场景多视图三维重建模型。该方法首先通过图像采集处理系统获取电缆头制作场景多视图,并对采集的图像实施特征点提取;再根据特征点的融合结果实现图像的特征点匹配,建立修正误差函数对匹配误差实施校正处理;最后通过三角测量方法获取场景多视图的测量点对应关系以及摄像机矩阵,获取图像的三维重建3D点,对三维重建3D点实施连接处理,实现电缆头制作虚拟场景的三维模型重建。实验结果表明,使用该方法建立电缆头制作虚拟场景三维重建时,重建时间短,重建效果好。 展开更多
关键词 视觉特征融合 电缆头制作 虚拟场景 多视图 三维重建模型
在线阅读 下载PDF
海事监管场景下通航环境可视化策略研究
8
作者 王昭 黄永军 +1 位作者 白亭颖 夏启兵 《海洋测绘》 北大核心 2025年第5期72-77,共6页
随着海洋经济的快速发展,海事监管场景下通航环境可视化亟需突破传统航海图叠加专题要素的专题图模式,走向地理场景模式。在分析海事监管场景化对通航环境可视化的多空间尺度、多表达精度、多语义和时空动态等需求特征的基础上,从地理... 随着海洋经济的快速发展,海事监管场景下通航环境可视化亟需突破传统航海图叠加专题要素的专题图模式,走向地理场景模式。在分析海事监管场景化对通航环境可视化的多空间尺度、多表达精度、多语义和时空动态等需求特征的基础上,从地理场景框架构建、视觉表达和符号配合、“数据-知识-模型”融合以及动态数据融合可视化表达四个层面分析了海事监管场景构建的关键技术,为未来海事监管领域的创新发展提供新的视角与思路。 展开更多
关键词 海图服务 海事监管 地理场景构建 通航环境 多源数据融合 可视化 动态符号设计
在线阅读 下载PDF
结合视觉显著性引导与分类器融合的遥感目标检测 被引量:9
9
作者 毕福昆 高立宁 +1 位作者 龙腾 杨健 《红外与激光工程》 EI CSCD 北大核心 2011年第10期2058-2064,共7页
利用有限计算资源对大视场遥感图像进行快速目标检测有着重要的现实意义。借鉴注意机制在人类视觉系统中的选择性感知特点,结合自底向上的视觉显著性引导及自顶向下的显著区域解译,提出一种新的大视场遥感目标检测模型。设计其整体架构... 利用有限计算资源对大视场遥感图像进行快速目标检测有着重要的现实意义。借鉴注意机制在人类视觉系统中的选择性感知特点,结合自底向上的视觉显著性引导及自顶向下的显著区域解译,提出一种新的大视场遥感目标检测模型。设计其整体架构分为注意初期、注视阶段及注意后期3个递进的层级,通过引入一种自适应形态学的显著图生成策略快速搜寻整个视场中的显著区域,并在其引导下利用分类器融合技术从特征属性相似的显著物中区分出任务目标。以大视场遥感图像舰船检测验证模型,性能及对比实验结果表明该模型是可行的,同时实现了计算资源有层次、有重点地合理分配。 展开更多
关键词 目标检测 视觉注意 场景分析 分类器融合 检测模型
原文传递
联合多尺度多特征的高分遥感图像场景分类 被引量:15
10
作者 黄鸿 徐科杰 石光耀 《电子学报》 EI CAS CSCD 北大核心 2020年第9期1824-1833,共10页
高分辨率遥感图像地物信息丰富,但场景构成复杂,目前基于手工设计的特征提取方法不能满足复杂场景分类的需求,而非监督特征学习方法尽管能够挖掘局部图像块的本征结构,但单一种类及尺度的特征难以有效表达实际应用中复杂遥感场景特性,... 高分辨率遥感图像地物信息丰富,但场景构成复杂,目前基于手工设计的特征提取方法不能满足复杂场景分类的需求,而非监督特征学习方法尽管能够挖掘局部图像块的本征结构,但单一种类及尺度的特征难以有效表达实际应用中复杂遥感场景特性,导致分类性能受限.针对此问题,本文提出了一种基于多尺度多特征的遥感场景分类方法.该算法首先设计了一种改进的谱聚类非监督特征(iUFL-SC)以有效表征图像块的本征结构,然后通过密集采样提取每幅遥感场景的iUFL-SC、LBP、SIFT等三种多尺度局部图像块特征,并通过视觉词袋模型(BoVW)获得场景的中层特征表达,以实现更为准确详实的特征描述,最后基于直方图交叉核的支持向量机(HIKSVM)进行分类.在UC Merced数据集以及WHU-RS19数据集上的实验结果表明本文方法可对遥感场景进行鉴别特征提取,有效提高分类性能. 展开更多
关键词 遥感 高分辨率影像 场景分类 非监督特征 特征融合 视觉词袋模型
在线阅读 下载PDF
大型构筑物水下检测多源数据处理及可视化系统设计与实现 被引量:2
11
作者 姜艳 段安民 肖雪露 《舰船电子工程》 2023年第4期104-109,共6页
大型构筑物水下状态检测与完整展示对大型构筑物的安全运营至关重要,而目前大型构筑物水下多源数据融合及三维展示系统几乎空白,论文针对该需求,通过重点突破水下检测多源数据融合、水下三维可视化等关键技术,研发了大型构筑物水下检测... 大型构筑物水下状态检测与完整展示对大型构筑物的安全运营至关重要,而目前大型构筑物水下多源数据融合及三维展示系统几乎空白,论文针对该需求,通过重点突破水下检测多源数据融合、水下三维可视化等关键技术,研发了大型构筑物水下检测多源数据处理及可视化系统,并通过港珠澳大桥水下检测实测数据,验证了港珠澳大桥水下环境多源观测大数据融合和海底三维实景可视化展示能力,为大型构筑物水下状况的安全检测防护和可视化运营管理提供了有效支撑。 展开更多
关键词 港珠澳大桥 多源时空大数据融合 三维实景可视化
在线阅读 下载PDF
复杂场景中的视觉跟踪研究
12
作者 丁建伟 刘伟 《电脑知识与技术》 2016年第1期196-197,共2页
现有的视觉跟踪方法在复杂场景中依然难以有效跟踪运动物体,而融合多种特征能有效地提升算法在复杂场景中的跟踪效果。该文研究了在粒子滤波框架下基于多种特征融合的视觉跟踪算法,通过在线训练支持向量机分类器构造判别式目标表观模型... 现有的视觉跟踪方法在复杂场景中依然难以有效跟踪运动物体,而融合多种特征能有效地提升算法在复杂场景中的跟踪效果。该文研究了在粒子滤波框架下基于多种特征融合的视觉跟踪算法,通过在线训练支持向量机分类器构造判别式目标表观模型。在复杂场景视频中进行测试,实验结果表明该文跟踪算法具有较好的鲁棒性和准确性。 展开更多
关键词 视觉跟踪 复杂场景 融合 支持向量机 粒子滤波
在线阅读 下载PDF
基于自注意力机制的多模态场景分类 被引量:7
13
作者 常月 侯元波 +2 位作者 谭奕舟 李圣辰 邵曦 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期46-52,共7页
针对真实环境场景会同时出现多种事件导致场景分类准确率受到干扰信息影响的问题,本文提出了一种基于自注意力机制的多模态场景分类方法。首先,对音频进行特征提取并使用自注意力机制获得关注信息;然后,对视频进行分帧图片抽取,通过ResN... 针对真实环境场景会同时出现多种事件导致场景分类准确率受到干扰信息影响的问题,本文提出了一种基于自注意力机制的多模态场景分类方法。首先,对音频进行特征提取并使用自注意力机制获得关注信息;然后,对视频进行分帧图片抽取,通过ResNet 50对图片特征进行提取;最后,将两个模态的特征进行拼接并再次使用自注意力机制对特征信息进行抓取分类。基于DCASE2021 Challenge Task 1B数据集的实验结果表明,与其基线系统、双模态信息简单拼接、视频辅助音频和音频辅助视频的分类系统相比,基于自注意力机制的多模态场景分类系统的准确率优于单模态互相辅助决策的场景分类系统。 展开更多
关键词 视听场景分类 自注意力机制 多模态融合 辅助学习
在线阅读 下载PDF
面向城市更新的实景三维平台设计与实现 被引量:12
14
作者 高俊 柳春生 +1 位作者 淦立琴 何骞 《地理空间信息》 2023年第9期120-123,共4页
充分了解城市更新政府主管部门业务需求,结合城市实景三维数据情况,基于二三维一体可视化技术构建了面向城市更新的实景三维可视化平台。研究了二三维数据融合、二三维数据可视化等关键技术,设计了支撑GIS、BIM、视频等实景三维数据一... 充分了解城市更新政府主管部门业务需求,结合城市实景三维数据情况,基于二三维一体可视化技术构建了面向城市更新的实景三维可视化平台。研究了二三维数据融合、二三维数据可视化等关键技术,设计了支撑GIS、BIM、视频等实景三维数据一体化融合展示的开发框架,实现了城市更新二三维场景综合展示、项目跟踪监管、经济测算分析、规范性审查等功能,为城市实景三维场景组织调度、多场景融合可视化提供技术参考,为城市更新立体空间精细化管理提供决策支撑。以广州市番禺区为例,验证了平台搭建的可行性和有效性。 展开更多
关键词 城市更新 二三维可视化 数据组织 多场景融合
在线阅读 下载PDF
室内三维场景纹理手机图片的自动更新方法 被引量:3
15
作者 马威 熊汉江 +1 位作者 郑先伟 龚健雅 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2019年第2期254-259,267,共7页
当前室内三维建模的纹理映射工作主要依赖人工完成,工作量大、处理效率低,且对建模后室内环境的变更难以实现及时更新,导致室内模型纹理存在不真实甚至错误的现象。对此,提出一种室内三维模型纹理手机图片的自动更新方法,该方法主要以... 当前室内三维建模的纹理映射工作主要依赖人工完成,工作量大、处理效率低,且对建模后室内环境的变更难以实现及时更新,导致室内模型纹理存在不真实甚至错误的现象。对此,提出一种室内三维模型纹理手机图片的自动更新方法,该方法主要以手机拍摄的图片为数据源,首先利用智能手机传感器获取拍摄图片的位姿参数,进而通过室内场景理解技术提取图片空间中的三维布局结构,最后与几何模型进行坐标点匹配解算纹理坐标,实现手机图片到三维几何模型的自动纹理映射。实验结果表明,该方法能够利用手机图片数据实现室内环境下的三维模型纹理自动生成及动态更新,有效提高室内三维场景表达的真实性。 展开更多
关键词 手机图片 纹理更新 室内场景理解 结构化预测 融合可视化
原文传递
融合运动信息的三维视觉显著性算法研究 被引量:7
16
作者 卢晶 张晓林 +1 位作者 陈利利 李嘉茂 《计算机工程》 CAS CSCD 北大核心 2018年第1期238-246,共9页
计算机视觉领域中的视觉显著性研究大多局限于二维图像层面,而忽略人的视觉注意力决策是在三维动态场景下发生的。为此,在融合多种特征的显著性计算框架基础上,提出一种三维视觉显著性算法。通过场景的颜色信息、运动信息和深度信息分... 计算机视觉领域中的视觉显著性研究大多局限于二维图像层面,而忽略人的视觉注意力决策是在三维动态场景下发生的。为此,在融合多种特征的显著性计算框架基础上,提出一种三维视觉显著性算法。通过场景的颜色信息、运动信息和深度信息分别计算各个特征通道下的显著性结果,再经过动态的融合得到最终的显著性结果。同时针对三维场景下显著性数据集的稀缺问题,给出一个用于评价三维动态场景下显著性算法的数据集。与HC算法、RC算法、GMR算法的对比结果验证了该算法具有明显的优势,并且更符合人眼的视觉注意力机制。 展开更多
关键词 视觉显著性 三维场景 运动信息 深度信息 对比度 融合
在线阅读 下载PDF
融合场景深度估计和视觉传达的复杂光照图像虚拟重建 被引量:1
17
作者 柴萍 柴金娣 《激光杂志》 CAS 北大核心 2024年第2期129-134,共6页
复杂光照图像虚拟中受到光照强度不均衡性影响导致重建效果不好,为了提高复杂光照图像虚拟重建效果,提出基于融合场景深度估计和视觉传达的复杂光照图像虚拟重建方法。针对不同场景深度混频光照的相互干扰采用相关匹配降噪方法实现图像... 复杂光照图像虚拟中受到光照强度不均衡性影响导致重建效果不好,为了提高复杂光照图像虚拟重建效果,提出基于融合场景深度估计和视觉传达的复杂光照图像虚拟重建方法。针对不同场景深度混频光照的相互干扰采用相关匹配降噪方法实现图像降噪处理,以光照图像低亮度区域内亮度值中位数作为场景深度的参考值,采用全局特性和局部细节特征拟合的方法实现对复杂光照图像的场景深度检测和视觉跟踪拟合,采用HSV空间特征分解方法实现对不同场景中光照图片亮度通道融合处理,提取场景物体边缘、纹理等细节信息,根据场景深度检测和全局对比度融合下的视觉传达效果实现复杂光照图像虚拟重建。测试结果得知,采用该方法进行复杂光照图像虚拟重建的视觉表达能力较好,重建后的图像细节展示能力较强,能准确重建暗区域内隐藏的图像信息,两个数据集图像的峰值信噪比较高,均方根误差较低,分别为45.63 dB、53.21 dB和0.366、0.265,且重建时长短,仅为1.5 s,具有较强的重建性能。 展开更多
关键词 融合场景深度 视觉传达 复杂光照图像 虚拟重建 细节特征
原文传递
面向数字孪生流域的多尺度三维数据底板建设 被引量:8
18
作者 高永红 田帅帅 +3 位作者 陈乐旻 范伟 王芳 李震 《河南科技》 2024年第10期10-15,共6页
【目的】数据底板是数字孪生相关项目建设的第一要务,是数字孪生流域“四预”目标实现的“基石”。【方法】根据水利部智慧水利实施方案和流域信息化需求,提出了基于地理空间数据的多尺度三维数字底板建设方案思路,明确了三维场景数据... 【目的】数据底板是数字孪生相关项目建设的第一要务,是数字孪生流域“四预”目标实现的“基石”。【方法】根据水利部智慧水利实施方案和流域信息化需求,提出了基于地理空间数据的多尺度三维数字底板建设方案思路,明确了三维场景数据底板构建的目标,提出了多来源、多尺度数字孪生底板数据构建的具体方式,阐明了底板建设过程中包括数据来源、数据获取、数据治理、数据融合的理论和方法。【结果】通过实践,细化了L1~L3级数据底板的建设内容和技术路线,提供了完整的数字孪生项目数据底板建设的思路和方法。【结论】通过三级数据底板建设与共享,构建了高精度、可视化场景,为智慧防汛、水资源管理与调配等业务化应用提供了强有力的数据支撑。 展开更多
关键词 数字孪生 数据底板 可视化场景 数据融合
在线阅读 下载PDF
结合注意力机制与特征融合的场景图生成模型 被引量:5
19
作者 黄勇韬 严华 《计算机科学》 CSCD 北大核心 2020年第6期133-137,共5页
视觉场景理解不仅可以孤立地识别单个物体,还可以得到不同物体之间的相互作用关系。场景图可以获取所有的(主语-谓词-宾语)信息来描述图像内部的对象关系,在场景理解任务中应用广泛。然而,大部分已有的场景图生成模型结构复杂、推理速... 视觉场景理解不仅可以孤立地识别单个物体,还可以得到不同物体之间的相互作用关系。场景图可以获取所有的(主语-谓词-宾语)信息来描述图像内部的对象关系,在场景理解任务中应用广泛。然而,大部分已有的场景图生成模型结构复杂、推理速度慢、准确率低,不能在现实情况下直接使用。因此,在Factorizable Net的基础上提出了一种结合注意力机制与特征融合的场景图生成模型。首先把整个图片分解为若干个子图,每个子图包含多个对象及对象间的关系;然后在物体特征中融合其位置和形状信息,并利用注意力机制实现物体特征和子图特征之间的消息传递;最后根据物体特征和子图特征分别进行物体分类和物体间关系推断。实验结果表明,在多个视觉关系检测数据集上,该模型视觉关系检测的准确率为22.78%~25.41%,场景图生成的准确率为16.39%~22.75%,比Factorizable Net分别提升了1.2%和1.8%;并且利用一块GTX1080Ti显卡可以在0.6 s之内实现对一幅图像的物体和物体间的关系进行检测。实验数据充分说明,采用子图结构明显减少了需要进行关系推断的图像区域数量,利用特征融合方法和基于注意力机制的消息传递机制提升了深度特征的表现能力,可以更快速准确地预测对象及其关系,从而有效解决了传统的场景图生成模型时效性差、准确度低的难题。 展开更多
关键词 场景图 视觉关系检测 注意力机制 消息传递 特征融合
在线阅读 下载PDF
结合倾斜影像的实景三维场景增强显示 被引量:7
20
作者 张英栋 赵军 +2 位作者 周圣川 胡振彪 胡海滨 《测绘通报》 CSCD 北大核心 2023年第3期123-127,共5页
针对实景三维场景在近地面视角或面对复杂特殊地物时存在的模型破损、纹理变形、悬浮物及细节表现精度不高等问题,本文提出了一种场景增强显示方法。利用计算纠正后的无畸变影像,查找匹配与场景呈现最相近的目标影像并将其精准叠加至三... 针对实景三维场景在近地面视角或面对复杂特殊地物时存在的模型破损、纹理变形、悬浮物及细节表现精度不高等问题,本文提出了一种场景增强显示方法。利用计算纠正后的无畸变影像,查找匹配与场景呈现最相近的目标影像并将其精准叠加至三维模型上,完成二维影像与三维模型间的视觉融合和自然过渡;同时实现三维漫游过程中影像的动态调度和实时绘制,以支撑超大场景的持续增强显示。实践证明,该方法不仅可以弥补实景三维模型的显示不足,提升场景视觉浏览效果,还可以结合最新航飞影像增强场景表达的现势性,提升实景三维的推广应用价值,研究成果可有助于开展自然资源管理、国土空间规划、应急救灾、城市治理等领域工作。 展开更多
关键词 实景三维场景 倾斜影像 视觉融合 增强显示
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部