期刊文献+
共找到341篇文章
< 1 2 18 >
每页显示 20 50 100
Precision Comparison and Analysis of Multi-stereo Fusion and Multi-view Matching Based on High-Resolution Satellite Data
1
作者 LIU Tengfei HUANG Xu HUANG Zefeng 《Transactions of Nanjing University of Aeronautics and Astronautics》 2025年第5期577-588,共12页
High-resolution sub-meter satellite data play an increasingly crucial role in the 3D real-scene China construction initiative.Current research on 3D reconstruction using high-resolution satellite data primarily focuse... High-resolution sub-meter satellite data play an increasingly crucial role in the 3D real-scene China construction initiative.Current research on 3D reconstruction using high-resolution satellite data primarily focuses on two approaches:Multi-stereo fusion and multi-view matching.While algorithms based on these two methodologies for multi-view image 3D reconstruction have reached relative maturity,no systematic comparison has been conducted specifically on satellite data to evaluate the relative merits of multi-stereo fusion versus multi-view matching methods.This paper conducts a comparative analysis of the practical accuracy of both approaches using high-resolution satellite datasets from diverse geographical regions.To ensure fairness in accuracy comparison,both methodologies employ non-local dense matching for cost optimization.Results demonstrate that the multi-stereo fusion method outperforms multi-view matching in all evaluation metrics,exhibiting approximately 1.2%higher average matching accuracy and 10.7%superior elevation precision in the experimental datasets.Therefore,for 3D modeling applications using satellite data,we recommend adopting the multi-stereo fusion approach for digital surface model(DSM)product generation. 展开更多
关键词 multi-stereo fusion reconstruction multi-view matching reconstruction non-local dense matching method occlusion detection high-resolution satellite data
在线阅读 下载PDF
基于双目立体视觉的多分辨率图像匹配方法研究 被引量:1
2
作者 刘华春 吴广文 闫静莉 《现代电子技术》 北大核心 2025年第1期29-32,共4页
在双目立体视觉系统中,面对复杂场景时噪声会损害图像特征,增加提取难度,导致匹配精度和鲁棒性下降。因此,文中提出基于双目立体视觉的多分辨率图像匹配方法,旨在从不同尺度图像中有效获取信息并实现高精度匹配。该方法利用双目立体视... 在双目立体视觉系统中,面对复杂场景时噪声会损害图像特征,增加提取难度,导致匹配精度和鲁棒性下降。因此,文中提出基于双目立体视觉的多分辨率图像匹配方法,旨在从不同尺度图像中有效获取信息并实现高精度匹配。该方法利用双目立体视觉模型的双目旋转相机扫描目标并进行成像,根据内、外空间标定提升双目旋转相机的位置精度,保证目标的多分辨率成像效果;将其输入金字塔立体匹配网络中,通过网络中的类金字塔多空洞卷积操作提取双目图像特征,在此基础上,基于可变卷积增强其纹理特征细节;结合细粒度特征和互注意力机制完成双目图像匹配。测试结果显示,空间标定后,左、右两个相机的成像误差最小值分别为0.6 Pixel和0.4 Pixel;匹配点坐标偏差均值和坐标偏差方差值分别低于0.012和0.011,匹配效果良好。 展开更多
关键词 双目立体视觉 多分辨率 图像匹配 空间标定 双目旋转相机 特征提取 特征增强 细粒度
在线阅读 下载PDF
基于低成本多视角立体视觉的辣椒苗三维重建与策略优化
3
作者 朱磊 程瑞英 +3 位作者 丁一民 孙振源 郭政 江伟 《中国农村水利水电》 北大核心 2025年第4期123-129,共7页
基于立体视觉的三维重建技术有效降低了植株表型无损测量中的影像获取成本,但算力消耗较大。开展三维重建策略优化研究,对于提高植株表型信息的采集效率具有重要意义。研究构建了以手机为影像获取手段的多视角成像系统,获取了30株辣椒... 基于立体视觉的三维重建技术有效降低了植株表型无损测量中的影像获取成本,但算力消耗较大。开展三维重建策略优化研究,对于提高植株表型信息的采集效率具有重要意义。研究构建了以手机为影像获取手段的多视角成像系统,获取了30株辣椒苗的影像数据,进一步结合运动恢复结构与多视图立体视觉(SFM-MVS,Structure From Motion-MultiPle View Stereo)算法,在2160个不同分辨率和不同数量影像组合情景下,分别重建了辣椒苗三维点云。通过重建速度、精度、稳定性以及植株表型参数(叶长、叶宽)准确性的评估,优化植株三维点云重建方案。结果表明,当分辨率为480 p,图片数量大于45幅时,重建成功率达到80%,点云间平均距离误差均小于0.05 cm,提取的表型参数值与实测值的R2均到了0.96以上。同时,该情景下单株平均重建时间为344 s,仅为参照情景(分辨率为1080 p、图片数量为120幅)耗时的10%。综上,在辣椒苗的重建中可将分辨率和图像数量分别设置为480 p和45,从而优化表型测量效率。研究结果可为基于三维重建的辣椒苗表型参数快速无损测量提供参考。 展开更多
关键词 三维重建 多视角立体视觉 点云模型 表型参数
在线阅读 下载PDF
基于多目近红外视觉的多目标实时跟踪方法
4
作者 陈忠 王傲辰 +2 位作者 高心怡 何利辉 张宪民 《华南理工大学学报(自然科学版)》 北大核心 2025年第7期31-38,共8页
近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成... 近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成像特性,利用灰度质心法提取各个反光标记球的几何中心,然后在各单目相机中使用SORT算法作为多目标跟踪方法对各个标记点进行帧间匹配,并根据对极几何原理,结合带权二分图匹配方法确定反光标记球在各个相机中像点的匹配关系,依据三角测量方法实时计算各个受跟踪反光标记球的三维空间坐标;其次,根据运动过程中各反光标记球之间的空间位置关系对反光标记球进行分组,识别属于同一物体的反光标记球,并根据同组反光标记球间的欧氏距离建立被跟踪物体与反光标记球的外观特征向量,以此作为物体丢失重现的匹配依据,而完全丢失后再重现的被跟踪物体利用外观特征向量的余弦距离进行重匹配;最后,对所提方法进行实验验证。实验结果表明:所提方法在不小于60 f/s的帧率下的跟踪精度约可达0.5 mm;另外,其可以对丢失的重现物体以及反光标记球进行正确的重匹配。 展开更多
关键词 多目视觉 近红外光学跟踪 立体匹配 反光标记球
在线阅读 下载PDF
基于编码立体靶标的单轴转台标定方法
5
作者 王昊天 王鹏 +2 位作者 李岳 魏家起 付鲁华 《仪器仪表学报》 北大核心 2025年第7期171-182,共12页
针对目前单轴转台标定存在流程繁琐且精度较低的问题,在深入剖析转台标定原理的基础上,设计一种新型编码立体靶标,并提出高精度转台参数多约束优化方法,用于提高单轴转台标定的效率和精度。首先,靶标整合3个含有编码特征点的不同位置姿... 针对目前单轴转台标定存在流程繁琐且精度较低的问题,在深入剖析转台标定原理的基础上,设计一种新型编码立体靶标,并提出高精度转台参数多约束优化方法,用于提高单轴转台标定的效率和精度。首先,靶标整合3个含有编码特征点的不同位置姿态的正方形平面,利用编码的唯一性可准确确定出各个平面的位姿变化情况,只需对靶标位姿进行一次调整,即可标定出转台的参数,显著简化了标定流程;其次,设计了编码特征点识别与处理算法,通过生成自适应椭圆掩膜,实现目标特征点的鲁棒分离,从而稳定、准确地识别编码特征点并完成解码,具备较强的鲁棒性;最后,设计了高精度转台参数多约束优化方法,结合点位约束、共面约束和法向量夹角约束建立目标函数,设置了权重参数,对转台标定参数进行优化,提高了标定精度。实验结果显示,使用所提方法标定转台,只需调整一次靶标位姿,即可使标定精度达到0.021 mm,与传统方法相比,精度可提高约36.363%。同时,根据标定结果拼接标准球,精度可达0.025 mm,相比于传统算法,误差约下降16.667%,进一步验证了该方法的可行性。此外,面对不同水平噪声时,所提优化算法可保持较为稳定的优化结果,展现出较好的鲁棒性。 展开更多
关键词 转台标定 编码立体靶标 多约束优化 精密测量
原文传递
基于深度学习的多视图立体视觉综述 被引量:1
6
作者 樊铭瑞 申冰可 +3 位作者 牛文龙 彭晓东 谢文明 杨震 《软件学报》 北大核心 2025年第4期1692-1714,共23页
多视图立体视觉在自动驾驶、增强现实、遗产保护和生物医学等领域得到广泛应用.为了弥补传统多视图立体视觉方法对低纹理区域不敏感、重建完整度差等不足,基于深度学习的多视图立体视觉方法应运而生.对基于深度学习的多视图立体视觉方... 多视图立体视觉在自动驾驶、增强现实、遗产保护和生物医学等领域得到广泛应用.为了弥补传统多视图立体视觉方法对低纹理区域不敏感、重建完整度差等不足,基于深度学习的多视图立体视觉方法应运而生.对基于深度学习的多视图立体视觉方法的开创性工作和发展现状进行综述,重点关注基于深度学习的多视图立体视觉局部功能改进和整体架构改进方法,深入分析代表性模型.同时,阐述目前广泛使用的数据集及评价指标,并对比现有方法在数据集上的测试性能.最后对多视图立体视觉未来有前景的研究发展方向进行展望. 展开更多
关键词 深度学习 计算机视觉 三维重建 多视图立体视觉
在线阅读 下载PDF
融合上下文引导代价体和深度细化的多视图立体重建
7
作者 陈光远 王朝辉 程泽 《计算机科学》 北大核心 2025年第3期231-238,共8页
针对基于深度学习的多视图立体(Multi-view Stereo,MVS)重建算法仍然存在图像特征提取不全面、代价体匹配模糊以及深度误差不断积累而导致在无纹理和重复纹理区域重建效果差的问题,提出了基于上下文引导的代价体构建和深度细化的级联MV... 针对基于深度学习的多视图立体(Multi-view Stereo,MVS)重建算法仍然存在图像特征提取不全面、代价体匹配模糊以及深度误差不断积累而导致在无纹理和重复纹理区域重建效果差的问题,提出了基于上下文引导的代价体构建和深度细化的级联MVS网络。首先,利用基于无参注意力的特征融合模块过滤无用特征并通过特征融合来解决多尺度特征不一致的问题;然后,利用基于上下文引导的代价体模块融合全局信息来提高代价体匹配的完整性和鲁棒性;最后,利用深度细化模块学习深度残差来提升低分辨下深度图的准确性。实验结果表明,在DTU数据集上,该网络相比MVSNet完整度误差减小了24.4%,准确度误差减小了4.1%,整体误差减小了14.3%,其在Tanks and Temples数据集上性能也优于大多数算法,展现出强大的竞争力。 展开更多
关键词 多视图立体 特征融合 上下文引导 代价体匹配 深度细化
在线阅读 下载PDF
自适应深度一致与跨频注意力的多视立体网络
8
作者 邢航 王刚 +1 位作者 王岩 侯明辉 《吉林大学学报(信息科学版)》 2025年第4期724-735,共12页
针对当前深度学习在三维重建中难以从图像中提取全面的场景信息,以及未充分考虑视图间的深度一致性问题,提出具有自适应深度一致性和跨频注意力的多视图立体网络(ADCFA-MVSNet:Multi-View Stereo with Adaptive Depth Consistency and C... 针对当前深度学习在三维重建中难以从图像中提取全面的场景信息,以及未充分考虑视图间的深度一致性问题,提出具有自适应深度一致性和跨频注意力的多视图立体网络(ADCFA-MVSNet:Multi-View Stereo with Adaptive Depth Consistency and Cross-Frequency Attention)。跨频注意力(CFA:Cross-Frequency Attention)模块整合图像内高频和低频信息,以及跨视图的全局场景信息,能更加全面地提取图像特征。自适应深度一致性(AD:Adaptive Depth Consistency)模块精确捕捉场景中的几何结构,动态考虑不同视图对深度一致性的贡献,在不同尺度上增强深度一致性。其创新之处在于利用全面的图像信息,确保几何一致性,从而在3D重建任务中取得优异的表现。实验结果表明,在DTU(Technical University of Denmark)数据集上精确度为0.319,完整度为0.285,整体得分为0.302,优于其他对比方法。在BlendedMVS数据集上,EPE(End-Point-Error)得分为0.27,e1得分为5.28,e3得分为1.84,同样优于对比方法。证明了ADCFA-MVSNet在提升多视图三维重建的完整度和精度方面的有效性,提高了多视图重建质量,取得了良好的重建效果。 展开更多
关键词 计算机视觉 多视图立体视觉 深度学习 跨频注意力 自适应深度一致性
在线阅读 下载PDF
基于视差估计网络的多视卫星影像稠密匹配及DSM生成
9
作者 姜楠 史长斌 +3 位作者 蔡文婧 曲英杰 刘海兵 邓非 《测绘科学》 北大核心 2025年第6期91-102,共12页
针对多时相卫星影像因光照和季节变化呈现动态特征,而传统立体匹配方法基于场景静态假设,导致匹配精度和完整性不足的问题,该文提出了一种基于深度学习视差估计网络的卫星立体匹配方法(DLSSM)。首先采用HMSM-NET网络,替代传统的匹配算法... 针对多时相卫星影像因光照和季节变化呈现动态特征,而传统立体匹配方法基于场景静态假设,导致匹配精度和完整性不足的问题,该文提出了一种基于深度学习视差估计网络的卫星立体匹配方法(DLSSM)。首先采用HMSM-NET网络,替代传统的匹配算法,通过构建多尺度金字塔特征和学习多尺度对应关系,增强网络在视差不连续和遮挡区域的处理能力,提升视差估计的准确性,最后通过有理多项式系数(RPC)三角化获取三维点云。另外,该文提出一种自适应点云聚类的DSM生成方法(ADG),融合多组立体匹配的点云并栅格化,对DSM栅格中的三维点进行滤波和聚类分析,并自适应地选择网格最优的高程值,从而提高DSM在边缘处的精度。在US3D和MVS3DM数据集上的实验表明,DLSSM方法具有较好的泛化能力,与传统的DSM融合方法相比,ADG方法生成的DSM边界更清晰和准确,与商业软件相比,该文方法的DSM细节更多且精度更高。 展开更多
关键词 光学卫星影像 多视图匹配 立体匹配 深度学习 视差估计 自适应DSM生成
原文传递
基于内窥镜图像的儿童腺样体场景三维重建
10
作者 许涛 王顺成 +3 位作者 钟建文 刘大波 周宜龙 刘畅 《集成技术》 2025年第1期65-77,共13页
腺样体肥大是导致儿童阻塞性睡眠呼吸暂停综合征的主要因素。医生通过内窥镜影像评估腺样体肥大程度及其对气道的阻塞程度。然而,内窥镜影像为二维图像,医生只能主观推测患者腺样体区域的三维结构。这种方法严重依赖医生的相关经验和对... 腺样体肥大是导致儿童阻塞性睡眠呼吸暂停综合征的主要因素。医生通过内窥镜影像评估腺样体肥大程度及其对气道的阻塞程度。然而,内窥镜影像为二维图像,医生只能主观推测患者腺样体区域的三维结构。这种方法严重依赖医生的相关经验和对腺样体的观察角度。腺样体表面为人体黏膜组织,覆盖鼻腔分泌物,其内窥镜影像具有强反光、特征稀少、场景光滑、模糊等特点。根据腺样体表面特点,该文提出一种基于腺样体鼻咽腔内镜图像序列的多视图三维重建算法。算法首先采用多视图立体匹配技术获取图像对应深度图的粗糙估计;其次,使用网格曲面在深度空间中对粗糙的深度信息进行拟合,从而得到平滑、精细的深度图;最后,通过点云融合算法获得腺样体区域稠密、精确的三维重建。仿真与真实实验表明,该文算法基于腺样体内窥镜图像序列,可实现精确、稠密、平滑的腺样体区域三维重建,且重建结果显著优于现有三维重建算法。 展开更多
关键词 腺样体 三维重建 曲面拟合 多视图立体重建
在线阅读 下载PDF
室内环境下融合点线特征的双目VI-SLAM方法
11
作者 郭旭 袁杰 +2 位作者 谢霖伟 鲍慧敏 李世钰 《哈尔滨工业大学学报》 北大核心 2025年第8期69-78,104,共11页
为解决室内环境下弱纹理场景中关键点特征稀疏、结构化场景中结构化特征应用不充分以及相机快速移动时关键帧容易跟踪失败的问题,提出了一种基于点线特征融合的双目视觉惯性SLAM方法。首先,基于EDlines线段提取方法,结合高斯图像金字塔... 为解决室内环境下弱纹理场景中关键点特征稀疏、结构化场景中结构化特征应用不充分以及相机快速移动时关键帧容易跟踪失败的问题,提出了一种基于点线特征融合的双目视觉惯性SLAM方法。首先,基于EDlines线段提取方法,结合高斯图像金字塔实现多尺度线段的提取,以增强线段匹配的尺度不变性。同时,对不同尺度下的线段端点的不确定性进行建模,并结合平铺技术对线段的二进制描述符进行分块处理,从而加速线段匹配并提高线特征匹配的鲁棒性与效率。其次,优化惯性传感器的预积分模型,融合双目视觉的点特征重投影误差、线特征重投影误差以及惯性传感器的预积分约束,采用滑动窗口的非线性优化方法进行联合优化,以提高系统位姿估计精度。最后,文中在包含弱纹理、结构化以及相机快速移动等复杂环境的EuRoC数据集上进行实验。结果表明,VI-SLAM方法在EuRoC数据集上的相机轨迹均方根误差为0.031 m,平均误差为0.027 m,拥有更强的鲁棒性和更高的定位精度,尤其在弱纹理和相机快速运动场景中,定位精度优势显著。 展开更多
关键词 同步定位与建图(SLAM) 视觉惯性 点线特征 双目相机 多尺度 非线性优化
在线阅读 下载PDF
双目结构光目标三维重建方法研究
12
作者 杨其望 张慧 +1 位作者 刘江涛 王钦若 《广东工业大学学报》 2025年第5期121-128,共8页
针对双目结构光三维重建在左右图像的立体匹配过程中匹配基源选取不当造成的重建精度低等问题,提出一种基于绝对相位的匹配方法,从而降低误匹配率,提高重建精度。首先,在相移法与多频外差法求解的绝对相位基础上,利用极线约束对左右图... 针对双目结构光三维重建在左右图像的立体匹配过程中匹配基源选取不当造成的重建精度低等问题,提出一种基于绝对相位的匹配方法,从而降低误匹配率,提高重建精度。首先,在相移法与多频外差法求解的绝对相位基础上,利用极线约束对左右图像像素点采用全局搜索与局部搜索创建搜索匹配区域;然后对搜索区域进行3次样条插值实现亚像素立体匹配;最后利用三角测距原理完成匹配点二维坐标到三维坐标的转换,实现对目标表面的三维重建。实验结果表明:本文提出的方法较绝对误差和(Sum of Absolute Differences,SAD)与误差平方和(Sum of Squared Differences,SDD)匹配算法在匹配耗时上缩短了87.77%,在重建精度上分别提高了77.75%和90%,具有较强的通用性和实用性。同时三维重建后的点云无水波纹现象,表面平整光滑更接近实物。 展开更多
关键词 双目结构光 三维重建 多频外差 绝对相位 立体匹配
在线阅读 下载PDF
基于农业自动驾驶环境感知的立体匹配网络研究 被引量:1
13
作者 黄莹 杨肖委 《中国农机化学报》 北大核心 2025年第4期74-79,85,共7页
针对农机自动驾驶环境感知在行驶边缘病态区域存在误匹配的问题,提出一种基于边缘检测和多尺度代价体的立体匹配网络。首先,在特征提取阶段设计边缘分支网络和视差分支网络,利用边缘分支网络有效提取细小物体的几何轮廓信息,并将轮廓作... 针对农机自动驾驶环境感知在行驶边缘病态区域存在误匹配的问题,提出一种基于边缘检测和多尺度代价体的立体匹配网络。首先,在特征提取阶段设计边缘分支网络和视差分支网络,利用边缘分支网络有效提取细小物体的几何轮廓信息,并将轮廓作为结构信息嵌入到视差分支网络中;其次,在构建匹配代价阶段设计一种多尺度代价体,不同代价体之间相互约束能够提高匹配像素与候选像素的相关性,同时融合多个代价体能够捕获更多的全局上下文信息进行正则化;最后,在Scene Flow、KITTI 2015以及Middlebury v.3立体数据集进行试验。结果表明,与EdgeStereo算法相比,提出的网络模型在Scene Flow、KITTI 2015以及Middlebury v.3数据集的视差精度分别提高45.8%、14.8%和41.2%,为农业自动驾驶环境感知提供技术参考。 展开更多
关键词 农业自动驾驶 立体匹配 边缘检测 多尺度代价体 视差优化
在线阅读 下载PDF
多阶段协同的多视图立体算法研究
14
作者 朱治年 刘韵婷 +2 位作者 肖培宇 李思维 刘欣然 《通信与信息技术》 2025年第2期28-32,共5页
多视图立体匹配(Multi-View Stereo)是计算机视觉领域的重要任务之一,旨在从多个视角的图像中恢复场景的结构信息。然而,由于成本体积聚合在局部存在着严重的不一致性,直接聚合几何相邻成本会导致严重错误导向。现有的方法要么寻求二维... 多视图立体匹配(Multi-View Stereo)是计算机视觉领域的重要任务之一,旨在从多个视角的图像中恢复场景的结构信息。然而,由于成本体积聚合在局部存在着严重的不一致性,直接聚合几何相邻成本会导致严重错误导向。现有的方法要么寻求二维空间的最优选择性聚集,要么增加聚集的手段,但都无法有效解决成本体积的几何不一致性,导致深度估计的精度和鲁棒性不佳。为了解决这个问题,提出用于多视图立体的协同表达(CRMVS),旨在协同多个模块整合几何的一致性信息,提高多视图立体匹配任务的深度估计精度和鲁棒性。首先,利用改进的特征金字塔网络(FPN)增强网络的特征提取能力。其次,设计了一个渐进式权重网络模块(PWN)进行代价体的构建。最后,设计了一个几何代价聚合与精化网络模块(GCR)来对代价体进行精准聚合。实验结果表明在DTU,Tanks&Temple数据集上都展现出了先进的性能。 展开更多
关键词 多视图立体匹配 特征金字塔 代价体 成本聚合
在线阅读 下载PDF
融合上下文增强与图像频率引导的MVS方法
15
作者 陈曦 刘美 陈嘉升 《计算机系统应用》 2025年第3期259-267,共9页
基于学习的多视图立体匹配算法目前成果显著,但是仍然存在的卷积感受野受限以及忽略图像频率信息导致在低纹理、重复和非兰伯曲面匹配性能不足的问题,针对以上问题提出了上下文增强与图像频率引导的多视图立体匹配网络CAF-MVSNet.首先,... 基于学习的多视图立体匹配算法目前成果显著,但是仍然存在的卷积感受野受限以及忽略图像频率信息导致在低纹理、重复和非兰伯曲面匹配性能不足的问题,针对以上问题提出了上下文增强与图像频率引导的多视图立体匹配网络CAF-MVSNet.首先,在特征提取阶段,将上下文增强模块融合到特征金字塔网络中,有效地扩大网络的感受野.然后引入了图像频率引导注意力模块,通过编码图像的不同频率获取图像的线条、形状、纹理和颜色等信息,增强图像的远程上下文联系的同时进一步解决低纹理、重复和非兰伯曲面的精确匹配问题,以实现可靠的特征匹配.在DTU数据集上的实验结果显示,与经典的级联模型Cas MVSNet相比综合误差(overall)提升了12.3%,展现了优秀的性能.此外,在Tanks and Temples数据集上也取得了不错的效果,展现了良好的泛化性能. 展开更多
关键词 多视图立体匹配 三维重建 上下文增强 图像频率引导 深度学习
在线阅读 下载PDF
基于高精度立体测绘卫星三维大模型建模技术研究与应用
16
作者 裴春营 廖芳芳 +3 位作者 庞晓峰 石峰 郑斌 孙仲秋 《现代信息科技》 2025年第13期144-148,共5页
境外大范围三维建模面临数据采集精度、处理融合、软件选择及产品可视化等多重技术挑战,亟需研究设计基于高分辨率立体测绘卫星影像的三维建模方法。以人工智能、遥感大模型和高精度立体测绘等先进技术为基础,利用WorldView-3和GeoEye-... 境外大范围三维建模面临数据采集精度、处理融合、软件选择及产品可视化等多重技术挑战,亟需研究设计基于高分辨率立体测绘卫星影像的三维建模方法。以人工智能、遥感大模型和高精度立体测绘等先进技术为基础,利用WorldView-3和GeoEye-1等主流高精度立体测绘卫星影像作为数据源,互联网众源影像作为辅助资料进行境外大区域地物识别、纹理信息提取以及高精度三维建模。实现了卫星影像的精准定向和众源影像的高精度位置姿态恢复、纹理信息提取、模型结构生成以及纹理贴图,最终成功构建境外精细化三维模型。解决了高分辨率影像在大范围、高精度三维建模中的关键技术难题,显著提高三维模型生成效率。 展开更多
关键词 遥感大模型 人工智能 多视角立体测绘卫星 三维建模
在线阅读 下载PDF
基于多尺度特征融合的双目位姿估计
17
作者 朱家奇 李彬 赵新华 《光学技术》 北大核心 2025年第5期610-616,共7页
针对病态区域位姿估计精度不足的问题,提出基于多尺度特征融合的双目位姿估计算法。算法通过构建双目视觉-位姿估计端到端联合优化框架,突破传统级联式架构的信息传递瓶颈。首先,设计多尺度成本积模块,通过融合不同感受野下的上下文特征... 针对病态区域位姿估计精度不足的问题,提出基于多尺度特征融合的双目位姿估计算法。算法通过构建双目视觉-位姿估计端到端联合优化框架,突破传统级联式架构的信息传递瓶颈。首先,设计多尺度成本积模块,通过融合不同感受野下的上下文特征,提升弱纹理与遮挡区域的立体匹配精度;其次,提出金字塔特征筛选融合模块,利用跨层注意力机制动态聚合低层几何细节与高层语义信息,以增强位姿估计的几何一致性;最后,以Linemod数据集为基础,搭建基于双目的Linemod-Stereo数据集,并验证本文算法的有效性。实验结果表明,所提算法相比传统基于RGB-D的位姿估计方法具有竞争性优势。 展开更多
关键词 立体匹配 双目视觉 位姿估计 多模态融合
原文传递
基于光度立体成像的软包电池表面缺陷检测方法
18
作者 赵阳 王中任 +2 位作者 周署明 吕庆海 何卫国 《制造业自动化》 2025年第7期23-31,共9页
软包电池表面缺陷检测是生产过程的关键环节,针对现有检测方法检测精度低、大尺寸电池成像困难等问题,提出一种基于光度立体成像和深度学习的检测方法。首先,结合光度立体与线阵相机成像技术,建立多光源分时曝光成像系统(MSTIS),通过分... 软包电池表面缺陷检测是生产过程的关键环节,针对现有检测方法检测精度低、大尺寸电池成像困难等问题,提出一种基于光度立体成像和深度学习的检测方法。首先,结合光度立体与线阵相机成像技术,建立多光源分时曝光成像系统(MSTIS),通过分时曝光获取多个光源下的电池表面图像,并进行光度立体计算得到包含三维信息的曲率图。然后,为解决小目标和多尺度缺陷漏检问题,对YOLOv8算法进行改进,通过Sobel卷积和常规卷积组成的双通道卷积构建边缘信息增强模块(EIEM),提高特征边缘提取能力,将语义和细节信息融合方法(SDI)与双向特征金字塔模块结合增强微小缺陷的识别精度,并采用轻量级共享卷积检测头以减少算法计算量。试验结果表明,该方法平均检测精度达到94.2%,检测速度达到116FPS,能有效检测软包电池表面缺陷。 展开更多
关键词 缺陷检测 软包电池 光度立体 多尺度 边缘增强 曲率图
在线阅读 下载PDF
融合多尺度特征注意力的双目立体匹配算法
19
作者 张嫡 李泽平 +1 位作者 赵勇 杨文帮 《计算机工程与设计》 北大核心 2025年第1期30-36,共7页
针对现有的立体匹配算法在反光、反射、纹理模糊、纹理复杂边缘等区域推理精度不高的问题,提出一种融合多尺度特征注意力的立体匹配网络。采用改进的金字塔池化模块,将金字塔池化结合U型架构,加强边缘区域有效特征信息的提取;在网络中... 针对现有的立体匹配算法在反光、反射、纹理模糊、纹理复杂边缘等区域推理精度不高的问题,提出一种融合多尺度特征注意力的立体匹配网络。采用改进的金字塔池化模块,将金字塔池化结合U型架构,加强边缘区域有效特征信息的提取;在网络中引入多尺度特征融合的注意力模块,融合多尺度代价体和注意力机制增强代价体中不同层次信息量,同时捕获在不同维度间的信息依赖关系,抑制代价体中无关信息;采用多阶段的视差精化得到最终的视差图。实验结果表明,MFANet预测的精度相比基准网络GwcNet在SceneFlow、KITTI 2012和KITTI 2015分别提高了18.8%、11.6%、12%。 展开更多
关键词 深度学习 立体匹配 双目视觉 特征提取 多尺度特征注意力 改进金字塔池化 视差优化
在线阅读 下载PDF
基于选择性融合上下文信息的立体匹配网络
20
作者 宁安琪 於跃成 +1 位作者 杨帆 李响 《电子测量技术》 北大核心 2025年第15期141-149,共9页
目前基于深度学习的立体匹配网络虽然具备较高的精度,但是网络中复杂的结构导致计算时间的急剧增加。为了平衡网络的匹配速度与精确度,本文提出了基于选择性融合上下文信息的立体匹配网络。首先,通过相关层方法构建成本体,进而在聚合模... 目前基于深度学习的立体匹配网络虽然具备较高的精度,但是网络中复杂的结构导致计算时间的急剧增加。为了平衡网络的匹配速度与精确度,本文提出了基于选择性融合上下文信息的立体匹配网络。首先,通过相关层方法构建成本体,进而在聚合模块中采用单编码器-解码器结构,以降低模型复杂度。其次,在编码器中融合多尺度成本体,以捕捉不同层级的视差信息;同时,在解码器中设计选择性融合上下文信息模块,利用参考图像的上下文特征引导几何信息的高质量解码。最后,设计多分支聚合金字塔池化模块,增强编码-解码模块理解全局语境的能力。实验结果表明,本文算法在KITTI2015数据集上全部区域的误匹配率为1.97%,在KITTI2012数据集上的三像素误差为1.50%。与其他算法相比,在满足算法实时性要求的同时,实现了更精准的立体匹配精度。 展开更多
关键词 立体匹配 注意力模块 多尺度融合 视差图 成本聚合
原文传递
上一页 1 2 18 下一页 到第
使用帮助 返回顶部