期刊文献+
共找到587篇文章
< 1 2 30 >
每页显示 20 50 100
Virtual Epipolar Line Construction of Single-Lens Bi-Prism Stereovision System 被引量:3
1
作者 Wei Loon Kee Kah Bin Lim 《Journal of Electronic Science and Technology》 CAS 2012年第2期97-101,共5页
This paper proposes a simple geometrical ray based approach to solve the stereo correspondence problem for the single-lens bi-prism stereovision system. Each image captured using this system can be divided into two su... This paper proposes a simple geometrical ray based approach to solve the stereo correspondence problem for the single-lens bi-prism stereovision system. Each image captured using this system can be divided into two sub-images on the left and right and these sub-images are generated by two virtual cameras which are produced by the bi-prism. This stereovision system is equivalent to the conventional two camera system and the two sub-images captured have disparities which can be used to reconstruct back the 3-dimensional (3D) scene. The stereo correspondence problem of this system will be solved geometrically by applying the epipolar geometry constraint on the generated virtual cameras instead of the real CCD camera. Experiments are conducted to validate the proposed method and the results are compared to the calibration based approach to confirm its accuracy and effectiveness. 展开更多
关键词 CORRESPONDENCE epipolar geometry PRISM STEREOVISION virtual camera.
在线阅读 下载PDF
An Iterative Pose Estimation Algorithm Based on Epipolar Geometry With Application to Multi-Target Tracking 被引量:3
2
作者 Jacob H.White Randal W.Beard 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2020年第4期942-953,共12页
This paper introduces a new algorithm for estimating the relative pose of a moving camera using consecutive frames of a video sequence. State-of-the-art algorithms for calculating the relative pose between two images ... This paper introduces a new algorithm for estimating the relative pose of a moving camera using consecutive frames of a video sequence. State-of-the-art algorithms for calculating the relative pose between two images use matching features to estimate the essential matrix. The essential matrix is then decomposed into the relative rotation and normalized translation between frames. To be robust to noise and feature match outliers, these methods generate a large number of essential matrix hypotheses from randomly selected minimal subsets of feature pairs, and then score these hypotheses on all feature pairs. Alternatively, the algorithm introduced in this paper calculates relative pose hypotheses by directly optimizing the rotation and normalized translation between frames, rather than calculating the essential matrix and then performing the decomposition. The resulting algorithm improves computation time by an order of magnitude. If an inertial measurement unit(IMU) is available, it is used to seed the optimizer, and in addition, we reuse the best hypothesis at each iteration to seed the optimizer thereby reducing the number of relative pose hypotheses that must be generated and scored. These advantages greatly speed up performance and enable the algorithm to run in real-time on low cost embedded hardware. We show application of our algorithm to visual multi-target tracking(MTT) in the presence of parallax and demonstrate its real-time performance on a 640 × 480 video sequence captured on a UAV. Video results are available at https://youtu.be/Hh K-p2 h XNn U. 展开更多
关键词 Aerial robotics epipolar geometry multi-target tracking pose estimation unmanned aircraft systems vision-based flight
在线阅读 下载PDF
A 3-D RECONSTRUCTION METHOD BASED ON THE CONSTRAINT OF EPIPOLAR GEOMETRY
3
作者 Xu Zhengwei Wu Chengke Pang Chenjing Shen Peiyi(Information Engineering Dept., Xidian University, Xi’an 710071) 《Journal of Electronics(China)》 1998年第3期274-277,共4页
This paper combines the least-square method and iteration method to get the fundamental matrix and develops a new evaluation function based on the epipolar geometry. During the iteration, with the evaluation function ... This paper combines the least-square method and iteration method to get the fundamental matrix and develops a new evaluation function based on the epipolar geometry. During the iteration, with the evaluation function as a measurment, the points which bring larger noise are deleted, and the points with smaller noise are retained, thus the precision of our method is increased. The experiment results indicate the new method is precise in calculation, stable in performance and resistant to noise. 展开更多
关键词 epipolar GEOMETRY FUNDAMENTAL MATRIX 3-D RECONSTRUCTION
在线阅读 下载PDF
Learning Epipolar Line Window Attention for Stereo Image Super-Resolution Reconstruction
4
作者 Xue Li Hongying Zhang +1 位作者 Zixun Ye Xiaoru 《Computers, Materials & Continua》 SCIE EI 2024年第2期2847-2864,共18页
Transformer-based stereo image super-resolution reconstruction(Stereo SR)methods have significantly improved image quality.However,existing methods have deficiencies in paying attention to detailed features and do not... Transformer-based stereo image super-resolution reconstruction(Stereo SR)methods have significantly improved image quality.However,existing methods have deficiencies in paying attention to detailed features and do not consider the offset of pixels along the epipolar lines in complementary views when integrating stereo information.To address these challenges,this paper introduces a novel epipolar line window attention stereo image super-resolution network(EWASSR).For detail feature restoration,we design a feature extractor based on Transformer and convolutional neural network(CNN),which consists of(shifted)window-based self-attention((S)W-MSA)and feature distillation and enhancement blocks(FDEB).This combination effectively solves the problem of global image perception and local feature attention and captures more discriminative high-frequency features of the image.Furthermore,to address the problem of offset of complementary pixels in stereo images,we propose an epipolar line window attention(EWA)mechanism,which divides windows along the epipolar direction to promote efficient matching of shifted pixels,even in pixel smooth areas.More accurate pixel matching can be achieved using adjacent pixels in the window as a reference.Extensive experiments demonstrate that our EWASSR can reconstruct more realistic detailed features.Comparative quantitative results show that in the experimental results of our EWASSR on the Middlebury and Flickr1024 data sets for 2×SR,compared with the recent network,the Peak signal-to-noise ratio(PSNR)increased by 0.37 dB and 0.34 dB,respectively. 展开更多
关键词 Stereo SR epipolar line window attention feature distillation
在线阅读 下载PDF
ImVoxelENet:Image to voxels epipolar transformer for multi-view RGB-based 3D object detection
5
作者 Gang Xu Haoyu Liu +1 位作者 Biao Leng Zhang Xiong 《Computational Visual Media》 2025年第4期871-888,共18页
The task of detecting three-dimensional objects using only RGB images presents a considerable challenge within the domain of computer vision.The core issue lies in accurately performing epipolar geometry matching betw... The task of detecting three-dimensional objects using only RGB images presents a considerable challenge within the domain of computer vision.The core issue lies in accurately performing epipolar geometry matching between multiple views to obtain latent geometric priors.Existing methods establish correspondences along epipolar line features in voxel space through various layers of convolution.However,this step often occurs in the later stages of the network,which limits overall performance.To address this challenge,we introduce a novel framework,ImVoxelENet,that integrates a geometric epipolar constraint.We start from the back-projection of pixel-wise features and design an attention mechanism that captures the relationship between forward and backward features along the ray for multiple views.This approach enables the early establishment of geometric correspondences and structural connections between epipolar lines.Using ScanNetV2 as a benchmark,extensive comparative and ablation experiments demonstrate that our proposed network achieves a 1.1%improvement in mAP,highlighting its effectiveness in enhancing 3D object detection performance.Our code is available at https://github.com/xug-coder/ImVoxelENet. 展开更多
关键词 3D object detection epipolar geometry TRANSFORMERS ATTENTION deep learning
原文传递
ETV-MVS:Robust Visibility-Aware Multi-View Stereo with Epipolar Line-Based Transformer
6
作者 Shaoqian Wang Xiaokun Ding +1 位作者 Yuxin Mao Yuchao Dai 《Big Data Mining and Analytics》 2025年第3期520-533,共14页
Multi-View Stereo(MVS)is a pivotal technique in computer vision for reconstructing 3D models from multiple images by estimating depth maps.However,the reconstruction performance is hindered by visibility challenges,su... Multi-View Stereo(MVS)is a pivotal technique in computer vision for reconstructing 3D models from multiple images by estimating depth maps.However,the reconstruction performance is hindered by visibility challenges,such as occlusions and non-overlapping regions.In this paper,we propose an innovative visibility-aware framework to address these issues.Central to our method is an Epipolar Line-based Transformer(ELT)module,which capitalizes on the epipolar line correspondence and candidate matching features between images to enhance the feature representation and correlation robustness.Furthermore,we propose a novel Supervised Visibility Estimation(SVE)module that estimates high-precision visibility maps,transcending the constraints of previous methods that rely on indirect supervision.By integrating these modules,our method achieves state-of-the-art results on the benchmarks and demonstrates its capability to perform high-quality reconstructions even in challenging regions.The code will be released at https://github.com/npucvr/ETV-MVS. 展开更多
关键词 Multi-View Stereo(MVS) Deep Neural Networks(DNN) epipolar geometry TRANSFORMER
原文传递
基于几何估计优化的多线激光三维重建
7
作者 黄会明 刘桂华 +2 位作者 邓磊 宋涛 钦付平 《中国光学(中英文)》 北大核心 2025年第2期274-286,共13页
传统的多线激光三维重建技术由于多线激光线不可避免地会受到噪声的影响,导致检测的激光中心坐标存在一定误差,这将导致直接使用基于极线约束找到的匹配点进行三维重建时无法获得高精度的三维数据。为了解决上述问题,本文提出了一种基... 传统的多线激光三维重建技术由于多线激光线不可避免地会受到噪声的影响,导致检测的激光中心坐标存在一定误差,这将导致直接使用基于极线约束找到的匹配点进行三维重建时无法获得高精度的三维数据。为了解决上述问题,本文提出了一种基于几何估计方法来实现多线激光的三维重建。首先,标定出多线激光的二次曲面方程,结合双目极线约束的方法可以计算出多线激光的初始匹配点。在找到正确的初始匹配点之后,利用图像点与双视图极线的关系约束来建立一个几何距离最小化的估计模型。通过这个几何距离最小化的优化估计,可以重新计算出更加符合极线约束的新匹配点,从而提高激光图像点的匹配精度,最后根据这些新的匹配点来完成多线激光的三维重建。实验结果显示:相较于传统方法,本文提出的算法在匹配度和精度方面表现更优,最终的三维重建精度可以达到0.02mm左右。通过这种方法可以显著提高双目多线激光重建的整体精度,从而获得更加精确和可靠的三维数据。 展开更多
关键词 多线激光 极线约束 几何估计 多线激光重建
在线阅读 下载PDF
动态场景优化ORB-SLAM3算法
8
作者 徐淑萍 杨定哲 +1 位作者 房嘉翔 蒋硕 《中国惯性技术学报》 北大核心 2025年第10期998-1007,共10页
针对动态场景中移动物体引发的机器人位姿估计偏差及地图构建不完善问题,提出一种动态场景优化ORB-SLAM3算法。首先通过改进的YOLOv5s算法检测动态物体并初步剔除关联特征点,随后联合LK光流跟踪与基于基本矩阵的极线几何约束分析,进一... 针对动态场景中移动物体引发的机器人位姿估计偏差及地图构建不完善问题,提出一种动态场景优化ORB-SLAM3算法。首先通过改进的YOLOv5s算法检测动态物体并初步剔除关联特征点,随后联合LK光流跟踪与基于基本矩阵的极线几何约束分析,进一步滤除漏检的动态特征点,从而提升环境感知与位姿估计精度。同时,通过滤除动态信息的关键帧生成对应的点云信息,实现三维稠密静态地图构建。室内动态场景下的测试结果表明:相较于传统ORB-SLAM3,所提算法的绝对轨迹误差和相对位姿误差在办公室环境下分别减小55.2%和93.7%,走廊场景中分别减小24.3%和40.2%,验证了其在动态场景中的鲁棒性优势。 展开更多
关键词 改进YOLOv5s LK光流 极线约束 三维稠密点云地图
在线阅读 下载PDF
基于U-Net网络和对极几何的介入导管空间形状重建方法 被引量:1
9
作者 王康 何彦霖 +2 位作者 黄宇辰 魏聚群 娄小平 《仪器仪表学报》 北大核心 2025年第1期147-156,共10页
介入手术是治疗心血管疾病的主要方式之一,现有手术主要依靠二维荧光透视图像指导医生操作,无法实现术中介入导管的三维可视化,限制了手术效率和安全性。面向心血管介入手术临床精准治疗的需求,提出一种基于U-Net网络和对极几何的介入... 介入手术是治疗心血管疾病的主要方式之一,现有手术主要依靠二维荧光透视图像指导医生操作,无法实现术中介入导管的三维可视化,限制了手术效率和安全性。面向心血管介入手术临床精准治疗的需求,提出一种基于U-Net网络和对极几何的介入手术导管空间形状重建方法,实现术中介入手术导管三维形状的重建。首先利用U-Net网络分割出双平面荧光透视图像中导管的轮廓,并通过骨架化算法提取出导管的中心线。接着研究了基于对极几何约束的立体视觉匹配方法,通过求解极线与导管中心线的交点,求解出双平面投影中导管点集的对应关系,并结合投影模型与导管中心线构造空间射线,通过逐个求解空间射线的相交点,将空间曲线重建问题转换成射线相交问题,实现导管三维空间形状的精确重建。最后,为验证所提出介入手术导管空间形状重建算法的可行性,进行了双平面透视图像重建导管实验,结果显示导管的最大形状重建误差<1.55 mm,均方误差<0.89 mm,豪斯多夫距离不足1.49 mm。表明所提出方法可实现介入手术导管三维形状的精确重建,为提升血管介入手术精准导航和柔性导丝安全操控提供新方法和技术基础。 展开更多
关键词 荧光透视图像 介入手术导管 形状重建 U-Net 对极几何
原文传递
多尺度EPI融合的密集光场解耦重建
10
作者 曹捷 吴玉静 +2 位作者 张倩 孟春丽 严涛 《上海大学学报(自然科学版)》 北大核心 2025年第3期530-542,共13页
为了充分挖掘光场极平面视图(epipolar plane image,EPI)之间的内在相关性,同时强化对空间信息的有效捕捉,提出了一种多尺度EPI信息融合的密集光场解耦重建方法.该方法对空间维度和极平面维度进行了更深层次的特征利用,能够更好地捕捉... 为了充分挖掘光场极平面视图(epipolar plane image,EPI)之间的内在相关性,同时强化对空间信息的有效捕捉,提出了一种多尺度EPI信息融合的密集光场解耦重建方法.该方法对空间维度和极平面维度进行了更深层次的特征利用,能够更好地捕捉子孔径视图间的角度相关性,通过解耦与融合多种信息,提高了光场重建的精度和效果.首先,在四维光场数据的基础上,增加了密集的空间维度,提升了网络的泛化能力,并增强了其对图像局部结构和纹理信息的理解.其次,为了更好地补充和增强极平面间的信息互补性,设计了一个极平面融合模块,并提出了一种新的多尺度卷积注意力机制来融合特征信息.该注意力机制通过多尺度特征提取与全局关注机制,能有效捕捉角度信息,增强重要特征表达并抑制冗余内容.最后,在HCInew、HCIold和Stanford等光场数据集上进行实验.结果表明,本方法在峰值信噪比(peak signal-to-noise ratio,PSNR)和结构相似性(structural similarity,SSIM)等评价指标上优于现有的最先进的SOTA(state-of-the-art)方法,在大多数测试场景中实现了更好的重建效果. 展开更多
关键词 光场 光场解耦 密集特征提取 极平面融合 角度超分辨率
在线阅读 下载PDF
双目极线约束下的储罐环焊缝定位算法
11
作者 金东升 曹文田 张英杰 《机械科学与技术》 北大核心 2025年第1期1-8,共8页
精准定位焊缝轨迹是实现自动化焊接的前提,该文依托双目视觉系统,以储罐环焊缝为焊接目标,研究了基于双目极线约束的焊缝定位算法。首先分析了双目系统成像模型以及三角测量原理,为后续实现焊缝的三维定位提供了理论依据。随后研究了基... 精准定位焊缝轨迹是实现自动化焊接的前提,该文依托双目视觉系统,以储罐环焊缝为焊接目标,研究了基于双目极线约束的焊缝定位算法。首先分析了双目系统成像模型以及三角测量原理,为后续实现焊缝的三维定位提供了理论依据。随后研究了基于灰度的焊缝特征提取算法,结合边缘检测、阈值分割、轮廓提取以及骨架提取等方法有效地提取出焊缝特征。并基于极线约束实现了左右图像焊缝特征的匹配,简化了匹配流程并降低了计算量,提高了匹配效率。实验结果表明:对焊缝特征点的三角测量平均误差为0.140106,能够满足实际工程需要。 展开更多
关键词 双目视觉 焊缝提取 视觉定位 极线约束 三角测量
在线阅读 下载PDF
动态场景下基于特征点筛选的视觉SLAM算法 被引量:1
12
作者 姜丽梅 陈信威 《系统仿真学报》 北大核心 2025年第3期753-762,共10页
针对传统的视觉SLAM算法在动态环境下定位精度与鲁棒性低的问题,提出了一种基于特征点筛选的改进动态SLAM算法。该算法以ORB-SLAM3算法为基本框架,增加了动态区域划分与特征点筛选模块。动态区域划分模块使用改进的RT-DETR目标检测算法... 针对传统的视觉SLAM算法在动态环境下定位精度与鲁棒性低的问题,提出了一种基于特征点筛选的改进动态SLAM算法。该算法以ORB-SLAM3算法为基本框架,增加了动态区域划分与特征点筛选模块。动态区域划分模块使用改进的RT-DETR目标检测算法检测图像中的动态物体并根据检测框划分动态区域,特征点筛选模块使用对极约束以及光流法筛选掉运动的动态物体身上的特征点,保留静止的动态物体上以及目标检测框内属于背景部分的特征点,参与后续的位姿优化。改进的算法尽可能的保留了更多的有效特征点参与相机位姿优化,实验结果表明:改进的算法在高动态环境下绝对轨迹误差的RMSE值,能够达到平均90%以上提升的同时保持实时运行。 展开更多
关键词 光流 对极约束 视觉SLAM 动态环境 RT-DETR PP-LCNet
原文传递
一种实时动态特征点识别方法及其视觉惯性里程计应用
13
作者 曹龙 柳景斌 +1 位作者 张伟 李孟祥 《测绘通报》 北大核心 2025年第7期26-31,共6页
视觉惯性里程计是一种常用的定位技术。该技术是建立在静态环境假设的前提下,在动态环境中稳健性和定位精度会降低。由于使用语义分割或目标检测的方法对动态物体进行识别,存在无法识别未定义的动态物体、错误识别静止物体以及实时性差... 视觉惯性里程计是一种常用的定位技术。该技术是建立在静态环境假设的前提下,在动态环境中稳健性和定位精度会降低。由于使用语义分割或目标检测的方法对动态物体进行识别,存在无法识别未定义的动态物体、错误识别静止物体以及实时性差等问题。为此,本文提出了一种实时动态特征点识别方法,用于提高视觉惯性里程计在动态场景中的定位精度。首先,对图像中的特征点速度矢量进行聚类分析;然后,基于极线匹配误差,对特征点的运动状态进行估计,识别出高动态点并去除,为低动态点设置权重因子;最后,在多组公开的动态数据集中进行评估。与其他的视觉惯性里程计算法的对比结果表明,本文方法显著提高了视觉惯性里程计在动态环境下的定位精度。 展开更多
关键词 视觉惯性里程计 动态物体 定位 特征点 聚类分析 极线匹配误差
原文传递
基于重投影误差与极线约束的多相机标定方法
14
作者 熊小平 顾建伟 +2 位作者 何彬 邓涛 张波 《价值工程》 2025年第25期116-118,共3页
在多目视觉测量中,相机之间的参数准确标定至关重要,直接决定了整个系统的测量精度和稳定性。本文采用基于圆编码平面标定板对多相机视觉系统进行标定。对于双目立体视觉系统,在系统外参数标定的过程中各个子相机需同时观察到标定板。... 在多目视觉测量中,相机之间的参数准确标定至关重要,直接决定了整个系统的测量精度和稳定性。本文采用基于圆编码平面标定板对多相机视觉系统进行标定。对于双目立体视觉系统,在系统外参数标定的过程中各个子相机需同时观察到标定板。为了进一步提高标定精度,在全局优化过程中,同时优化了相机的固有参数、镜头畸变系数和外在参数。并将多相机之间的极线约束与重投影误差一起添加到优化目标函数中,从而确保了优化前后内参数的基本一致性,并减少了因涉及标定的图像数量而引起的波动。系统标定和烟叶三维重建实验表明,本文提出的新方法是可行和有效的。 展开更多
关键词 多相机标定 重投影误差 极线约束
在线阅读 下载PDF
基于轻量级网络的动态场景视觉SLAM
15
作者 穆冰清 吴丽君 《电视技术》 2025年第8期53-59,共7页
视觉同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)系统常受到动态物体的影响,导致定位精度和健壮性下降。为了解决这一问题,将轻量化网络架构MobileNetV3引入系统设计,对YOLOv5s的主干网络进行重构,在保证检测精度... 视觉同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)系统常受到动态物体的影响,导致定位精度和健壮性下降。为了解决这一问题,将轻量化网络架构MobileNetV3引入系统设计,对YOLOv5s的主干网络进行重构,在保证检测精度的同时,实现模型参数规模缩减67.9%,单帧运行速度提升89%,能够满足实际应用中的高效运行需求。针对潜在动态特征干扰与漏检问题,引入光流运动估计和对极几何约束,通过运动一致性校验筛选静态特征点集,确保位姿解算的几何可靠性,并构建环境的稠密点云地图。实验量化评估结果显示,在动态目标占比高的测试场景下,改进算法定位误差较ORB-SLAM3降低90.2%,有效提升了位姿估计的精度和健壮性。 展开更多
关键词 同时定位与地图构建(SLAM) 目标检测 轻量级网络 光流法 对极几何约束
在线阅读 下载PDF
一种双目相机自标定改进算法
16
作者 罗国强 潘光洋 《自动化与仪器仪表》 2025年第4期97-101,106,共6页
针对双目相机在长时间运行、散热、抖动等原因导致的相机相对位姿偏差,提出了一种双目相机相对位姿的自标定改进算法。首先,该算法采用无标记的自然图片提取特征点并筛选匹配的特征点对,然后,最小化这些特征点对的对极约束误差,求取5自... 针对双目相机在长时间运行、散热、抖动等原因导致的相机相对位姿偏差,提出了一种双目相机相对位姿的自标定改进算法。首先,该算法采用无标记的自然图片提取特征点并筛选匹配的特征点对,然后,最小化这些特征点对的对极约束误差,求取5自由度的双目相机相对位姿,并通过协方差矩阵判断相对位姿的准确性。最后,通过连续多帧全局优化结果。该算法易于复现,实用性极高。实验表明,该改进算法精度和鲁棒性都相当优秀。 展开更多
关键词 双目散班结构光 自标定算法 特征匹配 对极约束
原文传递
一种适配于Fusiello模型的核线影像生成方法
17
作者 王顺 王宵 +4 位作者 杜锐 林中杰 王强 宋晨洋 刘阳 《时空信息学报》 2025年第2期127-135,共9页
针对近景摄影测量中核线重排列生成核线影像的方法对计算机视觉群体不适用的问题,以导航和避障双目相机为研究对象,本文提出一种PG-Fusiello(photogrammetry Fusiello)方法,以适配于计算机视觉中用于立体校正的Fusiello模型的双目核线... 针对近景摄影测量中核线重排列生成核线影像的方法对计算机视觉群体不适用的问题,以导航和避障双目相机为研究对象,本文提出一种PG-Fusiello(photogrammetry Fusiello)方法,以适配于计算机视觉中用于立体校正的Fusiello模型的双目核线影像生成。首先,通过对比分析Fusiello模型与近景摄影测量模型对极几何约束和参数表达的理论差异,推导基于旋转平移参数变换的模型适配公式;其次,将Fusiello模型与近景摄影测量标定模型的参数进行适配,并进行核线影像生成处理;最后,引入SURF(speededuprobustfeatures)特征匹配与随机采样一致性误匹配剔除算法,通过匹配特征点的重投影均方根误差,来评估相对方位标定精度和核线校正适配方法的有效性。结果表明,本文方法匹配特征点的平均误差小于0.9个像素,最大误差小于2个像素,均方根误差约为1个像素,实现了导航和避障相机的双目核线校正和相对方位标定精度验证,且处理速度和精度优于已有核线重排列方法、Bouguet方法。这为后期导航和避障双目相机的立体测图处理奠定了基础。 展开更多
关键词 导航避障相机 立体视觉标定 核线影像 Fusiello模型 双目相机 特征点匹配 计算机视觉
在线阅读 下载PDF
一种基于对极约束注意力的光场图像超分辨率方法
18
作者 杨敬钰 金满昌 +1 位作者 胡昆澍 刘高生 《华中科技大学学报(自然科学版)》 北大核心 2025年第3期1-7,共7页
针对光场成像中因空间-角度复用,导致空间分辨率成角度倍下降的问题,提出了一种基于对极约束注意力机制的深度学习光场空间超分辨率方法.通过分析光场的视差分布特性,结合深度学习注意力网络的原理,设计了针对光场图像处理的对极约束注... 针对光场成像中因空间-角度复用,导致空间分辨率成角度倍下降的问题,提出了一种基于对极约束注意力机制的深度学习光场空间超分辨率方法.通过分析光场的视差分布特性,结合深度学习注意力网络的原理,设计了针对光场图像处理的对极约束注意力模块,将注意力限制在了光场对极平面图像的一个特定范围内,从而强化光场图像超分辨率的相关特征和抑制非相关特征.实验结果表明:该范围在和输入光场的视差范围匹配时,可以达到最好的性能,具备一定的可解释性,所提出的方法在平均峰值信噪比和结构相似性等指标上优于10种比较方法,并且具有更好的视觉效果. 展开更多
关键词 光场图像 图像超分辨率 对极约束 深度学习 注意力机制
原文传递
结合不规则直线段描述符与几何约束的直线段匹配算法
19
作者 汪玉成 张宁 《地理空间信息》 2025年第3期9-12,17,共5页
针对传统直线匹配方法易漏选、匹配无力和部分直线描述符特异性较差等问题,提出了一种结合不规则直线描述符与几何约束的直线段匹配算法。通过网络公开数据集中4种不同影像变换类型数据对该算法进行验证,并与其他算法进行了对比分析。... 针对传统直线匹配方法易漏选、匹配无力和部分直线描述符特异性较差等问题,提出了一种结合不规则直线描述符与几何约束的直线段匹配算法。通过网络公开数据集中4种不同影像变换类型数据对该算法进行验证,并与其他算法进行了对比分析。结果表明,相较于对比算法,该算法的平均正确率分别提高了27.5%、14.2%和1.2%,平均正确匹配数目分别增加了247、290和182个,充分体现了算法的有效性与准确性。 展开更多
关键词 近景影像 极线约束 三角网约束 直线段描述符 透视变换
在线阅读 下载PDF
基于EPI融合的光场图像生成与消隐算法
20
作者 杜雪萍 胡娟梅 楼益民 《浙江理工大学学报(自然科学版)》 2025年第3期416-424,共9页
针对全息显示和虚拟现实技术中存在的光场图像质量较低且无法灵活消隐等问题,提出了一种基于EPI(Epipolar plane image,极平面图像)融合的光场图像生成与消隐算法。首先,利用视角间的透视相关性减少冗余计算,在EPI坐标系上根据已知相机... 针对全息显示和虚拟现实技术中存在的光场图像质量较低且无法灵活消隐等问题,提出了一种基于EPI(Epipolar plane image,极平面图像)融合的光场图像生成与消隐算法。首先,利用视角间的透视相关性减少冗余计算,在EPI坐标系上根据已知相机的RGBD数据对信息进行插值,获得包含密集光场信息的EPI图像。其次,设计了一种斜率亮度融合算法,通过斜率间接对EPI图像中的遮挡物体进行规范,结合亮度信息对EPI图像融合过程中的空洞进行填补。再次,为每一个数据点定义了一个光锥,通过控制光锥内的能量分布,实现光场图像中指定物体的消隐。最后,利用快速行进算法填补因消隐产生的空洞,获得高质量的密集的光场图像。结果表明:该算法在遮挡条件下生成的光场图像质量高于传统融合算法,结构相似度可达99.2%以上,并且实现了光场图像中多物体的消隐。该算法能够利用稀疏的图像数据生成优质且密集的多视角图像,消隐后可以展现更为丰富的多视角图像效果,为动态全息显示和虚拟现实等领域提供了有力的图像数据支持。 展开更多
关键词 光场图像 光场显示 极平面图像 光锥 图像消隐 图像融合
原文传递
上一页 1 2 30 下一页 到第
使用帮助 返回顶部