期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
High Quality Monocular Video Depth Estimation Based on Mask Guided Refinement
1
作者 Huixiao Pan Qiang Zhao 《Journal of Beijing Institute of Technology》 2025年第1期18-27,共10页
Depth maps play a crucial role in various practical applications such as computer vision,augmented reality,and autonomous driving.How to obtain clear and accurate depth information in video depth estimation is a signi... Depth maps play a crucial role in various practical applications such as computer vision,augmented reality,and autonomous driving.How to obtain clear and accurate depth information in video depth estimation is a significant challenge faced in the field of computer vision.However,existing monocular video depth estimation models tend to produce blurred or inaccurate depth information in regions with object edges and low texture.To address this issue,we propose a monocular depth estimation model architecture guided by semantic segmentation masks,which introduces semantic information into the model to correct the ambiguous depth regions.We have evaluated the proposed method,and experimental results show that our method improves the accuracy of edge depth,demonstrating the effectiveness of our approach. 展开更多
关键词 monocular video depth estimation depth refinement edge depth accuracy semantic segmentation
在线阅读 下载PDF
Monocular Video Guided Garment Simulation
2
作者 李发明 陈小武 +3 位作者 周彬 卢飞翔 郭侃 符强 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第3期528-539,共12页
We present a prototype to generate a garment-shape sequence guided by a monocular video sequence. It is a combination of a physically-based simulation and a boundary-based modification. Given a garment in the video wo... We present a prototype to generate a garment-shape sequence guided by a monocular video sequence. It is a combination of a physically-based simulation and a boundary-based modification. Given a garment in the video worn on a mannequin, the simulation generates a garment initial shape by exploiting the mannequin shapes estimated from the video. The modification then deforms the simulated 3D shape into such a shape that matches the garment 2D boundary extracted from the video. According to the matching correspondences between the vertices on the shape and the points on the boundary, the modification is implemented by attracting the matched vertices and their neighboring vertices. For best-matching correspondences and efficient performance, three criteria are introduced to select the candidate vertices for matching. Since modifying each garment shape independently may cause inter-frame oscillations, changes by the modification are also propagated from one frame to the next frame. As a result, the generated garment 3D shape sequence is stable and similar to the garment video sequence. We demonstrate the effectiveness of our prototype with a number of examples. 展开更多
关键词 garment simulation monocular video shape correspondence
原文传递
Multi-Scale Human Pose Tracking in 2D Monocular Images 被引量:1
3
作者 Jinglan Tian Ling Li Wanquan Liu 《Journal of Computer and Communications》 2014年第2期78-84,共7页
In this paper we address the problem of tracking human poses in multiple perspective scales in 2D monocular images/videos. In most state-of-the-art 2D tracking approaches, the issue of scale variation is rarely discus... In this paper we address the problem of tracking human poses in multiple perspective scales in 2D monocular images/videos. In most state-of-the-art 2D tracking approaches, the issue of scale variation is rarely discussed. However in reality, videos often contain human motion with dynamically changed scales. In this paper we propose a tracking framework that can deal with this problem. A scale checking and adjusting algorithm is proposed to automatically adjust the perspective scales during the tracking process. Two metrics are proposed for detecting and adjusting the scale change. One metric is from the height value of the tracked target, which is suitable for some sequences where the tracked target is upright and with no limbs stretching. The other metric employed in this algorithm is more generic, which is invariant to motion types. It is the ratio between the pixel counts of the target silhouette and the detected bounding boxes of the target body. The proposed algorithm is tested on the publicly available datasets (HumanEva). The experimental results show that our method demonstrated higher accuracy and efficiency compared to state-of-the-art approaches. 展开更多
关键词 HUMAN MOTION Tracking MULTI-SCALE 2D monocular video
在线阅读 下载PDF
基于GPS与单目SLAM紧耦合的输电通道正射影像图实时与事后生成方法
4
作者 陈静川 包若愚 +3 位作者 罗超玮 刘雪丹 邓百川 雷明 《测绘通报》 北大核心 2025年第11期22-26,33,共6页
在遇到洪水、火灾、泥石流等应急情况时,快速查明输电通道灾情是电网自然灾害应急处置的首要任务。然而,传统的正射影像生成技术无法满足应急的实时性需求,且基于现有技术对于长带状输电通道实时生成正射影像方法的研究相对较少,缺乏系... 在遇到洪水、火灾、泥石流等应急情况时,快速查明输电通道灾情是电网自然灾害应急处置的首要任务。然而,传统的正射影像生成技术无法满足应急的实时性需求,且基于现有技术对于长带状输电通道实时生成正射影像方法的研究相对较少,缺乏系统性的解决方案。本文提出了一种基于GPS与单目SLAM紧耦合的技术方法,通过给SLAM系统增加真实地理信息尺度和位姿,并采用局部和全局优化改进算法,解决了传统拼接算法中的误差累积问题。利用动态Delaunay三角化和正射校正算法,并针对输电线路长带状的特点,采用实时与事后相结合的正射影像生成策略,优化视频拼接流程,确保生成的影像具有实时性和较高的分辨率。消融试验表明,利用本文提出的系统性解决方案生成的模型,有效减少了正射影像图中的边缘尖刺、空洞和影像扭曲等现象,效果优于单一SLAM模型。相较于传统的Pix4D软件,本文方法在相同条件下,事后正射影像生成效率提升了34.64倍,正射影像图完整性提升了70.59个百分点。 展开更多
关键词 固定翼无人机 电网应急 输电通道 视频拼接 正射影像图 单目SLAM GPS紧耦合
原文传递
基于团块几何和位置特征的夜间前方车辆检测方法 被引量:3
5
作者 肖志涛 王悦 +1 位作者 耿磊 张芳 《河北工业大学学报》 CAS 北大核心 2013年第5期13-18,共6页
夜间前方车辆检测是智能车辆安全辅助驾驶的关键技术.提出了一种基于单目视觉的夜间前方车辆检测方法.首先对视频图像进行预处理得到二值图像,然后提取二值图像中的团块及团块的几何和位置特征,最后根据车辆尾灯对及车辆尾部的大面积反... 夜间前方车辆检测是智能车辆安全辅助驾驶的关键技术.提出了一种基于单目视觉的夜间前方车辆检测方法.首先对视频图像进行预处理得到二值图像,然后提取二值图像中的团块及团块的几何和位置特征,最后根据车辆尾灯对及车辆尾部的大面积反光区域的几何和位置特征,建立生成假设车辆的判断机制,用以检测出前方车辆.使用实际采集的道路视频进行测试,结果表明该方法能够在夜间有效地检测出前方车辆. 展开更多
关键词 夜间 车辆检测 团块特征 视频处理 单目视觉
在线阅读 下载PDF
利用多帧序列影像的自监督单目深度估计 被引量:1
6
作者 熊炜 陈奕博 +2 位作者 张丽真 杨茜 邹勤 《计算机应用》 CSCD 北大核心 2024年第12期3907-3914,共8页
多帧自监督单目深度估计通过当前帧和上一帧之间的关系构建代价体积(CV),可以作为单目深度估计网络的额外输入源,更准确地描述场景视频中的时间序列关系和空间结构信息;然而,当场景中存在动态物体或者无纹理区域时,CV会成为不可靠的信... 多帧自监督单目深度估计通过当前帧和上一帧之间的关系构建代价体积(CV),可以作为单目深度估计网络的额外输入源,更准确地描述场景视频中的时间序列关系和空间结构信息;然而,当场景中存在动态物体或者无纹理区域时,CV会成为不可靠的信息来源。当单目深度估计网络过度依赖CV中的不可靠信息源时,会导致深度估计精度下降。为此,设计一种多帧融合模块动态降低不可靠信息源的权重,减小不可靠信息源对网络的影响。为了应对CV中不可靠信息源对网络训练的负面影响,还设计了一种引导深度估计网络训练的网络,防止深度估计网络过度依赖不可靠信息。所提方法在KITTI数据集上取得了出色的性能,与基准方法 Lite-Mono相比,它的绝对相对误差、平方相对误差和均方根误差(RMSE)分别下降了0.015、0.094和0.200;与同类方法相比,所提方法精度更高,且占用的计算资源更少。所提网络结构充分利用了多帧训练的优势,同时避免了多帧训练的缺陷(即CV不确定性对网络的影响),可有效提升模型精度。 展开更多
关键词 自监督单目深度估计 多视图立体 单目视频 代价体积
在线阅读 下载PDF
基于单目视频的室外自然场景雾天模拟算法
7
作者 董健康 刘坤 王洁宁 《河北工业大学学报》 CAS 北大核心 2012年第6期16-20,共5页
为了能够更快速逼真地模拟室外自然条件下的虚拟场景,提出了一种基于真实拍摄的单目视频的雾天场景模拟算法.算法首先对初始输入图像中场景进行语义分割,针对不同类型的场景进行深度信息的解析;同时对多帧图像序列之间的光流场分布情况... 为了能够更快速逼真地模拟室外自然条件下的虚拟场景,提出了一种基于真实拍摄的单目视频的雾天场景模拟算法.算法首先对初始输入图像中场景进行语义分割,针对不同类型的场景进行深度信息的解析;同时对多帧图像序列之间的光流场分布情况和摄像机的运动参数进行估计,完成不同帧图像之间的深度映射与修正,最后基于大气散射模型的原理进行雾天场景的模拟与仿真.理论分析和实验表明,所提出的算法与传统的基于虚拟现实的方法相比效率大大提高,且生成的雾天虚拟场景更具真实感. 展开更多
关键词 单目视频 深度估计 语义分割 雾天模拟
在线阅读 下载PDF
改进YOLOv4算法的高速公路碰撞预警系统 被引量:4
8
作者 谈文蓉 薛余坤 +1 位作者 陈秋实 邢雪枫 《西南民族大学学报(自然科学版)》 CAS 2022年第1期64-74,共11页
针对目前基于视觉的车辆防碰撞预警技术存在检测速度慢、安全区域预测误差大的问题,提出一种基于改进YOLOv4模型的高速公路防碰撞预警算法.首先,使用安装在车顶部的摄像头获取图像,经过防抖处理之后作为神经网络的输入数据,计算周围车... 针对目前基于视觉的车辆防碰撞预警技术存在检测速度慢、安全区域预测误差大的问题,提出一种基于改进YOLOv4模型的高速公路防碰撞预警算法.首先,使用安装在车顶部的摄像头获取图像,经过防抖处理之后作为神经网络的输入数据,计算周围车辆的位置信息.其次,使用以单目视觉算法为核心的车载摄像头标定技术,根据本车行驶速度,构建危险区域预警模型.最后,根据预警策略和车辆位置关系,对可能发生的追尾碰撞事故进行预测并及时提醒驾驶员.实验结果表明,使用经过防抖处理的图像进行预警检测,车辆识别准确率提高了4.1%,车辆预警准确率提高了7.51%,预警误报率降低了10.53%,在移动平台的检测速率达到29帧/秒. 展开更多
关键词 车辆检测 防碰撞预警 YOLOv4 视频防抖 单目测距
在线阅读 下载PDF
基于循环神经网络的双目视觉物体6D位姿估计 被引量:2
9
作者 杨恒 李卓 +2 位作者 康忠元 田兵 董青 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第11期2179-2187,共9页
针对当前物体6D位姿估计任务准确率较低的问题,提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN.将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容,利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入,输... 针对当前物体6D位姿估计任务准确率较低的问题,提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN.将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容,利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入,输入各物体相关参数,由虚拟双目相机右摄像头捕获合成图片.利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取.经过循环神经网络对几何特征进行融合,并预测物体6D位姿.以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比.结果表明,在利用单一物体对网络进行训练时,Binocular-RNN的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍.利用基于物理的实时渲染(Real+PBR)方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法(DeepIM). 展开更多
关键词 6D位姿 单目视觉 主动视觉 循环神经网络 YCB-video数据集
在线阅读 下载PDF
基于单目视觉的倒车障碍物测距技术的研究 被引量:3
10
作者 于国防 刘岩 +2 位作者 谭相录 付丽娜 寇立强 《计算机应用与软件》 CSCD 北大核心 2012年第4期197-199,共3页
在摄像头相对障碍物移动距离可知的前提条件下,基于单目视觉的距离测量技术,结合运用有限局域图像快速匹配算法,研究一种可以实时测量后方障碍物距离的增强型倒车影像系统。模拟实验结果表明,所研究的关键技术具有较高的测量精度和较快... 在摄像头相对障碍物移动距离可知的前提条件下,基于单目视觉的距离测量技术,结合运用有限局域图像快速匹配算法,研究一种可以实时测量后方障碍物距离的增强型倒车影像系统。模拟实验结果表明,所研究的关键技术具有较高的测量精度和较快反应速度,为该系统产品的深入研发和推广应用奠定了良好的技术基础。 展开更多
关键词 单目视觉 有限域图像匹配 障碍物测距 倒车影像系统
在线阅读 下载PDF
近距离观察用便携式视频单筒望远镜的照明改进
11
作者 朱兴宝 刘泽飞 +2 位作者 和磊洁 李静 刘琼 《医疗卫生装备》 CAS 2015年第9期114-116,共3页
目的 :解决近距离观察用便携式视频单筒望远镜的照明问题。方法 :定制适合近距离观察用便携式视频单筒望远镜的发光灯头和反光灯头,将发光灯头后置式安装在物镜不能承重的目镜端,将发光灯头或反光灯头前置式安装在物镜能够承重的物镜端... 目的 :解决近距离观察用便携式视频单筒望远镜的照明问题。方法 :定制适合近距离观察用便携式视频单筒望远镜的发光灯头和反光灯头,将发光灯头后置式安装在物镜不能承重的目镜端,将发光灯头或反光灯头前置式安装在物镜能够承重的物镜端,分别使用安装照明系统和未安装照明系统的望远镜观察新鲜火龙果的创腔。结果:安装了定制的发光灯头和反光灯头的望远镜照明充足,无论创腔是浅表还是深远,无论倍率是低倍还是高倍,视屏图像均明亮,能够清楚分辨瓤籽。结论:近距离观察用便携式视频单筒望远镜能够低成本安装光线充足的照明系统,或可在颅脑显微手术中发挥作用。 展开更多
关键词 近距离观察 便携式视频单筒望远镜 发光灯头 反光灯头
暂未订购
基于单目视频的退火粒子滤波方法的姿态恢复技术研究
12
作者 赵颖 《宁夏大学学报(自然科学版)》 CAS 2012年第2期152-155,共4页
基于单目视频的退火粒子滤波方法的姿态恢复技术,将经典的退火粒子滤波方法应用于单目视频姿态恢复当中,利用蒙特卡罗随机实例重采样,更新姿态粒子的权重,并预测新的姿态,最终得到近似最优的姿态.实验验证了该方法的有效性和准确性.
关键词 单目视频 姿态 恢复技术
在线阅读 下载PDF
基于光流的卡尔曼滤波方法估计物体运动参数 被引量:4
13
作者 郭秀丽 郭玉申 洪鹰 《机床与液压》 北大核心 2005年第7期171-173,共3页
图像序列的运动参数估计是近代计算机视觉界最重要的研究课题。本文以一单目视觉跟踪系统为例,介绍了计算光流场后运用卡尔曼滤波方法进行运动参数估计的方法。
关键词 单目视觉 光流 卡尔曼滤波
在线阅读 下载PDF
基于单目视频的人体运动测量系统 被引量:11
14
作者 张烨 周晓晶 杨晓童 《计量学报》 CSCD 北大核心 2019年第3期367-372,共6页
针对基于视频的人体运动测量过程中,需要进行相机标定导致测量效率低的问题,提出一种单目视频未标定状态下的人体运动测量系统设计方案。该系统采用极大似然估计算法求解场景中的消失点和消失线,根据射影变换的交比不变量确定人体实时... 针对基于视频的人体运动测量过程中,需要进行相机标定导致测量效率低的问题,提出一种单目视频未标定状态下的人体运动测量系统设计方案。该系统采用极大似然估计算法求解场景中的消失点和消失线,根据射影变换的交比不变量确定人体实时身高。在身高测量的基础上,提出一种左右脚部特征点的提取方法用于测量行人的步幅。通过跟踪质心的运动来估计行人的轨迹、实时速度和步频,并对步行速度测量值进行正弦拟合,验证本系统测量的速度值符合行走客观规律。实验结果表明:身高和平均速度测量结果的相对误差分别不超过0. 84%和3. 72%,证明本系统的精确性和鲁棒性较好。 展开更多
关键词 计量学 视频测量 人体运动 步幅 速度 单目视频
在线阅读 下载PDF
基于ARM11的塔吊监控系统设计 被引量:3
15
作者 王旭 张自嘉 王慧敏 《电子技术应用》 北大核心 2013年第10期29-32,共4页
塔吊驾驶员在操作塔吊时经常遇到视觉盲区,对吊钩高度难以把握,只能靠经验感觉操作,极易引起安全事故。系统以S3C6410微处理器芯片为核心,搭建了单目测距监控系统,结合塔吊吊钩的形状及颜色特征,根据单目测距原理完成对吊钩下放距离的检... 塔吊驾驶员在操作塔吊时经常遇到视觉盲区,对吊钩高度难以把握,只能靠经验感觉操作,极易引起安全事故。系统以S3C6410微处理器芯片为核心,搭建了单目测距监控系统,结合塔吊吊钩的形状及颜色特征,根据单目测距原理完成对吊钩下放距离的检测,并通过WiFi无线模块实现视频的实时传输。实验结果表明,视频传输稳定可靠,单目测距较为准确,满足塔吊驾驶员对视频以及高度的实时性要求。 展开更多
关键词 嵌入式 视频传输 单目测距 WIFI
在线阅读 下载PDF
基于无人机单目视频的视景三维重建 被引量:6
16
作者 刘睿 李斌兵 罗杰 《计算机工程与设计》 北大核心 2017年第1期160-164,共5页
传统无人机视景三维建模方法通常依赖多目光学拍摄设备或者额外的空间定位设备(如GPS等),这些都限制了无人机的应用场景,为此研制一种基于单目成像的无人机三维建模技术,在不需要额外空间定位设备的条件下实现三维场景的构建,在一定程... 传统无人机视景三维建模方法通常依赖多目光学拍摄设备或者额外的空间定位设备(如GPS等),这些都限制了无人机的应用场景,为此研制一种基于单目成像的无人机三维建模技术,在不需要额外空间定位设备的条件下实现三维场景的构建,在一定程度上扩展了无人机技术的应用范围。进行实验评估该算法的构建结果,结果验证了其可用性。 展开更多
关键词 无人机 单目视频成像 三维建模 光束平差法 增强现实
在线阅读 下载PDF
基于嵌入式系统自动连续变倍视频显微镜 被引量:1
17
作者 曾赤良 蔡琳 +1 位作者 陈纲 廖文哲 《电子科技》 2013年第2期110-113,共4页
介绍了文中嵌入式系统总体设计思路,及在连续变倍系统中应用的嵌入式技术,在降低了成本的同时能快速地实现自动变倍、调焦和检测功能。阐述了电控变倍和自动调焦两方面技术,即机械传动部分采用小模数齿轮实现机械运动和动力的传递,单片... 介绍了文中嵌入式系统总体设计思路,及在连续变倍系统中应用的嵌入式技术,在降低了成本的同时能快速地实现自动变倍、调焦和检测功能。阐述了电控变倍和自动调焦两方面技术,即机械传动部分采用小模数齿轮实现机械运动和动力的传递,单片机电路控制部分实现计数脉冲的获取和电机的控制。该系统可按预先设定的方式控制电机,实现了视频显微镜的电控变倍和自动调焦,可满足部分工业生产过程在线自动检测的要求,同时为机器视觉检验提供了一种可行的方案。 展开更多
关键词 连续变倍视频显微镜 自动调焦 电控变倍 嵌入式系统
在线阅读 下载PDF
可量测视频目标动态轨迹生成及GIS应用 被引量:3
18
作者 徐汝东 刘进 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2016年第6期818-824,共7页
动态目标三维重建是进一步实现目标地理信息时空分析、目标统计、目标查询、异常报警及各种空间数据挖掘应用的重要基础。利用计算机视觉技术将摄像头中目标框的二维像坐标信息实时动态还原成三维物方目标信息,采用基于物方特征域的模... 动态目标三维重建是进一步实现目标地理信息时空分析、目标统计、目标查询、异常报警及各种空间数据挖掘应用的重要基础。利用计算机视觉技术将摄像头中目标框的二维像坐标信息实时动态还原成三维物方目标信息,采用基于物方特征域的模式分类方法,通过目标物方尺寸、目标出现的物方位置进行更准确的目标筛查,提高了目标跟踪的准确性,降低了虚警;通过地平面约束实现单目目标立体定位,增加了立体定位的场景覆盖范围;进而把以帧为单位的视频数据解析成为以目标轨迹为单位的空间三维地理对象信息,并将生成的时空轨迹图层集成到地理信息系统,实现了基于地理信息空间分布的视频时空数据管理。 展开更多
关键词 视频数据挖掘 视频动态三维轨迹 可量测视频 单目三维映射 地理信息系统
原文传递
基于sift特征匹配的人体上半身三维运动跟踪 被引量:1
19
作者 栗涛 陈姝 《计算机仿真》 CSCD 北大核心 2012年第1期202-205,共4页
研究人体姿态与视频优化跟踪问题,单目视频缺少深度信息,使得单目视频的人体运动跟踪难以实现三维姿态恢复问题。为解决上述问题,提出了一种利用sift特征尺度不变性的优点进行人体上半身三维运动跟踪的算法。在跟踪过程中先计算初始匹配... 研究人体姿态与视频优化跟踪问题,单目视频缺少深度信息,使得单目视频的人体运动跟踪难以实现三维姿态恢复问题。为解决上述问题,提出了一种利用sift特征尺度不变性的优点进行人体上半身三维运动跟踪的算法。在跟踪过程中先计算初始匹配sift特征点对,然后反复迭代出除误匹配点,消除误差,最后求解由两个匹配sift特征组成的方程组得到胸部关节的位姿,根据人体骨骼模型采用深度遍历依次恢复其它关节的姿态。实验结果表明,系统能够对人体上半身运动进行比较准确的三维运动跟踪。 展开更多
关键词 运动跟踪 单目视频 人体模型 迭代优化
在线阅读 下载PDF
基于单目视频的伪双目动态测距方法 被引量:3
20
作者 周东兴 韩东升 《电子测量技术》 北大核心 2021年第3期38-44,共7页
传统的双目测距是通过待测物体在双目相机中成像的视差来计算物体在三维空间中的坐标信息,需要结合理想的双目测距模型来完成。然而在实际的工程应用中所使用的摄像机往往是单目摄像相机,无法满足双目测距要求。针对以上问题提出一种基... 传统的双目测距是通过待测物体在双目相机中成像的视差来计算物体在三维空间中的坐标信息,需要结合理想的双目测距模型来完成。然而在实际的工程应用中所使用的摄像机往往是单目摄像相机,无法满足双目测距要求。针对以上问题提出一种基于单目视频的伪双目动态测距方法,针对在预定轨道上移动的摄像机拍摄的视频,对目标物体进行测距。对所使用的单目摄相机进行标定,得到摄相机的焦距、主点坐标等内部参数。在摄像机拍摄的视频中截取不同位置时的两帧图像,通过轨道参数计算出在不同位置时摄像机的位姿关系,运用归一化相关的模板匹配算法,得到最佳的像素匹配点,结合伪双目测距模型计算待测物体的距离,并与传统双目测距以及单目测距进行了比对。实验结果表明,当摄相机距待测物体5 m以内时,在摄相机视野范围内测量物体,误差能够维持在4%以内。 展开更多
关键词 伪双目 单目视频 动态测距 相机标定 模板匹配
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部