期刊文献+
共找到380篇文章
< 1 2 19 >
每页显示 20 50 100
卷积增强Vision Mamba模型的构建及其应用 被引量:1
1
作者 俞焕友 范静 黄凡 《计算机技术与发展》 2025年第8期45-52,共8页
针对Vision Mamba(Vim)模型的局限性,该文提出了一种改进的模型——Convolutional Vision Mamba(CvM)。此模型通过摒弃Vim中的图形切割和位置编码机制,转而采用卷积操作进行替代,以实现对全局视觉信息的更高效处理。同时,此模型对Vim模... 针对Vision Mamba(Vim)模型的局限性,该文提出了一种改进的模型——Convolutional Vision Mamba(CvM)。此模型通过摒弃Vim中的图形切割和位置编码机制,转而采用卷积操作进行替代,以实现对全局视觉信息的更高效处理。同时,此模型对Vim模型中的位置嵌入模块进行了优化,以解决其固有的高计算量和内存消耗问题。进而,该文将CvM模型应用于医学图像分类领域,选用了血细胞图像、脑肿瘤图像、胸部CT扫描、病理性近视眼底图像以及肺炎X射线影像等数据集进行实验。实验结果表明,与Vim模型及其他5个神经网络模型相比,CvM模型在准确率上表现更为出色,在内存占用和参数数量方面也展现出明显的优势。消融实验表明,深度可分离卷积比标准卷积使用的参数和显存占用更少,而且在血细胞图像、脑肿瘤图像等医学图像分类上,准确率还有了显著提升。这些结果充分说明了CvM模型的优势和可行性。 展开更多
关键词 深度学习 vision Mamba 卷积神经网络 深度可分离卷积 医学图像分类
在线阅读 下载PDF
基于深度相机的助残手不同抓取模式的控制方法研究
2
作者 崔建伟 王选杰 杜韩 《传感器与微系统》 北大核心 2025年第8期36-40,共5页
助残手是帮助上肢残疾患者恢复日常生活能力的重要方法,但在目前研究中,助残手一般只有张开和闭合这2种抓取模式,不符合真实的手部动作。为了实现不同的抓取模式,提出了一种基于深度相机的助残手不同抓取模式的控制方法,采用物体信息-... 助残手是帮助上肢残疾患者恢复日常生活能力的重要方法,但在目前研究中,助残手一般只有张开和闭合这2种抓取模式,不符合真实的手部动作。为了实现不同的抓取模式,提出了一种基于深度相机的助残手不同抓取模式的控制方法,采用物体信息-抓取模式映射的策略,帮助用户控制多指助残手对各种日用品进行抓取。通过设计助残手实验,完成了不同抓取模式下6种日常物体的控制动作。实验结果表明:模式识别成功率达到92.83%,验证了基于深度相机助残手不同抓取模式控制方法的可行性和实用性。 展开更多
关键词 助残手控制 计算机视觉 深度相机 抓取模式识别
在线阅读 下载PDF
单目视觉驱动的机器人实时高精度稠密场景重建算法
3
作者 蒋祥龙 邓文亮 何胜喜 《测绘通报》 北大核心 2025年第10期71-75,137,共6页
本文提出一种单目视觉驱动的机器人实时高精度稠密场景重建算法,该算法基于深度稠密单目视觉SLAM和快速不确定性传播技术,从图像中重建三维场景。该算法能够实现场景的稠密、准确和实时三维重建,并对来自单目视觉SLAM的极端噪声深度估... 本文提出一种单目视觉驱动的机器人实时高精度稠密场景重建算法,该算法基于深度稠密单目视觉SLAM和快速不确定性传播技术,从图像中重建三维场景。该算法能够实现场景的稠密、准确和实时三维重建,并对来自单目视觉SLAM的极端噪声深度估计具有良好的稳健性。与传统通过特殊深度滤波器或从RGB-D传感器模型中估计深度不确定性的方法不同,本文方法直接利用SLAM中底层束平差问题的信息矩阵生成概率深度不确定性。这种深度不确定性为体积融合的深度图加权提供了关键信号。本文方法能够生成更加精确且伪影显著减少的三维网格,并在具有挑战性的Euroc数据集上进行了试验验证。结果表明,相比直接从单目视觉SLAM中融合深度的方式,本文方法在建图准确率上提升了85%。 展开更多
关键词 单目视觉 稠密重建 SLAM 深度不确定性 机器人
原文传递
单目深度估计研究综述
4
作者 王诚 李梦媛 李春领 《红外》 2025年第5期1-10,共10页
单目深度估计在三维重建、目标跟踪、场景理解等众多应用中起到非常重要的作用。由于单目摄像头具有成本低、设备较为普及、图像获取方便等特点,从单目图像中获取深度信息成为热门研究。首先概述了用于单目深度估计的常见深度学习模型,... 单目深度估计在三维重建、目标跟踪、场景理解等众多应用中起到非常重要的作用。由于单目摄像头具有成本低、设备较为普及、图像获取方便等特点,从单目图像中获取深度信息成为热门研究。首先概述了用于单目深度估计的常见深度学习模型,主要包括卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)和生成对抗网络(Generative Adversarial Network,GAN)。然后从训练方法的角度归纳了用于单目深度估计的深度学习方法,并对单目深度估计的发展趋势进行了总结。 展开更多
关键词 单目深度估计 计算机视觉 深度学习
在线阅读 下载PDF
基于双目立体感知和安全区域分割的大型施工机械近电安全距离智能预警方法研究 被引量:1
5
作者 马富齐 王嘉勋 +2 位作者 贾嵘 王波 马恒瑞 《中国电机工程学报》 北大核心 2025年第7期2554-2566,I0009,共14页
大型施工机械是电力检修、改造等作业的重要工具,其近电作业过程的安全距离有严格要求,因此,研究施工机械安全距离智能测量方法对保障本质安全生产意义重大。但其作业过程具有作业范围广、带电环境复杂等特点,现有方法表现出明显局限性... 大型施工机械是电力检修、改造等作业的重要工具,其近电作业过程的安全距离有严格要求,因此,研究施工机械安全距离智能测量方法对保障本质安全生产意义重大。但其作业过程具有作业范围广、带电环境复杂等特点,现有方法表现出明显局限性。为此,该文提出一种基于双目立体感知和安全区域分割的施工机械安全距离智能测量方法。首先,通过PSMNet立体感知模型获取作业场景的双目视差值,并基于坐标转换的三维重建方法得到作业场景的三维世界空间坐标信息;然后,通过区域元素辨识和Canny边缘检测模型精确识别施工机械位置与安全区域边界;最后,通过监测施工机械与安全区域边界间水平和垂直方向的最小欧式距离变化,实现对大型施工机械作业安全距离的量化及动态预警。实验数据表明,所提方法对于实际施工机械复杂场景的三维空间重建平均误差仅3.3%,对于该场景多元化作业元素的识别精确度达到94.5%,相比现有方法表现出更好的检测性能及实用价值。 展开更多
关键词 近电作业 电力深度视觉 安全距离测量 双目立体感知 安全区域分割
原文传递
复杂背景下草莓点云语义分割优化方法 被引量:1
6
作者 谢元澄 陈自强 +3 位作者 许忠义 严心悦 姜海燕 梁敬东 《南京农业大学学报》 北大核心 2025年第2期476-487,共12页
[目的]针对田间背景噪声干扰、草莓果实体积小且伴随遮挡的难点,本文利用3D视觉技术实现草莓准确识别和定位,为机器人自动采摘提供技术支持。[方法]使用Intel Realsense D435i深度相机采集不同光照、季节和遮挡条件下的草莓点云数据,构... [目的]针对田间背景噪声干扰、草莓果实体积小且伴随遮挡的难点,本文利用3D视觉技术实现草莓准确识别和定位,为机器人自动采摘提供技术支持。[方法]使用Intel Realsense D435i深度相机采集不同光照、季节和遮挡条件下的草莓点云数据,构建包含3个类别的数据集,分别为无遮挡、低遮挡、高遮挡。结合多阈值统计滤波和ROI提取技术对点云数据进行预处理,过滤噪声;以PointNet++为基础模型,对点云数据直接提取特征,并在PointNet++基础上提出一种针对复杂背景下小尺度目标的语义分割模型SS-PointNet++,利用点云的多种特征信息作为网络输入特征,构建采样层、分组层,并通过PointNet提取局部特征,使用最远点采样法对点云取样并最大程度覆盖到整个点集,针对小尺度目标设计3种不同半径的球查询(ball query)来获取局部特征,改进SA层和FP层的结构,使其能够适应低密度点云。[结果]对未经预处理的点云进行分割时,有0.74%的概率出现离群点的误判问题,而对预处理后的单张点云图像进行语义分割的用时平均减少了3.47 s。点云图像测试结果表明,SS-PointNet++模型的平均准确率达到86.95%,比优化前提升了19.54百分点,平均交并比为0.740。在光照充足且无遮挡的草莓上,该模型的语义分割准确率高达95.36%,而在暗光环境下,该模型的平均准确率也能达到81.34%。[结论]SS-PointNet++模型提升了小尺度目标点云的语义分割效果,对不同光照条件具有较强的鲁棒性,为基于3D点云的小物体和遮挡物体分割提供了一种有效的方法;本文提出的草莓遮挡类型的划分方法,对后续草莓遮挡问题提供了数据分析支持,对其他基于3D点云的小尺度物体的目标检测和遮挡问题也起到借鉴作用。 展开更多
关键词 草莓 点云 采摘机器人 计算机视觉 语义分割 深度相机
在线阅读 下载PDF
面向机械臂抓取的双目视觉目标定位算法
7
作者 蒋畅江 向杰 何旭颖 《计算机应用》 北大核心 2025年第11期3698-3706,共9页
通过机器视觉算法对目标进行识别并定位它的空间坐标是实现机械臂视觉抓取的关键。针对基于双目视觉的目标识别与定位中定位精度低、运行效率不高等问题,提出面向机械臂抓取的联合双目视觉目标检测与立体深度估计的网络结构BDS-YOLO(Bin... 通过机器视觉算法对目标进行识别并定位它的空间坐标是实现机械臂视觉抓取的关键。针对基于双目视觉的目标识别与定位中定位精度低、运行效率不高等问题,提出面向机械臂抓取的联合双目视觉目标检测与立体深度估计的网络结构BDS-YOLO(Binocular Detect and Stereo YOLO)及基于BDS-YOLO的目标定位算法。该算法联合目标检测与立体深度估计算法,利用注意力机制进行跨视图特征信息交互,从而提高特征表达能力,使网络可以通过深度特征匹配获得高质量视差图,再经过自注意力机制进一步提升后,由三角测量原理转换为深度信息。BDS-YOLO网络采用多任务学习,同时训练目标检测与立体深度估计网络,并使用合成与真实数据共同训练。针对真实数据不易标注密集深度的问题,采用自监督学习技术优化由视差重建图像的过程,以提高BDS-YOLO网络对现实世界的泛化能力。实验结果表明:BDS-YOLO网络在真实数据集上对目标检测的平均精度(AP)比YOLOv8l高6.5个百分点,预测的视差和转换后的深度优于专门的立体深度估计算法,推理速度可达20 frame/s以上,对目标对象的识别和定位均优于对比方法,能较好地满足目标实时检测与定位的需求。 展开更多
关键词 双目视觉 目标检测 立体匹配 立体深度估计 目标定位 深度学习 注意力机制
在线阅读 下载PDF
单/双目深度估计研究进展与应用综述(特邀)
8
作者 胡海洋 陈超平 +4 位作者 高天沐 韩宝恩 杨云帆 刘毅 武小军 《红外与激光工程》 北大核心 2025年第7期25-38,共14页
深度估计作为计算机视觉领域的核心基础任务,在自动驾驶、增强现实、机器人导航等领域具有重要应用价值。文中系统综述了单目与双目深度估计的技术演进、方法体系及其在三维显示等场景中的创新应用。单目方法通过端到端深度学习架构,如... 深度估计作为计算机视觉领域的核心基础任务,在自动驾驶、增强现实、机器人导航等领域具有重要应用价值。文中系统综述了单目与双目深度估计的技术演进、方法体系及其在三维显示等场景中的创新应用。单目方法通过端到端深度学习架构,如多尺度特征融合、注意力机制,突破传统几何先验限制,结合监督或自监督范式缓解数据依赖问题,但受限于尺度模糊性。双目技术依托立体匹配的几何约束,通过代价体积构建与三维卷积网络实现亚像素级视差计算,在动态场景鲁棒性上表现突出。两类技术通过语义几何协同优化形成互补,推动算法从局部特征匹配向全局三维感知升级。在三维显示领域,深度估计技术成为虚实融合的关键:单目方法支撑移动端设备的实时空间拓扑重建,通过轻量化模型实现虚拟物体的物理遮挡与光照一致性渲染;双目技术为高精度全息投影与数字孪生提供毫米级深度支撑,实现动态光场重建。新兴技术如扩散模型和多教师蒸馏框架显著提升弱纹理区域的深度连续性,推动体积显示器渲染质量提升。文中进一步对比分析了主流数据集与评估指标的技术特性,指出未来研究需聚焦多传感器融合、轻量化边缘计算、跨模态评估基准构建及物理可逆渲染等方向。随着神经符号计算等范式的发展,深度估计技术将推动三维显示从几何重构向物理属性推理跃迁,最终实现“所见即所得”的沉浸式体验。 展开更多
关键词 深度估计 计算机视觉 机器学习 三维显示
原文传递
基于多尺度感受野的水下双目视觉测距算法研究
9
作者 涂天佳 秦毅 +1 位作者 梁晨 陈然 《兵器装备工程学报》 北大核心 2025年第8期11-19,共9页
基于双目视觉的立体匹配网络被广泛应用于目标定位,其计算速度和精度直接影响机器人的任务执行。针对现有立体匹配网络参数冗余、计算速度缓慢等问题,提出利用混合空洞卷积替代特征提取部分的普通卷积层,减少网络层数,极大地降低了网络... 基于双目视觉的立体匹配网络被广泛应用于目标定位,其计算速度和精度直接影响机器人的任务执行。针对现有立体匹配网络参数冗余、计算速度缓慢等问题,提出利用混合空洞卷积替代特征提取部分的普通卷积层,减少网络层数,极大地降低了网络参数量,提升了网络的运行速度。为增强网络在弱纹理、边缘区域的特征表达能力,提出一种多尺度感受野模块,以融合不同尺度感受野的特征。将该模块嵌入立体匹配网络,构建了多尺度感受野立体匹配网络,实现了目标位置信息的精确检测。基于所提网络和校正模型,在水池模拟环境下开展了水下机器人的目标定位实验。结果表明,所提方法有效解决了现有立体匹配网络在弱纹理、重叠以及边缘区域的误匹配问题,对特定目标物定位精度可达89%,较其他主流视觉测量方法均有显著提升,在水下目标定位中具有重要应用价值。 展开更多
关键词 双目视觉 深度估计 立体匹配 水下机器人 混合空洞卷积 多尺度
在线阅读 下载PDF
Monocular Vision-based Two-stage Iterative Algorithm for Relative Position and Attitude Estimation of Docking Spacecraft 被引量:7
10
作者 张世杰 刘峰华 +1 位作者 曹喜滨 贺亮 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2010年第2期204-210,共7页
Visual sensors are used to measure the relative state of the chaser spacecraft to the target spacecraft during close range ren- dezvous phases. This article proposes a two-stage iterative algorithm based on an inverse... Visual sensors are used to measure the relative state of the chaser spacecraft to the target spacecraft during close range ren- dezvous phases. This article proposes a two-stage iterative algorithm based on an inverse projection ray approach to address the relative position and attitude estimation by using feature points and monocular vision. It consists of two stages: absolute orienta- tion and depth recovery. In the first stage, Umeyama's algorithm is used to fit the three-dimensional (3D) model set and estimate the 3D point set while in the second stage, the depths of the observed feature points are estimated. This procedure is repeated until the result converges. Moreover, the effectiveness and convergence of the proposed algorithm are verified through theoreti- cal analysis and mathematical simulation. 展开更多
关键词 SPACECRAFT relative position and attitude monocular vision depth recovery absolute orientation
原文传递
基于融合拉普拉斯残差图像处理的输电线路巡检单目测距技术
11
作者 李勃铖 杨昊彦 +4 位作者 刘钢 郭昊 刘兰兰 李赛 席燕辉 《湖南电力》 2025年第3期122-128,共7页
在对超、特高压输电线路开展无人机巡检时,无人机能靠近输电线路,但距离过近会增加飞行干扰甚至发生碰撞,因此准确获取无人机与输电线之间的距离至关重要。针对这一问题,提出融合拉普拉斯残差的深度估计网络LapNet(Laplace net),以U-Ne... 在对超、特高压输电线路开展无人机巡检时,无人机能靠近输电线路,但距离过近会增加飞行干扰甚至发生碰撞,因此准确获取无人机与输电线之间的距离至关重要。针对这一问题,提出融合拉普拉斯残差的深度估计网络LapNet(Laplace net),以U-Net作为网络的基础架构,构建多尺度特征金字塔,提出LUB(Laplace UBlock)模块,替换U-Net的普通卷积层;在LUB模块中引入拉普拉斯金字塔残差结构,增加网络深度的同时保留深度特征中的高频信息,从而引导重建高质量的深度图像,实现单目距离的精确测量。实际测试结果表明,利用无人机单目镜头开展距离检测的平均误差为4.786%,最大误差为8.36%,能够实现无人机镜头与输电线路之间距离的精确测量。 展开更多
关键词 单目视觉 深度估计 拉普拉斯金字塔 LapNet 无人机巡检
在线阅读 下载PDF
温室番茄场景单目RGB模态向深度模态转换模型研究
12
作者 高旺 邓寒冰 +1 位作者 邢志鸿 朱彦强 《农业机械学报》 北大核心 2025年第6期499-508,574,共11页
在温室场景下,针对番茄的表型解析、自主采摘、多模态联合分割等任务,快速、高精度、低成本地获取场景深度信息对农机视觉系统至关重要。本研究提出了一种嵌入注意力机制的RGB模态向深度模态转换的单目深度估计网络(RGB to depth conver... 在温室场景下,针对番茄的表型解析、自主采摘、多模态联合分割等任务,快速、高精度、低成本地获取场景深度信息对农机视觉系统至关重要。本研究提出了一种嵌入注意力机制的RGB模态向深度模态转换的单目深度估计网络(RGB to depth conversion network,RDCN),以解决传统算法无法充分挖掘编码器的特征提取能力、深度估计精度低以及边界模糊问题。首先以ResNext101替换原来的ResNet101骨干网络,提取各个不同层级的特征图并将其融合到拉普拉斯金字塔分支,强调特征的尺度差异性并强化特征融合的深入与广泛性;同时为了增强模型获取全局信息以及上下文信息交互的能力,引入了置换注意力模块(Shuffle attention module,SAM),以减少下采样过程造成的局部细节信息丢失;其次,为了改善预测深度图的边界模糊问题,嵌入深度细化模块(Depth refinement module,DRM),感知预测特征图物体附近的深度变化;实现了温室场景下番茄植株图像深度信息的精准预测。试验结果表明,RDCN在测试集上的平均相对误差、均方根误差、对数均方根误差、对数平均误差相比于基准模型分别降低了20.5%、10.3%、8.3%、21.8%,在1.25、1.25~2、1.25~3阈值下的准确率分别提高3.2%、1.2%和1.0%;并且网络生成的深度图像视觉上全局完整清晰且有较多的纹理细节;研究表明,RDCN在温室场景下能够基于RGB信息获得高质量的深度信息,可为基于单目传感器的温室场景农机导航以及深度图像在多模态任务中的应用提供技术支持。 展开更多
关键词 温室 番茄图像 单目视觉 深度估计 拉普拉斯金字塔 模态转换
在线阅读 下载PDF
LightDiffu-DCE:基于光照强度扩散的低光照图像增强
13
作者 闫光辉 吴佰靖 马龙 《光学精密工程》 北大核心 2025年第7期1114-1129,共16页
针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增... 针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增强模型的泛化能力,提出了基于光源光照强度建模的扩散模型,以生成不同光照强度的训练数据集。设计了边缘特征融合的深度曲线估计网络,能够提取更丰富的低光照图像的多尺度轮廓和细节特征,提升对光照强度估计的准确性。为恢复出光照更加自然的图像,融合大气光估计来计算不同图像区域的光照强度,实现了对光增强曲线和光增强系数的动态微调。在无参考数据集ExDark和有参考数据集LOL上,使用6种评价指标进行实验分析。实验结果表明,相较于基准方法,LightDiffu-DCE在ExDark上的无参考评价指标NIQE,PIQE和RISQ上分别提升了约8.35%,6.20%和21.83%,在LOL数据集上的有参考评价指标PSNR,SSIM和RMSE提升了约12.12%,4.76%和49.89%。该方法可以有效增强低光照图像,且恢复出的低光照图像轮廓更加清晰,色彩鲜明且效果更自然。 展开更多
关键词 计算机视觉 扩散模型 低光照增强 边缘特征 深度曲线估计网络
在线阅读 下载PDF
复杂曲面物体表面力学检测与成像方法研究
14
作者 梁伟豪 张凯邦 +3 位作者 刘紫琛 黄敏 陈智明 罗坚义 《材料研究与应用》 2025年第4期778-788,共11页
力学检测在评估材料、结构或系统力学性能方面至关重要。然而,传统力学检测仪器多局限于单点测量或二维平面扫描,难以对复杂曲面物体的表面进行高精度、全覆盖的力学特性分析。因此,提出了一种基于六轴机械臂操作结合深度视觉技术的复... 力学检测在评估材料、结构或系统力学性能方面至关重要。然而,传统力学检测仪器多局限于单点测量或二维平面扫描,难以对复杂曲面物体的表面进行高精度、全覆盖的力学特性分析。因此,提出了一种基于六轴机械臂操作结合深度视觉技术的复杂曲面表面力学扫描与三维成像方法。该法借助机械臂带动深度相机从不同角度拍摄图像,运用Open3D开源库完成三维场景重建,获取被测物外轮廓的点云信息,随之对重建点云数据进行法线估计,将其转换为机械臂末端位姿控制参数,并利用贪婪算法规划扫描路径,从而使机械臂按照规划的扫描路径驱动末端带有力传感器的探针对各测量点进行力学按压检测,从而获取实时采集探针位置与压力数据。在按压的过程中,利用导纳力控的方式控制按压速度与力度间的关系,使得探针在按压到额定阈值时速度恰好降低为零,在高效率检测的同时保证测量数据的精确度。单次按压检测的所需时间约为6.4 s、位置精度为0.1 mm、力学精度为30 mN、最大检测范围为1.3 m的半球、最大按压力度为10 N。在对所有测量点完成检测后,通过将相同压力下的位置数据三维成像,以压缩深度为标量场对模型表面进行伪彩色映射,直观展现不同区域的软硬差异。实验验证,该方法可成功实现对人体大腿硅胶模型等复杂曲面的高分辨率力学成像,色彩梯度清晰反映了软组织仿生材料在不同压力下的压缩深度分布特征。复杂曲面物体的表面力学检测与成像方法,为生物医学工程等领域提供了量化依据。 展开更多
关键词 复杂曲面物体 力学检测 力学成像 导纳力控 深度视觉 场景重建 机械臂控制 伪彩色映射成像
在线阅读 下载PDF
基于双目视觉的城市洪涝区水深及流速监测方法 被引量:1
15
作者 张欣茹 王波 《中国农村水利水电》 北大核心 2025年第7期101-107,共7页
详细精准的水深及流速监测信息对城市洪涝救灾抢险和风险评估具有重要意义。随着极端气候事件的频发和城市化进程的推进,传统的城市洪涝监测方法已难以满足区域化、实时化的监测需求。针对目前城市洪涝仍缺乏整合水深流速为一体的区域... 详细精准的水深及流速监测信息对城市洪涝救灾抢险和风险评估具有重要意义。随着极端气候事件的频发和城市化进程的推进,传统的城市洪涝监测方法已难以满足区域化、实时化的监测需求。针对目前城市洪涝仍缺乏整合水深流速为一体的区域监测方法的问题,研究构建了基于双目视觉的城市洪涝区水深及流速监测系统,通过覆盖同一视野的两台监控摄像头进行洪涝区域影像数据采集,实现水深及流速的高精度测量;提出了基于特征点提取匹配的洪涝区水深重建方法,利用双目视觉的视差原理,通过提取匹配洪涝区域特征点计算三维坐标,重建水深分布;提出了基于漂浮物识别并耦合水深分布的表面流场测量方法,通过识别洪涝表面的漂浮物(如树叶、垃圾等)计算洪水表面流速,耦合水深分布,实现水深流速一体化监测。为验证监测方法的可行性,研究在实验室内搭建了水槽模拟洪涝环境,并利用监控摄像头拍摄洪涝影像进行水深及流速计算。结果表明:与波高仪相比,水深测量误差约为2.7 mm,与粒子测速技术相比,流速测量误差在5%左右。相较于传统监测方法,本方法具有非接触、无风险、区域监测、就地取材、无需额外增添设备等优点。 展开更多
关键词 双目视觉 监控摄像头 城市洪涝 水深 流速 监测方法
在线阅读 下载PDF
林下单木定位视觉SLAM算法研究
16
作者 尹伯卿 邢艳秋 +2 位作者 杨书航 常晓晴 丁志文 《武汉大学学报(信息科学版)》 北大核心 2025年第4期792-801,共10页
森林中立木的单木定位是林业遥感领域中的重要问题,基于单目相机的视觉即时定位与建图(simultaneous localization and mapping,SLAM)算法是室外空间定位和建图的重要手段,解决了由于树木冠层遮挡导致的全球导航卫星系统信号缺失问题,... 森林中立木的单木定位是林业遥感领域中的重要问题,基于单目相机的视觉即时定位与建图(simultaneous localization and mapping,SLAM)算法是室外空间定位和建图的重要手段,解决了由于树木冠层遮挡导致的全球导航卫星系统信号缺失问题,然而现有的单目视觉SLAM算法无法实现样地内立木直接定位。为解决此问题,基于单目视觉SLAM算法,提出了单木SLAM(individual tree SLAM,Indi-tree SLAM)算法。该算法通过使用图像序列进行相机位姿估计、地图尺度恢复、单木位置判断和单木位置坐标计算等过程可实现样地中的立木直接定位。采用相机对3块边长为40 m的方形样地进行样地扫描,对Indi-tree SLAM算法进行精度验证。实验结果表明,Indi-tree SLAM算法所计算的样地立木坐标在沿x轴和y轴方向的均方根误差均为0.44 m,平均定位误差为6.3%。Indi-tree SLAM算法实现了样地内立木的直接定位,缩短了森林结构参数测量时间,为森林资源调查提供了一种准确、高效的可行性方案。 展开更多
关键词 单目视觉 SLAM 图像增强 逆深度 单木定位
原文传递
基于双目相机的手术机器人视觉深度测量方法
17
作者 郑放 叶青 +2 位作者 王浩 孟祥锋 邓志超 《计量科学与技术》 2025年第11期25-33,共9页
手术机器人在内窥手术中发挥了越来越重要的作用,其显示系统为医生提供了关键的视觉信息。手术机器人的显示系统往往由两个独立的显示器组成,其图像由内窥镜头和显示器共同决定,而且其封装结构也给显示效果的测量与评价带来了阻碍。本... 手术机器人在内窥手术中发挥了越来越重要的作用,其显示系统为医生提供了关键的视觉信息。手术机器人的显示系统往往由两个独立的显示器组成,其图像由内窥镜头和显示器共同决定,而且其封装结构也给显示效果的测量与评价带来了阻碍。本文提出了一种基于双目相机结构的手术机器人视觉深度的测量系统和评价方法,棋盘格和双球连杆作为校准工具。首先,利用张氏标定法定标双目相机内外参数;然后,利用棋盘格调整内窥镜头以及相机位置以保证姿态正确;再然后,在内窥镜头不同的工作距离下对不同旋转角度的双球连杆成像;最后,利用球心识别算法识别双球球心的空间坐标,并计算出双球球心的视觉深度差。结果表明,本系统能够很好地测量出视觉深度,且同一个工作距离下,球心视觉深度差与球心实际深度差满足线性规律,其斜率是视觉深度差的放大系数。提出的测量和评价方法具有很高的可行性,能够为手术机器人显示系统的优化提供可靠依据。 展开更多
关键词 计量学 手术机器人 内窥镜 立体视觉 双目相机 视觉深度
原文传递
结构光式双目视差计算精度影响的仿真方法
18
作者 杨兴梅 靳项天 +2 位作者 李慧玲 李守业 胡茂海 《红外技术》 北大核心 2025年第11期1372-1381,共10页
实际光学系统的复杂性、环境、设备、光源及传统图像匹配困难等因素对双目视差的计算精度影响大且精度难以有效验证。针对上述问题,本文提出了一种不同的结构光模式的双目视差计算精度影响的建模仿真方法并设计仿真系统。在仿真系统中,... 实际光学系统的复杂性、环境、设备、光源及传统图像匹配困难等因素对双目视差的计算精度影响大且精度难以有效验证。针对上述问题,本文提出了一种不同的结构光模式的双目视差计算精度影响的建模仿真方法并设计仿真系统。在仿真系统中,对球体建模并对小球模型实现点、网格线、横向和纵向条纹等不同模式结构光的照明仿真。应用局部视差BM(Block Matching)算法和半全局视差匹配SGBM(Semi-Global Block Matching)算法分别计算上述4种结构光纹理下的小球视差。利用得到的视差信息进行深度计算获得估计的小球半径并通过对小球划分估计深度区域的思路来分析测量精度差异。实验结果表明:该仿真方法和划分深度区域思路有效可行,并且相对其它照明模式,横向条纹面结构光具有更优的可靠性、稳定性,且随着横向条纹面结构光纹理条纹空间频率提高,小球半径测量准确率呈上升趋势。 展开更多
关键词 双目视觉 结构光模式 视差精度 深度估计
在线阅读 下载PDF
基于深度非对称可分离卷积的人脸表情识别
19
作者 戚星烁 胡黄水 +1 位作者 唐志振 王玲 《长春工业大学学报》 2025年第2期143-148,共6页
提出深度非对称可分离卷积在网络结构不变的情况下,有效地降低了网络的参数。为了提高人脸表情的识别准确率,提出了改进通道注意力机制,通过指数函数增大不同通道特征图之间的差异,更突出关键特征。在Fer2013数据集上的实验表明,验证了... 提出深度非对称可分离卷积在网络结构不变的情况下,有效地降低了网络的参数。为了提高人脸表情的识别准确率,提出了改进通道注意力机制,通过指数函数增大不同通道特征图之间的差异,更突出关键特征。在Fer2013数据集上的实验表明,验证了文中提出的深度非对称可分离卷积和改进通道注意力机制的有效性。 展开更多
关键词 计算机视觉 人脸表情识别 深度可分离卷积 通道注意力机制
在线阅读 下载PDF
基于机器视觉的钢筋安装机器人设计
20
作者 董奇峰 吴中正 程茂林 《机床与液压》 北大核心 2025年第21期74-80,共7页
针对当前桥塔钢筋安装难度大、施工效率低等问题,基于机器视觉和工业机器人技术设计一款钢筋自动安装智能装备。对钢筋安装机器人结构进行设计,提出钢筋自动化安装作业工艺;基于D-H法进行机器人运动学分析,建立机器人正、逆运动学模型;... 针对当前桥塔钢筋安装难度大、施工效率低等问题,基于机器视觉和工业机器人技术设计一款钢筋自动安装智能装备。对钢筋安装机器人结构进行设计,提出钢筋自动化安装作业工艺;基于D-H法进行机器人运动学分析,建立机器人正、逆运动学模型;设计基于深度相机的钢筋网格视觉识别定位系统,实现了复杂环境下钢筋交叉点的识别与坐标提取;最后,通过试验对钢筋安装机器人方案的可行性进行验证。试验结果表明:钢筋安装机器人可实现桥塔钢筋的全流程自动化安装,与传统工艺相比,拉钩筋安装精度可达2 mm以内且焊接质量较为稳定,可减少作业人员50%,安装效率提升30%,提高了施工效率和质量,其视觉系统的可靠性和稳定性也满足钢筋安装的定位要求,达到了预期的设计目标。 展开更多
关键词 机器视觉 钢筋安装机器人 运动学模型 深度相机
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部