期刊文献+
共找到654篇文章
< 1 2 33 >
每页显示 20 50 100
Natural Scene Classification Inspired by Visual Perception and Cognition Mechanisms
1
作者 ZHANG Rui 《重庆理工大学学报(自然科学)》 CAS 2011年第7期24-43,共20页
The process of human natural scene categorization consists of two correlated stages: visual perception and visual cognition of natural scenes.Inspired by this fact,we propose a biologically plausible approach for natu... The process of human natural scene categorization consists of two correlated stages: visual perception and visual cognition of natural scenes.Inspired by this fact,we propose a biologically plausible approach for natural scene image classification.This approach consists of one visual perception model and two visual cognition models.The visual perception model,composed of two steps,is used to extract discriminative features from natural scene images.In the first step,we mimic the oriented and bandpass properties of human primary visual cortex by a special complex wavelets transform,which can decompose a natural scene image into a series of 2D spatial structure signals.In the second step,a hybrid statistical feature extraction method is used to generate gist features from those 2D spatial structure signals.Then we design a cognitive feedback model to realize adaptive optimization for the visual perception model.At last,we build a multiple semantics based cognition model to imitate human cognitive mode in rapid natural scene categorization.Experiments on natural scene datasets show that the proposed method achieves high efficiency and accuracy for natural scene classification. 展开更多
关键词 natural scene classification visual perception model visual cognition model
在线阅读 下载PDF
Introduction to Visual Surveillance of Dynamic Scenes
2
作者 Steve Maybank 《自动化学报》 EI CSCD 北大核心 2003年第3期319-320,共2页
关键词 of Introduction to visual Surveillance of Dynamic scenes
全文增补中
动态场景下基于跨域掩膜分割的视觉SLAM算法
3
作者 亢洁 徐婷 +4 位作者 王佳乐 郭进 赫轩 王沫 夏宇 《陕西科技大学学报》 北大核心 2026年第1期178-185,193,共9页
针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减... 针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减除法实现运动物体检测,利用深度图结合深度阈值分割构建跨域掩膜分割机制,并设计相机运动几何校正策略补偿检测框坐标误差,在实现运动物体分割的同时提升处理速度.为优化特征点利用率,采用金字塔光流对动态特征点进行帧间连续跟踪与更新,同时确保仅由静态特征点参与位姿估计过程.在TUM数据集上进行系统性评估,实验结果表明,相比于ORB-SLAM3算法,该算法的绝对位姿误差平均降幅达97.1%,与使用深度学习分割网络的DynaSLAM和DS-SLAM的动态SLAM算法相比,其单帧跟踪时间大幅减少,在精度与效率之间实现了更好的平衡. 展开更多
关键词 视觉SLAM 动态场景 YOLO-Fastest 金字塔光流 深度阈值分割
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
4
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉Transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
“眼前有景”的园林式公厕营建策略研究
5
作者 周潼 赵志红 《南方建筑》 北大核心 2026年第1期22-30,共9页
在存量更新背景下,优化公厕建设能够以点带面、有效提升人居空间环境质量。面对现有公厕理论研究不足以及人厕关系疏离的问题,园林式公厕的研究能够促进公厕的多元化发展和现代生活的诗意建构。引入传统造园“眼前有景”的相关理论,结... 在存量更新背景下,优化公厕建设能够以点带面、有效提升人居空间环境质量。面对现有公厕理论研究不足以及人厕关系疏离的问题,园林式公厕的研究能够促进公厕的多元化发展和现代生活的诗意建构。引入传统造园“眼前有景”的相关理论,结合当下公厕实践作品进行“疏密”“曲折”以及“对景”三个维度的分析,提出园林式公厕在空间与布局、路径与视线、视景与体验三个角度的设计策略。 展开更多
关键词 园林式公厕 公厕设计 眼前有景 视景 非透视效果
在线阅读 下载PDF
重叠感受野间隙耦合的方向差分运动感知神经网络
6
作者 陶星宇 胡滨 《计算机科学与探索》 北大核心 2026年第1期122-142,共21页
认知神经科学研究发现,脊椎动物视网膜存在方向差分神经元(OMS-DS),具有局部-全局方向差异偏好的视觉神经响应特性,有助于动态视觉场景中区分前景局部和背景全局之间的运动差异,但目前鲜有该神经特性在视觉运动感知问题研究的计算模型... 认知神经科学研究发现,脊椎动物视网膜存在方向差分神经元(OMS-DS),具有局部-全局方向差异偏好的视觉神经响应特性,有助于动态视觉场景中区分前景局部和背景全局之间的运动差异,但目前鲜有该神经特性在视觉运动感知问题研究的计算模型报道。针对该问题,基于蝾螈视网膜差分运动响应特性,提出一种方向差分运动感知神经网络(dirDMPNN)。所提出的神经网络包含突触前和突触后两部分。突触前网络感知运动变化在视野域中引发的低阶视觉线索;突触后网络基于重叠感受野间隙连接耦合机制以对前景、背景方向差分实现响应输出。系统性实验研究表明,dirDMPNN能感知视野域中平移自运动的前景-背景方向运动线索,并对其差分运动模式输出强烈神经尖峰响应。该工作涉及生物视脑神经机制启发的视觉信息加工处理,可为自运动视觉场景,诸如空间飞行器、无人驾驶、机器人自主导航等自治环境下的运动感知与识别、目标检测与跟踪问题的研究与解决提供新思想、新方法。 展开更多
关键词 方向差分感知 间隙连接耦合 重叠感受野 方向差分神经元 视网膜神经 视觉运动感知 自运动视觉场景
在线阅读 下载PDF
基于场景理解与概率采样的巡检机器人视觉避障研究
7
作者 产取结 唐磊 王皓 《传感器与微系统》 北大核心 2026年第2期42-47,共6页
为提升巡检机器人视觉避障性能,提出了一种基于场景理解与概率采样的机器人视觉避障方法。方法以轻量级的深度可分离空洞卷积单元为核心构建场景理解网络,对场景中道路及障碍物信息进行识别。然后,将场景理解结果转化为二值化语义地图,... 为提升巡检机器人视觉避障性能,提出了一种基于场景理解与概率采样的机器人视觉避障方法。方法以轻量级的深度可分离空洞卷积单元为核心构建场景理解网络,对场景中道路及障碍物信息进行识别。然后,将场景理解结果转化为二值化语义地图,并设计启发式的局部概率采样算法,从语义地图中高效搜索出安全的避障路线。最后,引入特征时序分析结构对机器人巡检过程中冗余特征计算进行过滤,保障方法在实际应用中的效率。实验结果表明:所提方法可以有效提升机器人的场景理解能力以及避障性能,并且相较于其他方法,该方法也体现出更强鲁棒性和稳定性,可以更好地辅助机器人完成巡检任务。 展开更多
关键词 巡检机器人 视觉避障 场景理解 概率采样 特征时序分析
在线阅读 下载PDF
基于单目图像的多目标三维视觉定位方法
8
作者 黄舒雯 郭柯宇 +3 位作者 宋翔宇 韩锋 孙士杰 宋焕生 《计算机应用》 北大核心 2026年第1期207-215,共9页
针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,... 针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,构建一个多目标视觉定位数据集Mmo3DRefer,并设计跨模态匹配网络TextVizNet。TextVizNet通过预训练的单目检测器生成目标的三维边界框,并借助信息融合模块与信息对齐模块实现视觉与语言信息的深度整合,进而实现文本指导下的多目标三维检测。与CORE-3DVG(Contextual Objects and RElations for 3D Visual Grounding)、3DVG-Transformer和Multi3DRefer(Multiple 3D object Referencing dataset and task)等5种方法对比的实验结果表明,与次优方法Multi3DRefer相比,TextVizNet在Mmo3DRefer数据集上的F1-score、精确度和召回率分别提升了8.92%、8.39%和9.57%,显著提升了复杂场景下基于文本的多目标定位精度,为自动驾驶和智能机器人等实际应用提供了有效支持。 展开更多
关键词 三维视觉定位 单目图像 多模态技术 目标检测 场景理解
在线阅读 下载PDF
Unity3D在工业煤场三维可视化中的关键技术应用
9
作者 席己强 王硕德 +2 位作者 罗涛 蒋宜峻 王金龙 《自动化应用》 2026年第1期205-208,共4页
为提升煤场的管理水平,并保证不同环境下的盘煤精度,研究Unity3D在工业煤场三维可视化中的关键技术。该技术的数据采集模块利用激光扫描仪采集工业煤场的点云数据,并通过基于面片的多视角立体视觉(PMVS)算法重建该数据;随后将该数据输... 为提升煤场的管理水平,并保证不同环境下的盘煤精度,研究Unity3D在工业煤场三维可视化中的关键技术。该技术的数据采集模块利用激光扫描仪采集工业煤场的点云数据,并通过基于面片的多视角立体视觉(PMVS)算法重建该数据;随后将该数据输入至三维场景构建模块,该模块利用Dynamo for Revit软件生成煤场的三维场景模型。场景渲染和可视化模块在Unity3D技术的支撑下渲染该模型,并完成模型可视化展示;结合构建的模型结果和点云数据完成煤场各区域煤堆的体积计算,实现煤场盘点。测试结果显示,该技术生成的三维场景模型能完整保留煤堆的形态细节,且能可靠完成不同高度煤堆的体积计算。 展开更多
关键词 UNITY3D 工业煤场 三维可视化 关键技术 数据采集模块 三维场景构建模块
在线阅读 下载PDF
动态环境下基于贝叶斯多视图估计的视觉惯性SLAM方法
10
作者 宁一鹏 范金龙 +3 位作者 王坚 郭郑伟 贾祥 柴大帅 《中国惯性技术学报》 北大核心 2026年第2期134-141,共8页
针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,... 针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,构建特征点动态概率模型,实现对特征点动态概率的精确估计;其次,提出特征点权重优化算法,动态调整特征点权重,提升系统在动态场景下的定位精度;最后,构建基于加权优化的位姿估计,实现相机与惯性测量装置的紧耦合。实验结果表明,相较于ORB-SLAM3算法,所提方法在TUM RGB-D和KITTI数据集上的绝对轨迹均方根误差分别平均降低了96.68%和27.80%,提升了系统在动态场景下的定位精度与鲁棒性。 展开更多
关键词 视觉惯性SLAM 多视图估计 特征点权重 动态场景 目标检测
在线阅读 下载PDF
Research on Ubiquitous Map Visualization for Ternary Space
11
作者 Si Wang Guangxia Wang 《Journal of Geoscience and Environment Protection》 2022年第2期162-170,共9页
In the era of information and communication technology (ICT) and big data, the map gradually shows a new qualitative feature of “spatiotemporal ubiquitous” with the extension of its object space, expression space an... In the era of information and communication technology (ICT) and big data, the map gradually shows a new qualitative feature of “spatiotemporal ubiquitous” with the extension of its object space, expression space and information source, which challenges the theory of cartographic visualization. This paper discusses the ubiquitous map visualization from the object content and expression form. Oriented to the ternary space, it divides the object dimension of ubiquitous map visualization and analyzes the expression characteristics of ubiquitous map visualization. Based on that, it constructs the variable system, symbol system and method system of ubiquitous map visualization. With three cases of the metro roadmap, the tag map, and the three-dimensional (3D) city map, the application of the proposed content is explained to illustrate its effectiveness. The research in this paper is expected to further enrich the theoretical basis of cartographic visualization and provide theoretical support for the expression and application of ubiquitous map visualization. 展开更多
关键词 Ubiquitous Map Ternary Space visualization VARIABLES Map Symbol scene
在线阅读 下载PDF
MR技术嵌入电子实验教学探索 被引量:1
12
作者 高玄怡 杨惠霞 +3 位作者 陈威 乔婧思 卢继华 王业亮 《实验室研究与探索》 北大核心 2025年第5期111-115,共5页
针对传统电子实验教学中学生对元器件内部构造机理的动态变化过程缺乏深入理解,导致实验调试时盲目操作的问题,提出一种基于混合现实(MR)技术的实验教学新模式,以“火灾报警电路综合设计实验”为例,展示MR技术在虚实结合场景中的应用。... 针对传统电子实验教学中学生对元器件内部构造机理的动态变化过程缺乏深入理解,导致实验调试时盲目操作的问题,提出一种基于混合现实(MR)技术的实验教学新模式,以“火灾报警电路综合设计实验”为例,展示MR技术在虚实结合场景中的应用。通过三维可视化技术,直观“透视”晶体管内部构造及载流子运行状态。实验结果表明,MR嵌入实验教学促进学生快速掌握和应用电子学知识,激发学生形象思维和创造力,培养学生深入探索的高阶思维,实现传统电子实验教学从单一模式向多维交互形式的转变,为实验教学与数字化技术的深度融合提供新的实践路径。 展开更多
关键词 混合现实技术 实验教学新模式 虚实场景 三维可视化
在线阅读 下载PDF
照度条件自适应的粒度渐进多模态图像融合方法 被引量:3
13
作者 王传云 孙冬冬 +3 位作者 周明奇 王田 高骞 李照奎 《工程科学学报》 北大核心 2025年第6期1257-1271,共15页
为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对... 为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对场景向量进行处理.随后,利用处理后的场景向量对图像重建阶段的图像特征在通道维度上进行调控,使得融合模型能够根据不同的场景光照生成不同风格的融合图像.其次,为了解决现有特征提取模块在特征表达上的不足,本文设计了基于状态空间方程的特征提取模块,以线性复杂度实现全局特征感知,减少了信息传输过程中的信息丢失,提升了融合图像的视觉效果.最后,设计了粒度渐进融合模块,利用状态空间方程对多模态特征进行全局聚合,并引入跨模态坐标注意力机制对聚合后的特征进行精细调优,从而实现多模态特征从全局到局部的多阶段融合,增强了网络的信息整合能力.在训练过程中,本文采用先验知识生成增强图像作为标签,并根据不同环境构建同源与异构的损失函数,以实现场景自适应的多模态图像融合.实验结果显示,本文方法在暗光场景数据集MSRS和LLVIP、混合光照数据集TNO、连续场景数据集RoadScene以及雾霾场景数据集M3FD上的表现均优于11种先进算法,在定量和定性对比中取得了更好的视觉效果和更高的定量指标.所提出的方法在自动驾驶、军事侦察和环境监控等任务中展现出较大的潜力. 展开更多
关键词 视觉感知优化 图像融合 多模态 场景自适应 状态空间模型 跨模态注意力机制
在线阅读 下载PDF
基于多语义关联与融合的视觉问答模型
14
作者 周浩 王超 +1 位作者 崔国恒 罗廷金 《计算机应用》 北大核心 2025年第3期739-745,共7页
弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的... 弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的作用。为解决上述问题,提出一种基于多语义关联与融合的VQA模型以建立问题与图像之间的语义联系。首先,基于场景图生成框架提取图像中的多种语义并把它们进行特征精炼后作为VQA模型的特征输入,从而充分挖掘图像场景中的信息;其次,为提高图像特征的语义价值,设计一个信息过滤器过滤图像特征中的噪声和冗余信息;最后,设计多层注意力融合和推理模块将多种图像语义分别与问题特征进行语义融合,以强化视觉图像重点区域与文本问题之间的语义关联。与BAN(Bilinear Attention Network)和CFR(Coarse-to-Fine Reasoning)模型的对比实验结果表明,所提模型在VQA2.0测试集上的准确率分别提高了2.9和0.4个百分点,在GQA测试集上的准确率分别提高了17.2和0.3个百分点。这表明所提模型能够更好地理解图像场景中的语义并回答组合式视觉问题。 展开更多
关键词 多语义特征融合 视觉问答 场景图 属性注意力 关系注意力
在线阅读 下载PDF
基于深度学习的动态场景视觉SLAM算法
15
作者 王晓栋 陈援峰 杨伟高 《广州城市职业学院学报》 2025年第3期95-100,共6页
同时定位与地图构建(SLAM)技术是无人机或机器人在未知复杂环境中进行自主探索的关键研究方向。借助该技术,机器人能够通过其传感器获取的数据,实时计算自身的位姿,同时构建外部环境的高精度地图。基于这些信息,机器人不仅能够制定路径... 同时定位与地图构建(SLAM)技术是无人机或机器人在未知复杂环境中进行自主探索的关键研究方向。借助该技术,机器人能够通过其传感器获取的数据,实时计算自身的位姿,同时构建外部环境的高精度地图。基于这些信息,机器人不仅能够制定路径规划,还可以动态修正位姿误差,从而显著提升在未知环境中导航的准确性和稳定性。在使用视觉传感器的SLAM系统中,位姿解算通常依赖于几何算法和特征匹配技术。这些方法通常假设外部环境由静止的物体构成,即基于场景静态化的前提。然而,在实际应用中,动态物体如行人和车辆经常出现,这对系统的性能和鲁棒性提出了严峻的挑战。因此,引入深度学习技术与视觉SLAM算法相结合,在现有的ORB-SLAM2算法框架上新增一个动态目标检测线程,用于识别动态物体,并在里程计的计算中剔除动态点,以减少动态目标对系统定位精度的影响。实验结果表明,该方法能够显著降低绝对轨迹误差,提升SLAM算法在动态场景下的适用性和稳定性。 展开更多
关键词 视觉SLAM 动态场景 深度学习 目标检测
在线阅读 下载PDF
建筑内基于虚拟仿真的跨视域行人监测研究
16
作者 陶振翔 李滢 +3 位作者 黄绪勃 王一森 张平 杨锐 《中国安全科学学报》 北大核心 2025年第5期161-168,共8页
为解决高层建筑楼宇或复杂开放建筑环境中多路视频数据采集成本高、长时间高质量标注难等问题,实现跨视域多路视频数据的生成与行人图像的自动标注,首先,设计虚拟现实场景,模拟行人运动并自动获取标记数据;其次,研究无监督领域自适应方... 为解决高层建筑楼宇或复杂开放建筑环境中多路视频数据采集成本高、长时间高质量标注难等问题,实现跨视域多路视频数据的生成与行人图像的自动标注,首先,设计虚拟现实场景,模拟行人运动并自动获取标记数据;其次,研究无监督领域自适应方法,降低源域数据与目标域数据的特征分布差异,使模型泛化至目标建筑场景;最后,验证模型泛化能力。研究结果表明:构建的虚拟现实场景能有效克服跨视域视频数据采集与高质量标注的困难;无监督领域自适应方法将平均首位命中率从22.02%提升至45.48%;结合源域风格转换、数据增广和目标域伪标签生成,首位命中率提升20%,降低了分布偏差,有助于实现模型在不同建筑场景中的泛化。 展开更多
关键词 建筑场景 虚拟仿真 跨视域 行人运动 自动标注
原文传递
无人机景象匹配导航技术研究综述
17
作者 王小攀 李建胜 +3 位作者 王安成 武燕 杨子迪 郭雨岩 《测绘科学技术学报》 2025年第3期221-229,共9页
拒止环境下的自主导航是未来无人机在各领域应对复杂环境时务必要解决的首要问题。目前,无人机导航和定位主要依赖全球卫星导航系统(GNSS)和惯性导航系统(INS),GNSS具有高精度特点,但容易受到外部复杂环境干扰;INS抗干扰能力较强,但其... 拒止环境下的自主导航是未来无人机在各领域应对复杂环境时务必要解决的首要问题。目前,无人机导航和定位主要依赖全球卫星导航系统(GNSS)和惯性导航系统(INS),GNSS具有高精度特点,但容易受到外部复杂环境干扰;INS抗干扰能力较强,但其定位误差会随时间慢慢累积。景象匹配导航技术(SMN)具有长时自主性、可视性、高精度、抗干扰性强、智能化等优点,更适合拒止环境下作为辅助GNSS和INS的自主导航手段为无人机飞行提供服务。该文聚焦无人机景象匹配导航技术系统原理,介绍了无人机景象匹配导航关键技术组成,并对该领域近十年的发展现状进行了梳理总结,最后对无人机景象匹配导航技术未来发展趋势进行了展望。 展开更多
关键词 拒止环境 自主导航 景象匹配 惯性 视觉导航
在线阅读 下载PDF
基于DBNet与SVTR的轮胎压印字符识别方法
18
作者 康朝海 蔡成颖 +1 位作者 孙行衍 任伟建 《自动化与仪表》 2025年第9期89-93,98,共6页
为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI... 为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI区域;最后基于DBNet检测字符、SVTR识别字符。实验表明,所提方法的检测Hmean达97.24%,识别准确率达99.22%,能有效解决轮胎压印字符识别的实际应用问题。 展开更多
关键词 轮胎压印字符 DBNet SVTR 字符识别
在线阅读 下载PDF
景象匹配无人机视觉定位 被引量:5
19
作者 袁媛 孙柏 刘赶超 《自动化学报》 北大核心 2025年第2期287-311,共25页
无人机因其高度的灵活性,在临地安防、灾后救援、地质勘测、农业植保等领域发挥着重要作用,因此受到越来越多的关注.定位导航作为无人机中的关键技术,对于无人机能否顺利执行任务至关重要.当前主要的定位导航算法包括全球导航卫星系统... 无人机因其高度的灵活性,在临地安防、灾后救援、地质勘测、农业植保等领域发挥着重要作用,因此受到越来越多的关注.定位导航作为无人机中的关键技术,对于无人机能否顺利执行任务至关重要.当前主要的定位导航算法包括全球导航卫星系统、惯性定位以及景象匹配定位导航等.首先,景象匹配定位导航方法利用计算机视觉技术,对无人机飞行时采集的航空影像进行数字化特征编码;随后,通过构建相似性度量与检索模型,将航空影像特征与预先获取的遥感地图库特征进行相似性度量,从而完成景象匹配;最后,根据无人机航空影像与遥感卫星地图的匹配结果,获取相应的地理位置信息,并将其更新为无人机的定位结果.景象匹配定位导航方法摆脱了定位系统对定位信号的依赖,实现了无人机飞行定位的自主化.鉴于此,以景象匹配算法中的特征提取方式为线索,分别针对基于模板匹配、基于手工特征以及基于度量学习的景象匹配,梳理其发展过程,并总结景象匹配定位导航方法中的关键问题.最后,针对景象匹配算法的发展现状,总结无人机景象匹配定位方法中亟待解决的问题. 展开更多
关键词 临地安防 无人机 视觉定位 景象匹配 度量学习 多视角变化
在线阅读 下载PDF
动态场景下基于深度学习的MR VSLAM综述
20
作者 高春艳 郭超阳 +1 位作者 孙凌宇 张明路 《计算机仿真》 2025年第3期466-471,共6页
视觉同时定位与地图构建(VSLAM)在动态场景中性能下降和缺乏鲁棒性已成为其实际应用的主要障碍。为应对复杂场景及其参数高度动态的挑战,将深度学习网络与VSLAM系统相结合,分割出场景中的静态背景和动态目标,实现移动机器人的精准定位... 视觉同时定位与地图构建(VSLAM)在动态场景中性能下降和缺乏鲁棒性已成为其实际应用的主要障碍。为应对复杂场景及其参数高度动态的挑战,将深度学习网络与VSLAM系统相结合,分割出场景中的静态背景和动态目标,实现移动机器人的精准定位。介绍已经用于VSLAM系统的深度学习网络,综合分析动态场景下基于深度学习的移动机器人VSLAM系统的研究进展,从动态目标删除与静态背景重建、动态目标跟踪与重建两方面进行综述,并对其深入应用做出展望。 展开更多
关键词 移动机器人 视觉同时定位与地图构建 深度学习 动态场景
在线阅读 下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部