期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于模型预测控制的高精度混合视觉伺服机械臂控制方法 被引量:1
1
作者 刘新 王辉 《中南大学学报(自然科学版)》 北大核心 2025年第6期2266-2277,共12页
机械臂在各领域应用广泛,其控制系统对精度与稳定性方面的要求日益增加,然而,传统控制方法在复杂动态环境中的适应性不强。针对这一问题,本文提出一种基于模型预测控制的机械臂混合视觉伺服控制方法。首先,通过对混合视觉伺服系统进行建... 机械臂在各领域应用广泛,其控制系统对精度与稳定性方面的要求日益增加,然而,传统控制方法在复杂动态环境中的适应性不强。针对这一问题,本文提出一种基于模型预测控制的机械臂混合视觉伺服控制方法。首先,通过对混合视觉伺服系统进行建模,分析系统误差函数中旋转部分和平移部分的动态变化特性,推导误差与相机速度之间的关联关系模型。其次,提出一种基于模型预测控制的机械臂控制方法,通过结合系统误差和相机速度信息构建状态空间模型,实时预测系统的未来动态并优化控制输入,实现误差补偿和快速收敛。最后,在ViSP仿真平台和实物运动控制平台上分别进行验证。研究结果表明:与传统控制方法相比,所提出的方法有效降低了稳态误差,提高了控制精度,特别是在动态复杂环境中具有更强的抗干扰能力和适应性。 展开更多
关键词 机械臂 混合视觉伺服 模型预测控制 状态空间模型 最优控制
在线阅读 下载PDF
照度条件自适应的粒度渐进多模态图像融合方法 被引量:3
2
作者 王传云 孙冬冬 +3 位作者 周明奇 王田 高骞 李照奎 《工程科学学报》 北大核心 2025年第6期1257-1271,共15页
为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对... 为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对场景向量进行处理.随后,利用处理后的场景向量对图像重建阶段的图像特征在通道维度上进行调控,使得融合模型能够根据不同的场景光照生成不同风格的融合图像.其次,为了解决现有特征提取模块在特征表达上的不足,本文设计了基于状态空间方程的特征提取模块,以线性复杂度实现全局特征感知,减少了信息传输过程中的信息丢失,提升了融合图像的视觉效果.最后,设计了粒度渐进融合模块,利用状态空间方程对多模态特征进行全局聚合,并引入跨模态坐标注意力机制对聚合后的特征进行精细调优,从而实现多模态特征从全局到局部的多阶段融合,增强了网络的信息整合能力.在训练过程中,本文采用先验知识生成增强图像作为标签,并根据不同环境构建同源与异构的损失函数,以实现场景自适应的多模态图像融合.实验结果显示,本文方法在暗光场景数据集MSRS和LLVIP、混合光照数据集TNO、连续场景数据集RoadScene以及雾霾场景数据集M3FD上的表现均优于11种先进算法,在定量和定性对比中取得了更好的视觉效果和更高的定量指标.所提出的方法在自动驾驶、军事侦察和环境监控等任务中展现出较大的潜力. 展开更多
关键词 视觉感知优化 图像融合 多模态 场景自适应 状态空间模型 跨模态注意力机制
在线阅读 下载PDF
基于双分支特征聚合的无人机视觉位置识别
3
作者 刘奇 裴智翔 +2 位作者 惠乐 何明一 戴玉超 《航空学报》 北大核心 2025年第23期119-130,共12页
无人机依赖全球导航卫星系统(GNSS)进行导航定位容易受到信号阻挡或干扰造成失效。视觉位置识别(VPR)通过将无人机捕获的视觉信息、预先构建的地图数据进行匹配实现地理定位,能够在GNSS信号拒止环境下提供可靠的定位信息,因此成为近年... 无人机依赖全球导航卫星系统(GNSS)进行导航定位容易受到信号阻挡或干扰造成失效。视觉位置识别(VPR)通过将无人机捕获的视觉信息、预先构建的地图数据进行匹配实现地理定位,能够在GNSS信号拒止环境下提供可靠的定位信息,因此成为近年来的研究热点。传统VPR方法依赖预训练网络提取用于匹配、检索的全局特征,通常对视角、尺度、光照等视觉外观变化敏感,并且容易丢失细粒度信息。为此,提出了一种基于双分支特征聚合网络的无人机视觉地理位置识别方法,结合了预训练的视觉Transformer模型、状态空间模型以提取更加鲁棒的特征。具体来说,设计了一个集成了DINOv2、VMamba模型的双分支特征提取网络,通过结合ViT的全局语义理解、视觉状态空间模型的局部动态建模能力,实现更强的泛化、细节感知能力。此外,引入了一个受MLP-Mixer架构启发的高效特征融合框架,以增强多通道特征表示的性能。在同视角的ALTO数据集、跨视角的VIGOR数据集上进行的实验表明,所提出的方法在诸如返回前1、5个结果中的召回率指标上具有较高的准确性,且优于现有方法,无论是在同一视角还是跨视角的场景中,都能够更有效地识别出匹配图像。 展开更多
关键词 无人机视觉位置识别 视觉匹配定位 状态空间模型 双分支特征提取 图像检索
原文传递
Enhancing Medical Image Classification with BSDA-Mamba:Integrating Bayesian Random Semantic Data Augmentation and Residual Connections
4
作者 Honglin Wang Yaohua Xu Cheng Zhu 《Computers, Materials & Continua》 2025年第6期4999-5018,共20页
Medical image classification is crucial in disease diagnosis,treatment planning,and clinical decisionmaking.We introduced a novel medical image classification approach that integrates Bayesian Random Semantic Data Aug... Medical image classification is crucial in disease diagnosis,treatment planning,and clinical decisionmaking.We introduced a novel medical image classification approach that integrates Bayesian Random Semantic Data Augmentation(BSDA)with a Vision Mamba-based model for medical image classification(MedMamba),enhanced by residual connection blocks,we named the model BSDA-Mamba.BSDA augments medical image data semantically,enhancing the model’s generalization ability and classification performance.MedMamba,a deep learning-based state space model,excels in capturing long-range dependencies in medical images.By incorporating residual connections,BSDA-Mamba further improves feature extraction capabilities.Through comprehensive experiments on eight medical image datasets,we demonstrate that BSDA-Mamba outperforms existing models in accuracy,area under the curve,and F1-score.Our results highlight BSDA-Mamba’s potential as a reliable tool for medical image analysis,particularly in handling diverse imaging modalities from X-rays to MRI.The open-sourcing of our model’s code and datasets,will facilitate the reproduction and extension of our work. 展开更多
关键词 Deep learning medical image classification data augmentation visual state space model
在线阅读 下载PDF
基于主动学习和视觉状态空间模型的热点检测器
5
作者 王盈 蔡述庭 熊晓明 《广东工业大学学报》 CAS 2024年第6期45-51,共7页
物理验证是芯片生产制造中的关键问题,可保证芯片良率。在实际制造前检测芯片版图中的潜在热点是物理验证的重要步骤,确保制造可行性,提高生产效率。传统的热点检测技术具有检测周期长、消耗大量计算资源等问题,不仅增加了整个生产周期... 物理验证是芯片生产制造中的关键问题,可保证芯片良率。在实际制造前检测芯片版图中的潜在热点是物理验证的重要步骤,确保制造可行性,提高生产效率。传统的热点检测技术具有检测周期长、消耗大量计算资源等问题,不仅增加了整个生产周期的时间成本,而且检测到的热点模式有限。基于主动学习技术和视觉状态空间模型,本文提出一种新的热点检测模型,使用记忆性评估查询的采样策略,缓解热点数据和非热点数据不平衡问题对模型的影响;同时对基于卷积神经网络(Convolutional Neural Network,CNN)结构的分辨率受限以及基于视觉转换器(Vision Transformers,Vi T)网络架构的二次复杂度进行优化,实现热点检测器的线性复杂度。使用ICCAD-2012竞赛数据进行测试,表明本文提出的热点检测器能够显著减少误报率,当召回率高达98.89%时,误报率仅为1.47%。 展开更多
关键词 热点检测 深度学习 视觉状态空间模型 主动学习
在线阅读 下载PDF
城市变化多基态修正模型三维时空表达 被引量:2
6
作者 冯彬雪 张菊清 《测绘科学》 CSCD 北大核心 2016年第5期83-86,167,共5页
为了减少时态地理信息系统的数据冗余、提高运行效率,该文在对比分析多种时空数据基态修正模型的基础上,选择了一种只存储几个基态和相应变化信息的多基态修正模型,并以德州市某地区为例进行三维时空数据组织,实现了城市变化的三维动态... 为了减少时态地理信息系统的数据冗余、提高运行效率,该文在对比分析多种时空数据基态修正模型的基础上,选择了一种只存储几个基态和相应变化信息的多基态修正模型,并以德州市某地区为例进行三维时空数据组织,实现了城市变化的三维动态展现,达到了城市变化三维时空可视化表达的目的。 展开更多
关键词 三维建模 时空数据模型 多基态 三维时空可视化
原文传递
基于三维建模的电力信息系统可视化管控方法 被引量:7
7
作者 郭玮 张铁刚 +2 位作者 李嗣明 唐蔚海 周志糯 《信息技术》 2021年第12期165-170,共6页
为了有效提高电力信息系统可视化管控效率及可靠性,提出了基于三维建模的电力信息系统可视化管控方法。根据电力信息系统的场景空间分割示意图,计算击中左包围盒和右包围盒的条件概率;通过计算系统被包围盒包围的场景空间分割代价,划分... 为了有效提高电力信息系统可视化管控效率及可靠性,提出了基于三维建模的电力信息系统可视化管控方法。根据电力信息系统的场景空间分割示意图,计算击中左包围盒和右包围盒的条件概率;通过计算系统被包围盒包围的场景空间分割代价,划分可视化场景空间;通过采样数据真实值与量测值之间的关系,估计电力信息系统的运行状态;根据可视化管控流程,实现电力信息系统的可视化管控。测试结果表明,所提方法电力信息系统的可视化切换时间较短,低于1.5s,电力信息系统的可视化管控精度高达98%,说明系统可视化的管控可靠性较高。 展开更多
关键词 三维建模 电力信息系统 可视化 场景空间 状态估计
在线阅读 下载PDF
基于视觉状态空间的表格结构识别方法
8
作者 陈思宇 杨词慧 《中国高新科技》 2026年第3期116-118,共3页
表格结构识别是文档图像分析领域的核心任务之一。近年来,深度学习技术为表格结构识别带来了新的突破,但现有方法在处理大规模表格图像数据时,仍普遍存在计算复杂度高、长距离依赖关系捕捉不足等问题。为了克服上述局限性,文章提出了一... 表格结构识别是文档图像分析领域的核心任务之一。近年来,深度学习技术为表格结构识别带来了新的突破,但现有方法在处理大规模表格图像数据时,仍普遍存在计算复杂度高、长距离依赖关系捕捉不足等问题。为了克服上述局限性,文章提出了一种基于视觉状态空间的表格结构识别新方法。该方法构建了视觉状态空间特征提取模块和视觉文本融合序列解析两个核心模块,旨在实现从表格图像到结构化序列文本高效的端到端生成。在PubTabNet和FinTabNet数据集上的实验结果表明,文章所提方法在TEDS-S指标上相对既有方法分别提升1.33%和1.28%,充分验证了该方法的有效性。 展开更多
关键词 表格结构识别 视觉状态空间模型 深度学习 多模态
在线阅读 下载PDF
基于异质图和Mamba的跨模态遥感语义分割
9
作者 叶志伟 冯青阳 +3 位作者 刘明明 王苑 高榕 严灵毓 《计算机应用研究》 2026年第3期917-923,共7页
针对可见光遥感影像语义分割中跨模态特征异构性显著及深层语义交互效率低下的问题,提出了一种跨模态异质图引导的Mamba网络(CHGMNet)。该方法通过设计跨模态异构特征对齐模块(CHFAM),利用异质图卷积构建可学习的特征相似性度量,实现光... 针对可见光遥感影像语义分割中跨模态特征异构性显著及深层语义交互效率低下的问题,提出了一种跨模态异质图引导的Mamba网络(CHGMNet)。该方法通过设计跨模态异构特征对齐模块(CHFAM),利用异质图卷积构建可学习的特征相似性度量,实现光谱-几何特征在共享语义空间的自适应校准,有效缓解模态间维度失配问题。同时,创新性地提出多路径融合Mamba模块(MPFM),通过线性复杂度的状态空间模型捕获多层次融合特征,结合多路径自适应架构在保持全局上下文建模能力的同时显著提升计算效率。实验结果表明,在Vaihingen和Potsdam两个大规模高分辨率遥感数据集上,CHGMNet在mIoU、mF1和OA等指标上均显著优于现有主流方法,验证了其在跨模态遥感解译任务中的优越性。 展开更多
关键词 跨模态 图卷积 视觉状态空间模型 遥感语义分割
在线阅读 下载PDF
基于Vmamba联合注意力机制的扎龙湿地信息提取与动态监测
10
作者 王旭 高心丹 《南京林业大学学报(自然科学版)》 2026年第2期48-56,共9页
【目的】研究芦苇(Phragmites australis)湿地土地类型变化、监测覆被特征,为湿地保护和开发提供参考。【方法】基于2017—2023年9月扎龙湿地Sentinel-2遥感影像,制作了包含湖泊、芦苇地、建筑地、耕地、盐碱地5种土地类型的遥感影像数... 【目的】研究芦苇(Phragmites australis)湿地土地类型变化、监测覆被特征,为湿地保护和开发提供参考。【方法】基于2017—2023年9月扎龙湿地Sentinel-2遥感影像,制作了包含湖泊、芦苇地、建筑地、耕地、盐碱地5种土地类型的遥感影像数据集。通过视觉状态空间(visual state space model,Vmamba)联合注意力机制并结合水体指数NDWI生成水体掩膜对研究区进行信息提取,统计各土地类型的位置和面积变化信息。利用像元二分法提取植被覆盖度(fractional vegetation cover,FVC),计算叶面积指数(leaf area index,LAI)和生态质量指数(ecosystem quality index,EQI)。【结果】通过本研究提出的方法对研究区内分布信息进行提取,整体精度(overall accuracy,OA)为80.85%、平均交并比(mean intersection over union,MIoU)为71.59%,宏观平均F1值(macro-F1,MF1)为79.93%。2017—2023年,在扎龙湿地内湖泊、芦苇地的覆盖面积呈增加趋势;耕地、建筑地的覆盖面积呈减少趋势;盐碱地的覆盖面积呈波动趋势。植被覆盖度、生态质量指数先升高后降低,与中国气候公报内容基本一致。【结论】Vmamba联合注意力机制并结合水体掩膜的模型,在湿地信息提取方面效果良好,一定程度上提高土地利用分类与变化监测的精度。植被覆盖度、叶面积指数、生态质量指数的监测对湿地资源管理与可持续利用提供借鉴。 展开更多
关键词 植被覆盖度(FVC) 叶面积指数(LAI) 生态质量指数(EQI) 视觉状态空间模型 Vmamba 扎龙湿地
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部