期刊文献+
共找到419篇文章
< 1 2 21 >
每页显示 20 50 100
基于点-线-面特征和曼哈顿约束的鲁棒RGB-D里程计 被引量:1
1
作者 程向红 于兴云 +1 位作者 吴建峰 刘丰宇 《中国惯性技术学报》 北大核心 2025年第7期688-697,共10页
为解决视觉定位系统在室内环境中由于低纹理和后端优化中的权重设置不合理而导致的位姿漂移问题,提出了一种鲁棒RGB-D里程计设计方案。首先,采用短线过滤和断线合并的策略改进EDLines算法,以提高线特征匹配的精度和速度;其次,通过结合... 为解决视觉定位系统在室内环境中由于低纹理和后端优化中的权重设置不合理而导致的位姿漂移问题,提出了一种鲁棒RGB-D里程计设计方案。首先,采用短线过滤和断线合并的策略改进EDLines算法,以提高线特征匹配的精度和速度;其次,通过结合平面深度一致验证和方向相关性来改进主导平面筛选方式,以精确初始化曼哈顿帧;最后,基于特征约束数量和特征重投影残差构建特征的置信度,并采用自适应非线性优化的方法,实现鲁棒的位姿估计。实验结果表明,相较于ORB-SLAM2、Planar-SLAM和Manhattan-SLAM,所提方案在ICL-NUIM数据集上的绝对轨迹均方根误差平均降低60.55%、26.35%和22.97%;在TUM数据集上的绝对轨迹均方根误差平均降低52.41%、54.52%和49.57%。此外,在真实世界场景实验中,相较于Planar-SLAM、Manhattan-SLAM,所提方案的轨迹端点漂移分别降低35.63%和20.00%。 展开更多
关键词 rgb-d里程计 点-线-面特征 曼哈顿约束 后端优化
在线阅读 下载PDF
基于边界增强和加权大核的多尺度RGB-D显著性目标检测
2
作者 严灵毓 周婷 +1 位作者 高榕 叶志伟 《计算机应用研究》 北大核心 2025年第12期3815-3822,共8页
针对显著性目标检测中前景与背景分离效果不佳及背景噪声抑制不足的问题,提出了一种加权大核边界增强多尺度RGB-D显著性目标检测网络(LKMNet)。该方法通过引入边界增强加权大核融合模块(BWLKF),结合边界信息与加权大核卷积结构,提升前... 针对显著性目标检测中前景与背景分离效果不佳及背景噪声抑制不足的问题,提出了一种加权大核边界增强多尺度RGB-D显著性目标检测网络(LKMNet)。该方法通过引入边界增强加权大核融合模块(BWLKF),结合边界信息与加权大核卷积结构,提升前景聚焦能力并增强边界检测精度。同时,设计了动态门控多尺度融合模块(DGMF),通过自适应门控机制平衡局部与全局信息,从而突出空间相关特征并有效抑制背景干扰。实验结果表明,该方法在四个RGB-D数据集上的检测精度优于现有方法,验证了其在显著性目标检测任务中的优越性能。 展开更多
关键词 rgb-d显著性检测 多尺度特征融合 边界增强 加权大核卷积
在线阅读 下载PDF
基于RGB-D图像的高纺锤形苹果树修剪执行末端位姿估计
3
作者 康峰 王嘉成 +1 位作者 王亚雄 王宁 《农业工程学报》 北大核心 2025年第12期77-85,共9页
针对果树智能化选择性修剪作业中缺乏执行末端位姿的预测方法,提出一种基于RGB-D图像的修剪点定位与执行末端位姿估计方法。首先,利用RealSense D435i深度相机获取苹果树的RGB图像和深度信息,并通过改进的YOLOv8-seg模型对RGB图像中的... 针对果树智能化选择性修剪作业中缺乏执行末端位姿的预测方法,提出一种基于RGB-D图像的修剪点定位与执行末端位姿估计方法。首先,利用RealSense D435i深度相机获取苹果树的RGB图像和深度信息,并通过改进的YOLOv8-seg模型对RGB图像中的树干与一级枝根部预设区域进行分割。其次,利用OpenCV图像处理方法,计算出树干直径、侧枝直径和侧枝生长间距,基于人工剪枝规则,判断并定位修剪点像素坐标。最后,结合修剪点坐标与深度信息,基于点面映射原理推导出修剪点对应的修剪位姿。结果表明,改进的YOLOv8-seg模型在自建数据集掩膜预测的精确率和召回率分别达到了95.31%和93.79%,修剪决策判断的正确率为88.3%,执行末端位姿估计的成功率为89.9%,可以为苹果树修剪机器人的研发提供技术支持。 展开更多
关键词 图像处理 实例分割 rgb-d YOLOv8-seg 苹果树 修剪 位姿估计
在线阅读 下载PDF
空间信息增强的室内多任务RGB-D场景理解
4
作者 孙国栋 熊晨韵 +1 位作者 刘俊杰 张杨 《北京航空航天大学学报》 北大核心 2025年第7期2209-2217,共9页
移动机器人在探索三维空间时需要获取大量场景信息,这些信息包含语义、实例对象、位置关系等多个方面。理解场景信息的准确性和计算复杂性是移动端关注的2个焦点。基于此,提出了一种适用于室内场景理解的空间信息增强的多任务学习方法... 移动机器人在探索三维空间时需要获取大量场景信息,这些信息包含语义、实例对象、位置关系等多个方面。理解场景信息的准确性和计算复杂性是移动端关注的2个焦点。基于此,提出了一种适用于室内场景理解的空间信息增强的多任务学习方法。该方法由包含通道-空间注意力融合模块的编码器及多任务头的解码器组成,可同时实现语义分割、全景分割(实例分割)和方向估计多个任务。其中,通道-空间注意力融合模块旨在增强RGB和深度各自的模态特征,由简单卷积构成的空间注意力机制可降低收敛速度,与通道注意力机制信息融合后,进一步强化全局信息的位置特征。语义分支的上下文模块位于解码器后,为像素级语义信息提供有力支持,有助于减小模型大小。同时,设计了一种基于硬参数共享且能均衡训练任务的损失函数,探讨合适的轻量级骨干网络和任务数量对提升场景理解算法性能的影响。在新增标签注释的室内数据集NYUv2和SUN RGB-D上,评估了多任务学习方法的有效性,综合性全景分割精度分别提高了2.93%和4.87%。 展开更多
关键词 场景理解 多任务学习 rgb-d 空间信息 室内场景
原文传递
基于RGB-D图像的机械臂工业零件抓取研究 被引量:1
5
作者 刘生寿 杜敏 +1 位作者 张旭 谢小正 《机床与液压》 北大核心 2025年第17期66-75,共10页
针对机械臂在复杂堆叠场景中视觉抓取识别成功率低、速度慢等问题,基于RGB-D图像提出一种新型机械臂视觉抓取检测算法。通过融合RGB图像和深度图像,生成多模态特征图,从而增强图像的语义信息。采用ResNet-34作为编码器,并结合SE-Net模块... 针对机械臂在复杂堆叠场景中视觉抓取识别成功率低、速度慢等问题,基于RGB-D图像提出一种新型机械臂视觉抓取检测算法。通过融合RGB图像和深度图像,生成多模态特征图,从而增强图像的语义信息。采用ResNet-34作为编码器,并结合SE-Net模块,提升模型的表达能力,利用ESP-Net对不同尺度目标进行分割,获取多尺度语义信息。通过对特征图进行上采样解码,并与加权特征图进行跳连接,提取梯度信息,进一步提升网络性能。在Cornell和Jacquard数据集上验证了该算法的有效性,识别成功率分别达到98.31%和95.65%,推理速度为36.40帧/s。为验证算法的实用性,构建工业零件数据集,并在UR5-e机械臂上进行实时抓取实验。结果表明:在非堆叠场景中抓取成功率超过93%,在堆叠场景中抓取成功率超过81%,表明该算法能够显著提升非结构化环境中零件的抓取成功率。 展开更多
关键词 视觉抓取 机械臂 rgb-d图像 堆叠场景
在线阅读 下载PDF
基于RGB-D图像的语义分割方法综述 被引量:1
6
作者 王晨 杜晨曦 +1 位作者 刘瑞军 齐越 《计算机辅助设计与图形学学报》 北大核心 2025年第1期100-119,共20页
语义分割技术致力于精确识别并分割图像中的各个物体或场景.基于RGB图像的方法在信息利用上存在局限,导致性能受限,随着深度传感器技术的普及,深度图的引入为语义分割网络注入了丰富的几何信息,显著地提升了分割精度.文中介绍了近几年基... 语义分割技术致力于精确识别并分割图像中的各个物体或场景.基于RGB图像的方法在信息利用上存在局限,导致性能受限,随着深度传感器技术的普及,深度图的引入为语义分割网络注入了丰富的几何信息,显著地提升了分割精度.文中介绍了近几年基于RGB-D图像的语义分割方面的显著进展和相关方法,根据对多模态融合特征处理方式的差异,将基于RGB-D图像的语义分割方法归纳为单分支、双分支、三分支网络架构3大类.其中,单分支网络在同一分支同时处理RGB和深度特征,实现特征的有机结合;双分支网络利用RGB和深度特征之间的互补性,优化多模态特征的校正与融合;三分支网络在保留原始的RGB和深度特征的同时,深入挖掘融合特征,确保信息的全面性.同时,总结注意力、模型优化等关键技术,并归纳常用的数据集和评价指标,对比分析各种方法在不同数据集上的性能,最后总结当前RGB-D图像语义分割在多模态数据交互与处理方面所面临的挑战,展望了语义分割技术在跨领域数据融合方向的发展前景. 展开更多
关键词 rgb-d图像 语义分割 多模态特征融合 卷积神经网络
在线阅读 下载PDF
基于RGB-D传感器的神经隐式语义SLAM系统 被引量:1
7
作者 唐敏璐 孙皇龙 +1 位作者 钱程 洪春华 《传感器与微系统》 北大核心 2025年第10期56-60,共5页
针对现有同步定位与地图构建(SLAM)系统在语义理解与场景重建方面的不足,提出了一种基于RGB-D传感器的神经隐式语义SLAM系统。该方法使用神经隐式表示的场景表征方式,通过层次语义表示实现场景的多粒度语义理解,并采用交叉注意力机制融... 针对现有同步定位与地图构建(SLAM)系统在语义理解与场景重建方面的不足,提出了一种基于RGB-D传感器的神经隐式语义SLAM系统。该方法使用神经隐式表示的场景表征方式,通过层次语义表示实现场景的多粒度语义理解,并采用交叉注意力机制融合外观、几何与语义特征,提升系统在单属性缺失时的鲁棒性,设计内部融合解码器生成语义、RGB和截断符号距离场(TSDF)多模态输出。实验表明,在Replica和ScanNet数据集上,本系统相较于主流方法,在跟踪精度提升32%、重建精度提升5%和语义分割提升10%,三方面均达到最优,同时支持8 Hz的实时语义建图。 展开更多
关键词 神经隐式表示 同步定位与地图构建 rgb-d传感器 层次语义表示 交叉注意力机制
在线阅读 下载PDF
RGB-D多模态融合与深度特征增强的固废检测网络 被引量:1
8
作者 赵崟昊 刘炳辰 +1 位作者 杨建红 房怀英 《华侨大学学报(自然科学版)》 2025年第2期133-141,共9页
针对建筑固废在线识别中因相似特征导致的RGB识别准确率不高的问题,搭建双相机采集实验台,同步采集彩色图像和深度图像,提出一种基于彩色图像和深度图像的多模态融合与深度特征增强网络(DFENet).DFENet能够有效融合固废的彩色图像特征... 针对建筑固废在线识别中因相似特征导致的RGB识别准确率不高的问题,搭建双相机采集实验台,同步采集彩色图像和深度图像,提出一种基于彩色图像和深度图像的多模态融合与深度特征增强网络(DFENet).DFENet能够有效融合固废的彩色图像特征和深度图像特征。通过设计深度特征加强融合模块PFPD平衡并加强深度特征,显著提升了网络的识别精度。实验结果表明:与RGB+FPN(特征金字塔网络)方式相比,PFPD方式在IoU=0.50上的识别精度从92.4%提高至94.7%,在IoU=0.75上的识别精度从90.8%提升至92.8%;与实例分割网络(Mask R CNN)相比,DFEnet识别精度从86.4%提高至89.2%;提出的方法有效地提高了固体废弃物识别的目标检测和实例分割模型识别精度。 展开更多
关键词 固废分选 深度加强 rgb-d图像 特征融合 实例分割
在线阅读 下载PDF
面向RGB-D数据的特征线提取和表示算法
9
作者 刘鑫 李洋 +1 位作者 冯胜杰 吴晓群 《图学学报》 北大核心 2025年第3期542-550,共9页
为了提高特征线提取结果的精度和质量,针对现有算法在颜色和几何边界难以区分,直线段表示的特征线不连续、不平滑等问题,提出了一种面向RGB-D数据的特征线提取与表示算法。同时,充分利用RGB图像与深度图像之间紧密耦合且互为补充的特性... 为了提高特征线提取结果的精度和质量,针对现有算法在颜色和几何边界难以区分,直线段表示的特征线不连续、不平滑等问题,提出了一种面向RGB-D数据的特征线提取与表示算法。同时,充分利用RGB图像与深度图像之间紧密耦合且互为补充的特性,结合颜色和几何信息,提出一种融合颜色和几何的边界提取和表示算法。首先基于RGB-D数据中的颜色、深度、法向和曲率等几何信息,以及对应的平面几何特征,提取稠密的几何边界特征点集;接着,通过稀疏处理优化特征点集,并在此基础上加入角点信息,以增强特征线的表示能力;最后,采用3次B样条曲线紧致、连续、光滑地表示特征线,且在曲线拟合过程中通过重节点设置确保曲线能够经过关键角点,以此较好地表示恢复特征线的准确走势。以自采和公开的RGB-D数据集进行实验,并与其他几种特征线提取算法进行比较,结果表明,该算法在NYU v2数据集上的提取精度达到了0.82,召回率达到了0.59,交并比达到了0.54,可以从包含深度噪声的低质量RGB-D输入中有效提取连续、光滑的几何特征线,具有明显优势。 展开更多
关键词 rgb-d 特征线提取 特征线表示 稠密与稀疏处理 B样条曲线
在线阅读 下载PDF
基于Transformer全局-局部特征融合的RGB-D显著性检测 被引量:2
10
作者 宋梦柯 王芸 郑元超 《计算机应用与软件》 北大核心 2025年第3期176-182,共7页
现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融... 现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融合后特征送入Transformer编码器通过在所有位置同时整合多尺度和多模态的特征来进行充分的特征融合,获得全局特征依赖关系之后再送入主干网络提取全局—局部融合特征。同时提出双重注意力模块,用来增强两个分支特征的融合效果。在五个公开数据集上进行的实验表明,该网络在三个评价指标上均取得了较好的表现。 展开更多
关键词 rgb-d显著性检测 全局-局部特征 跨模态融合 多尺度 TRANSFORMER
在线阅读 下载PDF
基于深度学习和改进RGB-D去噪算法的机器人夹取研究 被引量:1
11
作者 苏帅 王芳 《电脑编程技巧与维护》 2025年第1期134-136,161,共4页
当前,新一代人工智能相关学科发展、理论建模、技术创新、软硬件升级等整体推进,正在引发链式突破,推动经济社会各领域从数字化、网络化向智能化加速发展。但是传统的抓取判断需要预先对被夹取物建立3D模型,需要耗费大量计算资源,采用... 当前,新一代人工智能相关学科发展、理论建模、技术创新、软硬件升级等整体推进,正在引发链式突破,推动经济社会各领域从数字化、网络化向智能化加速发展。但是传统的抓取判断需要预先对被夹取物建立3D模型,需要耗费大量计算资源,采用了基于深度学习的方法对夹持器和物体视觉信息进行判断,给出夹取是否成功的预测。深度学习目前在图像识别、目标检测、自然语言处理、语音识别和机器翻译等领域已经取得了巨大进步,刷新了这些研究领域的最佳水平,但是在机械臂夹取领域还很少应用。由于深度学习不需要手工设计特征,这给夹取判断带来了很大便利,所以采用深度学习的方法对夹取进行判断非常值得研究。 展开更多
关键词 深度学习 rgb-d去噪算法 机械臂 夹取
在线阅读 下载PDF
基于运动概率筛选和加权位姿估计的鲁棒动态RGB-D SLAM
12
作者 于兴云 程向红 +1 位作者 刘丰宇 钟志伟 《电子测量技术》 北大核心 2025年第15期1-10,共10页
为减小动态物体对视觉SLAM的干扰,提出一种基于运动概率筛选和加权位姿估计的鲁棒动态RGB-D SLAM。首先,利用实例分割网络Yolact获取场景的语义信息,结合语义信息和深度信息对动态掩膜边界修复,根据先验运动概率的大小计算语义动态概率... 为减小动态物体对视觉SLAM的干扰,提出一种基于运动概率筛选和加权位姿估计的鲁棒动态RGB-D SLAM。首先,利用实例分割网络Yolact获取场景的语义信息,结合语义信息和深度信息对动态掩膜边界修复,根据先验运动概率的大小计算语义动态概率。然后,采用基于语义引导的方法,计算特征点的几何动态概率,将语义动态概率和几何动态概率及其置信度,通过加权融合的方式构造特征点的运动概率模型,并设计具有自适应概率阈值的特征点筛选策略。最后,在系统的位姿跟踪、局部地图优化、全局优化过程中,设计基于特征点运动概率的加权代价函数,以区分不同特征点对位姿优化的贡献。此外,在移除动态物体之后,对静态场景建立全局点云地图。公开数据集的实验结果表明,相较于ORB-SLAM2,所提算法在TUM RGB-D和Bonn数据集上的绝对轨迹误差的均方根误差分别平均降低69.16%和91.94%;与其他先进的动态SLAM算法相比,所提算法的位姿估计精度和鲁棒性均有一定程度的提升。在真实场景实验中,相较于ORB-SLAM2、Dyna-SLAM,轨迹端点漂移误差分别平均降低52.20%、19.15%。 展开更多
关键词 rgb-d SLAM 动态物体 运动概率 加权位姿估计 全局点云地图
原文传递
基于RGB-D图像的苹果检测
13
作者 盛卉子 王春宇 +3 位作者 许正荣 余添康 RAHMAN Momhammad Samsur 焦俊 《合肥大学学报》 2025年第2期107-114,共8页
提出了一种基于RGB-D的双主干网络模型YOLO-RDD(YOLO-RGB Depth Detection),用来进行苹果的检测。在YOLO-RDD中,主要利用特征提取网络分别从苹果的彩色图像和深度图像中提取特征,并利用自注意力机制特征融合功能对所提取的特征加以融合... 提出了一种基于RGB-D的双主干网络模型YOLO-RDD(YOLO-RGB Depth Detection),用来进行苹果的检测。在YOLO-RDD中,主要利用特征提取网络分别从苹果的彩色图像和深度图像中提取特征,并利用自注意力机制特征融合功能对所提取的特征加以融合,将融合后的特征层送入特征金字塔网络,从而实现对苹果个体的检测。实验结果表明,在苹果检测方面,改进后的YOLO-RDD模型与原始模型相比识别效果显著提升,检测精度P、召回率R、平均精度均值(MAP)分别为98.32%、93.7%和95.63%,对比原始模型检测精度P、召回率R、平均精度均值(MAP)分别提高了6.059%,1.451%,4.591%。 展开更多
关键词 YOLOv7 rgb-d 双主干
在线阅读 下载PDF
基于RGB-D相机定位的自主导航无人机设计与实现 被引量:1
14
作者 陈志宏 李欢 刘彬 《机械工程与自动化》 2025年第2期12-14,共3页
提出了一种基于RGB-D相机定位的自主导航无人机的设计与实现方案。通过搭载国产RK3588主控结合RGB-D相机,设计了一种小型四旋翼无人机。实机实验测试了部署的视觉SLAM算法、导航规划算法以及整个系统的有效性和可靠性。实验结果表明:该... 提出了一种基于RGB-D相机定位的自主导航无人机的设计与实现方案。通过搭载国产RK3588主控结合RGB-D相机,设计了一种小型四旋翼无人机。实机实验测试了部署的视觉SLAM算法、导航规划算法以及整个系统的有效性和可靠性。实验结果表明:该方案可以良好地实现对四旋翼无人机的控制,具有一定的实用与推广价值。 展开更多
关键词 四旋翼无人机 rgb-d相机 自主导航 SLAM 路径规划
在线阅读 下载PDF
基于RGB-D数据的改进PVN3D的6D位姿估计算法
15
作者 张筱晨 刘建新 +1 位作者 黄天才 陈博 《西华大学学报(自然科学版)》 2025年第6期82-90,共9页
在计算机视觉与机器人技术领域,6D位姿估计是一项重要任务。针对现有的基于RGB-D图像的6D位姿估计方法难以全面利用特征信息的问题,提出一种改进的6D位姿估计算法。该算法结合了YOLOv8n-seg与ResNet-UNet框架的优势,并有效提取、利用RG... 在计算机视觉与机器人技术领域,6D位姿估计是一项重要任务。针对现有的基于RGB-D图像的6D位姿估计方法难以全面利用特征信息的问题,提出一种改进的6D位姿估计算法。该算法结合了YOLOv8n-seg与ResNet-UNet框架的优势,并有效提取、利用RGB图像和点云数据中的多模态信息。在PVN3D网络的基础上,通过YOLOv8n-seg模块实现RGB图像的语义分割,以捕获更加细致的场景特征;引入ResNet-UNet,通过特征级联与多尺度信息融合,增强模型的检测精度,并通过对损失函数进行定制化优化,进一步提升整体性能。在LineMOD数据集上的实验结果表明:该算法是有效的;与PVN3D相比,该算法在13种不同物体类型上的平均精度提升了2%。 展开更多
关键词 6D位姿估计 rgb-d 图像处理 YOLOv8
在线阅读 下载PDF
基于双流聚合Transformer的RGB-D语义分割
16
作者 葛梦娇 苏雯 +2 位作者 何烨 陈稼炜 高金凤 《电子科技》 2025年第12期79-85,共7页
针对RGB-D(Red Green Blue Depth)语义分割中色彩信息和深度信息无法有效融合以及无法充分提取多尺度上下文信息的问题,文中提出了一种基于双流聚合Transformer的RGB-D语义分割方法。通过Transformer提取全彩图像和深度图像的多层次特征... 针对RGB-D(Red Green Blue Depth)语义分割中色彩信息和深度信息无法有效融合以及无法充分提取多尺度上下文信息的问题,文中提出了一种基于双流聚合Transformer的RGB-D语义分割方法。通过Transformer提取全彩图像和深度图像的多层次特征,采用通道注意交叉融合模块与深度增强RGB操作实现各层次特征模态鸿沟的补偿,完成双模态信息融合。使用多层聚合解码器模块整合多层次多尺度上下文特征,减少了信息传递损失,实现了更准确和更全面的语义分割。实验结果表明,所提方法在NYU-Dv2数据集上的平均交并比(mean Intersection over Union,mIoU)、像素准确率和平均像素准确率分别达到52.9%、78.0%、66.0%。在Cityscapes数据集上的实验结果表明,在低分辨率输入图像下,所提方法的mIoU达到了79.8%。 展开更多
关键词 rgb-d 语义分割 TRANSFORMER 通道注意交叉融合 深度增强RGB操作 多层聚合解码器 全彩图像 深度图像
在线阅读 下载PDF
基于频率感知跨模态差异特征融合的RGB-D显著性目标检测方法
17
作者 王天傲 陆利坤 《北京印刷学院学报》 2025年第9期23-31,共9页
为了提高RGB-D显著性目标检测的精度,解决现有模型在融合RGB和深度信息时未充分考虑频域差异、融合方式单一的问题,提出了一种基于跨模态特征融合的RGB-D显著性目标检测网络模型。该模型构建了频率感知跨模态注意力模块,从频率域与空间... 为了提高RGB-D显著性目标检测的精度,解决现有模型在融合RGB和深度信息时未充分考虑频域差异、融合方式单一的问题,提出了一种基于跨模态特征融合的RGB-D显著性目标检测网络模型。该模型构建了频率感知跨模态注意力模块,从频率域与空间信息结合的角度,有效提取并加强不同模态的互补信息;同时构建了加权通道融合模块,使网络能够自适应调整RGB和深度特征的融合比例,并通过高效局部注意力机制模块优化多模态特征融合策略和特征表示能力。实验结果表明,该模型在LFSD、NLPR和STERE等多个公开数据集上与14种主流模型进行比较,表现出色,显著优于现有多种主流方法。定性分析进一步验证了模型在复杂背景、多目标场景以及细节保留方面的优越性能。 展开更多
关键词 rgb-d显著性目标检测 多模态特征融合 频率感知跨模态注意力 深度学习
在线阅读 下载PDF
基于改进YOLOv8s与RGB-D信息融合的番茄采摘机器人识别与定位方法
18
作者 樊湘鹏 张岩琪 +3 位作者 周硕 任美飞 王雨薇 柴秀娟 《农业工程学报》 北大核心 2025年第15期106-116,共11页
采摘机器人视觉感知系统是完成选择性收获的基本条件。针对在非结构设施环境中番茄特定种植模式约束下,现有采摘机器人果实识别与定位精度低导致的采收成功率不高等问题,该研究面向番茄采摘机器人性能提升,在自建数据集基础上,提出一种... 采摘机器人视觉感知系统是完成选择性收获的基本条件。针对在非结构设施环境中番茄特定种植模式约束下,现有采摘机器人果实识别与定位精度低导致的采收成功率不高等问题,该研究面向番茄采摘机器人性能提升,在自建数据集基础上,提出一种基于改进YOLOv8s和RGB-D多源信息融合感知的番茄采摘机器人识别与定位方法。首先,利用空间重构卷积单元和通道重构卷积单元进行串联组合构建空间和通道重建卷积结构实现轻量化目标;然后,在YOLOv8s颈部结构中引入SimAM三维注意力机制,使模型更加关注复杂环境下番茄的关键特征;最后使用MPDIoU损失改进损失函数,解决因果实重叠导致的检测帧失真问题,减少番茄的漏检现象。结果表明,相比于原始YOLOv8s模型,改进模型的平均精度均值(mAP_(50))由91.49%增加到95.81%,模型大小由22.5 M减小到17.6 M,推理时间也从10.6 ms减少到8.7 ms,与YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv9和YOLOv10系列模型相比,改进的YOLOv8s模型在识别精度、检测速度和计算效率上具有明显优势。在改进YOLOv8s模型基础上,将RGB图像与Depth图像信息配准并融合获取番茄中心点在空间中的位置坐标,利用RealSense D435 RGB-D相机和NVIDIA Jetson AGX Orin边缘设备构建视觉感知决策系统,自主开发了番茄采摘执行系统,并开展了定位精度和采摘抓取试验。单帧图像平均耗时50 ms,采摘抓取成功率为94.73%,损伤率仅为4.17%。该研究有效解决了果实采收机器人视觉感知环节面临的技术挑战,并且适合在性能受限设备上部署应用,可为番茄等果实采收机器人识别与定位提供关键技术支撑。 展开更多
关键词 采摘机器人 识别定位 YOLOv8s rgb-d 融合感知 番茄抓取
在线阅读 下载PDF
HDF+:一种新的RGB-D显著性目标检测网络模型
19
作者 吴映霓 闫河 +1 位作者 姜彬 蔡朝安 《小型微型计算机系统》 北大核心 2025年第7期1645-1651,共7页
用于显著性目标检测的HDFNet模型在其编码阶段和解码阶段均缺乏有效的特征信息表示能力,分别由于其编码阶段仅把RGB特征和Depth特征进行简单相加,且解码阶段在多次上采样中缺乏有效监督,从而导致检测精度有待进一步提升.本文提出了一种... 用于显著性目标检测的HDFNet模型在其编码阶段和解码阶段均缺乏有效的特征信息表示能力,分别由于其编码阶段仅把RGB特征和Depth特征进行简单相加,且解码阶段在多次上采样中缺乏有效监督,从而导致检测精度有待进一步提升.本文提出了一种新的RGB-D显著性目标检测模型HDF+.首先,在编码阶段构建了非对称融合模块,该模块通过非对称的方式融合RGB特征和Depth特征,有效利用RGB特征的语义信息及Depth特征的空间细节信息;其次,在解码阶段采用多个深度监督模块对网络进行监督训练,并在各监督层引入IoU损失作为前景损失替换原来的区域增强损失.对比实验结果表明,本文的方法优于主流的RGB-D显著性目标检测方法. 展开更多
关键词 rgb-d 显著性目标检测 非对称融合 深度监督
在线阅读 下载PDF
改进RHGSO-FC算法的RGB-D图像GMM聚类分割
20
作者 郭培岩 范九伦 刘恒 《计算机工程与应用》 北大核心 2025年第2期234-246,共13页
随着低成本深度图像传感器的引入,在RGB-D图像中进行可靠的图像分割是计算机视觉的一个目标,而如何对杂乱的场景进行图像分割具有挑战性。基于随机亨利气体溶解度优化算法的模糊聚类(RHGSO-FC),提出一种新的RGB-D图像分割方法。对亨利... 随着低成本深度图像传感器的引入,在RGB-D图像中进行可靠的图像分割是计算机视觉的一个目标,而如何对杂乱的场景进行图像分割具有挑战性。基于随机亨利气体溶解度优化算法的模糊聚类(RHGSO-FC),提出一种新的RGB-D图像分割方法。对亨利气体溶解度优化算法(HGSO)进行改进,提出改进的亨利气体溶解度优化算法(LRHGSO),并利用基于改进亨利气体溶解度优化算法的核模糊聚类(LRHGSO-KFC)生成初始化标签。将初始化标签传入到高斯混合(GMM)聚类中,得到多个聚类结果。最后对这些聚类结果通过聚集超像素方法进行分割合并,得到最终分割结果。实验数据集采用NYU depth V2室内图像,与现有的一些分割方法:阈值分割算法、硬C-均值、模糊C-均值、高斯混合聚类、核模糊聚类、模糊子空间聚类、混沌Kbest引力搜索算法和随机亨利气体溶解度优化算法进行比较,结果表明提出的RGB-D分割算法优于其他比较的算法。 展开更多
关键词 rgb-d图像分割 核模糊聚类 亨利气体溶解度优化算法 高斯混合模型 聚集超像素
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部