基于GraspNet的多阶段无序混装抓取方法

Multi-stage Grasping Method for Unordered Mixed Objects Grasping Based on GraspNet

下载PDF

导出

摘要用于工业分拣领域的机械装置通常是针对特定应用场景和特定产品而设计的,面对多种物品无序堆叠的场景,其普适性和智能性往往较差。当前基于3D结构光相机的点云匹配抓取技术虽在一定程度上提升了柔性生产能力,但受限于硬件成本高昂,以及特征描述能力有限、计算复杂度高、对遮挡敏感等固有缺陷,难以满足无序混装抓取需求。近年来以GraspNet为代表的深度学习抓取技术发展迅速,通过双目相机实现位姿估计,但仍存在目标选择策略欠优、位姿评分机制具有局限性、位姿定位偏差大等问题。针对上述挑战,提出一种改进型三阶段抓取算法。第一阶段,针对目标选择策略欠佳的问题,通过融合YOLOv10目标检测与SAM分割模型,结合优化的目标选择算法,即选择无遮挡、距离近的目标,有效解决了堆叠遮挡场景下的目标选择策略不佳难题。第二阶段,对GraspNet位姿估计框架进行改进,即通过引入基于点云表面法向量的位姿筛选机制,重构更加合理的评分机制,进而获取高精度抓取位姿。第三阶段,设计位姿微调策略,即采用"悬停对齐-垂直抓取"的分层控制架构,最大程度消除执行过程中的累积误差,有效解决位姿定位偏差大、实际抓取不准确问题。实验结果表明,该方法显著提升了复杂场景下的抓取效率、操作可靠性和跨场景泛化能力,同时由于使用双目相机取代了3D结构光相机,还显著降低了系统成本,为工业自动化提供了高性价比的解决方案。 Mechanical devices used in industrial sorting are typically designed for specific application scenarios and products,often exhibiting poor versatility and intelligence when faced with unordered mixed object grasping.Current point cloud matching grasping technologies based on 3D structured light cameras have improved flexible production capabilities to a certain extent.How-ever,they are constrained by high hardware costs,limited feature description capabilities,high computational complexity,and sensitivity to occlusions,making it difficult to meet the demands of unordered mixed object grasping.In recent years,deep learning-based grasping technologies,represented by GraspNet,have developed rapidly,achieving pose estimation through binocular ca-meras.Nevertheless,these methods still suffer from suboptimal target selection strategies,limitations in pose scoring mechanisms,and significant pose localization errors.To address these challenges,this study proposes an improved three-stage grasping algorithm.In the first stage,the YOLOv10 object detection model is fused with the SAM segmentation model,combined with an optimized target selection algorithm that prioritizes unobstructed and closer targets,effectively solving the problem of poor target selection strategies in stacked and occluded scenarios.In the second stage,the GraspNet pose estimation framework is enhanced by introducing a pose filtering mechanism based on point cloud surface normals and reconstructing the scoring mechanism to obtain high-precision grasping poses.In the third stage,a pose fine-tuning strategy is designed using a hierarchical control architecture of“hover alignment-vertical grasping”to effectively eliminate cumulative errors during execution,ultimately addressing the issue of inaccurate real-world grasping.Experimental results demonstrate that this method significantly improves grasping efficiency,operational reliability,and cross-scenario generalization capabilities in complex environments.Moreover,by replacing 3D structured light cameras with binocular cameras,the system cost is significantly reduced,providing a cost-effective solution for industrial automation.

作者于灵鑫陈艺博曲浩君厉广伟李金屏 YU Lingxin;CHEN Yibo;QU Haojun;LI Guangwei;LI Jinping(School of Information Science and Engineering,University of Jinan,Jinan 250022,China;Shandong Provincial Key Laboratory of Network Based Intelligent Computing(University of Jinan),Jinan 250022,China;Shandong College and University Key Laboratory of Information Processing and Cognitive Computing in 13th Five-year(University of Jinan),Jinan 250022,China)

机构地区济南大学信息科学与工程学院山东省网络环境智能计算技术重点实验室(济南大学) 山东省“十三五”高校信息处理与认知计算重点实验室(济南大学)

出处《计算机科学》北大核心 2026年第4期318-325,共8页 Computer Science

基金山东省科技型中小企业创新能力提升工程(2022TSGC1047) 中央引导地方科技发展项目(YDZX2024078) 济南大学2023年学科交叉会聚建设项目(XKJC-202310)。

关键词无序混装抓取位姿估计目标选择姿态优化双目相机 Unordered mixed objects grasping Pose estimation Target selection Pose optimization Binocular camera

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献3

1郭海奎.人工智能技术在机械自动化中的应用[J].电子技术(上海),2024,53(10):218-219. 被引量：6
2张慧娟,熊芝,劳达宝,周维虎.基于EPNP算法的单目视觉测量系统研究[J].红外与激光工程,2019,48(5):180-185. 被引量：32
3张庆鹏,曹宇.室内场景下弱纹理物体三维重建算法的研究[J].激光与光电子学进展,2021,58(8):189-195. 被引量：20

二级参考文献28

1王鹏,孙长库,张子淼.单目视觉位姿测量的线性求解[J].仪器仪表学报,2011,32(5):1126-1131. 被引量：45
2杨森,吴福朝.摄像机位姿的加权线性算法[J].软件学报,2011,22(10):2476-2487. 被引量：16
3李书杰,刘晓平.摄像机位姿的高精度快速求解[J].中国图象图形学报,2014,19(1):20-27. 被引量：14
4林义闽,吕乃光,娄小平,董明利.用于弱纹理场景三维重建的机器人视觉系统[J].光学精密工程,2015,23(2):540-549. 被引量：23
5邓非,吴幼丝,胡玉雷,崔红霞.球形全景影像位姿估计的改进EPnP算法[J].测绘学报,2016,45(6):677-684. 被引量：18
6王芳,汪伟.缺帧环境下弱纹理图像的三维重建方法[J].西安工程大学学报,2016,30(4):477-482. 被引量：19
7逄晖.基于Harris角点的弱纹理三维非连续图像检测[J].计算机仿真,2016,33(9):431-434. 被引量：1
8何斐彦,林嘉睿,高扬,任永杰,邾继贵.单目视觉与倾角仪组合优化的位姿测量系统[J].光学学报,2016,36(12):183-190. 被引量：28
9王天宇,董文博,王震宇.基于单目视觉和固定靶标的位姿测量系统[J].红外与激光工程,2017,46(4):146-153. 被引量：36
10武君,白刚,张彩霞.EPNP和POSIT算法在头部姿态估计上的实验比较与分析[J].北方工业大学学报,2017,29(2):19-27. 被引量：11

共引文献54

1张刘港,熊芝,冯维,周维虎,董登峰.基于视觉与激光准直的激光跟踪姿态角测量方法[J].仪器仪表学报,2020(8):30-36. 被引量：23
2汪佳宝,张世荣,周清雅.基于视觉EPnP加权迭代算法的三维位移实时测量[J].仪器仪表学报,2020,41(2):166-175. 被引量：25
3刘岩,雷柏平(指导),范斌,边疆.基于视觉测量的目标定位技术及结构参数优化[J].红外与激光工程,2020(S02):300-308. 被引量：7
4先柯桦.基于姿态参数宽幅旋耕机作业监测方法研究[J].农机化研究,2021,43(3):24-29. 被引量：4
5路合香.基于计算机视觉的三光带激光三维人体动画合成方法[J].激光杂志,2021,42(4):154-158. 被引量：1
6刘岩,雷柏平,杜俊峰,刘盾.基于特征点识别的位姿测量数据处理方法研究[J].半导体光电,2021,42(4):568-573. 被引量：2
7李孟锡,任笑圆,王粲雨,逄博,蒋李兵,王壮.基于HOURGLASS网络语义关键点提取的光学图像空间目标姿态估计方法[J].信号处理,2021,37(9):1653-1662. 被引量：3
8李美燕,黄世玲.基于MATLAB的运动恢复结构三维重建算法的研究与实现[J].信息与电脑,2021,33(18):30-33. 被引量：2
9任笑圆,蒋李兵,钟卫军,王壮.基于视觉的非合作空间目标三维姿态估计方法[J].电子与信息学报,2021,43(12):3476-3485. 被引量：7
10姚远,徐晶晶,朱小倩.基于2D和3D图像处理技术的在线学习评估[J].计算机技术与发展,2021,31(12):128-134. 被引量：1

1刘洋,王子涵.基于长短期记忆网络的目标选择技术在自动驾驶系统中的应用[J].上海汽车,2023(10):38-48.
2方佳莹,王辰星.基于折射流的透明物体单目深度估计[J].光学学报,2025,45(21):93-100.
3杨宝林.多旋翼无人机倾斜摄影的建筑立面测绘技术[J].中文科技期刊数据库(文摘版)自然科学,2026(1):079-082.
4卢传钊,林启勇,陈开,何立,周波.基于深度学习的运动物体抓取算法设计[J].工业控制计算机,2026,39(1):78-79.
5王晨宇.电力调度远程控制操作可靠性提升路径[J].电力研究,2026,9(1):9-12.
6宋立志,李晨阳,付旭,伊永烁.LPGNet:基于多尺度特征的轻量化像素级抓取检测网络[J].机械工程与技术,2026,15(1):73-81.
7黄艳.区域比较优势、区域经济合作、区域对口帮扶[J].中国投资(中英文),2026(3):90-91.
8朱堃,刘斌,李文然,李宗强,王刘剂,王利伟,庞小停,上官小亚.机器视觉技术在再生资源智能分拣系统中的应用研究[J].再生资源与循环经济,2026,19(3):10-14.
9辛公剑.基于激光定位的链式快速阴干室电瓷坯件抓取技术研究与应用[J].电瓷避雷器,2026(1):113-119.
10石昊哲,刘荣威,张利.数字孪生煤矿自动钻机远程交互系统应用[J].内蒙古煤炭经济,2026(2):145-147.

计算机科学

2026年第4期

浏览历史

内容加载中请稍等...

基于GraspNet的多阶段无序混装抓取方法

参考文献3

二级参考文献28

共引文献54

相关作者

相关机构

相关主题

浏览历史