期刊文献+
共找到591篇文章
< 1 2 30 >
每页显示 20 50 100
基于多尺度信息的生成式人体姿态估计
1
作者 陈俊芬 冯武山 +1 位作者 郝旭阳 谢博鋆 《计算机工程与应用》 北大核心 2026年第3期265-276,共12页
针对人体姿态估计中遮挡带来的缺乏图像低级特征指导和预测姿势与人体生理结构的不一致性问题,提出了一种新颖的生成式人体姿态估计方法(generative human pose estimation,GenPose)。该模型使用多尺度信息融合和条件生成模块解决了严... 针对人体姿态估计中遮挡带来的缺乏图像低级特征指导和预测姿势与人体生理结构的不一致性问题,提出了一种新颖的生成式人体姿态估计方法(generative human pose estimation,GenPose)。该模型使用多尺度信息融合和条件生成模块解决了严重遮挡问题。多尺度模块从尺度和通道上细粒度融合图像特征,能捕捉到更多肢体细节,从而推理出遮挡关键点的特征信息。条件生成模块通过建模遮挡场景与姿态间的对应关系,根据标记编码器特征动态调整生成姿态,在保证可见点准确率的同时,在一定程度上减少了遮挡对非遮挡的干扰,提升了对遮挡姿态的生成效果。在公开的COCO和MPII数据集上,同以往方法相比,有了更好的结果,同时在CrowdPose、OCHuman以及SyncOCC数据集上验证了泛化能力。该模型在一定程度上能够解决严重遮挡下的姿态估计问题,提高了预测姿态的合理性,取得了更加优异的效果。 展开更多
关键词 人体姿态估计 不可见关键点 严重遮挡 注意力机制 变分编码器
在线阅读 下载PDF
基于FREAK描述子的精确图像配准改进算法 被引量:6
2
作者 房贻广 刘武 +2 位作者 高梦珠 谭守标 张骥 《计算机应用》 CSCD 北大核心 2016年第12期3402-3405,3410,共5页
快速视网膜特征(FREAK)描述子通过计算模式方向实现了旋转不变性,但对于旋转尺度变化较大的情况匹配性能并不理想,误匹配率较高,为此提出了一种改进的基于FREAK描述子的精确图像配准算法。首先,对原有FREAK算法添加长距离点对,设定距离... 快速视网膜特征(FREAK)描述子通过计算模式方向实现了旋转不变性,但对于旋转尺度变化较大的情况匹配性能并不理想,误匹配率较高,为此提出了一种改进的基于FREAK描述子的精确图像配准算法。首先,对原有FREAK算法添加长距离点对,设定距离阈值,只利用关键点采样模式中距离较远的点来生成角度信息。其次,对Hamming距离进行加权。对每一个关键点,在为了生成描述子选择点对时,对训练数据描述子的每一列计算均值,越接近0.5的列权值越大,改进了原来Hamming距离计算粗略的状态,使距离计算更精确。最后,使用最近邻匹配结合最近邻和次近邻的比值以及随机抽样一致(RANSAC)方法进行快速匹配和优化。实验结果表明,改进算法更适用于旋转尺度变化较大的环境及匹配性能要求较高的场合。 展开更多
关键词 快速视网膜特征 特征提取 HAMMING距离 图像配准
在线阅读 下载PDF
基于改进FREAK的增强现实实时注册算法 被引量:5
3
作者 李晶皎 赵越 +2 位作者 王爱侠 李贞妮 杨丹 《小型微型计算机系统》 CSCD 北大核心 2016年第1期173-177,共5页
为提高增强现实实时注册的鲁棒性,针对FREAK特征描述符的特点,提出一种IFREAK特征描述符.该描述符是基于FREAK描述符的取样模型基础上考虑了空间结构的描述符.IFREAK描述符中,每一感受野对存储多个位,位数取决于参数.相比于FREAK描述符... 为提高增强现实实时注册的鲁棒性,针对FREAK特征描述符的特点,提出一种IFREAK特征描述符.该描述符是基于FREAK描述符的取样模型基础上考虑了空间结构的描述符.IFREAK描述符中,每一感受野对存储多个位,位数取决于参数.相比于FREAK描述符的存储方式,IFREAK描述符提高了特征点匹配的精度.在IFREAK描述符基础上本文提出一种改进的增强现实实时注册算法.实验表明,本文提出的IFREAK特征描述符的匹配度在大多数场景下优于FREAK描述符及其他描述符.本文提出的基于IFREAK的增强现实实时注册算法具有更强的鲁棒性. 展开更多
关键词 freak 感受野 描述符 增强现实
在线阅读 下载PDF
基于改进的FREAK算法的图像特征点匹配 被引量:8
4
作者 谢红 王石川 解武 《应用科技》 CAS 2016年第4期35-40,45,共7页
针对采集图像时存在尺度、光线强度以及图像间旋转的差异等现象而导致图像匹配不理想的问题,提出了改进的FREAK算法(SURF-FREAK):将SURF算法和FREAK算法结合进行图像匹配。首先,利用Hessian矩阵确定候选点,进行非极大值抑制,提取的特征... 针对采集图像时存在尺度、光线强度以及图像间旋转的差异等现象而导致图像匹配不理想的问题,提出了改进的FREAK算法(SURF-FREAK):将SURF算法和FREAK算法结合进行图像匹配。首先,利用Hessian矩阵确定候选点,进行非极大值抑制,提取的特征点具有尺度不变信息;然后用FREAK描述子对特征点进行描述,为特征点分配方向;最后利用最近邻算法进行图像配准。改进算法经实验与传统SIFT、SURF、以及FREAK算法比较分析后得知,在图像特征点匹配准确度上有一定的提高,并且对图像的尺度差异、光照差异以及旋转差异具有良好的鲁棒性。 展开更多
关键词 特征点匹配 SIFT SURF freak 改进freak
在线阅读 下载PDF
非线性freak波分析及模拟理论探讨 被引量:3
5
作者 陈学闯 董艳秋 杨冠声 《海洋工程》 CSCD 北大核心 2003年第1期105-108,共4页
概述了国内外学者对freak波的认识,并从各种观测资料分析总结了freak波的特征。引入完全非线性控制方程Schr dinger方程的1+1模式,对freak波进行模拟,为在实验室造波或计算研究提供一种方法。
关键词 freak SCHROEDINGER方程 畸形波 波高 孤立波 模拟
在线阅读 下载PDF
基于视觉的无标记运动学分析方法
6
作者 黄高华 李玉榕 +1 位作者 姜海燕 陈建国 《仪器仪表学报》 北大核心 2026年第1期312-324,共13页
针对基于标记的光学系统成本高、耗时长、专业性强的问题,提出了一种采用两个视角的视觉无标记运动学分析方法,旨在实现便捷、低成本的运动学评估。首先,集成Swin Transformer的全局上下文建模能力、坐标注意力的精准位置感知能力、双... 针对基于标记的光学系统成本高、耗时长、专业性强的问题,提出了一种采用两个视角的视觉无标记运动学分析方法,旨在实现便捷、低成本的运动学评估。首先,集成Swin Transformer的全局上下文建模能力、坐标注意力的精准位置感知能力、双向特征金字塔网络的多尺度特征融合能力,构建二维特征提取架构,克服自遮挡、关键点小目标检测问题,有效提取二维特征。其次,提出以关键点位置合理性和肢体长度一致性为关节上下文约束的三角测量方法,并结合人体参数化模型对三维关键点进行重构,提高关键点估计精度。最后,构建关键点增强模型,获取解剖标记集并结合肌骨模型进行运动学分析。公开数据集上的运动学评估实验表明,所提方法的平均关节角度误差为8.59°,平均关节位置误差为42.02 mm,优于现有的高性能方法。同时,为验证方法在真实场景下的适用性,以商用动作捕捉系统Xsens作为评估标准,并与当前主流方法OpenCap进行比较,分别对肩关节和步态运动学展开分析。实验结果表明,在肩关节和步态运动学上,所提方法与Xsens的相关系数分别为0.92和0.86,较OpenCap的相关系数分别提高9.52%和7.40%;角度误差分别为13.97°和3.12°,较OpenCap的误差分别下降27.01%和25.18%。综上所述,在公开数据集和真实场景下,所提方法可实现比当前主流方法更准确的运动学分析,对促进运动学分析相关应用的推广具有重要意义。 展开更多
关键词 视觉 无标记 三维关键点估计 关键点增强 肌骨模型 运动学分析
原文传递
关于一种危害船舶安全的波浪—Freak波的探讨 被引量:7
7
作者 董艳秋 陈学闯 杨冠声 《船舶力学》 EI 2003年第2期33-38,共6页
波浪是研究船舶稳性、可靠性、安全性和设计船舶的重要环境条件之一。对于它的认识和了解还远没有完成 ,尤其是对一些特殊的波浪。Freak波就是其中之一。Freak波是一种仅发生在某些海域 ,但危害性巨大的波浪 ,近年来逐步为人们所重视 ,... 波浪是研究船舶稳性、可靠性、安全性和设计船舶的重要环境条件之一。对于它的认识和了解还远没有完成 ,尤其是对一些特殊的波浪。Freak波就是其中之一。Freak波是一种仅发生在某些海域 ,但危害性巨大的波浪 ,近年来逐步为人们所重视 ,但国内对它的研究还比较少。本文在分析国外一些研究成果的基础上 ,对比总结出Freak波的特征 ,并根据以往的观测资料总结了Freak波对船舶的危害。本文重点是引入完全非线性控制方程Schr dinger方程 ,对Freak波进行模拟 ,为定量地研究它对船舶的危害打下理论基础。 展开更多
关键词 船舶安全 波浪 船舶稳性 可靠性 freak 危害性 SCHRODINGER方程
在线阅读 下载PDF
基于改进的FAST和FREAK的图像匹配算法 被引量:4
8
作者 赵小强 徐铸业 《兰州理工大学学报》 CAS 北大核心 2018年第3期83-87,共5页
针对传统图像匹配算法匹配时间较长、误匹配率较高的问题,提出一种改进的FAST和FREAK的图像匹配算法.该算法首先在圆形邻域上不断改变像素点个数,并与其他FAST像素模板进行对比,从而建立FAST-9特征点提取方法;然后计算其FREAK局部不变... 针对传统图像匹配算法匹配时间较长、误匹配率较高的问题,提出一种改进的FAST和FREAK的图像匹配算法.该算法首先在圆形邻域上不断改变像素点个数,并与其他FAST像素模板进行对比,从而建立FAST-9特征点提取方法;然后计算其FREAK局部不变特征描述符,生成特征向量;最后通过RANSAC一致性筛选剔除误匹配点.实验结果表明,本文算法与SIFT、BRIEF算法比较,图像匹配时间缩短且图像匹配精度有一定的提高,并且对图像的旋转差异、尺度差异和光照差异都具有较好的鲁棒性. 展开更多
关键词 图像匹配 FAST freak RANSAC
在线阅读 下载PDF
一种SIFT-FREAK图像匹配算法 被引量:5
9
作者 陈建新 唐丽玉 《测绘与空间地理信息》 2023年第6期32-35,共4页
图像匹配算法是计算机视觉应用研究的基础。为了解决传统尺度不变特征变换算法(Scale-invariant Feature Transform, SIFT)运行效率低、存在误匹配点对和精匹配点对稀少等问题,本文将其与快速视网膜关键点(Fast Retina Keypoint, FREAK... 图像匹配算法是计算机视觉应用研究的基础。为了解决传统尺度不变特征变换算法(Scale-invariant Feature Transform, SIFT)运行效率低、存在误匹配点对和精匹配点对稀少等问题,本文将其与快速视网膜关键点(Fast Retina Keypoint, FREAK)算法和PROSAC算法相结合,提出了一种SIFT-FREAK图像匹配算法。首先在特征点检测阶段,用SIFT算法提取具有尺度不变性的特征点,然后利用FREAK算法构建二进制描述子,特征匹配时,先采用汉明距离(Hamming Distance)进行初始匹配点对,再用双向匹配完成粗匹配,最后用PROSAC算法进行精匹配。实验结果表明,本文SIFT-FREAK算法比SIFT算法和FREAK算法(以加速分割检测特征(Feature from Accelerated Segment Test, FAST)算法提取特征点)在准确率、运行效率和精匹配点数三大方面都有着一定的优势。 展开更多
关键词 SURF算法 freak算法 PROSAC算法 图像匹配
在线阅读 下载PDF
基于改进的FREAK算法的机器人抓取系统 被引量:2
10
作者 党宏社 吴晨刚 孙俊龙 《科学技术与工程》 北大核心 2019年第28期184-188,共5页
为了解决工业机器人对带有复杂纹理的平面型工件的识别与定位问题,将机器视觉技术与工业机器人相结合。利用改进的FREAK算法对目标工件进行快速识别,并根据工件的形状和单应矩阵计算出工件的形心坐标和旋转角度,再结合双目视觉系统,获... 为了解决工业机器人对带有复杂纹理的平面型工件的识别与定位问题,将机器视觉技术与工业机器人相结合。利用改进的FREAK算法对目标工件进行快速识别,并根据工件的形状和单应矩阵计算出工件的形心坐标和旋转角度,再结合双目视觉系统,获取机器人抓取点的三维位姿信息,引导SCARA机器人抓取目标工件。实验结果表明:在复杂的工业环境下,机器人抓取系统能够准确识别出目标工件,具有良好的鲁棒性,同时也满足工业生产的实时性要求。 展开更多
关键词 机器视觉 freak算法 抓取系统 工件识别
在线阅读 下载PDF
基于YOLO-FMC-pose的中华绒螯蟹头胸甲关键点检测方法
11
作者 张哲 于合龙 +3 位作者 杨信廷 罗娜 李珊珊 孙传恒 《农业工程学报》 北大核心 2026年第1期210-221,共12页
中华绒螯蟹(Eriocheir sinensis)的头胸甲形态在同一物种的不同个体之间表现出明显差异,这一特征可作为产地溯源和个体识别的重要依据。其中,头胸甲关键点的精准检测是实现个体识别与表型分析等任务的基础环节。然而,传统的人工检测方... 中华绒螯蟹(Eriocheir sinensis)的头胸甲形态在同一物种的不同个体之间表现出明显差异,这一特征可作为产地溯源和个体识别的重要依据。其中,头胸甲关键点的精准检测是实现个体识别与表型分析等任务的基础环节。然而,传统的人工检测方法依赖经验性判断,存在效率低、重复性差等问题,难以满足规模化水产处理的实际需求。为此,该研究提出了一种基于YOLO-FMC-pose的中华绒螯蟹头胸甲关键点自动检测方法,以实现高精度、自动化的特征提取。首先,构建了一个包含大量中华绒螯蟹头胸甲图像的自建数据集,并选取具有代表性的35个地标关键点进行精确标注,同时通过数据增强提升模型的训练效果。其次,该研究基于改进的YOLO11n-pose框架设计了中华绒螯蟹头胸甲关键点检测模型YOLO-FMC-pose。模型中引入了融合频率动态卷积(FDConv)的C3K2FD模块、混合聚合网络(MANet)模块以及CBAM注意力机制,从频域响应、特征融合与空间关注等层面对结构进行了优化。结果表明,所提出的YOLO-FMC-pose模型在关键点检测精度方面均优于现有主流方法,准确率、召回率、mAP_(0.5)和m AP_(0.5:0.95)分别为97.98%、97.00%、98.27%和73.28%,相较于原始YOLO11n-pose,准确率、召回率、mAP_(0.5)和mAP_(0.5:0.95)分别提高了3.33、2.33、2.94和13.08个百分点,标准化平均误差(normalized mean error,NME)降低至3.835%,单帧图片推理时间为7.5 ms,具备良好的实际应用潜力。该研究为中华绒螯蟹的个体智能识别、产地溯源与防伪管控提供了关键技术支撑,也为水产品精细化特征检测提供了路径。 展开更多
关键词 中华绒螯蟹 关键点检测 表型特征识别 深度学习 图像处理
在线阅读 下载PDF
基于FREAK和P3CA的鲁棒目标跟踪 被引量:6
12
作者 王宇霞 赵清杰 赵留军 《计算机学报》 EI CSCD 北大核心 2015年第6期1188-1201,共14页
在粒子滤波框架下,提出了基于快速视网膜特征点(Fast Retina Keypoint,FREAK)和主成分-典型相关分析(Principal Component-Canonical Correlation Analysis,P3CA)的目标跟踪算法.该文提出的基于FREAK的多模态运动模型提高了目标位置预... 在粒子滤波框架下,提出了基于快速视网膜特征点(Fast Retina Keypoint,FREAK)和主成分-典型相关分析(Principal Component-Canonical Correlation Analysis,P3CA)的目标跟踪算法.该文提出的基于FREAK的多模态运动模型提高了目标位置预测准确性,缩小了目标搜索空间.基于P3CA的外观模型利用图像子区域间的典型相关性衡量候选目标的优劣,解决了基于全局信息外观模型对遮挡敏感的问题;利用主成分分析在数据降维方面的优势,解决了典型相关分析用于跟踪存在的小样本问题,降低了计算开销.同时,P3CA在线更新算法使跟踪器可以更好地应对跟踪过程中目标外观变化.通过在多个具有挑战性的视频上与多种优秀算法对比实验表明,该文的方法可以很好地应对光照变化、遮挡、旋转以及复杂背景等问题. 展开更多
关键词 目标跟踪 快速视网膜特征 主成分-典型相关分析 主成分分析 典型相关分析
在线阅读 下载PDF
NSST域融合FREAK及全方向相似度的泡沫崩塌率检测 被引量:3
13
作者 廖一鹏 张进 +1 位作者 陈诗媛 王卫星 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第5期92-101,共10页
针对浮选表面泡沫流动变化和运动形变导致崩塌率难以检测的问题,提出了一种在非下采样Shearlet变换(NSST)域融合改进快速视网膜关键点(FREAK)匹配及形状全方向相似度的泡沫崩塌率检测方法。对相邻两帧泡沫图像进行NSST分解,分割低频子... 针对浮选表面泡沫流动变化和运动形变导致崩塌率难以检测的问题,提出了一种在非下采样Shearlet变换(NSST)域融合改进快速视网膜关键点(FREAK)匹配及形状全方向相似度的泡沫崩塌率检测方法。对相邻两帧泡沫图像进行NSST分解,分割低频子带图像的气泡亮点,在多尺度高频子带结合方向模极大值检测和非极大值抑制进行特征点检测,改进FREAK采样模型并用于特征点描述及匹配,通过统计前一帧分割亮点周围匹配点数提取潜在崩塌气泡,然后对各潜在崩塌气泡通过前后帧分割亮点的形状复杂度特征及全方向相似度计算进一步确定崩塌气泡,最后根据崩塌气泡的提取结果计算崩塌率。实验结果表明,该方法受泡沫不均匀流动、运动形变的影响小,能有效提取出崩塌气泡,检测精度较现有方法有较大提高,不同工况下均表现出良好的鲁棒性,满足浮选生产在线检测的需求。 展开更多
关键词 浮选泡沫图像 崩塌率检测 非下采样Shearlet变换 快速视网膜关键点 形状全方向相似度
在线阅读 下载PDF
基于深度学习的服装关键点实时检测模型
14
作者 冯采伶 于施佳 韩曙光 《纺织学报》 北大核心 2026年第1期196-206,共11页
针对复杂场景下服装关键点检测模型的准确性与实时性难以兼得的问题,以提高检测准确性并保持实时性能为目的,提出了一种基于深度学习的服装关键点实时检测模型。该模型以实时多人姿态估计架构为基础,首先构建中值增强的通道与空间注意... 针对复杂场景下服装关键点检测模型的准确性与实时性难以兼得的问题,以提高检测准确性并保持实时性能为目的,提出了一种基于深度学习的服装关键点实时检测模型。该模型以实时多人姿态估计架构为基础,首先构建中值增强的通道与空间注意力模块,通过并行执行全局平均池化、最大池化与中值池化,融合生成注意力权重,增强服装关键部位的特征表示;其次设计跨尺度特征融合模块,将骨干网络中不同层级的特征图进行上采样、拼接与交叉卷积融合,构建兼具细节信息与语义特征的金字塔结构;进一步建立自注意力特征增强模块,通过计算特征点间相似性动态生成注意力图,自适应调整各区域特征权重;最终实施分类别微调策略,针对6类典型服装分别建立专用模型以优化整体性能。结果表明:该方法在DeepFashion2和DeepFashion数据集上分别达到了65.1%与68.0%的检测准确度,同时保持140.0帧/s和142.3帧/s的实时处理速度。该模型提升了复杂场景下服装关键点检测的综合性能,未来可应用于服装智能制造和虚拟试衣等领域。 展开更多
关键词 服装关键点 实时检测 深度学习 自注意力机制 跨尺度特征融合
在线阅读 下载PDF
基于扩散模型多模态提示的电力人员行为图像生成
15
作者 朱志航 闫云凤 齐冬莲 《浙江大学学报(工学版)》 北大核心 2026年第1期43-51,70,共10页
电力人员行为的特殊性与复杂性导致其图像数据稀缺,给数据驱动下的行为识别带来了挑战.在稳定扩散模型的基础上,充分融合人体骨架、掩膜以及文本描述信息,加入关键点损失函数,建立多模态条件控制的电力人员行为图像生成模型PoseNet,该... 电力人员行为的特殊性与复杂性导致其图像数据稀缺,给数据驱动下的行为识别带来了挑战.在稳定扩散模型的基础上,充分融合人体骨架、掩膜以及文本描述信息,加入关键点损失函数,建立多模态条件控制的电力人员行为图像生成模型PoseNet,该模型可以生成高质量的可控人体图像.设计基于关键点相似度的图像滤波器,以去除错误、低质量的生成图像;采用双阶段训练策略,在通用数据上对模型进行预训练,并在私有数据上微调,提升模型性能;针对电力人员行为特点,设计集通用、专用评价指标于一体的生成图像评价指标集,分析不同评价指标下的图像生成效果.实验结果表明,与主流人体生成模型ControlNet、HumanSD相比,该模型的生成结果更精准、真实、效果更优. 展开更多
关键词 条件图像生成模型 数据扩充 人体关键点 图像分割 扩散模型 深度学习
在线阅读 下载PDF
基于局部消失点的车道线检测方法研究
16
作者 秦文清 赵尔敦 王永强 《计算机工程与应用》 北大核心 2026年第1期356-368,共13页
现存的车道线检测方法常为提升检测精度而使用计算复杂、内存占用多的算法,往往忽视检测速度以及部署难度。为此,利用车道线互相平行的先验信息设计了一种新的车道线表示方法,该方法使车道线共享同一组局部消失点,不仅大幅降低了参数量... 现存的车道线检测方法常为提升检测精度而使用计算复杂、内存占用多的算法,往往忽视检测速度以及部署难度。为此,利用车道线互相平行的先验信息设计了一种新的车道线表示方法,该方法使车道线共享同一组局部消失点,不仅大幅降低了参数量,在部分遮挡情况下也能准确恢复车道线形状。在此基础上提出一种3D车道线检测模型——LVPDepth,并为训练适配了消失点标签转换算法、改进了KL散度损失函数。该模型的特点如下:设计了深度检测模块,从而通过相机内参矩阵和车道线深度就能获得车道线三维坐标;为训练过程定义一种匹配标签和预测结果的准则,可以预测任意条车道线;针对车道线细长的形状,引入动态蛇形卷积提升检测精度;利用车道线天然的深度信息,加入预设相对深度向量,使训练更快收敛、结果更准确稳定。模型在校正后的ONCE-3DLanes数据集上进行训练与验证,在检测速度达到132 FPS的同时精度损失甚微。 展开更多
关键词 消失点 透视学 关键点检测 车道线检测
在线阅读 下载PDF
基于改进YOLOv8n-pose的巨峰葡萄采摘定位方法
17
作者 陈馨 吴子炜 +1 位作者 周素茵 夏芳 《华南农业大学学报》 北大核心 2026年第1期118-127,共10页
【目的】对巨峰葡萄进行精准高效地采摘定位,以有效降低果实损伤。【方法】提出一种基于改进YOLOv8n-pose的葡萄采摘定位方法。首先,利用改进YOLOv8n-pose检测葡萄果梗和顶部易损果粒的关键点,基于关键点的坐标构建果实上界位姿的表征向... 【目的】对巨峰葡萄进行精准高效地采摘定位,以有效降低果实损伤。【方法】提出一种基于改进YOLOv8n-pose的葡萄采摘定位方法。首先,利用改进YOLOv8n-pose检测葡萄果梗和顶部易损果粒的关键点,基于关键点的坐标构建果实上界位姿的表征向量;然后,利用此向量计算出最优采摘角度;最后,通过将采摘点与采摘角协同,确定最佳采摘位置。【结果】试验结果表明,改进后YOLOv8n-pose的P、R、mAP@0.50、mAP@0.50~0.95较原模型分别提升了1.7、0.7、0.9、1.7个百分点,较YOLOv12s-pose分别提升了0.4、0.1、0.6、2.7个百分点,同时模型参数量比YOLOv8n-pose减少了5.8%。应用本文方法的葡萄采摘定位成功率为90.8%,相较于不使用采摘角的定位方法,提升了9.2个百分点。【结论】研究为巨峰葡萄采摘机器人提供了一种低损定位方法。 展开更多
关键词 巨峰葡萄 YOLOv8-pose 关键点检测 采摘定位 采摘角度
在线阅读 下载PDF
基于多视角融合的机器人抓取位姿估计模型
18
作者 杨红玲 代路 解仑 《科学技术与工程》 北大核心 2026年第9期3616-3625,共10页
为解决机械臂抓取时因物体对称性和遮挡等因素引发的位姿估计难题,通过融合多视角RGB-D数据的方法研究了目标物体的六自由度位姿估计问题。该方法基于单视角位姿估计框架,利用三维关键点投票网络对各视角场景中的三维关键点进行独立预测... 为解决机械臂抓取时因物体对称性和遮挡等因素引发的位姿估计难题,通过融合多视角RGB-D数据的方法研究了目标物体的六自由度位姿估计问题。该方法基于单视角位姿估计框架,利用三维关键点投票网络对各视角场景中的三维关键点进行独立预测,并通过置信度评分、加权融合以及均值偏移聚类实现多视角信息的有效整合,最终完成目标物体位姿的精确求解。结果表明:该方法在对称与遮挡场景下能够显著提升位姿估计精度;多视角融合策略有效增强了关键点的预测稳定性与鲁棒性;在桌面环境下的自主抓取实验中显著提高了抓取成功率与执行效果。实验证明,所提出的方法在复杂抓取场景中具有良好的适应性和应用价值,能有效提高在非结构化场景下的作业自主性,还为解决复杂工况下的智能装配作业提供了关键技术支撑,具有广阔的产业应用前景。 展开更多
关键词 场景融合 位姿估计 均值偏移 关键点 多视角 机器人抓取
在线阅读 下载PDF
基于改进RTMPose3D模型的番茄三维关键点估计方法
19
作者 王蓬勃 刘宇 +1 位作者 赵胜辉 傅毅凯 《农业机械学报》 北大核心 2026年第5期149-158,共10页
针对温室环境下串番茄枝叶遮挡严重、光照干扰强,导致自动采摘机器人难以稳定获取果实三维位姿的问题,提出了一种改进的串番茄三维关键点估计模型TomatoPose3D。该模型在训练阶段引入RGB图像与三维真值关键点的联合约束,增强结构一致性... 针对温室环境下串番茄枝叶遮挡严重、光照干扰强,导致自动采摘机器人难以稳定获取果实三维位姿的问题,提出了一种改进的串番茄三维关键点估计模型TomatoPose3D。该模型在训练阶段引入RGB图像与三维真值关键点的联合约束,增强结构一致性与泛化能力;在推理阶段,仅输入单幅RGB图像即可端到端回归三维关键点坐标,避免了因点云缺失或稀疏导致的定位失败。改进模型以RTMPose3D为基线,引入全局结构感知模块MobileVit Block与分布感知解码策略(DARK),在保持轻量化的同时提升了定位精度。温室场景对比实验表明,TomatoPose3D的PCK@0.05指标较RTMPose3D和SimpleBaseline3D分别提升5.18、9.98个百分点;在无深度信息辅助下,其定位精度与基于RGB-D投影的方法相当,且鲁棒性更优。此外,模型经TensorRT加速部署于工业级嵌入式平台,端到端推理速度达37 f/s,满足采摘机器人实时空间视觉感知需求。 展开更多
关键词 温室番茄 采摘机器人 三维关键点估计 轻量化网络 RTMPose3D
在线阅读 下载PDF
实例分割与空间解析融合的番茄实时三维位姿估计方法
20
作者 苟豪 赵国瑞 +3 位作者 董适 吕生华 林晨 文剑 《农业工程学报》 北大核心 2026年第2期185-194,共10页
针对复杂种植环境中现有果实位姿估计方法精度低、实时性差等问题,该研究提出一种融合轻量化实例分割与空间解析的番茄实时三维位姿估计方法。通过构建改进的YOLOv7-M1轻量化网络,实现果实掩膜高精度提取与关键点感兴趣区域快速定位;设... 针对复杂种植环境中现有果实位姿估计方法精度低、实时性差等问题,该研究提出一种融合轻量化实例分割与空间解析的番茄实时三维位姿估计方法。通过构建改进的YOLOv7-M1轻量化网络,实现果实掩膜高精度提取与关键点感兴趣区域快速定位;设计HRNet-ECA嵌入高通量注意力机制提升检测准确率;搭建多模态数据融合框架,结合深度图与感兴趣区域,经点云滤波处理和空间几何计算实时获取果实三维位姿参数。试验结果表明,改进后的YOLOv7-M1掩膜分割平均精度为95.56%,召回率93.52%,准确率96.17%;改进后的HRNet-ECA关键点相似度为96.61%,位姿估计准确率95.00%,三维姿态角平均误差9.40°,关键点平均定位误差4.13 mm,关键点在X、Y、Z方向上的平均误差分别为3.41、2.95和1.02 mm。单果处理平均耗时0.063 s。该方法构建了轻量化实例分割网络与改进关键点检测模型的级联结构,结合点云空间解析,在保证精度指标同时兼顾实时效率,实现了番茄果实的高精度实时位姿估计,可为复杂农业场景下果蔬精准自动化采收提供高效的解决方案。 展开更多
关键词 机器人 位姿估计 实例分割 关键点检测 点云滤波
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部