期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于改进堆叠沙漏网络的人体姿态估计
1
作者 吕超 马歌谣 《计算机应用研究》 北大核心 2026年第3期948-953,共6页
针对堆叠沙漏网络在复杂场景人体姿态估计任务中存在注意力机制缺失导致语义感知能力弱、固定卷积采样模式导致几何建模能力差、结构冗余影响推理效率问题,设计了一种轻量高效的改进网络架构。该网络采用空间-通道双路径协同注意力模块... 针对堆叠沙漏网络在复杂场景人体姿态估计任务中存在注意力机制缺失导致语义感知能力弱、固定卷积采样模式导致几何建模能力差、结构冗余影响推理效率问题,设计了一种轻量高效的改进网络架构。该网络采用空间-通道双路径协同注意力模块,从空间维度增强关键点感知、抑制背景干扰,同时在通道维度筛选高语义特征,实现多维特征优化;引入多态线性可变形卷积瓶颈模块,通过异构初始采样形状提升对复杂姿态结构的几何建模能力;构建ELA-PCCW沙漏模块,在保持特征完整性的同时显著降低模型复杂度以提升模型推理效率。在MPII与COCO2017两个主流数据集上进行性能评估,结果显示,所提方法在MPII数据集上PCKh@0.5提高2.3个百分点,参数量和计算量分别减少9.1M和6 GFLOPs,在精度与复杂度之间形成良好平衡。对比实验和可视化分析进一步验证了该方法在多种复杂场景人体姿态估计任务中的优越性。 展开更多
关键词 人体姿态估计 堆叠沙漏网络 轻量化模型 注意力机制 线性可变形卷积 几何建模能力 特征融合 模型推理效率
在线阅读 下载PDF
Multipath affinage stacked-hourglass networks for human pose estimation 被引量:11
2
作者 Guoguang HUA Lihong LI Shiguang LIU 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第4期155-165,共11页
Recently,stacked hourglass network has shown outstanding performance in human pose estimation.However,repeated bottom-up and top-down stride convolution operations in deep convolutional neural networks lead to a signi... Recently,stacked hourglass network has shown outstanding performance in human pose estimation.However,repeated bottom-up and top-down stride convolution operations in deep convolutional neural networks lead to a significant decrease in the initial image resolution.In order to address this problem,we propose to incorporate affinage module and residual attention module into stacked hourglass network for human pose estimation.This paper introduces a novel network architecture to replace the stacked hourglass network of up-sampling operation for getting high-resolution features.We refer to the architecture as an affinage module which is critical to improve the performance of the stacked hourglass network.Additionally,we also propose a novel residual attention module to increase the supervision of up-sample process.The effectiveness of the introduced module is evaluated on standard benchmarks.Various experimental results demonstrated that our method can achieve more accurate and more robust human pose estimation results in images with complex background. 展开更多
关键词 human pose estimation stacked hourglass network affinage module residual attention module
原文传递
基于改进沙漏网络的线段检测方法
3
作者 李玉峰 高闯 李露 《计算机与数字工程》 2025年第6期1722-1727,共6页
针对图像纹理信息强、图像尺寸大、分辨率低、数据量大等特性,提出了一种基于改进沙漏网络的线段检测方法。首先利用多分支改进堆叠沙漏网络的残差块,捕获图像多尺度特征信息,然后对堆叠沙漏网络进行级联,并均值化其各阶段结果,获取丰... 针对图像纹理信息强、图像尺寸大、分辨率低、数据量大等特性,提出了一种基于改进沙漏网络的线段检测方法。首先利用多分支改进堆叠沙漏网络的残差块,捕获图像多尺度特征信息,然后对堆叠沙漏网络进行级联,并均值化其各阶段结果,获取丰富的上下文信息,有效提升对具有强纹理特征图像的线段检测精度。与现有技术相比,该方法在不影响线段检测精度的情况下,对强纹理特征、大尺寸等复杂环境下图像检测精度提升了5%。 展开更多
关键词 堆叠沙漏网络 深度学习 线段检测
在线阅读 下载PDF
面向太极拳学习的人体姿态估计及相似度计算 被引量:6
4
作者 蔡兴泉 霍宇晴 +1 位作者 李发建 孙海燕 《图学学报》 CSCD 北大核心 2022年第4期695-706,共12页
针对当前线上太极拳学习自然交互性差、缺乏学习反馈等问题,提出一种面向太极拳学习的人体姿态估计及相似度计算方法。首先,输入太极拳视频,利用帧间差分法提取关键帧图像;然后,利用堆叠沙漏网络模型对关键帧图像进行二维关节点检测;接... 针对当前线上太极拳学习自然交互性差、缺乏学习反馈等问题,提出一种面向太极拳学习的人体姿态估计及相似度计算方法。首先,输入太极拳视频,利用帧间差分法提取关键帧图像;然后,利用堆叠沙漏网络模型对关键帧图像进行二维关节点检测;接着,使用长短期记忆(LSTM)网络结合Sequence-to-Sequence网络模型对检测到的二维关节点序列进行二维到三维的映射,预测三维关节点的位置坐标;最后对估计的人体姿态进行二维和三维余弦相似度计算。利用该方法设计并开发了一款相关设备简便、用户体验感强的太极拳学习与反馈应用系统,并在实际中应用。该系统可以检测太极拳学员的整体动作及各肢体段动作是否标准,并给出反馈,学员可以根据反馈结果练习和改善不标准动作,达到提升学习效果的目的。 展开更多
关键词 太极拳学习 人体姿态估计 帧间差分 堆叠沙漏网络 余弦相似度
在线阅读 下载PDF
基于堆叠沙漏网络改进的多人姿态估计 被引量:2
5
作者 梁鸿 任文静 +1 位作者 张千 李传秀 《计算机工程与设计》 北大核心 2022年第2期502-509,共8页
为解决多人姿态估计中小尺度关键点(手腕、脚踝等)定位准确率低的问题,采用自顶向上的方式,结合先进的人体目标检测模型YOLOv3,提出一种基于堆叠沙漏网络改进的多人姿态估计方法。在沙漏网络中融入通道混洗模块,加强不同尺度下多层特征... 为解决多人姿态估计中小尺度关键点(手腕、脚踝等)定位准确率低的问题,采用自顶向上的方式,结合先进的人体目标检测模型YOLOv3,提出一种基于堆叠沙漏网络改进的多人姿态估计方法。在沙漏网络中融入通道混洗模块,加强不同尺度下多层特征之间的跨通道信息交流,提高被遮挡关键点的识别效果;使用注意力机制对沙漏网络原有的残差模块进行特征增强,抑制无用特征并提升有用特征,提高小尺度关键点的识别率。实验结果表明,在MPII数据集上的总体PCK@0.5达到了88.6%,在MSCOCO数据集上的AP@0.75相比原始网络提升了4.6%,验证了所提方法的有效性。 展开更多
关键词 堆叠沙漏网络 人体姿态估计 多尺度特征融合 注意力机制 人体目标检测
在线阅读 下载PDF
YOLOv3剪枝模型的多人姿态估计 被引量:11
6
作者 蔡哲栋 应娜 +2 位作者 郭春生 郭锐 杨鹏 《中国图象图形学报》 CSCD 北大核心 2021年第4期837-846,共10页
目的为了解决复杂环境中多人姿态估计存在的定位和识别等问题,提高多人姿态估计的准确率,减少算法存在的大量冗余参数,提高姿态估计的运行速率,提出了基于批量归一化层(batch normalization, BN)通道剪枝的多人姿态估计算法(YOLOv3 prun... 目的为了解决复杂环境中多人姿态估计存在的定位和识别等问题,提高多人姿态估计的准确率,减少算法存在的大量冗余参数,提高姿态估计的运行速率,提出了基于批量归一化层(batch normalization, BN)通道剪枝的多人姿态估计算法(YOLOv3 prune pose estimator, YLPPE)。方法以目标检测算法YOLOv3(you only look once v3)和堆叠沙漏网络(stacked hourglass network, SHN)算法为基础,通过重叠度K-means算法修改YOLOv3网络锚框以更适应行人目标检测,并训练得到Trimming-YOLOv3网络;利用批量归一化层的缩放因子对Trimming-YOLOv3网络进行循环迭代式通道剪枝,设置剪枝阈值与缩放因子,实现较为有效的模型剪枝效果,训练得到Trim-PruneYOLOv3网络;为了结合单人姿态估计网络,重定义图像尺寸为256×256像素(非正方形图像通过补零实现);再级联4个Hourglass子网络得到堆叠沙漏网络,从而提升整体姿态估计精度。结果利用斯坦福大学的MPII数据集(MPII human pose dataset)进行实验验证,本文算法对姿态估计的准确率达到了83.9%;同时,时间复杂度为O(n2),模型参数量与未剪枝原始YOLOv3相比下降42.9%。结论结合YOLOv3剪枝算法的多人姿态估计方法可以有效减少复杂环境对人体姿态估计的负面影响,实现复杂环境下的多人姿态估计并提高估计精度,有效减少模型冗余参数,提高算法的整体运行速率,能够实现较为准确的多人姿态估计,并具有较好的鲁棒性和泛化能力。 展开更多
关键词 目标检测 多人姿态估计 模型剪枝 YOLOv3 堆叠沙漏网络 MPII数据集
原文传递
有条件生成对抗网络的IVUS图像内膜与中-外膜边界检测 被引量:4
7
作者 袁绍锋 杨丰 +3 位作者 徐琳 吴洋洋 黄靖 刘娅琴 《中国生物医学工程学报》 CAS CSCD 北大核心 2019年第2期146-156,共11页
针对血管内超声(IVUS)图像中各类斑块、超声阴影和血管分支等造成内膜(LU)与中-外膜(MA)边界难以准确检测的问题,提出一种结合堆叠沙漏网络(SHGN)和有条件生成对抗网络(C-GAN)的IVUS内膜与中-外膜检测的改进方法。首先根据血管形态特点... 针对血管内超声(IVUS)图像中各类斑块、超声阴影和血管分支等造成内膜(LU)与中-外膜(MA)边界难以准确检测的问题,提出一种结合堆叠沙漏网络(SHGN)和有条件生成对抗网络(C-GAN)的IVUS内膜与中-外膜检测的改进方法。首先根据血管形态特点,使用旋转、缩放和Gamma变换等方法将图像训练集扩充57倍,降低网络训练过拟合风险;然后利用对抗训练思想,构建基于L1、L2重建损失的联合损失函数,学习超声图像与其对应分割图像的映射关系,将IVUS图像分割为3种不同区域:血管外周组织、斑块区域和内腔区域;最后在图像分割结果上,采用阈值处理方法,检测最终的内膜与中-外膜边界。采用国际标准IVUS图像数据集(10位病人435幅)评价所提出的算法。实验量化评价结果为:内膜计算面积交并比(JM) 93%,面积差异百分比(PAD) 3%,Hausdorff距离(HD) 0.19 mm;中-外膜JM 95%,PAD 3%,HD 0.16 mm。这些指标满足临床诊断要求,性能优于现有的、近年较好的9种算法,以及Pix2Pix模型。在临床实践应用分析中,利用南部战区总医院心血管内科所收集的100幅IVUS图像进行检验,取得较好的分割结果。这表明该方法具有较好的跨数据集泛化性能。 展开更多
关键词 血管内超声 内膜与中-外膜边界检测 有条件生成对抗网络 堆叠沙漏网络 深度学习
在线阅读 下载PDF
基于堆叠沙漏网络的量体特征点定位 被引量:2
8
作者 邹昆 王伟灿 +1 位作者 董帅 李文生 《电子科技大学学报》 EI CAS CSCD 北大核心 2020年第5期709-717,共9页
为提高复杂背景和任意着装情况下的量体特征点定位精度,将堆叠沙漏网络(SHN)引入人体图像量体特征点定位中,并针对SHN模型输出特征图分辨率过低导致定位精度不足的问题,构建了一种Deconv-SHN模型。一方面用多个反卷积层代替初始模型的... 为提高复杂背景和任意着装情况下的量体特征点定位精度,将堆叠沙漏网络(SHN)引入人体图像量体特征点定位中,并针对SHN模型输出特征图分辨率过低导致定位精度不足的问题,构建了一种Deconv-SHN模型。一方面用多个反卷积层代替初始模型的输出层以提高输出特征图的分辨率,另一方面基于Smooth L1和局部响应对目标函数进行了优化。在自建的6700幅正面人体图像数据集上对Deconv-SHN模型、SHN模型以及传统算法进行实验的结果表明,Deconv-SHN模型在复杂背景和任意着装情况下的特征点定位精度较传统算法有显著提升,也明显优于SHN模型,基本满足人体参数测量应用的要求。 展开更多
关键词 量体特征点定位 深度学习 非接触式人体参数测量 堆叠沙漏网络
在线阅读 下载PDF
一种基于轻量级堆叠沙漏网络的机械臂姿态估计方法 被引量:2
9
作者 王琦 郑飂默 +2 位作者 王诗宇 刘信君 郭威 《小型微型计算机系统》 CSCD 北大核心 2022年第11期2370-2374,共5页
现有的机械臂姿态估计方法通常只考虑如何改进模型的泛化能力,而忽略了模型的效率,因此在实际应用中,开发出的模型参数量和计算量过大.为了解决此问题,本文提出一种新的基于Ghost模块的堆叠沙漏网络(Ghost Module-Based Stacked Hourgla... 现有的机械臂姿态估计方法通常只考虑如何改进模型的泛化能力,而忽略了模型的效率,因此在实际应用中,开发出的模型参数量和计算量过大.为了解决此问题,本文提出一种新的基于Ghost模块的堆叠沙漏网络(Ghost Module-Based Stacked Hourglass Network,Ghost-SHN).Ghost-SHN以堆叠沙漏网络(Stacked hourglass Network,SHN)为基础,构建了具有两个堆的堆叠沙漏网络,并通过把堆叠沙漏网络中的普通卷积替换成轻量的Ghost模块来压缩模型,能够更好地在机械臂上进行部署,实现了轻量级的机械臂姿态估计.四个典型数据集上的实验结果表明,Ghost-SHN相比同类模型,不仅减少了参数量和计算量,而且泛化性能很好,取得了比堆叠沙漏网络更好的精度. 展开更多
关键词 机械臂姿态估计 关键点检测 堆叠沙漏网络 Ghost模块 模型压缩
在线阅读 下载PDF
基于引导对抗网络的人体深度图像修补方法 被引量:2
10
作者 阴敬方 朱登明 +1 位作者 石敏 王兆其 《系统仿真学报》 CAS CSCD 北大核心 2020年第7期1312-1321,共10页
移动设备配备的小型深度相机采集到的人体深度图像存在严重的孔洞问题。针对该问题,提出基于深度学习的引导对抗网络。使用基于堆叠沙漏网络的引导器从RGB图像中提取人体部分分割特征和深度类别特征;在上述人体特征引导下,使用独特的生... 移动设备配备的小型深度相机采集到的人体深度图像存在严重的孔洞问题。针对该问题,提出基于深度学习的引导对抗网络。使用基于堆叠沙漏网络的引导器从RGB图像中提取人体部分分割特征和深度类别特征;在上述人体特征引导下,使用独特的生成器修复人体深度图像中的孔洞。为使结果更加逼真,加入判别器在网络训练过程中对生成器进行优化调整。实验结果显示,该方法在现有的人体数据集和小型深度相机采集的数据集上,都能很好解决孔洞问题,均取得比现有方法更好的效果。 展开更多
关键词 深度相机 人体深度图像修复 深度学习 堆叠沙漏网络 引导对抗网络
原文传递
利用改进生成对抗网络进行人体姿态识别 被引量:13
11
作者 吴春梅 胡军浩 尹江华 《计算机工程与应用》 CSCD 北大核心 2020年第8期96-103,共8页
针对人体模型中某些重要关节点准确定位的问题,提出了一种新型深度卷积生成对抗网络以进行静态图像中人体姿态的估计的方法。该方法采用了深度卷积的堆叠沙漏网络来准确提取图像上关键关节点的位置,该网络的生成和辨别部分被设计用于编... 针对人体模型中某些重要关节点准确定位的问题,提出了一种新型深度卷积生成对抗网络以进行静态图像中人体姿态的估计的方法。该方法采用了深度卷积的堆叠沙漏网络来准确提取图像上关键关节点的位置,该网络的生成和辨别部分被设计用于编码第一层次结构(亲本)与第二层次结构(子本)中的空间关系,并且展示了人体部位的空间层次。生成器和判别器在网络中被设计为两部分,并按照顺序连接在一起用来编码外观可能的关系,同时为人体部位存在的可能性以及身体的每个部分与其亲本部分之间的关系进行编码。在静态图像中,可以较准确地识别人体模型关键节点以及大致人体姿态。该方法在不同的数据集上进行了实验,在大部分情况下,提出的方法获得的结果优于其他几种对比方法。 展开更多
关键词 卷积神经网络 生成对抗网络(GAN) 人体姿态识别 堆叠沙漏网络 层次感知
在线阅读 下载PDF
端到端堆叠沙漏网络的遥感影像建筑物轮廓重构 被引量:3
12
作者 张兴忆 李佳田 +3 位作者 杨汝春 陆大进 张泽龙 杨超 《测绘通报》 CSCD 北大核心 2022年第5期67-73,共7页
针对如何以端到端可训练的方式重构建筑物轮廓的问题,本文提出了一种端到端多残差模块堆叠沙漏网络的建筑物轮廓重构方法。首先,采用多残差模块堆叠沙漏网络提取建筑物角点和边缘特征;其次,利用角点检测模块匹配对应角点的相对位置,以... 针对如何以端到端可训练的方式重构建筑物轮廓的问题,本文提出了一种端到端多残差模块堆叠沙漏网络的建筑物轮廓重构方法。首先,采用多残差模块堆叠沙漏网络提取建筑物角点和边缘特征;其次,利用角点检测模块匹配对应角点的相对位置,以获取候选角点;然后,通过线段采样将候选角点生成候选轮廓线;最后,线验证模块利用候选线段及多残差模块堆叠沙漏网络得到特征图,并验证每个线段是否为建筑物轮廓线,以获得建筑物轮廓重构结果。试验结果表明,在SpaceNet建筑物数据集上,本文方法能检测出建筑物角点及边缘,并有效实现了以端到端可训练的方式重构建筑物轮廓。 展开更多
关键词 建筑物轮廓重构 堆叠沙漏网络 残差模块 角点检测 线段采样
原文传递
基于关键点的眼睛定位和状态估计 被引量:1
13
作者 何勇 孙哲南 +2 位作者 王财勇 王云龙 朱宇豪 《计算机应用与软件》 北大核心 2022年第4期185-192,共8页
眼睛定位和状态估计是虹膜、巩膜、眼周等生物特征识别中重要的预处理过程。非合作环境下捕获的眼睛图像经常面临严重的遮挡和复杂的背景。为此提出一种鲁棒而准确的基于眼睛关键点的单阶段方法去定位眼睛的位置并估计眼睛的左右和开闭... 眼睛定位和状态估计是虹膜、巩膜、眼周等生物特征识别中重要的预处理过程。非合作环境下捕获的眼睛图像经常面临严重的遮挡和复杂的背景。为此提出一种鲁棒而准确的基于眼睛关键点的单阶段方法去定位眼睛的位置并估计眼睛的左右和开闭状态。为了训练和评估提出的模型,手工标注一个新的数据集OCE-1000,每幅图像标注左右两只眼睛共8个关键点,以及左右眼的开闭状态。实验结果表明,提出的模型在OCE-1000数据集上达到了98%的关键点定位准确率,眼睛状态估计的准确率为97%。 展开更多
关键词 生物特征识别 眼睛关键点定位 眼睛状态估计 残差网络 堆叠沙漏网络
在线阅读 下载PDF
基于改进堆叠沙漏网络的动物姿态估计 被引量:4
14
作者 张雯雯 徐杨 +1 位作者 白芮 陈娜 《计算机工程》 CAS CSCD 北大核心 2023年第2期263-270,共8页
堆叠沙漏网络在动物姿态估计任务中得到成功应用,但其编码-解码过程容易丢失网络的浅层信息,影响了检测精度。针对该问题,提出基于改进堆叠沙漏网络的动物姿态估计模型。设计一种基于SE注意力机制的多尺度最大池化模块,完成多尺度信息... 堆叠沙漏网络在动物姿态估计任务中得到成功应用,但其编码-解码过程容易丢失网络的浅层信息,影响了检测精度。针对该问题,提出基于改进堆叠沙漏网络的动物姿态估计模型。设计一种基于SE注意力机制的多尺度最大池化模块,完成多尺度信息的提取,解决池化后信息大量丢失的问题,提高网络获取全局信息的能力,同时提出多级特征融合方法,充分提取和融合特征信息。在此基础上,嵌入CBAM注意力机制,学习特征融合权重,提升网络对多通道信息的提取能力,抑制无效特征,使网络提取出更丰富、细腻的特征。在TigDog数据集和合成动物数据集上进行训练和测试,结果表明,该模型估计性能优于Syn、BDL、CyCADA和CC-SSL模型,其对于马和老虎的PCK@0.05指标较次优的CC-SSL模型分别提高4.6%和3.5%。消融实验结果也验证了整个网络体系结构的先进性和有效性。 展开更多
关键词 动物姿态估计 堆叠沙漏网络 多尺度信息提取 注意力机制 特征融合
在线阅读 下载PDF
基于改进堆叠沙漏网络的交警姿态估计 被引量:1
15
作者 乔稳 刘惠义 《信息技术》 2021年第4期17-23,29,共8页
针对交警动作中的姿态估计问题,提出一种改进的堆叠沙漏网络模型。该模型通过减少沙漏网络级联次数,来简化堆叠沙漏网络结构。利用多尺度下深浅层特征信息之间的聚合,得到丰富的上下文信息,增强姿态、遮挡、低分辨率图像的鲁棒性。将不... 针对交警动作中的姿态估计问题,提出一种改进的堆叠沙漏网络模型。该模型通过减少沙漏网络级联次数,来简化堆叠沙漏网络结构。利用多尺度下深浅层特征信息之间的聚合,得到丰富的上下文信息,增强姿态、遮挡、低分辨率图像的鲁棒性。将不同阶段产生的热图估计结果进行融合平均化处理,进一步提高局部位置坐标的精细定位以及整体估计结果的准确性。在MPII数据集以及中国交警数据集上进行实验,结果表明,改进后的网络模型提高了运行的效率,同时可以很好地对目标交警的姿态特征信息进行提取,对结果热图平均化处理后,提高了位置坐标整体估计的准确性。 展开更多
关键词 交警姿态 深度学习 堆叠沙漏网络 特征聚合
在线阅读 下载PDF
改进的CornerNet-Saccade车辆检测算法 被引量:4
16
作者 梁礼明 熊文 +1 位作者 蓝智敏 钱艳群 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第6期137-146,共10页
针对现有的CornerNet-Saccade算法在车辆检测任务中存在明显的误检和漏检现象,提出了一种改进的CornerNet-Saccade算法。首先通过加深堆叠沙漏网络结构,增强车辆高级特征提取能力;其次,增加更小尺度的attention maps以改善小目标车辆的... 针对现有的CornerNet-Saccade算法在车辆检测任务中存在明显的误检和漏检现象,提出了一种改进的CornerNet-Saccade算法。首先通过加深堆叠沙漏网络结构,增强车辆高级特征提取能力;其次,增加更小尺度的attention maps以改善小目标车辆的检测能力,引入Dense Block模型和瓶颈残差单元降低堆叠沙漏网络参数的复杂度,保证层与层之间的最大信息流;最后,通过Sigmoid激活函数得到最终的检测结果。在KITTI数据库和自制数据库上对改进算法进行了仿真实验,平均精确率分别达92.56%和95.21%,检测速度分别达40 FPS和49FPS,同时在自制数据库上对原CornerNet-Saccade算法和改进算法进行了仿真实验,精确率和召回率相比原算法分别提高了3.8%和8.5%。结果表明:此改进的CornerNet-Saccade算法在车辆检测任务中具有明显优势。 展开更多
关键词 车辆检测 堆叠沙漏网络 注意力机制 锚点框 角点检测
在线阅读 下载PDF
基于堆叠沙漏网络的单分蘖水稻植株骨架提取 被引量:3
17
作者 王敏娟 刘小丫 +2 位作者 马啸霄 常天根 宋青峰 《农业工程学报》 EI CAS CSCD 北大核心 2021年第24期149-157,共9页
针对水稻栽培和遗传育种研究中单分蘖性状高通量无损提取的实际需求,该研究提出了一种基于沙漏网络模型的单分蘖水稻关键点预测和骨架提取方法。首先,对原始图像进行批量裁剪、gamma校正和锐化卷积等预处理,获取单色背景下的水稻单分蘖... 针对水稻栽培和遗传育种研究中单分蘖性状高通量无损提取的实际需求,该研究提出了一种基于沙漏网络模型的单分蘖水稻关键点预测和骨架提取方法。首先,对原始图像进行批量裁剪、gamma校正和锐化卷积等预处理,获取单色背景下的水稻单分蘖图像数据集;设计水稻单分蘖各器官关键点数据标注策略,构建监督数据集。然后,构建堆叠沙漏网络架构实现叶片数固定和不固定的水稻关键点检测,引入沙漏结构整合图像的多尺度特征,结合中间监督机制整合不同沙漏模块信息。叶片数一致的情况,模型预测准确率最高可达96.48%;叶片数不一致的情况,预测准确率达到82.09%。最后,根据预测关键点及其对应的语义信息连接形成植株骨架,选取茎秆长、叶片长、穗长、叶片-茎秆夹角和茎节点位置5个表型参数对生成骨架模型的实际意义进行评估,其均方根误差依次为5.82 cm、3.09 cm、1.71 cm、3.22°和2.0356cm,证明了该方法能较好地识别水稻单分蘖关键点,为水稻骨架提取提供了一种新思路,有助于加快水稻育种速度。 展开更多
关键词 水稻 神经网络 表型参数 关键点检测 堆叠沙漏网络 植株骨架提取
在线阅读 下载PDF
对抗训练在人脸关键点序列稳定化问题中的应用
18
作者 何卓骋 李京 《小型微型计算机系统》 CSCD 北大核心 2021年第7期1407-1414,共8页
人脸关键点检测问题在静态图像上已经得到了较好的解决,然而当使用这类解决方案逐帧地应用于视频数据时,所预测出的人脸关键点会呈现出明显的非规则抖动,因此如何准确且稳定地对流媒体中的人脸关键点进行定位成为了新的挑战.本文提出了... 人脸关键点检测问题在静态图像上已经得到了较好的解决,然而当使用这类解决方案逐帧地应用于视频数据时,所预测出的人脸关键点会呈现出明显的非规则抖动,因此如何准确且稳定地对流媒体中的人脸关键点进行定位成为了新的挑战.本文提出了一种基于平滑网格逆变换以及借助参数化人脸3D模型进行对抗训练的方式对现有方案进行改进.该方案训练所得的神经网络模型能够在不借助序列平滑后处理算法的情况下,逐帧应用于流媒体数据,给出稳定且准确的人脸关键点位置信息.其准确性相较于改进前的模型保持一致,而稳定性则超越了已有工作. 展开更多
关键词 人脸关键点检测 堆叠沙漏网络 对抗训练 计算机视觉
在线阅读 下载PDF
基于骨架模型的人体行为分析
19
作者 朱凌飞 万旺根 《电子测量技术》 2019年第8期68-73,共6页
随着深度学习运用到图像领域,姿态估计、行为分析等算法的性能得到显著提升,希望在利用较好模型基础上进一步分析,在尽可能短的时间内得到更直观的结果。2016年提出的沙漏堆网络对人体关节点进行多尺度、多阶段的训练,在MPII数据集上回... 随着深度学习运用到图像领域,姿态估计、行为分析等算法的性能得到显著提升,希望在利用较好模型基础上进一步分析,在尽可能短的时间内得到更直观的结果。2016年提出的沙漏堆网络对人体关节点进行多尺度、多阶段的训练,在MPII数据集上回归了16对关节点坐标,在单个11 G显存的GPU上的平均准确率为87.6%;连接关节点构建人体骨架模型,然后根据骨架模型的加权角和倾斜角等几何特征,进一步推断人体的动作和行为状态,最后对人体行为进行分类和判断,包括站立、直坐、躺下等常见7类动作,平均准确率为82%,优势在于有效降低计算量和处理时间。 展开更多
关键词 神经网络 姿态估计 行为分析 沙漏堆模型 几何特征
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部