期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
Multipath affinage stacked-hourglass networks for human pose estimation 被引量:10
1
作者 Guoguang HUA Lihong LI Shiguang LIU 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第4期155-165,共11页
Recently,stacked hourglass network has shown outstanding performance in human pose estimation.However,repeated bottom-up and top-down stride convolution operations in deep convolutional neural networks lead to a signi... Recently,stacked hourglass network has shown outstanding performance in human pose estimation.However,repeated bottom-up and top-down stride convolution operations in deep convolutional neural networks lead to a significant decrease in the initial image resolution.In order to address this problem,we propose to incorporate affinage module and residual attention module into stacked hourglass network for human pose estimation.This paper introduces a novel network architecture to replace the stacked hourglass network of up-sampling operation for getting high-resolution features.We refer to the architecture as an affinage module which is critical to improve the performance of the stacked hourglass network.Additionally,we also propose a novel residual attention module to increase the supervision of up-sample process.The effectiveness of the introduced module is evaluated on standard benchmarks.Various experimental results demonstrated that our method can achieve more accurate and more robust human pose estimation results in images with complex background. 展开更多
关键词 human pose estimation stacked hourglass network affinage module residual attention module
原文传递
基于YOLOv4-tiny和Hourglass的指针式仪表读数识别 被引量:14
2
作者 陶金 林文伟 +4 位作者 曾亮 张建寰 赵紫阳 徐周毅 张陈涛 《电子测量与仪器学报》 CSCD 北大核心 2023年第5期1-10,共10页
为了降低电力巡检机器人识别变电站指针式仪表的误检率,提高仪表读数识别的精度,设计了一种基于深度学习的指针式仪表检测方法。通过在YOLOv4-tiny网络结构基础上添加残差模块来提高模型的鲁棒性,并对Hourglass网络结构改进,达到精准识... 为了降低电力巡检机器人识别变电站指针式仪表的误检率,提高仪表读数识别的精度,设计了一种基于深度学习的指针式仪表检测方法。通过在YOLOv4-tiny网络结构基础上添加残差模块来提高模型的鲁棒性,并对Hourglass网络结构改进,达到精准识别指针式仪表读数的目的。为了验证所提出方法的有效性,以变电站现场仪表图像数据对方法进行测试,并将检测结果与其他方法进行对比。实验结果表明,仪表定位漏检率仅1.25%,指针定位精度在1.125%以内,整体检测时间小于0.5 s。相较于常用的Hough直线检测与ORB结合或基于U-net模型的方法,读数识别的平均误差分别降低了70.8%和58.8%,为变电站指针式仪表的读数识别提供新的思路。 展开更多
关键词 深度学习 指针式仪表检测 hourglass网络 YOLOv4-tiny
原文传递
HourglassNet:一种用于遥感目标检测的改进FCOS算法 被引量:2
3
作者 原瑜蔓 白宏阳 +2 位作者 郭宏伟 付宏建 李泽超 《南京理工大学学报》 CAS CSCD 北大核心 2022年第6期719-727,741,共10页
针对遥感图像中背景复杂、目标分布密集、目标尺度形态多样等问题,该文在单阶段全卷积(FCOS)目标检测模型的基础上,基于沙漏特征金字塔并且与多尺度上下文场景结合,提出了沙漏网(HourglassNet)。针对卷积神经网络(CNN)中不同深度语义信... 针对遥感图像中背景复杂、目标分布密集、目标尺度形态多样等问题,该文在单阶段全卷积(FCOS)目标检测模型的基础上,基于沙漏特征金字塔并且与多尺度上下文场景结合,提出了沙漏网(HourglassNet)。针对卷积神经网络(CNN)中不同深度语义信息和空间信息不均衡的问题,提出了一种沙漏特征金字塔,通过将多尺度特征缩放至中间尺度进行融合和优化以获得全局特征。基于注意力机制将全局特征向不同尺度特征传递,在抑制无关特征的同时增强了有效特征,实现了对多尺度特征的补偿。为了将高层特征的语义信息更加充分地融入不同尺寸的特征图内,设计了多尺度上下文融合模块。利用适当的感受野提取高层特征的上下文信息,提升了特征的鲁棒性和辨识性。分别在DOTA v1.5和NWPU VHR-10公开遥感图像数据集上进行了性能对比与消融实验。结果表明,该文算法的均值平均精度(mAP)相比于FCOS在DOTA v1.5和NWPU VHR-10数据集上分别提升了4.3%和3.4%,且检测性能优于YOLOv3等其它对比方法。 展开更多
关键词 单阶段全卷积目标检测 遥感图像 沙漏特征金字塔 多尺度特征 上下文场景 卷积神经网络 注意力机制 特征融合
在线阅读 下载PDF
结合注意力机制和多尺度特征融合的三维手部姿态估计
4
作者 郭诗月 党建武 +1 位作者 王阳萍 雍玖 《计算机应用》 北大核心 2025年第4期1293-1299,共7页
针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(S... 针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(SEM),以替换沙漏网络(HGNet)中的基本块(Basicblock),在扩大感受野的同时增强对空间信息的敏感性,从而提高手部特征的提取能力;其次,设计一种结合SPCNet(Spatial Preserve and Contentaware Network)和Soft-Attention改进的多尺度信息融合模块SS-MIFM(SPCNet and Soft-attention-Multi-scale Information Fusion Module),在充分考虑空间内容感知机制的情况下,有效地聚合多级特征,并显著提高二维手部关键点检测的准确性;最后,利用2.5D姿态转换模块将二维姿态转换为三维姿态,从而避免二维关键点坐标直接回归计算三维姿态信息导致的空间丢失问题。实验结果表明,在InterHand2.6M数据集上,所提算法的双手关节点平均误差(MPJPE)、单手MPJPE和根节点平均误差(MRRPE)分别达到了12.32、9.96和29.57 mm;在RHD(Rendered Hand pose Dataset)上,与InterNet和QMGR-Net算法相比,所提算法的终点误差(EPE)分别降低了2.68和0.38 mm。以上结果说明了所提算法能够更准确地估计手部姿态,且在一些双手交互和遮挡的场景下有更高的鲁棒性。 展开更多
关键词 手部姿态估计 多尺度特征融合 注意力机制 高分辨率网络 沙漏网络
在线阅读 下载PDF
基于改进沙漏网络的红外图像视线估计
5
作者 沈文忠 魏佳钰 《计算机应用与软件》 北大核心 2025年第9期60-65,71,共7页
随着VR/AR等元宇宙概念的兴起,集成虹膜识别的视线估计技术是目前的研究热点,而虹膜识别与视线跟踪都采用近红外摄像头捕捉眼部图像,仅从单眼红外眼部图像进行视线估计是一项挑战性任务。该文提出新的视线估计网络,首先利用圆形眼球与... 随着VR/AR等元宇宙概念的兴起,集成虹膜识别的视线估计技术是目前的研究热点,而虹膜识别与视线跟踪都采用近红外摄像头捕捉眼部图像,仅从单眼红外眼部图像进行视线估计是一项挑战性任务。该文提出新的视线估计网络,首先利用圆形眼球与椭圆虹膜的映射得到中间眼部模型标签图像,引入中间监督;再通过改进沙漏网络回归红外虹膜图像的中间眼部模型图像;最后再结合DenseNet回归3D视线角度。设计近红外光虹膜采集系统,建立红外虹膜数据集SEPAD-Gaze。实验结果表明,该文提出的视线估计方法在数据集SEPAD-Gaze上误差为4.62°,并且在可见光下的公共数据集MPIIGaze上做了泛化性验证实验,误差低至4.48°,超过目前所有主流算法。 展开更多
关键词 视线估计 红外眼部图像 改进沙漏网络 眼部模型 DenseNet
在线阅读 下载PDF
基于改进沙漏网络的线段检测方法
6
作者 李玉峰 高闯 李露 《计算机与数字工程》 2025年第6期1722-1727,共6页
针对图像纹理信息强、图像尺寸大、分辨率低、数据量大等特性,提出了一种基于改进沙漏网络的线段检测方法。首先利用多分支改进堆叠沙漏网络的残差块,捕获图像多尺度特征信息,然后对堆叠沙漏网络进行级联,并均值化其各阶段结果,获取丰... 针对图像纹理信息强、图像尺寸大、分辨率低、数据量大等特性,提出了一种基于改进沙漏网络的线段检测方法。首先利用多分支改进堆叠沙漏网络的残差块,捕获图像多尺度特征信息,然后对堆叠沙漏网络进行级联,并均值化其各阶段结果,获取丰富的上下文信息,有效提升对具有强纹理特征图像的线段检测精度。与现有技术相比,该方法在不影响线段检测精度的情况下,对强纹理特征、大尺寸等复杂环境下图像检测精度提升了5%。 展开更多
关键词 堆叠沙漏网络 深度学习 线段检测
在线阅读 下载PDF
基于全连接神经网络的三维人体姿态估计 被引量:10
7
作者 孟琭 高恒上 +1 位作者 张含光 刘阳 《仪器仪表学报》 EI CAS CSCD 北大核心 2020年第10期165-177,共13页
人体姿态估计是计算机视觉领域的重要分支,在实践中有广泛应用,例如:智能交通、安防监控、影视娱乐、司法分析等。现有的三维人体姿态估计算法大多来源于二维人体姿态估计算法的扩展,其识别结果是以三维关节点、线的形式来体现,无法展... 人体姿态估计是计算机视觉领域的重要分支,在实践中有广泛应用,例如:智能交通、安防监控、影视娱乐、司法分析等。现有的三维人体姿态估计算法大多来源于二维人体姿态估计算法的扩展,其识别结果是以三维关节点、线的形式来体现,无法展示更多的人体细节信息,且表达形式比较抽象,难于理解。为解决这个问题,本文引入了参数化人体模型(SMPL),该模型可以实体化的展示三维人体姿态。本文通过二维图像预测人体的三维姿态,该过程分为3个阶段,首先从多角度二维图像中预测人体关节点的二维坐标,然后基于全连接神经网络实现二维关节点到SMPL模型参数的映射,最后根据这些参数构建三维SMPL模型,以展示三维人体姿态。实验表明,本文通过从图像中提取二维关节点坐标,并以此为全连接神经网络的输入,可以快速、准确的估计出人体三维姿态。相比从二维图像直接估计三维人体姿态的方法,本文的模型降低了训练参数,简化了网络结构,加快了模型训练的速度,节约了训练成本。 展开更多
关键词 三维人体姿态估计 全连接神经网络 沙漏型网络 SMPL网格模型
原文传递
面向太极拳学习的人体姿态估计及相似度计算 被引量:6
8
作者 蔡兴泉 霍宇晴 +1 位作者 李发建 孙海燕 《图学学报》 CSCD 北大核心 2022年第4期695-706,共12页
针对当前线上太极拳学习自然交互性差、缺乏学习反馈等问题,提出一种面向太极拳学习的人体姿态估计及相似度计算方法。首先,输入太极拳视频,利用帧间差分法提取关键帧图像;然后,利用堆叠沙漏网络模型对关键帧图像进行二维关节点检测;接... 针对当前线上太极拳学习自然交互性差、缺乏学习反馈等问题,提出一种面向太极拳学习的人体姿态估计及相似度计算方法。首先,输入太极拳视频,利用帧间差分法提取关键帧图像;然后,利用堆叠沙漏网络模型对关键帧图像进行二维关节点检测;接着,使用长短期记忆(LSTM)网络结合Sequence-to-Sequence网络模型对检测到的二维关节点序列进行二维到三维的映射,预测三维关节点的位置坐标;最后对估计的人体姿态进行二维和三维余弦相似度计算。利用该方法设计并开发了一款相关设备简便、用户体验感强的太极拳学习与反馈应用系统,并在实际中应用。该系统可以检测太极拳学员的整体动作及各肢体段动作是否标准,并给出反馈,学员可以根据反馈结果练习和改善不标准动作,达到提升学习效果的目的。 展开更多
关键词 太极拳学习 人体姿态估计 帧间差分 堆叠沙漏网络 余弦相似度
在线阅读 下载PDF
基于堆叠沙漏网络改进的多人姿态估计 被引量:2
9
作者 梁鸿 任文静 +1 位作者 张千 李传秀 《计算机工程与设计》 北大核心 2022年第2期502-509,共8页
为解决多人姿态估计中小尺度关键点(手腕、脚踝等)定位准确率低的问题,采用自顶向上的方式,结合先进的人体目标检测模型YOLOv3,提出一种基于堆叠沙漏网络改进的多人姿态估计方法。在沙漏网络中融入通道混洗模块,加强不同尺度下多层特征... 为解决多人姿态估计中小尺度关键点(手腕、脚踝等)定位准确率低的问题,采用自顶向上的方式,结合先进的人体目标检测模型YOLOv3,提出一种基于堆叠沙漏网络改进的多人姿态估计方法。在沙漏网络中融入通道混洗模块,加强不同尺度下多层特征之间的跨通道信息交流,提高被遮挡关键点的识别效果;使用注意力机制对沙漏网络原有的残差模块进行特征增强,抑制无用特征并提升有用特征,提高小尺度关键点的识别率。实验结果表明,在MPII数据集上的总体PCK@0.5达到了88.6%,在MSCOCO数据集上的AP@0.75相比原始网络提升了4.6%,验证了所提方法的有效性。 展开更多
关键词 堆叠沙漏网络 人体姿态估计 多尺度特征融合 注意力机制 人体目标检测
在线阅读 下载PDF
基于深度可分离沙漏网络的快速人脸对齐 被引量:2
10
作者 贺怀清 陈琴 惠康华 《计算机工程与设计》 北大核心 2021年第8期2316-2323,共8页
针对沙漏网络应用于人脸对齐中存在网络结构复杂、时间开销大的问题,提出一种带有深度可分离的轻量级沙漏网络。通过知识蒸馏的思想构造轻量级沙漏网络,解决网络结构复杂的问题;在叠层沙漏网络中使用深度可分离卷积,通过深度卷积和逐点... 针对沙漏网络应用于人脸对齐中存在网络结构复杂、时间开销大的问题,提出一种带有深度可分离的轻量级沙漏网络。通过知识蒸馏的思想构造轻量级沙漏网络,解决网络结构复杂的问题;在叠层沙漏网络中使用深度可分离卷积,通过深度卷积和逐点卷积共同作用简化复杂网络,解决时间开销大的问题。实验结果表明,在300w数据集和WFLW数据集上,该方法与主流的人脸对齐方法相比,对齐精度在保持基本不变的情况下,对齐速度具有明显的优势。 展开更多
关键词 沙漏网络 人脸对齐 轻量级 知识蒸馏 深度可分离卷积
在线阅读 下载PDF
An Oracle Bone Inscription Detector Based on Multi-Scale Gaussian Kernels 被引量:1
11
作者 Guoying Liu Shuanghao Chen +1 位作者 Jing Xiong Qingju Jiao 《Applied Mathematics》 2021年第3期224-239,共16页
The detection of Oracle Bone Inscriptions (OBIs) is one of the most fundamental tasks in the study of Oracle Bone, which aims to locate the positions of OBIs on rubbing images. The existing methods are based on the sc... The detection of Oracle Bone Inscriptions (OBIs) is one of the most fundamental tasks in the study of Oracle Bone, which aims to locate the positions of OBIs on rubbing images. The existing methods are based on the scheme of anchor boxes, involving complex network design and a great number of anchor boxes. In order to overcome the problem, this paper proposes a simpler but more effective OBIs detector by using an anchor-free scheme, where shape-adaptive Gaussian kernels are employed to represent the spatial regions of different OBIs. More specifically, to address the problem of misdetection caused by regional overlapping between some tightly distributed OBIs, the character regions are simultaneously represented by multiscale Gaussian kernels to obtain regions with sharp edges. Besides, based on the kernel predictions of different scales, a novel post-processing pipeline is used to obtain accurate predictions of bounding boxes. Experiments show that our OBIs detector has achieved significant results on the OBIs dataset, which greatly outperforms several mainstream object detectors in both speed and efficiency. Dataset is available at http://jgw.aynu.edu.cn. 展开更多
关键词 Oracle Bone Inscriptions Deep Learning Object Detection hourglass network
在线阅读 下载PDF
污染场地修复环境中人体姿态估计算法研究
12
作者 张宝峰 田宇 +1 位作者 朱均超 刘娜 《计算机应用与软件》 北大核心 2023年第2期212-216,235,共6页
针对污染场地修复环境中背景复杂、人体遮挡、视点变化等突出问题,提出一种基于沙漏网络的人体姿态估计算法,在有效过滤复杂背景的同时,提高姿态估计的准确性与鲁棒性。该算法利用感受野与注意力机制,对沙漏网络中的传统残差模块与跳级... 针对污染场地修复环境中背景复杂、人体遮挡、视点变化等突出问题,提出一种基于沙漏网络的人体姿态估计算法,在有效过滤复杂背景的同时,提高姿态估计的准确性与鲁棒性。该算法利用感受野与注意力机制,对沙漏网络中的传统残差模块与跳级连接结构进行了改进。其通过扩大有效感受野面积,提高了人体关键点之间的关联性;通过对人体区域添加掩模,保留住关键人体信息的同时,过滤掉复杂背景。实验表明,提出的模型在MPII多人数据集上mAP检测精度达到83.1%,在MSCOCO Test-dev数据集上平均精度较Mask R-CNN、RMPE模型分别提升了9.6百分点和0.4百分点。 展开更多
关键词 多人姿态估计 沙漏网络 感受野 注意力机制
在线阅读 下载PDF
人体姿态估计网络的轻量化设计
13
作者 高丙坤 马克 +1 位作者 毕洪波 王玲 《实验室研究与探索》 CAS 北大核心 2020年第1期79-82,共4页
以金字塔残差模块为基础,设计了一个轻量化的网络模型。使用深度可分离卷积代替普通的卷积以减少训练的参数,同时加入通道分离模块和通道混合模块来改变特征图通道维数,以加强特征的融合。为保证网络仍然能更完整的提取特征,只对恒等映... 以金字塔残差模块为基础,设计了一个轻量化的网络模型。使用深度可分离卷积代替普通的卷积以减少训练的参数,同时加入通道分离模块和通道混合模块来改变特征图通道维数,以加强特征的融合。为保证网络仍然能更完整的提取特征,只对恒等映射部分进行了通道分离处理,在最后的特征融合加入了通道混合模块,在标准MPII数据集上进行测试。结果表明,轻量化的金字塔残差网络有效地减少了网络的参数,减少了约1/2的参数存储空间并保持相当的准确度,同时复杂度仅为2.83 GFLOs。 展开更多
关键词 姿态估计 沙漏网络 轻量化 金字塔残差模块
在线阅读 下载PDF
YOLOv3剪枝模型的多人姿态估计 被引量:11
14
作者 蔡哲栋 应娜 +2 位作者 郭春生 郭锐 杨鹏 《中国图象图形学报》 CSCD 北大核心 2021年第4期837-846,共10页
目的为了解决复杂环境中多人姿态估计存在的定位和识别等问题,提高多人姿态估计的准确率,减少算法存在的大量冗余参数,提高姿态估计的运行速率,提出了基于批量归一化层(batch normalization, BN)通道剪枝的多人姿态估计算法(YOLOv3 prun... 目的为了解决复杂环境中多人姿态估计存在的定位和识别等问题,提高多人姿态估计的准确率,减少算法存在的大量冗余参数,提高姿态估计的运行速率,提出了基于批量归一化层(batch normalization, BN)通道剪枝的多人姿态估计算法(YOLOv3 prune pose estimator, YLPPE)。方法以目标检测算法YOLOv3(you only look once v3)和堆叠沙漏网络(stacked hourglass network, SHN)算法为基础,通过重叠度K-means算法修改YOLOv3网络锚框以更适应行人目标检测,并训练得到Trimming-YOLOv3网络;利用批量归一化层的缩放因子对Trimming-YOLOv3网络进行循环迭代式通道剪枝,设置剪枝阈值与缩放因子,实现较为有效的模型剪枝效果,训练得到Trim-PruneYOLOv3网络;为了结合单人姿态估计网络,重定义图像尺寸为256×256像素(非正方形图像通过补零实现);再级联4个Hourglass子网络得到堆叠沙漏网络,从而提升整体姿态估计精度。结果利用斯坦福大学的MPII数据集(MPII human pose dataset)进行实验验证,本文算法对姿态估计的准确率达到了83.9%;同时,时间复杂度为O(n2),模型参数量与未剪枝原始YOLOv3相比下降42.9%。结论结合YOLOv3剪枝算法的多人姿态估计方法可以有效减少复杂环境对人体姿态估计的负面影响,实现复杂环境下的多人姿态估计并提高估计精度,有效减少模型冗余参数,提高算法的整体运行速率,能够实现较为准确的多人姿态估计,并具有较好的鲁棒性和泛化能力。 展开更多
关键词 目标检测 多人姿态估计 模型剪枝 YOLOv3 堆叠沙漏网络 MPII数据集
原文传递
有条件生成对抗网络的IVUS图像内膜与中-外膜边界检测 被引量:4
15
作者 袁绍锋 杨丰 +3 位作者 徐琳 吴洋洋 黄靖 刘娅琴 《中国生物医学工程学报》 CAS CSCD 北大核心 2019年第2期146-156,共11页
针对血管内超声(IVUS)图像中各类斑块、超声阴影和血管分支等造成内膜(LU)与中-外膜(MA)边界难以准确检测的问题,提出一种结合堆叠沙漏网络(SHGN)和有条件生成对抗网络(C-GAN)的IVUS内膜与中-外膜检测的改进方法。首先根据血管形态特点... 针对血管内超声(IVUS)图像中各类斑块、超声阴影和血管分支等造成内膜(LU)与中-外膜(MA)边界难以准确检测的问题,提出一种结合堆叠沙漏网络(SHGN)和有条件生成对抗网络(C-GAN)的IVUS内膜与中-外膜检测的改进方法。首先根据血管形态特点,使用旋转、缩放和Gamma变换等方法将图像训练集扩充57倍,降低网络训练过拟合风险;然后利用对抗训练思想,构建基于L1、L2重建损失的联合损失函数,学习超声图像与其对应分割图像的映射关系,将IVUS图像分割为3种不同区域:血管外周组织、斑块区域和内腔区域;最后在图像分割结果上,采用阈值处理方法,检测最终的内膜与中-外膜边界。采用国际标准IVUS图像数据集(10位病人435幅)评价所提出的算法。实验量化评价结果为:内膜计算面积交并比(JM) 93%,面积差异百分比(PAD) 3%,Hausdorff距离(HD) 0.19 mm;中-外膜JM 95%,PAD 3%,HD 0.16 mm。这些指标满足临床诊断要求,性能优于现有的、近年较好的9种算法,以及Pix2Pix模型。在临床实践应用分析中,利用南部战区总医院心血管内科所收集的100幅IVUS图像进行检验,取得较好的分割结果。这表明该方法具有较好的跨数据集泛化性能。 展开更多
关键词 血管内超声 内膜与中-外膜边界检测 有条件生成对抗网络 堆叠沙漏网络 深度学习
在线阅读 下载PDF
结合掩码定位和漏斗网络的6D姿态估计 被引量:5
16
作者 李冬冬 郑河荣 +1 位作者 刘复昌 潘翔 《中国图象图形学报》 CSCD 北大核心 2022年第2期642-652,共11页
目的6D姿态估计是3D目标识别及重建中的一个重要问题。由于很多物体表面光滑、无纹理,特征难以提取,导致检测难度大。很多算法依赖后处理过程提高姿态估计精度,导致算法速度降低。针对以上问题,本文提出一种基于热力图的6D物体姿态估计... 目的6D姿态估计是3D目标识别及重建中的一个重要问题。由于很多物体表面光滑、无纹理,特征难以提取,导致检测难度大。很多算法依赖后处理过程提高姿态估计精度,导致算法速度降低。针对以上问题,本文提出一种基于热力图的6D物体姿态估计算法。方法首先,采用分割掩码避免遮挡造成的热力图污染导致的特征点预测准确率下降问题。其次,基于漏斗网络架构,无需后处理过程,保证算法具有高效性能。在物体检测阶段,采用一个分割网络结构,使用速度较快的YOLOv3(you only look once v3)作为网络骨架,目的在于预测目标物体掩码分割图,从而减少其他不相关物体通过遮挡带来的影响。为了提高掩码的准确度,增加反卷积层提高特征层的分辨率并对它们进行融合。然后,针对关键点采用漏斗网络进行特征点预测,避免残差网络模块由于局部特征丢失导致的关键点检测准确率下降问题。最后,对检测得到的关键点进行位姿计算,通过PnP(perspective-n-point)算法恢复物体的6D姿态。结果在有挑战的Linemod数据集上进行实验。实验结果表明,本文算法的3D误差准确性为82.7%,与热力图方法相比提高了10%;2D投影准确性为98.9%,比主流算法提高了4%;同时达到了15帧/s的检测速度。结论本文提出的基于掩码和关键点检测算法不仅有效提高了6D姿态估计准确性,而且可以维持高效的检测速度。 展开更多
关键词 姿态估计 目标分割 关键点定位 漏斗网络 特征融合
原文传递
基于尺度注意力沙漏网络的头部MRI解剖点自动定位 被引量:2
17
作者 李赛 黎浩江 +2 位作者 刘立志 张天桥 陈洪波 《光学精密工程》 EI CAS CSCD 北大核心 2021年第9期2278-2286,共9页
为了自动定位头部核磁共振成像(Magnetic Resonance Imaging,MRI)中稳定解剖结构点,提出了一种基于沙漏网络(Hourglass Network,HN)的头部MRI图像解剖点自动定位方法。该方法使用HN的基本结构实现多尺度特征的提取与融合,并在融合多尺... 为了自动定位头部核磁共振成像(Magnetic Resonance Imaging,MRI)中稳定解剖结构点,提出了一种基于沙漏网络(Hourglass Network,HN)的头部MRI图像解剖点自动定位方法。该方法使用HN的基本结构实现多尺度特征的提取与融合,并在融合多尺度特征时引入尺度注意力机制,提高解剖结构点的提取精度。利用DSNT(Differentiable Spatial to Numerical Transform)层将卷积神经网络生成的预测热图进行坐标回归来定位解剖点。500例头部MRI图像用于训练,300例图像用于测试,测试结果表明本文提出的方法对四个解剖点的定位准确率均超过了80%,与常用的关键点定位方法相比,该方法取得了最好的效果。该方法可辅助医生进行图像的解剖点标记,为头部图像的自动配准和头部疾病的大数据分析提供技术支持。 展开更多
关键词 头部MR图像 解剖点定位 沙漏网络 尺度注意力 DSNT
在线阅读 下载PDF
一种基于轻量级堆叠沙漏网络的机械臂姿态估计方法 被引量:2
18
作者 王琦 郑飂默 +2 位作者 王诗宇 刘信君 郭威 《小型微型计算机系统》 CSCD 北大核心 2022年第11期2370-2374,共5页
现有的机械臂姿态估计方法通常只考虑如何改进模型的泛化能力,而忽略了模型的效率,因此在实际应用中,开发出的模型参数量和计算量过大.为了解决此问题,本文提出一种新的基于Ghost模块的堆叠沙漏网络(Ghost Module-Based Stacked Hourgla... 现有的机械臂姿态估计方法通常只考虑如何改进模型的泛化能力,而忽略了模型的效率,因此在实际应用中,开发出的模型参数量和计算量过大.为了解决此问题,本文提出一种新的基于Ghost模块的堆叠沙漏网络(Ghost Module-Based Stacked Hourglass Network,Ghost-SHN).Ghost-SHN以堆叠沙漏网络(Stacked hourglass Network,SHN)为基础,构建了具有两个堆的堆叠沙漏网络,并通过把堆叠沙漏网络中的普通卷积替换成轻量的Ghost模块来压缩模型,能够更好地在机械臂上进行部署,实现了轻量级的机械臂姿态估计.四个典型数据集上的实验结果表明,Ghost-SHN相比同类模型,不仅减少了参数量和计算量,而且泛化性能很好,取得了比堆叠沙漏网络更好的精度. 展开更多
关键词 机械臂姿态估计 关键点检测 堆叠沙漏网络 Ghost模块 模型压缩
在线阅读 下载PDF
基于引导对抗网络的人体深度图像修补方法 被引量:2
19
作者 阴敬方 朱登明 +1 位作者 石敏 王兆其 《系统仿真学报》 CAS CSCD 北大核心 2020年第7期1312-1321,共10页
移动设备配备的小型深度相机采集到的人体深度图像存在严重的孔洞问题。针对该问题,提出基于深度学习的引导对抗网络。使用基于堆叠沙漏网络的引导器从RGB图像中提取人体部分分割特征和深度类别特征;在上述人体特征引导下,使用独特的生... 移动设备配备的小型深度相机采集到的人体深度图像存在严重的孔洞问题。针对该问题,提出基于深度学习的引导对抗网络。使用基于堆叠沙漏网络的引导器从RGB图像中提取人体部分分割特征和深度类别特征;在上述人体特征引导下,使用独特的生成器修复人体深度图像中的孔洞。为使结果更加逼真,加入判别器在网络训练过程中对生成器进行优化调整。实验结果显示,该方法在现有的人体数据集和小型深度相机采集的数据集上,都能很好解决孔洞问题,均取得比现有方法更好的效果。 展开更多
关键词 深度相机 人体深度图像修复 深度学习 堆叠沙漏网络 引导对抗网络
原文传递
基于多尺度对抗学习的人体姿态估计 被引量:1
20
作者 李晓明 黄慧 +3 位作者 应毅 徐建华 曾岳 刘洋 《实验室研究与探索》 CAS 北大核心 2020年第11期35-39,共5页
为解决现有基于对抗学习的人体姿态估计算法对人体尺度变化敏感问题,提出了一种基于多尺度对抗学习的人体姿态估计模型。该模型通过堆栈沙漏网络分别构建对抗网络中的生成器和判别器,再分别在生成器和判别器中引入多尺度监督损失函数,... 为解决现有基于对抗学习的人体姿态估计算法对人体尺度变化敏感问题,提出了一种基于多尺度对抗学习的人体姿态估计模型。该模型通过堆栈沙漏网络分别构建对抗网络中的生成器和判别器,再分别在生成器和判别器中引入多尺度监督损失函数,从而提高整个网络检测不同尺度人体部件的性能。为证明方法的有效性,采用了LSP、LSPE、FLIC和MPII 4个数据集进行人体姿态估计模型的训练与测试。结果表明,引入多尺度信息的人体姿态估计模型可提高0.7%的检测正确率;与现有的部分人体姿态估计算法相比,多尺度对抗学习算法具有更高的估计正确率。 展开更多
关键词 人体姿态估计 对抗学习 多尺度监督 沙漏网络
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部