期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于MAPFormer的人体动作识别研究
1
作者 陆静芳 智敏 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2024年第1期44-52,共9页
人体动作识别可以为医疗、安全和娱乐等许多不同的应用程序提供基础服务,逐渐成为研究热点。为解决Vision Transformer(ViT)计算复杂度过高和参数量过大的问题,利用池化与序列长度的线性复杂性以及无参数的优势,提出MAPFormer框架模型,... 人体动作识别可以为医疗、安全和娱乐等许多不同的应用程序提供基础服务,逐渐成为研究热点。为解决Vision Transformer(ViT)计算复杂度过高和参数量过大的问题,利用池化与序列长度的线性复杂性以及无参数的优势,提出MAPFormer框架模型,引入并行池化模块代替ViT的多头注意力模块,利用深度可分离卷积增强局部特征,同时进一步降低参数量,并将该方法与人体动作识别任务相结合,提高动作识别准确度。实验结果在Miniimagnet数据集和MS COCO数据集分别达到88.3%和89.1%的实验精度,相比ViT实验精度分别提高4.3%和2.1%,参数量减少65.2 M和58.3 M。 展开更多
关键词 mapformer 人体动作识别 VIT 池化 深度可分离卷积
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部