期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
改进伪三维残差网络的微表情识别方法 被引量:1
1
作者 肖振久 陶嘉伟 《软件导刊》 2024年第11期63-73,共11页
针对微表情特征捕捉难度大、识别率低存在的问题,提出一种改进伪三维残差网络的微表情识别方法。首先,预处理数据集样本后,在伪三维残差网络(Pseudo-3DResNet)设计阶段,针对基本3D残差单元层间顺序不合理、输出值不稳定及信息传播阻塞3... 针对微表情特征捕捉难度大、识别率低存在的问题,提出一种改进伪三维残差网络的微表情识别方法。首先,预处理数据集样本后,在伪三维残差网络(Pseudo-3DResNet)设计阶段,针对基本3D残差单元层间顺序不合理、输出值不稳定及信息传播阻塞3个问题,设计了Pseudo-3D-SS、Pseudo-3D-PS、Pseudo-3D-SSS不同的瓶颈结构,并应用到4个残差块中。其次,将两个独立设计的卷积层和池化层应用在不同残差块间过滤表征不强的微表情序列,以进一步突出有价值的特征信息和去除冗余,实现时空特征提取。最后,为进一步降低亮度变化对光流特征提取的影响,提升追踪特征点速度,改进了基于L_(1)范数的全变分光流法,利用TV-OFM方法提取光流特征以得到每个微表情的水平光流序列和垂直光流序列。实验表明,所提方法相较于近期方法的未加权F_(1)值(UF_(1))、未加权平均召回率(UAR)分别提升3.61%、2.92%;在光流法比较实验中,所提方法追踪特征点的速度相较于比较方法提升30.08%;将包含改进的4个残差块变体与其他网络变体比较发现,所提模型的Avg(UF_(1)+UAR)提升2.5%,网络结构具有更强的泛化和特征提取能力;在层中叠加卷积和池化操作能更平衡地提取特征,进一步提高识别率,使模型更具鲁棒性和先进性。 展开更多
关键词 微表情识别 TV-OFM光流法 伪三维残差网络 残差块 LOOCV评估方法
在线阅读 下载PDF
HgaNets:Fusion of Visual Data and Skeletal Heatmap for Human Gesture Action Recognition
2
作者 Wuyan Liang Xiaolong Xu 《Computers, Materials & Continua》 SCIE EI 2024年第4期1089-1103,共15页
Recognition of human gesture actions is a challenging issue due to the complex patterns in both visual andskeletal features. Existing gesture action recognition (GAR) methods typically analyze visual and skeletal data... Recognition of human gesture actions is a challenging issue due to the complex patterns in both visual andskeletal features. Existing gesture action recognition (GAR) methods typically analyze visual and skeletal data,failing to meet the demands of various scenarios. Furthermore, multi-modal approaches lack the versatility toefficiently process both uniformand disparate input patterns.Thus, in this paper, an attention-enhanced pseudo-3Dresidual model is proposed to address the GAR problem, called HgaNets. This model comprises two independentcomponents designed formodeling visual RGB (red, green and blue) images and 3Dskeletal heatmaps, respectively.More specifically, each component consists of two main parts: 1) a multi-dimensional attention module forcapturing important spatial, temporal and feature information in human gestures;2) a spatiotemporal convolutionmodule that utilizes pseudo-3D residual convolution to characterize spatiotemporal features of gestures. Then,the output weights of the two components are fused to generate the recognition results. Finally, we conductedexperiments on four datasets to assess the efficiency of the proposed model. The results show that the accuracy onfour datasets reaches 85.40%, 91.91%, 94.70%, and 95.30%, respectively, as well as the inference time is 0.54 s andthe parameters is 2.74M. These findings highlight that the proposed model outperforms other existing approachesin terms of recognition accuracy. 展开更多
关键词 Gesture action recognition multi-dimensional attention pseudo-3D skeletal heatmap
在线阅读 下载PDF
基于迁移学习的动态孤立手语识别方法
3
作者 王特 郭莹 吴春迪 《计算机与网络》 2025年第6期609-615,共7页
手语是正常人与听障人士的沟通桥梁,而动态手语是其最为重要的分支,在现实生活中有着重要的研究意义。针对动态手语识别中识别难度大、识别率低等问题,对手语数据集进行提取关键帧等预处理操作,使用深度学习的方法,以降维后的3DResNet... 手语是正常人与听障人士的沟通桥梁,而动态手语是其最为重要的分支,在现实生活中有着重要的研究意义。针对动态手语识别中识别难度大、识别率低等问题,对手语数据集进行提取关键帧等预处理操作,使用深度学习的方法,以降维后的3DResNet卷积神经网络(Convolutional Neural Network,CNN)为基础,构建网络基础模型。实验采用迁移学习方法预训练模型,加快了网络的优化过程,并对其引入注意力机制以增强对手部信息的关注,提升了识别精度,其在CSL100手语数据集上的验证识别准确率达到95.11%,与其他方式对比,该方法具有较高的识别率,验证了此改进算法的有效性与可行性。 展开更多
关键词 动态手语 关键帧 3dresnet 卷积神经网络 注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部