随着深度学习的快速发展,计算机视觉领域对图像的分类研究不仅仅局限于识别出物体的类别,更需要在传统图像分类任务的基础上进行更细致的类别划分。通过对现有细粒度图像分类算法和模型的分析研究,提出一种基于Xception模型与WSDAN(weak...随着深度学习的快速发展,计算机视觉领域对图像的分类研究不仅仅局限于识别出物体的类别,更需要在传统图像分类任务的基础上进行更细致的类别划分。通过对现有细粒度图像分类算法和模型的分析研究,提出一种基于Xception模型与WSDAN(weakly supervised data augmentation network)弱监督数据增强的方法相结合的深度学习网络应用于细粒度图像分类任务。该方法以Xception网络作为骨干网络和特征提取网络、利用改进的WSDAN模型进行数据增强,并把增强后的图像反馈回网络作为输入图像来增强网络的泛化能力。在常用的细粒度图像数据集和NABirds数据集上进行实验验证,得到的分类正确率分别为89.28%、91.18%、94.47%、93.04%和88.4%。实验结果表明,与WSDAN(Pytorch)模型及其他多个主流细粒度分类算法相比,该方法取得了更好的分类结果。展开更多
针对单一卷积神经网络对多种复杂背景下手势图像识别准确率较低等问题,提出一种基于改进Xception网络的手势图像识别方法。该方法使用密集连接代替残差连接,在保留跳跃连接效果的同时减少深度可分离卷积模块和网络通道数量,不仅有效利...针对单一卷积神经网络对多种复杂背景下手势图像识别准确率较低等问题,提出一种基于改进Xception网络的手势图像识别方法。该方法使用密集连接代替残差连接,在保留跳跃连接效果的同时减少深度可分离卷积模块和网络通道数量,不仅有效利用了网络参数,而且降低了模型大小;其还融合SE模块强化重要特征,采用特征金字塔结构获得包含多尺度语义的特征张量,有助于网络分类。验证实验结果表明,改进网络的计算参数量为原始Xception网络的1/5,对NUS-Ⅱ手势数据集的识别准确率达到99.64%,比原始Xception网络提高了1.09%;对Sign Language for Numbers手势数据集的识别准确率达到99.7%,比原始Xception网络提高了0.15%。与ResNet50、DenseNet121和InceptionV3等常用手势识别网络进行比较,改进网络在训练时间、模型大小、计算参数量和识别准确率方面均表现更优。基于改进Xception网络的手势识别方法在多种复杂背景因素干扰下仍具有较高的识别准确率,其泛化性强、参数量少,综合性能优于许多常用网络。展开更多
文摘随着深度学习的快速发展,计算机视觉领域对图像的分类研究不仅仅局限于识别出物体的类别,更需要在传统图像分类任务的基础上进行更细致的类别划分。通过对现有细粒度图像分类算法和模型的分析研究,提出一种基于Xception模型与WSDAN(weakly supervised data augmentation network)弱监督数据增强的方法相结合的深度学习网络应用于细粒度图像分类任务。该方法以Xception网络作为骨干网络和特征提取网络、利用改进的WSDAN模型进行数据增强,并把增强后的图像反馈回网络作为输入图像来增强网络的泛化能力。在常用的细粒度图像数据集和NABirds数据集上进行实验验证,得到的分类正确率分别为89.28%、91.18%、94.47%、93.04%和88.4%。实验结果表明,与WSDAN(Pytorch)模型及其他多个主流细粒度分类算法相比,该方法取得了更好的分类结果。
文摘针对单一卷积神经网络对多种复杂背景下手势图像识别准确率较低等问题,提出一种基于改进Xception网络的手势图像识别方法。该方法使用密集连接代替残差连接,在保留跳跃连接效果的同时减少深度可分离卷积模块和网络通道数量,不仅有效利用了网络参数,而且降低了模型大小;其还融合SE模块强化重要特征,采用特征金字塔结构获得包含多尺度语义的特征张量,有助于网络分类。验证实验结果表明,改进网络的计算参数量为原始Xception网络的1/5,对NUS-Ⅱ手势数据集的识别准确率达到99.64%,比原始Xception网络提高了1.09%;对Sign Language for Numbers手势数据集的识别准确率达到99.7%,比原始Xception网络提高了0.15%。与ResNet50、DenseNet121和InceptionV3等常用手势识别网络进行比较,改进网络在训练时间、模型大小、计算参数量和识别准确率方面均表现更优。基于改进Xception网络的手势识别方法在多种复杂背景因素干扰下仍具有较高的识别准确率,其泛化性强、参数量少,综合性能优于许多常用网络。