期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Res2Net的人脸表情识别方法 被引量:2
1
作者 唐宏伟 丁祥 +3 位作者 邓嘉鑫 高方坤 罗佳强 王军权 《邵阳学院学报(自然科学版)》 2024年第2期28-35,共8页
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据... 为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。 展开更多
关键词 表情识别 Focal Loss函数 广义平均池化模块 res2net50
在线阅读 下载PDF
国标麻将的多尺度骨干神经网络模型 被引量:1
2
作者 代君学 李霞丽 +1 位作者 刘博 王昭琦 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期137-144,共8页
在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数... 在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数据,做出更准确的游戏策略。基于IJCAI 2020 Champion的对局数据,对训练数据进行数据增强。采用增强后的数据,在NVIDAI GeForce RTX3090 LapTop GPU上进行了5天的监督学习训练,训练出的模型有52 M参数,动作准确率达到93.47%,弃牌准确率达到83.93%,鸣牌准确率达到97.56%。将提出的模型部署到北京大学开发的Botzone平台上,进入天梯榜前1%。 展开更多
关键词 深度学习 麻将 卷积神经网络 res2net50 多尺度骨干架构
在线阅读 下载PDF
改进 Res2Net和注意力的中药饮片识别模型
3
作者 谷瑞 宋翠玲 李元昊 《国外电子测量技术》 2024年第9期130-140,共11页
中药饮片是指药材经炮制后可直接用于中医临床或制剂生产的药品,针对中药饮片种类繁多、形状各异、鉴别困难的问题,提出一种改进Res2Net和注意力的中药饮片识别模型BIM-Res2Net50-IECA。首先,在Res2Net的基础上引入双向融合策略,促进不... 中药饮片是指药材经炮制后可直接用于中医临床或制剂生产的药品,针对中药饮片种类繁多、形状各异、鉴别困难的问题,提出一种改进Res2Net和注意力的中药饮片识别模型BIM-Res2Net50-IECA。首先,在Res2Net的基础上引入双向融合策略,促进不同尺度特征之间的有效交互,获取更精细和丰富的特征信息;其次,使用最大池化改进ECA注意力机制,同时增强全局视角和显著性特征,突出中药饮片重要的特征区域;最后,结合Softmax Loss和Center Loss构造联合损失函数,有效地调节类内以及类间距离,提高分类的准确性。实验表明,基线模型能有效提取多尺度特征,BIM-Res2Net50-IECA在构建的16类中药饮片数据集上的准确率、精确率、召回率和F1-Score分别为94.74%、94.27%、94.83%和94.55%,与先进的Tansformer分类模型相比,具有更低的计算复杂度和更高的准确率,能为中药饮片的智能识别提供有力支持。 展开更多
关键词 中药饮片 BIM-res2net50-IECA 多尺度特征 注意力机制
原文传递
基于卷积神经网络的农作物病虫害检测研究 被引量:4
4
作者 白雪松 吴建平 +2 位作者 景文超 何旭鑫 余咏 《计算机技术与发展》 2022年第12期200-205,共6页
农作物病虫害图像采集困难,且公共数据集较少,因此使用单一网络模型识别准确率不高。常用的数据增强方法只能对图像进行像素空间的变换,不能进行语义转换。对此,研究并提出基于隐式语义数据增强算法的CBAM-Res2Net50模型:该模型使用Res2... 农作物病虫害图像采集困难,且公共数据集较少,因此使用单一网络模型识别准确率不高。常用的数据增强方法只能对图像进行像素空间的变换,不能进行语义转换。对此,研究并提出基于隐式语义数据增强算法的CBAM-Res2Net50模型:该模型使用Res2Net50主干网络,从多尺度学习图像信息,加载预训练模型部分参数,提高模型的收敛速度;在网络残差块中添加混合注意力模块,提取并保留关键特征;训练过程中使用隐式语义数据增强算法对提取的深层网络空间特征进行语义扩充增强,提高模型的泛化能力。改进模型与现有模型在AI Challenger 2018农作物病虫害数据集上的对比实验结果表明:改进模型具有较高的识别率,其分类准确率达88.33%。改进后的模型通过挖掘相似病虫害图像的语义信息,在一定程度上解决了深度网络中由于数据不足导致的过拟合等问题。 展开更多
关键词 农作物病虫害 卷积神经网络 CBAM-res2net50 迁移学习 注意力模块 隐式语义数据增强
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部