期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于ResNet50的图像自识别技术在城市体检中的应用研究
1
作者 石星宇 韩迪 +2 位作者 刘奕巧 王昊 潘嵩 《建筑科学》 北大核心 2025年第10期249-261,共13页
城市体检作为查找城市病因和促进城市更新的重要手段,不仅能够保障居民的生活质量和安全,还能促进城市的可持续发展。然而,当前城市体检在数据检查阶段依赖人工检查照片筛查问题,主观性较强且效率低下。为提升该阶段的效率,本文采用了1... 城市体检作为查找城市病因和促进城市更新的重要手段,不仅能够保障居民的生活质量和安全,还能促进城市的可持续发展。然而,当前城市体检在数据检查阶段依赖人工检查照片筛查问题,主观性较强且效率低下。为提升该阶段的效率,本文采用了1种基于深度学习的Res Net50图像分类算法,针对与居民安全直接相关的关键指标—单元门口未安装监控、单元门口未安装标识牌和楼梯踏步缺损—的照片进行自动分类。首先,采用在Image Net数据集上预训练的Res Net50模型,并仅微调最后一层的方法进行训练。结果显示,该方法在识别楼梯踏步缺损和单元门口未安装监控两类问题的准确率较高,分别为98.59%和97.02%,而单元门口未安装标识牌的准确率相对较低,为87.57%。与VGG16和Efficient Net-b0相比,Res Net50的表现略优于其他模型,尤其在单元门口未安装监控类别中准确率分别高出1.01%和4.67%。然而,这一方法在所有类别上的效果不一,说明仅微调最后一层的训练方式可能无法满足城市体检的多样化需求。鉴于此,本文引入了另外2种训练策略:第1种是微调在Image Net数据集上预训练的Res Net50模型的所有层,使其在新数据集上更好地适应所有特征的分布;第2种是不使用任何预训练权重,所有层的权重均从随机初始化开始训练。结果显示,微调所有层的方法在识别单元门口特征上表现良好,其中单元门口未安装监控的准确率达到100%,未安装标识牌的准确率为99.68%。而楼梯踏步缺损类别已经有了较高的准确率,因此性能提升并不明显。当不考虑图像标注和模型训练时,3种训练策略均可以将检查时间从16.8 h缩短至0.5 h,节省约97%的时间。本研究为城市体检提供了1种降本增效的新方法,通过引入基于Res Net50的图像分类模型,实现了自动化的数据检查,显著提高了数据检查阶段的效率和准确性。该方法不仅减少了人工成本,还能应对大规模城市体检的需求,具备广泛的应用价值。 展开更多
关键词 城市体检 深度学习 图像分类 住房维度 Res net50
原文传递
基于Res2Net的人脸表情识别方法 被引量:2
2
作者 唐宏伟 丁祥 +3 位作者 邓嘉鑫 高方坤 罗佳强 王军权 《邵阳学院学报(自然科学版)》 2024年第2期28-35,共8页
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据... 为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。 展开更多
关键词 表情识别 Focal Loss函数 广义平均池化模块 Res2net50
在线阅读 下载PDF
基于卷积神经网络的农作物病虫害检测研究 被引量:5
3
作者 白雪松 吴建平 +2 位作者 景文超 何旭鑫 余咏 《计算机技术与发展》 2022年第12期200-205,共6页
农作物病虫害图像采集困难,且公共数据集较少,因此使用单一网络模型识别准确率不高。常用的数据增强方法只能对图像进行像素空间的变换,不能进行语义转换。对此,研究并提出基于隐式语义数据增强算法的CBAM-Res2Net50模型:该模型使用Res2... 农作物病虫害图像采集困难,且公共数据集较少,因此使用单一网络模型识别准确率不高。常用的数据增强方法只能对图像进行像素空间的变换,不能进行语义转换。对此,研究并提出基于隐式语义数据增强算法的CBAM-Res2Net50模型:该模型使用Res2Net50主干网络,从多尺度学习图像信息,加载预训练模型部分参数,提高模型的收敛速度;在网络残差块中添加混合注意力模块,提取并保留关键特征;训练过程中使用隐式语义数据增强算法对提取的深层网络空间特征进行语义扩充增强,提高模型的泛化能力。改进模型与现有模型在AI Challenger 2018农作物病虫害数据集上的对比实验结果表明:改进模型具有较高的识别率,其分类准确率达88.33%。改进后的模型通过挖掘相似病虫害图像的语义信息,在一定程度上解决了深度网络中由于数据不足导致的过拟合等问题。 展开更多
关键词 农作物病虫害 卷积神经网络 CBAM-Res2net50 迁移学习 注意力模块 隐式语义数据增强
在线阅读 下载PDF
非接触式笼养蛋鸡核心体温检测方法 被引量:6
4
作者 严煜 盛哲雅 +3 位作者 谷月 衡一帆 周昊博 王树才 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期312-321,共10页
针对笼养条件下蛋鸡核心温度测量工作效率低下的问题,提出了一种利用红外热图像结合深度学习的蛋鸡核心温度检测方法。首先通过采集172只蛋鸡的10994幅红外热图像制作数据集,利用目标检测网络YOLO v8s提取作为感兴趣区域(Region of inte... 针对笼养条件下蛋鸡核心温度测量工作效率低下的问题,提出了一种利用红外热图像结合深度学习的蛋鸡核心温度检测方法。首先通过采集172只蛋鸡的10994幅红外热图像制作数据集,利用目标检测网络YOLO v8s提取作为感兴趣区域(Region of interest,ROI)的鸡脸图像;再利用改进的深度卷积神经网络对提取的蛋鸡ROI图像以及实时采集的蛋鸡泄殖腔温度进行回归预测。实验显示,目标检测算法的检测准确率达到99.38%,平均精度均值达到99.9%,召回率达到99.87%,3项评价指标均高于YOLO v4s、YOLO v5s、YOLO v7、YOLOX-s目标检测算法;在深度卷积神经网络算法上,同时将MobileNetV3、GhostNet、ShuffleNetV2、RegNet、ConvNeXt、Res2Net以及MobileVIT共7种分类模型修改为回归模型,利用蛋鸡ROI图像进行训练,其中,Res2Net模型对蛋鸡核心体温估测拟合效果最好,在测试集上估测的决定系数R^(2)为0.9565、调整后决定系数R^(2)_(adj)为0.95631,均高于其他回归模型;为进一步提高预测精度,在Res2Net50回归模型的Bottle2block结构之后分别插入SE(Squeeze-and-excitation)模块、CBAM(Convolutional block attention module)模块、CA(Coordinate attention)模块、ECA(Efficient channel attention)模块,其中利用CA模块改进后的算法在测试集上的R^(2)为0.97364、R^(2)_(adj)为0.97352,均高于其他改进方法;利用目标检测网络和回归网络搭建蛋鸡核心体温估测模型,对9只蛋鸡进行体温估测试验,结果显示ROI均能完整找出,且估测体温平均绝对误差(Mean absolute error,MAE)为0.153℃。因此,本研究提出的目标检测+深度神经网络模型为红外热图像下蛋鸡核心温度预测提供了较好的自动化检测方法。 展开更多
关键词 笼养蛋鸡 核心体温 YOLO v8s-Res2net50 红外热成像
在线阅读 下载PDF
国标麻将的多尺度骨干神经网络模型 被引量:1
5
作者 代君学 李霞丽 +1 位作者 刘博 王昭琦 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期137-144,共8页
在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数... 在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数据,做出更准确的游戏策略。基于IJCAI 2020 Champion的对局数据,对训练数据进行数据增强。采用增强后的数据,在NVIDAI GeForce RTX3090 LapTop GPU上进行了5天的监督学习训练,训练出的模型有52 M参数,动作准确率达到93.47%,弃牌准确率达到83.93%,鸣牌准确率达到97.56%。将提出的模型部署到北京大学开发的Botzone平台上,进入天梯榜前1%。 展开更多
关键词 深度学习 麻将 卷积神经网络 Res2net50 多尺度骨干架构
在线阅读 下载PDF
改进 Res2Net和注意力的中药饮片识别模型 被引量:2
6
作者 谷瑞 宋翠玲 李元昊 《国外电子测量技术》 2024年第9期130-140,共11页
中药饮片是指药材经炮制后可直接用于中医临床或制剂生产的药品,针对中药饮片种类繁多、形状各异、鉴别困难的问题,提出一种改进Res2Net和注意力的中药饮片识别模型BIM-Res2Net50-IECA。首先,在Res2Net的基础上引入双向融合策略,促进不... 中药饮片是指药材经炮制后可直接用于中医临床或制剂生产的药品,针对中药饮片种类繁多、形状各异、鉴别困难的问题,提出一种改进Res2Net和注意力的中药饮片识别模型BIM-Res2Net50-IECA。首先,在Res2Net的基础上引入双向融合策略,促进不同尺度特征之间的有效交互,获取更精细和丰富的特征信息;其次,使用最大池化改进ECA注意力机制,同时增强全局视角和显著性特征,突出中药饮片重要的特征区域;最后,结合Softmax Loss和Center Loss构造联合损失函数,有效地调节类内以及类间距离,提高分类的准确性。实验表明,基线模型能有效提取多尺度特征,BIM-Res2Net50-IECA在构建的16类中药饮片数据集上的准确率、精确率、召回率和F1-Score分别为94.74%、94.27%、94.83%和94.55%,与先进的Tansformer分类模型相比,具有更低的计算复杂度和更高的准确率,能为中药饮片的智能识别提供有力支持。 展开更多
关键词 中药饮片 BIM-Res2net50-IECA 多尺度特征 注意力机制
原文传递
基于神经网络的图像分类模型的设计与实现
7
作者 刘鹏 《无线互联科技》 2022年第22期53-55,共3页
传统的图像分类方法是采用人工分类图像的即由人眼观察到色彩特征进行特征分类的。随着人工智能时代的到来,图像自动分类处理技术已成为一项研究热点。研究以残差神经网络模型中的Res Net50为目标场景,以残差神经网络在图像分类中的应... 传统的图像分类方法是采用人工分类图像的即由人眼观察到色彩特征进行特征分类的。随着人工智能时代的到来,图像自动分类处理技术已成为一项研究热点。研究以残差神经网络模型中的Res Net50为目标场景,以残差神经网络在图像分类中的应用及网络优化为切入点,将Res Net50神经网络模型应用到CIFAR10图像集的图像分类问题上,从优化网络模型和优化特征层抽取技术两个方面,对图像分类模型进行了改进。同时对梯度消失,过度拟合等一系列训练过程中可能会遇到的问题进行分析,通过在Res Net50模型的两个卷积层间增加Dropout层和在图像加载到Res Net50模型前进行一系列图像增强技术以便能改善残差网络的结构,从而达到最好的图像分类效果。 展开更多
关键词 图像分类 残差神经网络 Res net50模型 图像增强技术
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部