期刊文献+
共找到293篇文章
< 1 2 15 >
每页显示 20 50 100
基于像素距离和VGG16网络的脚手架安全间距检测
1
作者 郭爽 《机械工程与自动化》 2026年第1期157-160,共4页
脚手架应用过程中,纵横间距不一致,导致重合交点处安全间距的风险值较高,存在难以确认横杆间距和立杆间距的问题。针对这一问题,提出基于像素距离和VGG16网络的脚手架安全间距检测方法。应用VGG16网络进行脚手架骨架的提取,并通过引入SE... 脚手架应用过程中,纵横间距不一致,导致重合交点处安全间距的风险值较高,存在难以确认横杆间距和立杆间距的问题。针对这一问题,提出基于像素距离和VGG16网络的脚手架安全间距检测方法。应用VGG16网络进行脚手架骨架的提取,并通过引入SE(Squeeze-and-Excitation)注意力模块提高特征提取能力,将提取的骨架图根据双阈值自适应二值化方法进行处理,以减少干扰并保留关键信息,通过计算像素点的4邻域之和标记潜在脚手架交点,并删除重合交点,在处理后的脚手架交点集合中,计算相邻交点之间的欧式距离,分析重合交点处安全间距的风险,并通过标靶法将像素距离转换为实际距离,以判断脚手架的各间距是否符合安全标准,实现了脚手架安全间距检测。实验结果表明:该方法能够提取出清晰、连续的脚手架骨架图,检测得到的横杆间距和立杆间距与实际间距的差值均在±5mm以内。 展开更多
关键词 像素距离 vgg16网络 SE注意力模块 双阈值二值化 脚手架安全间距 欧式距离
在线阅读 下载PDF
基于改进VGG16网络的失能老人表情识别研究 被引量:2
2
作者 何巍 李苏 《四川师范大学学报(自然科学版)》 2025年第3期383-391,共9页
为能更好地关注失能老人的情绪状态,采用VGG16作为表情识别的基础模型,并在此基础上进行优化改进.首先,在特征层上将激活函数改用SiLU函数,并添加批归一化层;然后,在分类层上采用自适应平均池化处理图像,同时利用卷积层实现全连接效果,... 为能更好地关注失能老人的情绪状态,采用VGG16作为表情识别的基础模型,并在此基础上进行优化改进.首先,在特征层上将激活函数改用SiLU函数,并添加批归一化层;然后,在分类层上采用自适应平均池化处理图像,同时利用卷积层实现全连接效果,避免参数过多和过拟合问题;最后,通过SENet通道注意力机制迭代式地融合相同通道数的卷积层,实现浅层与深层特征的交互,丰富人脸表情特征提取.实验结果表明,在FER2013和CK+数据集上的识别准确率分别达到72.50%和98.70%,与基础方法对比分别提高8.20%和3.90%,实验表明改进的方法能够提高表情识别率,具有一定的先进性. 展开更多
关键词 vgg16 表情识别 自适应平均化 通道注意力机制
在线阅读 下载PDF
基于VGG16框架的无人机自适应深度感知火灾检测国内外现状研究
3
作者 方月娥 《张江科技评论》 2025年第10期31-33,共3页
当前,火灾预警主要依赖视频检测和近远程设备。视频检测中的深度学习算法效率较高,但近远程设备存在室外施工困难、成本高昂的问题,传统深度视频检测则面临小目标火点精度不足、误报漏报率高的瓶颈。鉴于深度学习在大范围火点检测中的... 当前,火灾预警主要依赖视频检测和近远程设备。视频检测中的深度学习算法效率较高,但近远程设备存在室外施工困难、成本高昂的问题,传统深度视频检测则面临小目标火点精度不足、误报漏报率高的瓶颈。鉴于深度学习在大范围火点检测中的高精度表现,将自适应深度感知火灾检测算法应用于无人机具有较大潜力。该算法通过自适应动态颜色空间模型初检疑似火区,在VGG16中加入感知网络以增强适配性、减少冗余,并结合深度可分离技术降低计算量,从而提升速度。 展开更多
关键词 无人机 vgg16 自适应 深度感知
在线阅读 下载PDF
基于SA改进VGG16算法的YB55包装机喷码图像识别
4
作者 张维琛 金姝彬 +3 位作者 吉鹏 王伟 刘昊喆 付志强 《印刷与数字媒体技术研究》 北大核心 2025年第2期38-46,共9页
为解决YB55包装机喷码过程中字符图像识别精度低问题,本研究采用全局阈值法,对喷码字符图像进行二值化处理。基于最小割算法,对二值化图像进行单一字符提取。利用VGG16算法,进行喷码字符库训练和喷码字符图像识别。通过对比Transformer... 为解决YB55包装机喷码过程中字符图像识别精度低问题,本研究采用全局阈值法,对喷码字符图像进行二值化处理。基于最小割算法,对二值化图像进行单一字符提取。利用VGG16算法,进行喷码字符库训练和喷码字符图像识别。通过对比Transformer算法、RCNN算法以及YOLOv4算法,对VGG16算法的准确性进行评价。利用模拟退火(SA)-VGG16算法,对VGG16算法识别错误的字符进行二次识别。结果表明,基于全阈值和最小割算法,可获得完整的单一喷码字符图像;当VGG16算法迭代27次时,训练模型的准确度可达0.987;利用VGG16算法,对不同喷码字符图像中字符的识别精度均大于0.95;相较于其他三种算法,VGG16算法准确率分别提升了7.87%、5.11%和4.44%,说明该算法可更精准预测喷码字符;该算法还可修正错误的识别,识别精度可达到0.84以上。本研究可为日后喷码设备智能化提供理论基础。 展开更多
关键词 全阈值法 最小割算法 vgg16算法 喷码字符识别
在线阅读 下载PDF
锐化处理和优化器对VGG16在印文种类鉴别中影响的研究 被引量:1
5
作者 张询 于彬 《中国人民公安大学学报(自然科学版)》 2025年第1期7-16,共10页
探讨了图像锐化处理和优化器选择对VGG16模型在印章印文种类鉴别任务中的影响。结合OpenCV进行图像预处理和锐化处理,评估了SGD与Adam优化器的性能表现。实验结果表明,图像锐化显著提升了模型的特征提取能力和分类精度,而SGD优化器在验... 探讨了图像锐化处理和优化器选择对VGG16模型在印章印文种类鉴别任务中的影响。结合OpenCV进行图像预处理和锐化处理,评估了SGD与Adam优化器的性能表现。实验结果表明,图像锐化显著提升了模型的特征提取能力和分类精度,而SGD优化器在验证集和测试集上的准确率均超过95%,且在收敛速度和稳定性方面优于Adam。因此,适当的图像锐化处理和优化器选择能够有效提高VGG16模型的分类性能,未来可通过扩展数据集和优化算法进一步提升印章印文识别的效率和鲁棒性。 展开更多
关键词 印章印文检验 卷积神经网络 OPENCV vgg16模型 图像锐化 优化器
在线阅读 下载PDF
融合VGG16和关键点信息的手语识别研究 被引量:1
6
作者 佟婷 王书芹 +3 位作者 潘佳雯 李建宇 任涛 韩嘉俊 《软件工程》 2025年第8期22-25,47,共5页
手语识别在帮助听障人士与健听人建立有效的沟通中发挥着重要作用。随着人工智能技术的快速发展,越来越多的深度学习方法被应用于手语识别领域。因此,提出了一种基于预训练VGG16模型和手部关键点信息的手语识别模型:Full-VGG16。该模型... 手语识别在帮助听障人士与健听人建立有效的沟通中发挥着重要作用。随着人工智能技术的快速发展,越来越多的深度学习方法被应用于手语识别领域。因此,提出了一种基于预训练VGG16模型和手部关键点信息的手语识别模型:Full-VGG16。该模型通过VGG16提取图像特征,并融合通过mediaPipe抽取的关键点特征来进行手语识别。实验结果表明,Full-VGG16模型在手语识别任务中表现优异,准确率达到99.52%。通过消融实验,验证了图像特征和关键点特征的有效性,显示出多模态融合方法的优势。 展开更多
关键词 手语识别 vgg16 手部关键点 MediaPipe
在线阅读 下载PDF
基于改进VGG16网络模型的人脸疲劳检测方法
7
作者 黄尚安 阮太元 +2 位作者 周昊 蔡雄友 韩冰 《科学技术创新》 2025年第16期105-109,共5页
疲劳驾驶是道路交通安全中的重要隐患,人脸疲劳检测是帮助解决疲劳驾驶的重要方法。当前人脸疲劳检测众多方法存在模型训练复杂、精度低、耗时慢等问题,针对人脸疲劳面部特征的相关特点,提出在原VGG16网络模型基础上,重构模型相关网络层... 疲劳驾驶是道路交通安全中的重要隐患,人脸疲劳检测是帮助解决疲劳驾驶的重要方法。当前人脸疲劳检测众多方法存在模型训练复杂、精度低、耗时慢等问题,针对人脸疲劳面部特征的相关特点,提出在原VGG16网络模型基础上,重构模型相关网络层,并结合Lanczos插值算法增加“人脸疲劳检测感受野增强模块”,使用Focal Loss损失函数,深度提取人脸面部细节特征,再利用MeanShift聚类算法沿着密度梯度上升的特点,完成人脸疲劳检测,在公共数据集上的精度达到了94.3%。 展开更多
关键词 人脸疲劳检测 vgg16 Lanczos插值算法 Focal Loss损失函数 MeanShift聚类
在线阅读 下载PDF
基于ECA-VGG16和迁移学习的砂轮磨损状态识别研究
8
作者 周思康 张明柱 +3 位作者 王宁宁 王一帆 史帅涛 邱明 《机床与液压》 北大核心 2025年第19期103-109,共7页
针对轴承套圈磨削过程中砂轮磨损状态识别精度低的问题,提出一种基于ECA-VGG16和迁移学习的砂轮磨损状态识别方法。采集3种工况下砂轮全寿命周期磨削过程中的声发射信号,并使用格拉姆角和场(GASF)将声发射信号转换为二维图像,构建源域... 针对轴承套圈磨削过程中砂轮磨损状态识别精度低的问题,提出一种基于ECA-VGG16和迁移学习的砂轮磨损状态识别方法。采集3种工况下砂轮全寿命周期磨削过程中的声发射信号,并使用格拉姆角和场(GASF)将声发射信号转换为二维图像,构建源域数据集和目标域数据集。分析不同砂轮进给速度下3种砂轮磨损迁移学习任务,并对所提方法进行验证。结果表明:所提模型在3种多源域数据集中的平均识别准确率达到97.61%,比单源域迁移识别准确率94.04%提高了3.80%,表明通过构建多源域数据集进行迁移学习,可以有效提高砂轮磨损状态的识别准确率;与残差神经网络ResNet、对抗神经网络GAN和域自适应网络DAN相比,所提方法在多源域迁移(A/B→C、A/C→B、B/C→A)中的识别准确率分别为97.00%、97.50%、98.32%,均比上述3种算法得到的识别结果优异。研究结果为当前轴承套圈砂轮磨损状态监测工程应用提供了参考。 展开更多
关键词 砂轮磨损状态识别 迁移学习 ECA-vgg16 格拉姆角和场(GASF) 声发射信号
在线阅读 下载PDF
基于VGG16与自注意力机制融合的极光千米波识别
9
作者 王鹤野 郭雪豆 +3 位作者 张赛 黄泱泱 刘天乐 赵舒雅 《空间科学学报》 北大核心 2025年第3期677-688,共12页
提出了一种能准确识别极光千米波(Auroral Kilometric Radiation,AKR)的方法,为进一步研究极光千米波在地球辐射带能量粒子剧烈变化过程中的作用提供支撑.首先采用VGG16卷积神经网络作为基础模型,从原始数据中提取出有助于识别AKR的局... 提出了一种能准确识别极光千米波(Auroral Kilometric Radiation,AKR)的方法,为进一步研究极光千米波在地球辐射带能量粒子剧烈变化过程中的作用提供支撑.首先采用VGG16卷积神经网络作为基础模型,从原始数据中提取出有助于识别AKR的局部特征.之后引入嵌入VGG16网络的定制化自注意力机制(Self-Attention Mechanism embedded in VGG network,SAM-V),该机制有助于捕捉功率谱图中不同时间点或频率上的信号可能存在的关联,减小其他杂波的影响,提高识别准确性.同时,采用线性学习率预热和动态衰减策略使模型更快地收敛并提高泛化能力.实验结果表明,改进后的模型平均识别准确率在93%左右,比原始VGG16平均提高约3.3%,并且召回率和精确度等指标均有所改善. 展开更多
关键词 vgg16卷积神经网络 自注意力机制 极光千米波 学习率策略
在线阅读 下载PDF
基于VGG16深度学习模型的中草药图像识别技术与应用 被引量:2
10
作者 朱思博 《大众标准化》 2025年第3期76-78,共3页
为了增强对中草药的准确识别,减少人工鉴别的主观性和效率问题,文章研究了基于VGG16架构的深度学习模型。该模型可自动辨识出枸杞、百合、金银花、党参和槐花5种中草药的图像。通过设计的卷积层和全连接层,文章提出的模型有效地提取了... 为了增强对中草药的准确识别,减少人工鉴别的主观性和效率问题,文章研究了基于VGG16架构的深度学习模型。该模型可自动辨识出枸杞、百合、金银花、党参和槐花5种中草药的图像。通过设计的卷积层和全连接层,文章提出的模型有效地提取了图像中的颜色和形状等关键特征,并用这些特征进行准确分类。训练过程中采用了Adam优化算法实现,在经过35轮训练后,模型得到优化,在验证集上的准确率达到了75.83%。此次研究不仅为中药材的智能识别提供了一种可行的技术方案,还在中药材的标准化、自动化识别等方面进行了探索。 展开更多
关键词 深度学习 中草药识别 vgg16架构 Adam优化算法 标准化
在线阅读 下载PDF
基于VGG16-Laplacian算子优化的心理检测设备故障自动检索模型构建研究 被引量:1
11
作者 周传清 《自动化与仪器仪表》 2025年第9期245-249,共5页
为提高大学生心理检测设备故障自动检索精度,提出一种基于改进VGG16-Laplacian的心理检测设备故障自动检索方法。首先,在VGG16网络中引入类别注意力与上下文感知金字塔,提出改进VGG16网络;然后采用Laplacian对大学生心理检测设备故障图... 为提高大学生心理检测设备故障自动检索精度,提出一种基于改进VGG16-Laplacian的心理检测设备故障自动检索方法。首先,在VGG16网络中引入类别注意力与上下文感知金字塔,提出改进VGG16网络;然后采用Laplacian对大学生心理检测设备故障图像进行增强处理,采用改进VGG16网络提取大学生心理检测设备故障图像的特征向量;最后采用汉明距离,计算改进VGG16网络输出特征向量与离线特征库的相似度,输出前k个相似图像。结果表明,改进VGG16-Laplacian算子对大学生心理检测设备故障自动检索性能最好,查准率、查全率、平均精度均值分别为95.98%、96.31%、96.74%。由此得出,基于改进VGG16-Laplacian的心理检测设备故障自动检索方法,可提高大学生心理检测设备故障自动检索精度。 展开更多
关键词 vgg16网络 LAPLACIAN算子 心理检测设备 故障检索 自动检索
原文传递
基于改进VGG16的无人机钢轨缺陷识别算法研究
12
作者 王志飞 李樊 +2 位作者 杨博璇 刘天阳 魏奇 《铁道运输与经济》 北大核心 2025年第11期84-93,共10页
随着低空经济的快速发展,无人机巡检技术在铁路基础设施维护领域的应用需求显著提升。为解决传统人工巡检效率低、成本高,以及现有深度学习模型在无人机搭载设备上计算资源受限、查准率低的问题,研究提出一种改进的VGG16网络模型,用于... 随着低空经济的快速发展,无人机巡检技术在铁路基础设施维护领域的应用需求显著提升。为解决传统人工巡检效率低、成本高,以及现有深度学习模型在无人机搭载设备上计算资源受限、查准率低的问题,研究提出一种改进的VGG16网络模型,用于无人机巡检场景下的钢轨缺陷识别。首先,将传统VGG16部分标准卷积层替换为深度可分离卷积层,削减参数量,同时保持特征提取能力。其次,在高层特征提取阶段引入CBAM注意力模块,使得模型聚焦钢轨缺陷关键特征。最后,进一步引入全局平均池化(GAP)对特征进行降维,并使用随机森林分类器进行分类任务,有效提高了分类精度并实现了模型轻量化。实验结果表明:在同一数据集上,提出的算法与原模型VGG16相比,查准率高出24.9%,检出率提高25%,模型尺寸减少88.83%。与网络模型Inceptionv3和ResNet34比较,检出率分别高出17.5%和19.5%。 展开更多
关键词 钢轨缺陷 vgg16算法 深度可分离卷积 随机森林 注意力机制
在线阅读 下载PDF
基于C2f-FADC-YOLOv8与SE-ORB-VGG16的输电线路关键部件测温研究
13
作者 王勇 徐云成 +2 位作者 吴有鹏 谭芳雄 赵云 《高压电器》 北大核心 2025年第11期203-211,220,共10页
输电线路中关键部件如避雷器、悬垂绝缘子串等的温度监测对电网的安全稳定运行至关重要。为了提高温度监测的准确率。文中基于红外检测提出了一种基于改进YOLOv8方法。首先,针对输电线路关键部位远距离高精度识别问题,在YOLOv8的C2f模... 输电线路中关键部件如避雷器、悬垂绝缘子串等的温度监测对电网的安全稳定运行至关重要。为了提高温度监测的准确率。文中基于红外检测提出了一种基于改进YOLOv8方法。首先,针对输电线路关键部位远距离高精度识别问题,在YOLOv8的C2f模块中嵌入FADC模块得到改进的C2f-FADC-YOLOv8网络。其次,提出SE-ORB-VGG16网络。该网络有效结合了ORB的浅层特征提取与VGG16的深层特征提取能力,并通过SE注意力模块优化了配准过程。结合温度计算获取了从电力设备可见光图像上识别部件对应红外图像上的温度信息。实验结果显示,文中方法在识别精度上相较于改进前提升了2.9%,在召回率和mAP50上分别提升了2.4%和3.4%,在MAE、RMSE等指标误差值均小于其他算法,温度监测的绝对误差最小,为输电线路上温度监测提供了有力的技术支持。 展开更多
关键词 温度监测 YOLOv8 FADC模块 SE注意力模块 ORB-vgg16配准网络
在线阅读 下载PDF
基于VGG16模型的暗光环境垃圾图像识别分类方法
14
作者 鞠镇泽 李世豪 +2 位作者 赵安欣 康乔 喻哲钦 《移动信息》 2025年第10期290-292,共3页
针对暗光环境下的垃圾分类难题,文中提出了一种基于VGG16模型的垃圾图像识别分类方法。该方法通过维纳滤波算法对采集到的垃圾图像进行预处理,降低了采集图像暗光模糊问题对识别分类精度的影响;采用垃圾图像样本数据对VGG16模型进行深... 针对暗光环境下的垃圾分类难题,文中提出了一种基于VGG16模型的垃圾图像识别分类方法。该方法通过维纳滤波算法对采集到的垃圾图像进行预处理,降低了采集图像暗光模糊问题对识别分类精度的影响;采用垃圾图像样本数据对VGG16模型进行深度学习训练,实现对四大类垃圾的高效识别。测试结果表明,基于该方法的整体识别精度达到了93%~97%,为垃圾分类技术的发展提供了有力支撑。 展开更多
关键词 垃圾分类 图像识别 暗光图像处理 vgg16模型 深度学习
在线阅读 下载PDF
基于改进VGG16的大豆灰斑病识别
15
作者 贾倩 郭俊 +1 位作者 陈勇明 梅明林 《人工智能与机器人研究》 2025年第1期43-51,共9页
作为重要的粮食作物,大豆在全球市场中需求巨大。大豆灰斑病严重制约了大豆的优质和高产,因此,快速而准确地识别灰斑病对于大豆种植具有重要意义。目前基于深度学习的大豆灰斑病识别方法存在限制,包括对输入图像尺寸的特定要求、准确率... 作为重要的粮食作物,大豆在全球市场中需求巨大。大豆灰斑病严重制约了大豆的优质和高产,因此,快速而准确地识别灰斑病对于大豆种植具有重要意义。目前基于深度学习的大豆灰斑病识别方法存在限制,包括对输入图像尺寸的特定要求、准确率不足,以及模型参数量大导致计算缓慢。针对这些问题,本研究提出了一种改进的VGG16图像识别方法。该方法基于VGG16模型进行了优化,保留了三层卷积层结构,并集成了Inception模块。每个Inception模块由三个并行分支构成:1 × 1卷积层用于降维,1 × 1后接3 × 3卷积层用于特征提取,以及3 × 3最大池化层后接1 × 1卷积层以聚合空间信息。此外,本研究采用全局平均池化层替代了传统的全连接层,减少了模型复杂度并提升计算效率。实验结果表明,该结构不仅放宽了对输入图像尺寸的限制,还显著减少了模型参数,使得参数个数仅为传统VGG16的1.5%,而模型准确率达到99.1%。As an important food crop, soybean is in great demand in the global market. Gray spot of soybean seriously restricts the quality and high yield of soybean, so it is of great significance to identify gray spot quickly and accurately for soybean planting. Current deep learn-based methods for soybean gray spot recognition have limitations, including specific requirements for input image size, inadequate accuracy, and slow calculation due to the large number of model parameters. To solve these problems, an improved VGG16 image recognition method is proposed in this paper. The method is optimized based on the VGG16 model, retains the three-layer convolutional layer structure, and integrates the Inception module. Each Inception module consists of three parallel branches: a 1 × 1 convolutional layer for dimensionality reduction, a 1 × 1 convolutional layer followed by a 3 × 3 convolutional layer for feature extraction, and a 3 × 3 maximum pooling layer followed by a 1 × 1 convolutional layer for aggregation of spatial information. In addition, the global average pooling layer is used to replace the traditional fully connected layer, which reduces the model complexity and improves the computational efficiency. The experimental results show that the structure not only eases the limit on the input image size, but also significantly reduces the model parameters, making the number of parameters only 1.5% of the traditional VGG16, and the model accuracy reaches 99.1%. 展开更多
关键词 大豆灰斑病 深度学习 vgg16 Inception模块 全局平均池化
在线阅读 下载PDF
An Explainable Deep Learning Framework for Kidney Cancer Classification Using VGG16 and Layer-Wise Relevance Propagation on CT Images
16
作者 Asma Batool Fahad Ahmed +4 位作者 Naila Sammar Naz Ayman Altameem Ateeq Ur Rehman Khan Muhammad Adnan Ahmad Almogren 《Computer Modeling in Engineering & Sciences》 2025年第12期4129-4152,共24页
Early and accurate cancer diagnosis through medical imaging is crucial for guiding treatment and enhancing patient survival.However,many state-of-the-art deep learning(DL)methods remain opaque and lack clinical interp... Early and accurate cancer diagnosis through medical imaging is crucial for guiding treatment and enhancing patient survival.However,many state-of-the-art deep learning(DL)methods remain opaque and lack clinical interpretability.This paper presents an explainable artificial intelligence(XAI)framework that combines a fine-tuned Visual Geometry Group 16-layer network(VGG16)convolutional neural network with layer-wise relevance propagation(LRP)to deliver high-performance classification and transparent decision support.This approach is evaluated on the publicly available Kaggle kidney cancer imaging dataset,which comprises labeled cancerous and noncancerous kidney scans.The proposed model achieved 98.75%overall accuracy,with precision,recall,and F1-score each exceeding 98%on an independent test set.Crucially,LRP-derived heatmaps consistently localize anatomically and pathologically significant regions such as tumor margins in agreement with established clinical criteria.The proposed framework enhances clinician trust by delivering pixel-level justifications alongside state-of-the-art predictive performance.It facilitates informed decision-making,thereby addressing a key barrier to the clinical adoption of DL in oncology. 展开更多
关键词 Explainable artificial intelligence(XAI) deep learning vgg16 layer-wise relevance propagation(LRP) kidney cancer medical imaging
在线阅读 下载PDF
基于改进VGG16卷积神经网络的烟丝类型识别 被引量:15
17
作者 牛群峰 袁强 +2 位作者 靳毅 王莉 刘江鹏 《国外电子测量技术》 北大核心 2022年第9期149-154,共6页
为改善人工分拣烟丝效率低下,分类效果差导致香烟品质难以得到保证的现象,提出一种将机器视觉和深度学习相结合的烟丝类型识别方法。实验采集了4种烟丝图像并经过预处理以后送入以VGG16为基础改进的Light-VGG网络模型中进行分类,改进包... 为改善人工分拣烟丝效率低下,分类效果差导致香烟品质难以得到保证的现象,提出一种将机器视觉和深度学习相结合的烟丝类型识别方法。实验采集了4种烟丝图像并经过预处理以后送入以VGG16为基础改进的Light-VGG网络模型中进行分类,改进包括减少VGG16中卷积核个数以优化网络结构;增加残差模块以提升模型学习能力;使用全局池化代替全连接层,大幅减少网络参数量,应对网络过拟合。Light-VGG相比VGG16参数量减少96.5%,预测时间减少20.3%,在自建烟丝数据集中准确率达到95.5%,也明显高于其他神经网络(AlexNet、VGG13、GoogLeNet),实现了快速、准确识别烟丝类型的目标。 展开更多
关键词 烟丝识别 机器视觉 深度学习 vgg16 残差模块
原文传递
基于改进VGG16网络模型的花卉分类 被引量:12
18
作者 侯向宁 刘华春 侯宛贞 《计算机系统应用》 2022年第7期172-178,共7页
为进一步提高花卉分类的准确率,在对现有的VGG16网络模型进行研究的基础上,提出一种基于视觉注意力机制的网络模型.将SE视觉注意力模块嵌入到VGG16网络模型中,实现了对花卉显著性区域特征的提取;为有效防止梯度爆炸及梯度消失,加快网络... 为进一步提高花卉分类的准确率,在对现有的VGG16网络模型进行研究的基础上,提出一种基于视觉注意力机制的网络模型.将SE视觉注意力模块嵌入到VGG16网络模型中,实现了对花卉显著性区域特征的提取;为有效防止梯度爆炸及梯度消失,加快网络的训练和收敛的速度,在各卷积层后加入BN层;采用多损失函数融合的方式对新模型进行训练.新模型能有效提取花卉的花蕊、花瓣等显著性区域,放大了花卉的类间距离,缩小了类内距离,加快了网络的收敛,进一步提高了花卉分类的准确率.实验结果表明,新模型在Oxford-102数据集上的分类准确率比未引入注意力前有较大提高,与参考文献相比,分类准确率也有较大的提高. 展开更多
关键词 vgg16 注意力机制 SE模块 损失函数 深度学习 图像分类
在线阅读 下载PDF
基于VGG16网络的人脸情绪识别 被引量:11
19
作者 蔡靖 杜佳辰 +1 位作者 王庆 周泓任 《电子技术应用》 2022年第1期67-70,75,共5页
近年来,如何通过人工智能对人的面部表情进行识别分析成为一个研究热点,利用人工智能可以快速地分析人的面部情绪,并以此为基础进行进一步研究。在深度学习中,传统的卷积神经网络存在对面部表情特征的提取不充分以及计算机参数量较大的... 近年来,如何通过人工智能对人的面部表情进行识别分析成为一个研究热点,利用人工智能可以快速地分析人的面部情绪,并以此为基础进行进一步研究。在深度学习中,传统的卷积神经网络存在对面部表情特征的提取不充分以及计算机参数量较大的问题,导致分类准确率较低。因此,提出了基于VGG16网络的人脸表情识别算法,通过与InceptionV3、InceptionResNetV2、ResNet50等模型实验对比,结果表明,VGG16神经网络在FER2013PLUS测试数据集上的识别准确率为79%,准确率比传统的卷积神经网络高。 展开更多
关键词 深度学习 卷积神经网络 情绪识别 vgg16
在线阅读 下载PDF
基于改进VGG16的自编码器视频异常检测算法 被引量:3
20
作者 杨大为 刘志权 《计算机技术与发展》 2024年第4期95-100,共6页
在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像... 在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像素级相似性,对于复杂场景,像素级相似性可能无法准确判断预测帧与真实帧之间的相似性。针对以上问题,对基于U-Net风格的自编码器进行改进,提出了一种使用改进的VGG16作为编码器的视频异常检测算法,同时在均方误差的基础上添加结构相似性(SSIM)损失函数。改进的VGG16去掉了全连接层,并加入了残差连接防止特征退化,添加SSIM在计算像素级相似性的同时计算图像的亮度、对比度和结构等方面的相似性来优化网络。实验结果表明,改进后的算法,在Ped2数据集上检测效果达到95.91%,在Avenue数据集上检测效果达到84.89%,与改进前的方法相比分别提高了0.80%和0.19%,验证了所提方法的有效性。 展开更多
关键词 自编码器 U-Net 特征提取 vgg16 残差连接 结构相似性
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部